10 个特训项目
从数据质检到自动化报告,覆盖数据分析全流程核心技能
入门
电商销售数据质检审计
E-commerce Sales Data QA Audit
对电商销售数据进行完整的质量审计流程,包括缺失值处理、异常值检测与数据标准化。
缺失值处理IQR 异常检测Z-Score+2
进入项目
入门
基于购物车的复购行为与商品关联预测
Shopping Cart Repeat Purchase Analysis
通过 groupby 聚合与特征构造,分析用户复购行为并预测商品关联购买概率。
groupby 聚合特征构造复购率计算+2
进入项目
进阶
RFM 模型与用户价值聚类分层
RFM Customer Segmentation
构建 RFM 模型,使用 KMeans 聚类对用户进行价值分层,识别高价值客户群体。
RFM 建模KMeans 聚类StandardScaler+2
进入项目
进阶
AIGC 训练语料库去偏与去噪
AI Training Corpus De-biasing
对 AIGC 训练语料进行文本清洗、去重与数据平衡,确保训练数据质量。
.str 文本清洗正则表达式去重策略+2
进入项目
进阶
游戏玩家行为序列与留存漏斗分析
Gaming Player Funnel Analysis
通过时间序列处理和漏斗分析,追踪玩家从注册到付费的转化路径。
时间序列rolling 窗口shift 操作+2
进入项目
高级
金融信贷反欺诈特征工程
Credit Anti-fraud Feature Engineering
构建信贷反欺诈特征工程管道,包含 Target Encoding、特征交叉与方差过滤。
Target Encoding特征交叉方差过滤+2
进入项目
高级
IoT 传感器时序数据异常检测
IoT Sensor Anomaly Detection
对 IoT 传感器时序数据进行重采样、移动平均平滑与动态阈值异常检测。
resample 重采样移动平均动态阈值+2
进入项目
进阶
多源数据融合与主数据治理
Multi-source Data Fusion & MDM
整合多源异构数据,使用 merge/join/concat、模糊匹配与格式归一化。
merge/join/concat模糊匹配格式归一化+2
进入项目
高级
AI 数据质量监控与血缘追踪
AI Data Quality Monitoring
构建数据 Schema 校验、自定义校验函数与元数据记录的质量监控体系。
Schema 校验自定义校验器分布漂移检测+2
进入项目
高级
AI 辅助数据自动化分析与故事化报告
Automated Data Storytelling
使用 pivot_table 构建自动化分析摘要,将数据转化为可读的故事化报告。
pivot_table自动化摘要数据故事化+2
进入项目