本人主导某头部在线英语教育平台师生上课行为全链路数据分析系统的从 0 到 1 建设,基于 Databricks 云平台搭建企业级数据仓库,通过复杂 SQL 实现多源业务数据的深度加工,结合 Airflow 完成全流程调度,最终通过 Tableau 构建多维度分析看板,为教学质量优化、运营策略迭代提供数据支撑。
数据仓库与复杂 SQL 开发:基于 Databricks 平台,针对学生学习行为、教师授课行为、课程内容、工具使用、活动参与等多源异构数据,设计并编写高复杂度 SQL 脚本,完成数据抽取、清洗、关联、聚合与建模,实现学生上课时间分布、活跃度、答题耗时、教师授课效率、工具使用占比、课程环节使用率等核心指标的精准计算,支撑千万级数据的高效处理与实时分析。
ETL 流程与 Airflow 调度:基于 Spark SQL 构建全链路 ETL 流程,通过 Airflow 实现任务的自动化调度、监控与告警,保障数据链路的稳定性、时效性与准确性,实现每日师生行为数据的自动更新与同步,支撑业务报表的实时性需求。
Tableau 可视化分析看板开发:独立设计并开发多套核心业务看板,涵盖学生活跃度与上课规律分析、教师授课行为与效率分析、课程环节使用率分析、学生答题行为耗时分析、师生上课行为甘特图追踪、课程计划与实际授课对比分析等全场景,实现师生行为的全链路可视化追踪,助力教学质量评估与运营决策。
系统优化与迭代:负责数仓性能调优、复杂 SQL 优化、Airflow 任务调度优化,提升数据处理效率;基于业务需求迭代报表功能,优化可视化交互,实现师生行为数据的深度洞察,为平台教学优化、产品迭代提供数据驱动的决策支持。