熟练使用栈、队列、链表等常见数据结构。
熟悉 XGBoost、回归、聚类等机器学习常用算法。
熟练使用 Linux 基本命令,熟悉 Docker 部署。
熟练使用 Python 及 SQL 语言,熟悉 pandas 等数据处理常用库。
熟练使用 MySQL,了解索引以及常见的优化手段等。
路面性能衰变预测项目
项目描述:基于道路养护、病害、检测指标等多维度数据,开展数据工程、特征工程、模型建模,预测道路性能指标数据,以推进道路养护科学决策。
数据工程与特征工程:收集多维度指标数据,根据各数据表的主键-外键关联拼接数据,进行数据预处理、缺失值填补、特征提取、特征选择等,完成入模数据准备工作。
模型建立与调优:调研行业常用预测方法,建立 XGBoost 模型,完成模型训练及优化。路面性能衰变预测准确率超98.5%。
接口开发:基于 Flask 框架开发预测接口,调用接口预测未来指标。