项目介绍:招标数据清洗、GPS数据清洗、基于APP埋点日志和业务数据构建用户画像进行招标文件推荐、匠人推荐
1. 招标数据清洗部分
(1). 爬虫系统爬取招标、中标、拟建数据写入Kafka
(2). Flink消费kafka数据进行清洗,Maxwell 同步业务数据与之关联存储hive中
(3). Presto 进行数据查询hive数据展现到APP中
2. GPS数据清洗运用
(1). kafka接收工程车辆安装的GPS传输的数据
(2). 使用Flink清洗GPS数据(GPS数据分段、GPS轨迹漂移、使用基站信息解决GPS数据坐标为0的问题),数据清洗后存储到clickhouse中
(3).查询clickhouse中数据做GPS分段数据、GPS分段轨迹、GPS自定义轨迹对外提供服务
(4). Flink CEP 对超速、驶入驶出电子围栏进行短信报警
3. 招标推荐、工人推荐
(1). 对APP埋点日志进行清洗存储到数仓中
(2). 埋点数据和业务数据进行关联构建用户画像
(3). 基于用户画像对招标文件和匠人进行推荐