熟悉Python(熟练闭包/装饰器/协程)、Java(多线程开发)、C++(STL/数据结构)多种编程语言, 熟悉Flask(JWT/RBAC/分布式锁)、Django(ORM优化/Redis缓存)后端框架熟悉Vue3(组件化开发/Element Plus)、熟悉Scrapy分布式架构、JS逆向(AST解析/参数加密破解)爬虫技术。
flask电商后台项目,django在线教育平台,人人车网站数据分析项目,去哪儿网站旅游景点票价项目,人口薪资普查项目,人口薪资普查项目
技术架构:基于Scrapy分布式爬虫构建10万+数据量的二手车数据集 核心实现: - 设计多维度反爬策略(IP代理池+请求指纹校验),突破人人车网站动态加密限制,采集完整率达98% - 开发特征工程流水线,通过WOE编码与IV值筛选优化特征,关键特征维度压缩40% - 构
数据工程:爬取去哪儿网20省市、5万+景点数据,构建时空维度票价分析数据库 关键技术: - 实现动态JS渲染破解,通过Selenium+MitmProxy捕获加密接口,数据采集效率提升3倍 - 开发基于孤立森林的异常检测模块,清洗无效数据13.2% - 构建LSTM时