资深数据工程师,核心专长在网络爬虫开发与数据分析挖掘。精通使用Python生态工具(Scrapy, Requests, BeautifulSoup, Selenium)构建高效、稳定的分布式爬虫系统,擅长处理复杂反爬策略(验证码识别、IP代理池、动态渲染页面抓取)。熟练运用数据清洗、预处理技术(Pandas, NumPy)处理海量异构数据。具备扎实的数据分析能力,熟练使用Pandas进行统计分析、特征工程,并运用Matplotlib/Seaborn/Tableau进行数据可视化。了解常用机器学习算法(Scikit-learn)用于数据挖掘与预测建模(分类、回归、聚类)。熟悉数据存储方案(MySQL, MongoDB, Redis)。掌握Linux基础操作及数据ETL流程。
资深数据工程师,专注网络爬虫与数据分析。精通Python爬虫框架(Scrapy、Selenium)及反爬破解技术(IP代理池、验证码识别、JS逆向),具备千万级数据分布式采集经验。熟练使用Pandas/NumPy进行数据清洗、特征工程,掌握统计分析及可视化(Matplotlib/Tableau)。了解机器学习建模(Scikit-learn)与SQL/NoSQL数据库(MySQL/MongoDB)。熟悉Linux运维及ETL流程设计,保障数据管道高可用。