我擅长使用 Python 进行爬虫开发,熟练掌握 requests/urllib、BeautifulSoup、lxml 解析与 XPath/CSS Selector 抽取,能用 Selenium 或 Playwright 处理 JS 渲染页面。熟悉代理池、User-Agent 轮换、限速与重试策略以规避反爬,能把抓取数据清洗后存入 MySQL、MongoDB 或 CSV/Excel,具备基本反反爬与异常监控能力,注重合法合规与数据质量。
参与开发舆情数据采集与情感分析系统,负责网站爬虫模块与数据清洗逻辑。系统基于 Python 的 requests + lxml 实现多站点抓取,结合 Selenium 模拟用户行为处理动态页面与登录验证。通过关键词匹配和时间筛选,实现评论数据实时更新与监控。后端采用 MySQL 存储结构化数据,Pandas 进行数据分析与清洗,配合情感模型计算舆情趋势。项目成功实现舆情自动采集与可视化,为市场品牌监控提供数据支撑。