猿急送>

深圳其它兼职程序员

ID：404422

y＝e^x

无

公司信息：
无

工作经验：
1年

兼职日薪：
500元/8小时

兼职时间：
下班后
周六
周日
可工作日远程

所在区域：
深圳
南山

技术能力

我专注于Python网络爬虫开发，具备扎实的技术能力和丰富的实战经验。核心技术栈包括：精通Requests、Scrapy、Selenium等主流爬虫框架，能够根据项目需求灵活选型。熟练掌握XPath、BeautifulSoup4、PyQuery等数据解析技术，高效精准地从复杂HTML或XML中提取结构化数据。
深入理解反爬虫机制，能有效应对验证码识别（如使用PIL、Tesseract进行简单图像处理）、IP代理池搭建与维护、User-Agent轮换、请求频率控制等常见反爬策略。熟悉异步高性能爬虫开发，熟练运用Aiohttp库提升大规模数据采集效率。
在数据存储方面，拥有丰富的MySQL、MongoDB、Redis等数据库的操作经验，能够根据数据特性和应用场景设计合理的存储方案。同时，了解使用Pandas、NumPy进行初步的数据清洗与分析，并具备基本的Linux开发环境操作能力，能独立完成爬虫项目的部署与维护。致力于编写稳定、高效、可维护且遵守Robots协议的爬虫系统。

项目经验

Etsy 电商平台数据采集与清洗

使用 DrissionPage + BeautifulSoup 搭建了一个稳定的网页爬虫框架，实现对 Etsy 平台珠宝类店铺和商品数据的自动化采集。

采集的核心指标包括：店铺 ID、店铺名称、国家、开店年份、销售总量、评分、关注人数、商品数，以及商品层面的标题、价格（统一转换为 EUR）、定制化标签等。

针对网页结构的动态加载问题，结合 Chromium 内核与 XPath/正则进行精准定位，避免采集过程中出现漏抓和重复。

在数据清洗环节，利用 Pandas 对采集结果进行去重、缺失值处理、货币转换及统一编码（UTF-8），最终输出为结构化 CSV 数据集，方便后续在 Python/R 中进行分析。

项目成果：实现了端到端的电商数据采集与清洗流程，生成的店铺级与商品级数据可直接用于市场研究、价格建模和推荐系统的输入。

案例展示

Etsy 电商平台数据采集与清洗

Etsy 电商平台数据采集与清洗使用 DrissionPage + BeautifulSoup 搭建了一个稳定的网页爬虫框架，实现对 Etsy 平台珠宝类店铺和商品数据的自动化采集。采集的核心指标包括：店铺 ID、店铺名称、国家、开店年份、销售总量、评分、关注人数
Etsy 电商平台数据采集与清洗

Etsy 电商平台数据采集与清洗使用 DrissionPage + BeautifulSoup 搭建了一个稳定的网页爬虫框架，实现对 Etsy 平台珠宝类店铺和商品数据的自动化采集。采集的核心指标包括：店铺 ID、店铺名称、国家、开店年份、销售总量、评分、关注人数