猿急送>

长沙其它兼职程序员

ID：402262

海

爬虫工程师

公司信息：
小米

工作经验：
2年

兼职日薪：
500元/8小时

兼职时间：
周六
可工作日驻场（自由职业原因）

所在区域：
长沙
全区

技术能力

精通 Python 爬虫与数据采集技术，擅长运用 Requests、BeautifulSoup 等库构建高效采集流程，可精准解析网页结构，突破反爬限制获取数据。熟悉 js 逆向，能分析、还原加密逻辑，处理动态渲染页面数据；掌握 app 逆向，通过抓包、反编译等手段，挖掘移动端数据接口，为多场景数据采集项目提供技术支撑，助力高效获取与整理目标信息。

项目经验

多平台数据采集项目经验：深度参与多平台数据采集项目，涵盖 ZW 论文、bilibili 评论、网易云音乐评论及淘宝数据采集。运用 Python 爬虫技术，针对不同平台特性，如 bilibili 动态渲染页面，通过 js 逆向解析评论接口；处理网易云音乐加密数据，借助 app 逆向与加密算法还原；针对淘宝反爬机制，配置代理池、控制请求频率，精准采集多维度数据，沉淀跨平台数据采集与反爬应对经验。
多平台数据采集实践：主导多平台数据采集项目，覆盖 ZW 论文、bilibili、网易云音乐、淘宝。以 Python 为核心，结合爬虫框架，攻克各平台反爬：解析 bilibili 评论的 js 加密逻辑，突破网易云音乐 app 数据传输限制，应对淘宝复杂验证。通过构建灵活采集策略，精准获取论文元数据、平台用户评论等信息，为数据分析、舆情研究提供稳定数据源，锤炼多场景数据采集与逆向工程能力。
跨平台数据采集项目：负责跨平台数据采集系列项目，涉及 ZW 论文、bilibili 评论、网易云音乐评论、淘宝数据抓取。基于 Python 技术栈，运用 Requests、Scrapy 等工具，针对不同平台架构，开展 js 逆向（如 bilibili 动态评论加载）、app 逆向（网易云音乐接口解析），破解淘宝反爬策略。实现高效、稳定的数据采集流程，累计获取海量多元数据，支撑后续分析应用，展现从需求分析到技术落地的全流程把控力。

案例展示

ZW论文获取

本项目旨在通过技术手段实现中国知网（CNKI）论文资源的自动化采集与整理，为学术研究、文献分析等场景提供高效的数据获取支持。项目聚焦于解决传统人工检索、下载文献过程中的效率低下、批量处理困难等问题，通过规范化的爬虫流程，实现对知网论文元数据（如标题、作者、摘要、关键词、发表期刊、
UpWork全栈数据采集

UpWork全站数据采集项目，基于Python开发，实现对UpWork平台职位信息、自由职业者资料、技能标签、薪资报价等核心数据的高效抓取，支持多线程并发、断点续爬与反爬策略，数据结构化存储便于商业分析。
QCC加密参数生成api开发

企查查加密头部参数生成API项目，针对QCC网站请求签名机制进行逆向分析，实现动态加密参数的自动化生成，包括反爬Token、时间戳签名等核心参数，提供标准RESTful接口，支持高并发调用，为QCC数据采集提供稳定的鉴权支撑。