猿急送>

郑州Python兼职程序员

ID：421540

不动禅心_851

信息化专员

公司信息：
河南中誉鼎力智能装备有限公司

工作经验：
12年

兼职日薪：
500元/8小时

兼职时间：
下班后
周六
周日
可工作日远程

所在区域：
郑州
全区

技术能力

熟练掌握 Python 编程语言，可独立搭建完整爬虫采集方案，熟练运用 requests、BeautifulSoup、Selenium、Scrapy 等主流爬虫库，能够处理静态网页、动态 JS 渲染页面、登录鉴权、Cookie 维持、代理 IP 反爬规避、请求频率限流等各类常见反爬场景，精准抓取网页文本、表格、图片、分页批量数据等多类型网页资源。
精通结构化与非结构化数据清洗全流程，依托 Pandas、Numpy、Openpyxl、CSV 等工具，完成缺失值填充、重复数据删除、异常值剔除、格式统一、字段拆分合并、乱码修正、多源数据表拼接整合等操作，可将杂乱原始采集数据规整为可直接用于统计分析、报表导出的标准化数据集。
能够根据业务需求定制轻量化自动化采集脚本，自动执行定时抓取、增量更新、数据本地持久化存储任务，同时规范爬虫请求逻辑，严格遵守网站 robots 协议，规避合规风险，可高效承接网页定向数据抓取、原始数据规整加工类技术需求。

项目经验

掘金者论坛关键词定向爬虫与数据导出项目
基于 Python 开发定向爬虫程序，根据客户指定多组检索关键词批量访问掘金者论坛索引页面，使用 Requests 结合页面解析库遍历分页列表，精准抓取帖子标题、发布时间、作者、浏览量、回复数量、帖子链接、内容摘要等全部核心字段；针对论坛动态加载、请求频次限制等反爬机制，增加请求间隔随机延时、请求头伪装等策略，保障数据完整抓取，无漏爬、重复抓取问题。
采集完成原始数据后，依托 Pandas、Openpyxl 工具开展全套数据清洗工作：剔除空白无效行、去除重复帖子条目、统一时间格式、修正乱码字符、规整数值类统计字段，对缺失关键信息的数据行做标记区分；清洗完毕后自动批量写入结构化 Excel 表格，按关键词分工作表归档存储，表格内置筛选、排序格式，客户拿到文件可直接筛选检索、二次统计分析。
整套脚本实现全流程自动化运行，无需人工逐页复制粘贴，单次可批量处理上百页索引数据，大幅缩减人工整理耗时，交付的数据文件规整易用，满足客户资料归档、信息汇总调研的业务需求。

案例展示

掘⾦技术社区⽂章索引

本项目为Python开发的掘金技术社区文章索引爬虫工具，核心功能与亮点如下： 1. 自动化分页爬取：支持自定义最大爬取页数，自动遍历目标板块全部分页，检测到无内容时自动终止任务，全程无需人工值守； 2. 全字段精准提取：可精准提取文章标题、作者名称、发布时间、阅读量、原文跳转
局域网服务器资源监控软件

服务器资源监控系统本项目基于 Python 开发一套 C/S 架构服务器资源监控平台，采用 TCP 长连接实现客户端与采集端实时数据交互，全方位监控服务器运行状态。技术栈：Python3、psutil、Socket、PyQt6、Matplotlib、cryptograph
局域网服务器资源监控软件

服务器资源监控系统本项目基于 Python 开发一套 C/S 架构服务器资源监控平台，采用 TCP 长连接实现客户端与采集端实时数据交互，全方位监控服务器运行状态。技术栈：Python3、psutil、Socket、PyQt6、Matplotlib、cryptograph