猿急送>

广州其它兼职程序员

ID：393372

what 有团队

爬虫工程师

公司信息：
无

工作经验：
1年

兼职日薪：
500元/8小时

兼职时间：
下班后
周六
周日
可工作日远程
可工作日驻场（离职原因）
可工作日驻场（自由职业原因）

所在区域：
广州
天河

技术能力

本人对爬虫技术有着深入的理解和丰富的实践经验，能够熟练运用多种编程语言和工具构建高效的爬虫系统，全面获取互联网上的公开数据。面对日益复杂的网站反爬机制，我能够通过分析网站结构和网络请求，巧妙地模拟真实用户行为，成功突破限制，确保爬虫的稳定运行和数据的顺利获取。在处理动态网页方面，我熟练掌握JavaScript语言，能够深入分析网页的前端代码逻辑，精准定位数据的生成和交互过程。运用工具如Selenium等，可以完美地控制浏览器，执行JavaScript代码，从而获取动态加载的数据，包括但不限于通过AJAX请求加载的内容、单页面应用中的数据更新以及需要用户交互才能展示的信息等。在数据预处理阶段，我熟练运用pandas和numpy等强大的数据处理库，对爬取到的原始数据进行清洗和转换。能够高效地处理缺失值、异常值，进行数据类型转换、数据合并和重塑等操作，将杂乱无章的原始数据整理成结构化、清晰可用的数据集。在数据存储方面，我熟悉关系型数据库如MySQL，能够设计合理的数据库结构，编写SQL语句，将处理后的数据准确地存储到数据库中，方便后续的数据查询和分析。同时，我也能够根据需求将数据存储为其他格式，如CSV、Excel、JSON等，以满足不同的业务场景和数据分析工具的要求。在数据可视化方面，我熟练掌握多种可视化工具和库，如Matplotlib、Seaborn、Plotly等。能够根据数据特点和分析目的，选择合适的可视化方式，将数据以直观的图表形式呈现出来，如柱状图、折线图、饼图、散点图、热力图等。通过精美的可视化设计，能够突出数据的关键信息和趋势，帮助用户快速理解数据的含义，为决策提供有力支持。例如，绘制网站流量趋势图、用户分布地图、数据相关性热力图等，让数据的价值一目了然。

项目经验

在实际项目中，我曾爬过多个加密网站如招标网、考古网等信息。通过模拟登录、设置代理IP、随机延时等策略，有效应对了网站的反爬机制。运用JavaScript逆向分析，成功破解了数据接口的加密参数，获取了完整的数据。在数据处理过程中，利用pandas和numpy对大量的数据进行了清洗和分析，最后成功为用户服务

团队情况

整包服务：其他开发

角色	职位
负责人	爬虫工程师
队员	前端工程师
队员	后端工程师

案例展示

python爬虫爬取数据

爬虫设计与实现多平台兼容：系统能够同时适配京东、淘宝、拼多多等主流电商平台，通过分析不同平台的网页结构和反爬机制，设计了针对性的爬虫策略。例如，针对京东的静态页面结构，采用requests库结合BeautifulSoup进行高效的数据抓取；对于淘宝和拼多多等动态加载数据的页面
爬取高德地图实时全国拥堵城市榜单

、爬取高德地图实时全国拥堵城市榜单 2、高德地图实时拥挤前十名拥堵延时指数制作成柱状图 3、使用web框架如flask，django,fastapi等，实现一个的登录界面，使用ajax请求后台登录并且验证账户密码，后台存放应十个账户，登录时不在这十个账