开发百度地图/高德地图汽修厂数据采集爬虫工具(含导出Excel)
任务背景:
我们是一家汽车悬挂生产企业,需要定期采集各地汽车维修厂、改装厂的信息用于客户开发,希望能开发一个可长期使用的采集脚本。
任务需求说明:
一、功能要求:
输入:
- 可输入关键词(默认:“汽修厂”、“改装厂”);
- 可输入城市名称或省份列表;
采集字段:
- 店名
- 地址
- 电话
- 店铺类型(汽修 / 改装 / 维修)
- 地图来源(百度 / 高德)
- 经纬度(可选)
输出格式:
- Excel 或 CSV 文件导出
- 自动去重
采集逻辑:
- 自动翻页,采集指定关键词所有结果;
- 支持多城市批量采集;
- 每个城市单独导出一份表格。
运行环境:
- Python 或 Node.js 均可;
- 在Windows系统上可直接运行(带简单使用说明);
- 不需服务器部署。
性能与数据要求:
每次采集不少于1000条有效数据;
采集速度合理(1小时采集完一个城市即可);
避免被封IP(可设置随机延迟或切换User-Agent);
交付内容:
可执行脚本(.py 或 .exe);
源代码;
使用说明文档(简单图文说明);
测试样例(例如采集“上海市 汽修厂”的结果)。
预算与周期:
预算范围:¥800 ~ ¥1500(视功能复杂度)
开发周期:5~7天
可后续追加功能(如自动更新、电话筛选、代理采集等)
验收标准:
能正常采集并导出Excel;
数据字段完整、无乱码;
采集成功率 ≥90%;
代码可二次运行,简单易用;
备注:
允许使用爬虫框架(如requests + BeautifulSoup、selenium、playwright等);
不需要GUI界面,命令行操作即可;
可长期合作开发后续版本(如按车型过滤、关键词批量抓取等)。