一、需求描述
每次运行导入X个关键词(可编辑),手机端开启百度自动搜索目标词,每个词的搜索结果,打开指定前X页的所有网站,符合我方要求的目标站,记录并生成文档,文档格式应为:目标词,所在排名,目标站域名。
注意项:百度对某设备某IP循环搜索可能会有自己的风控防爬虫机制,需要有完整的过百度风控的机制。
验收标准:我方会明确的告诉技术团队,我要抓什么样的站。
1、是否能24小时0人工自动运行脚本,不会卡验证,或软件无故停止运行。
2、软件运行后,导入某个词,例如苹果导航,会人工搜索对比采集器搜索结果,要求误差率不超过10%,即人工搜索某个词搜索到30个符合要求的目标站,软件应不低于27个,且无效站不超过20%.