人人优活科技
个人
已顺利交付
1 个项目
ID:120529
python 后端
1年
500元/8小时
技术:熟悉django的开发流程,
使用各种数据提取手段,js xpath 正则可以制定完整的爬虫方案,优化爬取效率
熟悉爬虫scrapy框架搭建分布式爬取
mysql数据的索引优化
Nginx加wsgi部署项目
项目:项目:淘宝页面抓取
职责:负责页面分析,抓取工作,将数据进行存储
技术名词:mongodb,selenim,chrome/phantomJS,xpath,scrapy
项目流程:1.搜索关键字:利用selenium驱动浏览器搜索关键字,得到查询后的商品列表
2.分析页面并