熟悉使用Xpth、BeautifulSoup、re、json模块进行数据提取
熟练使用Python urllib2、Requests等网络模块
了解Tesseract机器图像识别系统,并处理简单的文字验证码,进行模拟登录
熟练掌握Scrapy框架,以及编写各类中间件
熟练掌握scrapy-redis分布式框架,了解各组件工作机制
了解熟练使用Selenium+PhantomJS实现动态HTML抓取
擅长办公小插件的开发
目前正在学习web开发
cad二开自动化程序;Office办公自动化插件;爬取qq空间模拟登录;爬取一二三零六官网车票数据;气象数据分析;上市公司年报中获取指定内容