ID:263088

Kant

爬虫工程师

  • 公司信息:
  • 七月网络科技有限公司
  • 工作经验:
  • 2年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 其他
  • 全区

技术能力

对于本科期间学过的数据结构和算法、C语言、前端、Python、SQL、计算机网络这些较为熟悉,熟悉计算机和操作系统的底层原理。目前专攻Python,两年Python爬虫经验,熟练使用Linux系统和Mysql数据库,熟悉HTML、CSS、JS,熟悉爬虫需要使用的各种库,熟悉scrapy框架,能够熟练分析出爬虫目标网站的逻辑。熟悉各种排序算法。

项目经验

主要做的爬虫相关项目较多,其中有:
1、爬取房天下并入Mysql数据库。采用多线程方式爬取房天下房源信息并入mysql数据库,爬取指定城市的全部租房房源信息,包括标题名称、地址、价位、房东联系方式、所属小区,房源详细介绍等等,类似的项目还写过很多。
2、爬取京东商品信息存入Mysql数据库并生成统计图进行可视化展示。根据客户要求,使用Python的bs4、requests等爬取某东商城的手机信息,包括但不限于品牌、销量、价格、评论量、评论等等,爬取的同时存入Mysql数据库中,并且可以安装分类、销量、价格等等生成统计图。
3、爬取东方财富网的股票信息。​用到的两个网站分别东方财富网和老虎社区,为先从东方财富网获取股票列表,列表包含所有的股票名称和代码。然后再根据股票代码从老虎社区获取到个股的价格信息。
4、车牌号识别系统。利用Python和机器学习框架TensoFlow实现对车辆车牌号的自动识别,在运行程序后选择一张图片,程序会自动识别图片中的车牌号和车牌号中的字符,准确率90%左右,几乎可以识别全部的蓝色底的车牌号。
爬虫项目还写过很多,其实爬取每个网站用到的技术都差不多,关键在于能否准确分析出页面的结构逻辑还有应对反爬虫。

案例展示

  • 爬虫东方财富网的股票信息

    爬虫东方财富网的股票信息

    用到的两个网站分别东方财富网和老虎社区,先从东方财富网获取股票列表,列表包含所有的股票名称和代码。然后再根据股票代码从老虎社区获取到个股的价格信息。

  • 爬取“房天下”的租房信息

    爬取“房天下”的租房信息

    Python采用多线程方式爬取房天下房源信息并入mysql数据库,爬取指定城市的全部租房房源信息,包括标题名称、地址、价位、房东联系方式、所属小区,房源详细介绍等等,类似的项目还写过很多。

  • 爬取京东网站商品信息和评论

    爬取京东网站商品信息和评论

    根据客户要求,使用Python的bs4、requests等爬取某东商城的手机信息,包括但不限于品牌、销量、价格、评论量、评论等等,爬取的同时存入Mysql数据库中。

  • 网课题目查题网站

    网课题目查题网站

    利用Python爬虫爬取网上免费公开的上千条题目以及答案,并存入Mysql数据库,网站前端采用Vue框架开发,后端用了PHP,打开网站后在搜索框输入要查询的题目信息,可立马展现出包含输入关键字的数据。

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服