ID:219823

藉藉晓生 身份已认证

python爬虫开发

  • 公司信息:
  • 大家说我有天赋
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 上海
  • 徐汇

技术能力

1.理解并熟练运用python基础
2.理解并熟练运用python面向对象, 进程, 线程, urllib, requests, re, xpath, BeautifulSoup, json, scrapy, smtplib, selenium
3.熟练运用html, xml, MySQL, xlrd, xlwt, MongoD, jieba等基础
4.运用Flask, jinja2; (目前能力有限只能做一些简单web项目)
5.应该很难有人能看到我,所以随缘模式开启,
6.朋友出于对我的感激,推荐主动接单,说这样更锻炼人.所以我就来了
7.老婆怀孕,在家照顾老婆,闲时间多,
8.目前在给两位上班朋友当长期枪手:
1) 一个是大数据相关岗位(具体不详,我只负责写爬虫)
2) 一个声称是文本算法工程师岗位(这朋友就是会找代码,不是很会写代码,大部分由我完成的)
9.我高中文化,9月16开始自学python的,上学那会数理化接近满分,但英语最低9分,因此爬虫相关的最好不要是英文站
10.对爬虫的理解:爬虫的实现其本质就是与目标服务器的数据交互过程.数据的清洗与存储只是爬虫的增值品.爬虫的核心在'与服务器的数据交互'
11.以学习为目接单,廉价的劳动力,当时我做www-vandream-com这个站的商品信息采集时,花半小时,让朋友随意给的,给了150,某宝上同样的要求报价最低800多,最短3天交付,得知这一信息并核实后我惊了,同时我也飘了
12.关于爬虫收费:爬虫50起步,对我技术提升有帮助的随意给(最低50).我一眼都能确定怎么实现的,根据数据清洗和存储工作量提价,你没看错,更难 != 更贵, 更简单 != 更便宜, 对我技术提升有帮助 = 更便宜, 耗时的 = 贵
13.关于其它项目:目前除了接过爬虫单,就只对短文本相似度分类有经验,因此如果您愿意找我尝试,我做样让你验证,然后随意给报酬(最低50)
14,欢迎发小项目小功能的实现要求给我,你不限时间,我权当练习,做好发你,免费.(权当长期合作敲门砖,交个朋友)
15.无论你是需要完成公司派发的爬虫任务,还是有爬虫单没时间做,都可以联系我,我这低廉的收费,让你体验一把中间商赚差价的快感

项目经验

爬虫:目前给人代写的爬虫差不多近30个,像商品分享类网评论,商城商品信息,行业数据,商家信息,爬房源的等(都是可以免费浏览的,不存在法律争议,而且都是别人主动联系我的)
印象最深刻就是当时爬www-dealmoon-com这个站的晒货栏目,那个评论让我熬了个通宵,当然那时候比现在更小白.
超半数是让需求方随意给的,最低给20元的 最高给666元的,爬虫总收入不到2000,还是那句话,以学习为目的接单,都是最廉价的劳动力.

短文本相似度分类:这位朋友当时找到我给写爬虫,连续写了几个爬虫后,他给了新的项目,让我学习下余弦相似度,TF-IDF,bert,发了一个跑不起来的参考源码,我进行了突击学习,最终是用gensim, jieba, ashutil等实现的,虽然无法完全理解,但是能修修改改实现,在这过程中我学习进度在他们公司不断增加的要求前边,目前在建深度模型,我还没搞定.期间这位朋友想和我月结,因不想多一分牵挂,最后还是按项目功能的实现结,大大小小功能实现了近十个,廉价的劳动力,到现在才800多元.当然我也是抱着学习的态度,报酬也算额外收货.

web:写过一个简单web,Flask和爬虫结合,首页在百度首页模板的基础上改的,输入连续剧提交搜索,后台用来启动爬虫爬取腾讯视频对应续集的基本信息和单集链接,然后利用免费的IVP解码接口,进行处理,覆盖所有免费的,VIP的,超前点播的,并排除预告,展示在前端的续集详情页(在腾讯续集详情页模板基础上改的),可直接点击单集进行跳转播放(此过程不储存任何信息)
我打包发布到吾爱破解论坛分享供大家测试研究,不到三十个小时,1.5万的浏览器量,500多的评论,初衷是python学习交流,后为响应众多评论,源码上传GitHub,分享了我学习的python培训机构

案例展示

  • 爬虫

    爬虫

    一个爬虫没什么好介绍的,无非就是应要求确定数据源,获取数据,我直接找到API 提取的数据 ,一步到位几秒钟全部数据保存完成,就这在某宝上报价最低800多,3天交付,我搞好从上手分析开始算 都没有半小时

  • 短文本相似度分类

    短文本相似度分类

    爬虫获取30W问卷模板保存TXT,根据模板中的问题倾向对模板文件进行概念,行业分类,保存到对应文件夹下,对模板中的题型进行进行精细化概念行业分类,将同类题和对应选项保存到相应的txt文件中

  • WEB 视频解码(,用的免费解码接口)

    WEB 视频解码(,用的免费解码接口)

    Flask和爬虫结合,首页在百度首页模板的基础上改的,输入连续剧提交搜索,后台用来启动爬虫爬取腾讯视频对应续集的基本信息和单集链接,然后利用免费的IVP解码接口,进行处理,覆盖所有免费的,VIP的,超前点播的,并排除预告,展示在前端的续集详情页(在腾讯续集详情页模板基础上改的),

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服