ID:198160

宅男拯救协会会长

python数据分析工程师

  • 公司信息:
  • 京东数字科技控股股份有限公司
  • 工作经验:
  • 3年
  • 兼职日薪:
  • 600元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 可工作日驻场(离职原因)
  • 可工作日驻场(自由职业原因)
  • 所在区域:
  • 北京
  • 海淀

技术能力

熟悉Pandas、Numpy、Matplotlib等数据分析常用库的功能,进行数据操作、采集、处理、清洗、可视化、规整数据集;
● 熟悉Random Forest、GradientBoosting、Logistic Regression、K-Nearest Neighbors、Naive Bayes、Linear Regression、Support Vector Machines 等机器学习算法应用;
● 熟悉常用数据结构算法;
● 熟悉NLP中Word Segmentation、Filtering Words、Representation、Sentence Similarity、Noisy Channel Model、Language Model等方法原理;
● 对数据有较强的敏感度;
● 熟悉集成学习算法的模型选择;
● 熟悉数据离散化操作;
● 熟悉特征工程;
● 理解TensorFlow深度学习框架的使用;
● 理解深度学习、神经网络;
● 熟悉Github操作;
● 理解Hadoop、Hive;
● 熟悉MySQL、MongoDB、Redis数据库的使用;
● 熟悉Python函数式编程;
● 熟悉Linux命令;
● 熟悉常见网站的反爬策略;
● 理解Scrapy爬虫框架;
● 熟练掌握Python OOP开发,编码遵守PEP8规范;

项目经验

项目一:对目标网站爬取分析生成报告
项目简介:利用Scrapy框架编写代码对一些特定网站的数据进行抓取,然后将获得的数据进行内容分析,得到可用的数据后生成情报报告。
项目职责:
1.从上级获取目标网站。
2.分析网站结构。
3.编写爬虫代码,将数据存在本地。
4.针对报告格式编写自动化生成报告程序。

项目二:对网站中的内容进行分类
项目简介:通过建立语言模型判断目标网站内容发布的信息是否有害,并将结果上报给相关部门。
项目职责:
1.利用爬虫搜集网站内容。
2.通过分词工具建立有害信息字典。
3.利用贝叶斯算法训练分类模型。
4.将结果输出并上报。

项目三:基于平台大学生用户行为分析绘制用户画像
项目简介:P2P借贷平台的兴起吸引了社会中各个层次人群加入其中,对于用户群体分析发现许多年轻大学生活跃程度很高。为了分析大学生在目标客户平台借贷的行为特征,对大学生借贷、投资和生活行为制作用户画像。
项目职责:
1. 提取用户信用信息,定位目标用户。
2. 分析提取用户强相关信息,忽略弱相关信息。
3. 根据用户信息为目标用户打标签。

案例展示

  • 简书用户爬虫

    简书用户爬虫

    通过爬虫实现一个提取简书网用户数据的程序,实现从简书网翻页提取包括关注用户数、粉丝数、文章数、字数、收获喜欢、简书钻、文章内容,将获取的数据存储到数据库中。然后运用NLP分析工具对用户文章进行分析使得给用户贴上标签,进而对简书用户进行分类。最后利用关键词标签生成词云,将每个用户的

  • 机器学习对简书用户进行分析,生成用户画像

    机器学习对简书用户进行分析,生成用户画像

    通过爬虫实现一个提取简书网用户数据的程序,实现从简书网翻页提取包括关注用户数、粉丝数、文章数、字数、收获喜欢、简书钻、文章内容,将获取的数据存储到数据库中。然后运用NLP分析工具对用户文章进行分析使得给用户贴上标签,进而对简书用户进行分类。最后利用关键词标签生成词云,将每个用户的

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    1
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服