猿急送>

北京Python兼职程序员

ID：198160

宅男拯救协会会长

python数据分析工程师

公司信息：
京东数字科技控股股份有限公司

工作经验：
3年

兼职日薪：
600元/8小时

兼职时间：
下班后
周六
周日
可工作日远程
可工作日驻场（离职原因）
可工作日驻场（自由职业原因）

所在区域：
北京
海淀

技术能力

熟悉Pandas、Numpy、Matplotlib等数据分析常用库的功能，进行数据操作、采集、处理、清洗、可视化、规整数据集；
● 熟悉Random Forest、GradientBoosting、Logistic Regression、K-Nearest Neighbors、Naive Bayes、Linear Regression、Support Vector Machines 等机器学习算法应用；
● 熟悉常用数据结构算法；
● 熟悉NLP中Word Segmentation、Filtering Words、Representation、Sentence Similarity、Noisy Channel Model、Language Model等方法原理；
● 对数据有较强的敏感度；
● 熟悉集成学习算法的模型选择；
● 熟悉数据离散化操作；
● 熟悉特征工程；
● 理解TensorFlow深度学习框架的使用；
● 理解深度学习、神经网络；
● 熟悉Github操作；
● 理解Hadoop、Hive；
● 熟悉MySQL、MongoDB、Redis数据库的使用；
● 熟悉Python函数式编程；
● 熟悉Linux命令；
● 熟悉常见网站的反爬策略；
● 理解Scrapy爬虫框架；
● 熟练掌握Python OOP开发，编码遵守PEP8规范；

项目经验

项目一：对目标网站爬取分析生成报告
项目简介：利用Scrapy框架编写代码对一些特定网站的数据进行抓取，然后将获得的数据进行内容分析，得到可用的数据后生成情报报告。
项目职责：
1.从上级获取目标网站。
2.分析网站结构。
3.编写爬虫代码，将数据存在本地。
4.针对报告格式编写自动化生成报告程序。

项目二：对网站中的内容进行分类
项目简介：通过建立语言模型判断目标网站内容发布的信息是否有害，并将结果上报给相关部门。
项目职责：
1.利用爬虫搜集网站内容。
2.通过分词工具建立有害信息字典。
3.利用贝叶斯算法训练分类模型。
4.将结果输出并上报。

项目三：基于平台大学生用户行为分析绘制用户画像
项目简介：P2P借贷平台的兴起吸引了社会中各个层次人群加入其中，对于用户群体分析发现许多年轻大学生活跃程度很高。为了分析大学生在目标客户平台借贷的行为特征，对大学生借贷、投资和生活行为制作用户画像。
项目职责：
1．提取用户信用信息，定位目标用户。
2．分析提取用户强相关信息，忽略弱相关信息。
3．根据用户信息为目标用户打标签。

案例展示

简书用户爬虫

通过爬虫实现一个提取简书网用户数据的程序，实现从简书网翻页提取包括关注用户数、粉丝数、文章数、字数、收获喜欢、简书钻、文章内容，将获取的数据存储到数据库中。然后运用NLP分析工具对用户文章进行分析使得给用户贴上标签，进而对简书用户进行分类。最后利用关键词标签生成词云，将每个用户的
机器学习对简书用户进行分析，生成用户画像

通过爬虫实现一个提取简书网用户数据的程序，实现从简书网翻页提取包括关注用户数、粉丝数、文章数、字数、收获喜欢、简书钻、文章内容，将获取的数据存储到数据库中。然后运用NLP分析工具对用户文章进行分析使得给用户贴上标签，进而对简书用户进行分类。最后利用关键词标签生成词云，将每个用户的