编程语言:Python(Pandas/NumPy)、Java、SQL
大数据工具:MySQL(分布式搭建)、Linux/Ubuntu系统管理
数据分析:爬虫、数据可视化、基础机器学习算法
开发能力:前后端开发
1.XX市2024年12个月天气情况爬取及可视化(Scrapy框架爬取,python的matplotli库,Mysql)
2.淘宝用户购物数据集分析(MongoDB 完全分布式集群,Redis 分布式集群;Pandas 库完成数据清洗、预处理,借助MongoDB 的Python API 实现数据存储与复杂查询统计,matplotlib可视化。)
3.新闻网站一个垂类新闻爬取和词频统计(python,自然语言处理)