掌握Python语言基本语法;基于Python语言,主要有如下几方面的技能:
1. 利用Pandas, Scikit-learn(sklearn)等库进行数据分析与数据挖掘;
2. 利用Selenium进行网页内容爬取(爬虫)与表单自动化填写;
3. 使用matplotlib等库完成常见的数据可视化、报表可视化任务;
4. 利用Pandas, openpyxl, csv等库,对表格文件进行批量编辑、合并、拆分等操作;
5. 将VBA与Python相集成(利用win32com),从而实现使用Python操作Outlook客户端进行自动化邮件读取、编写、回复等操作;
6. 使用os等库进行文件操作,如查找、剪切、复制等
项目1:基于高分遥感影像数据和POI数据的城市建筑物多标签分类研究
使用随机森林算法,基于建筑物形状、颜色和纹理等方面共22维特征属性,将北京市区约8000个建筑对象分为7类。
主要操作包括:
1. Python代码编写;
2. 数据读取和数据清理;
3. 训练样本的选择;
4. 特征属性的z-score标准化;
5. 基于scikit学习库算法进行随机森林分类;
6. 使用混淆矩阵进行准确度评估;
7. 使用arcgis软件绘制结果图。
项目2:基于Selenium库进行的表单自动化填写
基于Selenium库,实现网页中表单的批量自动化填写,从而实现批量数据录入。
主要操作包括:
1. 解构需填写表单的html代码,从而精确定位数据录入操作涉及的各个网页元素;
2. 基于Pandas等库,从文件中读取数据;
3. 基于Selenium,将读取的数据填写到表单的相应位置当中,并自动点击提交按钮。