ID:400301

一沫丶

资料员

  • 公司信息:
  • 广东强龙机械设备有限公司
  • 工作经验:
  • 7年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 可工作日驻场(离职原因)
  • 可工作日驻场(自由职业原因)
  • 所在区域:
  • 其他
  • 全区

技术能力

数据清洗与整理:熟练使用Python(Pandas/Numpy)处理10万+量级数据,擅长去重(drop_duplicates)、异常值筛选(query)、多表合并(merge/concat),可自动化完成PDF/扫描件数据提取(Tabula+正则表达式)。

数据可视化:精通Matplotlib/Seaborn动态图表生成,能根据业务需求定制折线图、热力图(如气候数据趋势分析),熟悉调整图例/坐标轴/色彩方案提升可读性。

效率工具:

Excel高级应用(Power Query批量清洗、VLOOKUP跨表匹配、宏录制自动化操作)

数据库基础(SQLite增删改查,实现Excel与数据库交互)

质量控制:通过交叉验证(assert语句)、抽样复核确保数据准确率≥99%。

附加能力:

非结构化数据处理(OCR文本识别后结构化存储)

中英文数据兼容处理(编码转换/单位统一)

项目经验

案例1:多源温度数据整合可视化(猪八戒平台)

需求:合并6份PDF扫描件(共7000+数据点)中的温度曲线,剔除无效数据并统一时间轴。

解决方案:

使用EasyOCR提取PDF文本,正则表达式匹配温度值(\d{1,2}℃),人工复核误差<3%。

通过Pandas对齐时间戳(resample方法补全缺失值),Matplotlib绘制6条对比曲线,用Viridis色系区分数据源。

成果:客户验收一次通过,获5星评价:“图表专业清晰,超出预期”。

案例2:电商订单数据清洗(校内实践)

问题:原始订单数据含15%重复项、地址格式混乱(如“北京/北京市”)。

处理:编写Python脚本自动标准化地址(省市区三级分离)、标记异常订单(金额>3倍标准差),工时从8小时压缩至1.5小时。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服