ID:394684

二 格.

数据项目助理

  • 公司信息:
  • 浙江大华技术股份有限公司
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 所在区域:
  • 杭州
  • 滨江

技术能力

python:
核心语法与特性
精通基础语法:数据类型(列表/字典/集合推导式)、流程控制、函数式编程(lambda/map/filter)
面向对象编程:类与继承、魔术方法、装饰器、元类等高级特性
异常处理与上下文管理器(with语句),熟悉__enter__/__exit__机制
异步编程:熟练使用asyncio库,掌握协程(Coroutine)、async/await语法及事件循环原理
生态工具与框架
数据科学:NumPy向量化计算、Pandas数据处理、Matplotlib/Seaborn可视化
Web开发:Django(ORM、中间件、REST框架)、Flask(蓝图、Jinja2模板)
自动化运维:利用paramiko进行SSH连接,fabric实现批量任务编排
测试工具:unittest/pytest单元测试,Selenium自动化浏览器操作
性能优化
使用cProfile分析性能瓶颈,通过C扩展(如Cython)加速关键代码
多进程/多线程编程(multiprocessing/concurrent.futures),解决GIL限制
内存管理:引用计数与垃圾回收机制,避免循环引用导致的内存泄漏

项目经验

宁波尖兵计划:
数据采集与清洗
开发多源数据爬虫:使用Scrapy框架对接企业API(OAuth2认证),处理JSON/XML异构数据,日均采集量达2TB。
数据清洗管道:基于Pandas实现自动化清洗(去重/异常值修正),结合OpenPyXL处理Excel模板,效率提升60%。
异步任务调度:通过Celery + Redis构建分布式任务队列,支持断点续传与失败重试,确保数据同步稳定性。
数据分析与可视化
产能预测模型:利用Prophet时间序列算法预测企业季度产能,准确率达85%;通过Dask加速大规模数据计算。
供应链网络分析:基于NetworkX构建供应商-生产商关系图谱,识别关键节点风险,降低供应链中断概率30%。
可视化大屏:集成ECharts与Pyecharts生成动态图表,支持多维度下钻分析(区域/行业/规模)。
系统架构与部署
微服务化设计:采用Django REST Framework构建API服务,使用JWT实现跨域鉴权,QPS峰值达1200+。
容器化部署:通过Docker-Compose编排MySQL主从集群、Redis哨兵节点,Nginx负载均衡+Gunicorn多Worker模式。
运维监控:基于Prometheus采集容器资源指标,Grafana配置自定义看板;通过ELK集中分析Python应用日志。

案例展示

  • 异步调用,关键词区分

    异步调用,关键词区分

    第一个代码是调取某平台的api接口,通过接口获取某平台后台数据,实现数据自动化下载及处理 第二个代码是根据客户需求满足其条件,筛选相应的数据并进行分类

  • 爬虫

    爬虫

    爬虫脚本:使用Python通过requests和正则表达式高效爬取百度图片:先分析网页结构获取真实图片URL,利用多线程加速下载。注意设置请求头模拟浏览器访问,控制频率避免封禁,建议添加异常处理提升稳定性。

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服