技术:python: 核心语法与特性 精通基础语法:数据类型(列表/字典/集合推导式)、流程控制、函数式编程(lambda/map/filter) 面向对象编程:类与继承、魔术方法、装饰器、元类等高级特性 异常处理与上下文管理器(with语句),熟悉__enter__/__ex
项目:宁波尖兵计划: 数据采集与清洗 开发多源数据爬虫:使用Scrapy框架对接企业API(OAuth2认证),处理JSON/XML异构数据,日均采集量达2TB。 数据清洗管道:基于Pandas实现自动化清洗(去重/异常值修正),结合OpenPyXL处理Excel模板,效率提升6
案例: 异步调用,关键词区分爬虫