本项目是一个多源数据爬虫控制台,支持股票(A股/美股/港股)、新闻、电商、论坛等场景的数据采集与任务管理。后端采用Python + Scrapy框架,前端使用Vue.js构建可视化控制面板,数据存储于SQLite及后续可扩展的MySQL/PostgreSQL。
我负责的核心工作包括:
1. 爬虫引擎设计:实现基于定时任务的自动化爬取,支持增量采集与去重逻辑;
2. 多市场股票行情抓取:针对A股(如000001、600519)、美股(AAPL、TSLA)、港股,分别适配不同的数据源接口,并处理反爬策略(如User-Agent轮换、IP代理);
3. 任务调度模块:开发定时任务组件,允许用户设置抓取频率(分钟/小时/天),并支持手动触发;
4. 数据过滤与限制:加入关键词过滤功能(如“银行”“科技”),并可配置最多返回条数,避免数据过载;
5. 结果统计与展示:展示爬取记录、成功/失败数量、耗时等统计信息,并提供历史查询能力。
本项目适用于金融数据分析师、量化交易研究者或市场舆情监测需求方。搜索“爬虫”“股票数据采集”“定时任务”“A股美股港股行情”等关键词可定位到此案例。