本项目是一个面向金融市场的智能化新闻舆情分析平台,旨在通过前沿的自然语言处理(NLP)技术,对海量的股市新闻和网络评论进行自动化的情感分析,从而将非结构化的文本数据转化为直观、量化的市场情绪指标,为投资者和金融分析师提供决策辅助。
我在该项目中担任核心开发者角色,独立负责了从系统设计、数据采集、模型微调到全栈开发的完整流程。
核心技术与创新点:
情感分析模型:项目核心采用功能强大的 BERT (bert-base-uncased, Large) 模型作为基础。为了提升在金融领域的分析精度,我利用专业的预标注金融新闻数据集对模型进行了微调(Fine-tuning),使其能够更精准地识别金融文本中特有的情感倾向(积极、消极、中性)。
自动化数据管道:开发了高效稳定的网络爬虫模块,能够自动化、定时地从各大主流财经门户和社交平台抓取最新的新闻及相关评论,确保了数据源的实时性和广泛性。
现代化Web展示:前端界面完全遵循 Google 的 Material Design 2 设计规范进行开发,打造了美观、响应式且用户体验优秀的可视化交互平台。
系统主要功能模块:
我负责设计并实现了系统九大核心功能模块,构成了一个完整的分析与展示闭环:
登录页:提供安全的用户身份验证和会话管理。
主页:作为系统的门户,集中展示市场的整体情感趋势、热点新闻摘要和关键指数概览。
搜索页:支持用户按股票代码、公司名称或关键词进行精确搜索,快速定位相关新闻及舆情分析结果。
数据大屏页:项目的核心可视化模块,通过多种图表(如折线图、K线图、仪表盘)动态展示市场情绪指数、个股情感波动以及 热度分析 ,为用户提供宏观的市场洞察。
关键词分析页:自动提取新闻报道中的核心关键词,帮助用户迅速把握市场讨论的焦点。
数据分析页:提供更深层次的数据钻取功能,用户可以对不同时间维度、不同新闻来源的情感数据进行交叉对比分析。
词云页:将一段时间内的热点关键词生成词云图,实现信息焦点的快速可视化。
新闻舆情页:以信息流的形式展示实时新闻,并附上每一条新闻的情感分析标签,方便用户追踪动态。
设置页:允许用户进行个性化配置,如定制关注的股票列表、设置新闻推送频率等。