nuoya

人工智能-其他 chf

项目概述:从pdf格式的年报中抽取出年报所涉及的公司以及公司的主营业务,从年报中的图表中抽取出公司的营业收入 构成表,统一将最终提取到的信息存库,用来对公司年度状况进行分析,并且提供公司年报数据给有需求的公司。  负责板块: 1.将pdf格式的年报数据进行转化,转化成txt格式的年报数据; 2.从转化好txt格式的年报数据中抽取出公司以及公司的主营业务; 3.从年报中的图表中抽取出公司的盈亏状况,并将所有信息入库。  技术方案: 1.利用OCR模型将pdf格式的年报数据转成txt格式(OCR模型可以高效的解析出pdf文件中的图片与表格); 2.应用BERT+bilstm...

nuoya
nuoya
------ 加载完毕 ------
联系聘用方端客服