本项目旨在实现论文PDF的定制化解析,输入为论文的PDF文件(支持扫描件),输出为指定的结构化信息(json文件),主要包含论文题目、摘要、作者、作者邮箱、作者单位,正文文本及对应的坐标,参考文献列表,图片,表格。
项目实现主要包含两部分:a. 解析主服务 b. 解析主服务所依赖的大模型服务。其中解析主服务为用户直接访问的服务接口,接受论文PDF文件作为输出,构建解析任务,调度资源进行解析,完成解析后保存结果文件,支持用户通过接口获取解析之后的json结果。解析主服务在判断是否是正文时需要调用大模型服务,在进行论文题目、摘要、作者等信息抽取时也会调用大模型服务,利用大模型理解能力进行部分抽取。