PDF论文结构化解析服务

基本信息

案例ID:243641

技术顾问:离风源 - 3年经验 - 北京欧珀通信有限公司

联系沟通

微信扫码,建群沟通

项目名称:PDF论文结构化解析服务

所属行业:教育 - 高等教育

->查看更多案例

案例介绍

本项目旨在实现论文PDF的定制化解析,输入为论文的PDF文件(支持扫描件),输出为指定的结构化信息(json文件),主要包含论文题目、摘要、作者、作者邮箱、作者单位,正文文本及对应的坐标,参考文献列表,图片,表格。
项目实现主要包含两部分:a. 解析主服务 b. 解析主服务所依赖的大模型服务。其中解析主服务为用户直接访问的服务接口,接受论文PDF文件作为输出,构建解析任务,调度资源进行解析,完成解析后保存结果文件,支持用户通过接口获取解析之后的json结果。解析主服务在判断是否是正文时需要调用大模型服务,在进行论文题目、摘要、作者等信息抽取时也会调用大模型服务,利用大模型理解能力进行部分抽取。

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服