一、作品核心功能(全流程拆解)
1. 智能邮件监控与PDF采集:实时监听医学文献邮箱,POP3/IMAP双协议适配,自动识别含医学PDF附件邮件并过滤无效邮件;校验文件完整性、告警异常PDF,按PaperID/标题去重,适配医学文献特殊命名规则并可过滤非目标领域文献。
2. 医学文献多模态解析(核心):采用PDFPlumber+OCR提取文献内容,解决医学特殊符号识别问题;通过LayoutLMv3+YOLOv11组合算法,实现医学复合图语义化子图分割,按规范命名裁剪,输出≥300DPI高清子图,子图提取准确率≥99%。
3. 医学科普文案智能生成:基于微调版Claude 3 Opus,将专业内容转化为公众号科普语言,简化术语;按模板自动生成推文结构,嵌入子图占位符,内置合规校验,支持Web后台可视化配置模板与规则。
4. 微信公众号自动化发布:提供API上传草稿箱、Playwright无头浏览器全自动化两种方案;支持扫码登录缓存、登录告警与发布状态监控,生成每日处理日志,平衡合规与自动化。
5. 系统运维与扩展:支持Docker容器化部署,双系统适配;按时间分类归档数据并支持批量导出,预留对接医院文献库、知网等API接口,可拓展至全医学领域。
二、开发者核心职责(核心技术负责人)
主导项目全生命周期,对接医疗团队拆解需求,选型LayoutLMv3+YOLOv11、API+Playwright等技术,制定核心验收指标;开发子图分割算法、全流程工程代码,搭建后端框架,联合医疗团队保障医学适配与合规;设计多维度测试方案,编写相关文档,完成部署交付与售后支持;根据反馈优化算法与系统性能,输出可复用技术文档。
三、作品核心价值与落地效果
单篇文献转推文时长从2-3小时缩短至5分钟,日均处理量提升至100+篇,效率提升90%;子图提取准确率99.5%,优于人工;减少80%人工成本,释放医疗团队精力;核心子图分割算法可复用到药学、病理学等领域,实现多科室拓展。