ID:413441

神经蛙

研发工程师

  • 公司信息:
  • 中航信
  • 工作经验:
  • 5年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 可工作日远程
  • 所在区域:
  • 北京
  • 石景山

技术能力

作为技术顾问,我具备端到端自动化工程与 AI 多模态处理的全栈技术能力,核心覆盖肿瘤学文献处理、智能图文解析、大模型应用及自动化部署全链路。在底层技术层面,精通基于 LayoutLMv3、YOLOv11 及 Vision Transformer 的文档布局分析与语义识别算法,可实现 PDF 文献中子图的高精度语义化分割(而非简单 PDF 转图),能精准定位 Fig 1A/2C 等子图标签坐标并完成逻辑区域合并;熟练运用 IMAP/POP3 协议实现邮件监控与附件自动化下载,掌握 Claude / 肿瘤学微调大模型的 Prompt Engineering 技术,可定制化生成符合新媒体格式的文案并嵌入图片占位符。在自动化部署层面,精通 Playwright/Selenium 无头浏览器与 RPA 流程编排,能绕过微信 API 权限限制实现公众号全流程自动化发布,同时具备 Docker 容器化部署、服务器环境配置及高可用异常处理(如扫码登录过期、验证码校验)能力。此外,熟悉医学文本结构化处理、多模态数据融合及自动化测试体系搭建,可保障 99% 以上的子图提取准确率与全流程闭环稳定性,能独立完成从需求拆解、技术选型到交付验收的全周期顾问工作。

项目经验

项目背景
某三甲医院肿瘤研究所需将前沿肿瘤学 PDF 文献快速转化为公众号推文对外科普,但人工处理存在效率低(单篇文献耗时 2-3 小时)、子图分割误差大、排版不统一等问题,亟需一套端到端自动化流水线,实现从邮件接收文献到公众号定时发布的全流程无人干预。
技术架构与核心实现
我作为该项目的核心技术负责人,主导了全流程的技术选型、算法开发与系统落地,整体架构采用 “数据触发层 + AI 解析层 + 内容生成层 + 自动化部署层” 四层设计:
数据触发层:邮件监控与 PDF 获取基于 IMAP 协议开发邮箱监控模块,通过 Python 实现指定邮箱的实时轮询(频率可配置),自动识别含肿瘤学 PDF 附件的邮件,完成附件下载与元数据(发件人、文献标题、PaperID)提取,同时加入异常处理机制(如超大 PDF 分片下载、加密 PDF 提示、重复文献过滤),保障数据接入的稳定性。
AI 解析层:语义化子图提取(核心难点突破)针对 “普通 PDF 转图工具无法分割子图” 的核心痛点,放弃传统的 PDFPlumber 简单截图方案,采用 LayoutLMv3(文档理解模型)+YOLOv11(目标检测)的组合算法:
先通过 LayoutLMv3 对 PDF 页面进行布局分析,识别出 “图表区域”“文字区域”“子图标签区域” 的语义边界;
再用 YOLOv11 对图表区域内的子图标签(A/B/C/a/b 等)进行坐标定位,结合欧式距离算法将标签与对应图表区域逻辑合并,实现子图的精准裁剪;
开发子图命名规则引擎,按 “PaperID_FigX_Y.png” 格式自动命名(如 “20240508_Fig1A.png”),并输出至指定存储目录。经测试,该模块对 20 篇不同排版的肿瘤学文献子图提取准确率达到 99.5%,远超验收标准的 99%。
内容生成层:AI 文案润色与格式标准化集成 Claude 3 Opus 肿瘤学微调模型,设计多阶段 Prompt Engineering 策略:
第一阶段:提取 PDF 文本中的核心研究结论、实验数据、创新点,转化为通俗化科普语言;
第二阶段:按预设模板(标题 + 研究背景 + 核心发现 + 图表解读 + 参考文献)填充内容,并自动嵌入子图占位符(如 {INSERT_FIGURE_1C_HERE});
第三阶段:通过自定义规则引擎校验排版格式(如标题字号、正文行间距、图片说明样式),确保符合公众号发布规范。同时开发模板配置后台,支持用户可视化修改推文样式、关键词替换规则,无需修改代码即可适配不同科普场景。
自动化部署层:公众号无人化发布考虑到微信官方 API 仅支持草稿箱上传、无定时发布权限,最终采用 “API+Playwright 无头浏览器” 混合方案:
先通过微信开放平台 API 将推文文本与子图上传至草稿箱;
再用 Playwright 模拟微信公众平台登录(接入扫码登录缓存机制,避免重复扫码),自动完成草稿箱内的图片替换(将占位符替换为实际子图)、排版微调、定时发布时间设置;
加入异常重试机制,针对验证码校验、登录过期等场景设计自动告警与人工兜底方案,保障全流程闭环。
项目成果与技术亮点
效率提升:单篇文献处理时长从人工 2-3 小时缩短至 5 分钟内,日均处理文献量从 10 篇提升至 100 + 篇;
精度达标:20 篇测试文献的子图提取准确率 99.5%,排版一致性 100% 符合模板要求;
可扩展性:系统支持 Docker 一键部署,提供完整的环境配置文档与管理后台,用户可自主修改邮箱配置、推文模板、发布时间等参数;
技术创新:首次将多模态 AI 算法(LayoutLMv3+YOLOv11)应用于医学文献子图语义分割,解决了传统工具 “只截图不理解” 的行业痛点,相关技术方案已被客户纳入内部技术白皮书。
项目交付与验收
最终交付物包含完整源代码(GitHub 私有库交付)、Docker 镜像、部署文档、管理后台、20 篇测试报告,全流程通过客户的压力测试(连续 7 天批量处理 50 篇文献无故障),一次性通过验收。该系统上线后,客户的科普内容发布效率提升 90%,人工成本降低 80%,成为医院数字化科普的核心工具。

案例展示

  • 医学文献自动转微信公众号推文流水线开发

    医学文献自动转微信公众号推文流水线开发

    一、作品核心功能(全流程拆解) 1. 智能邮件监控与PDF采集:实时监听医学文献邮箱,POP3/IMAP双协议适配,自动识别含医学PDF附件邮件并过滤无效邮件;校验文件完整性、告警异常PDF,按PaperID/标题去重,适配医学文献特殊命名规则并可过滤非目标领域文献。 2

  • 测试 MBTI 性格类型

    测试 MBTI 性格类型

    MBTI性格测评轻应用作品介绍 本作品是一款MBTI性格测评应用,以“科学、便捷、贴心”为核心定位,依托荣格八维理论与MBTI 16型人格体系,为用户提供精准、易懂的性格测评服务,适配学生、职场人等各类人群,无需复杂操作,即可快速完成测试并获取个性化解读,兼顾趣味性与专业性

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服