基本信息
案例ID:236505
技术顾问:Kierkegaard📜 - 2年经验 - Apodeixis Technology LLC
微信扫码,建群沟通
项目名称:Anamnesis古籍识别整理软件
->查看更多案例案例ID:236505
技术顾问:Kierkegaard📜 - 2年经验 - Apodeixis Technology LLC
项目名称:Anamnesis古籍识别整理软件
->查看更多案例是一个专为数字人文(Digital Humanities)领域设计的桌面端应用。它致力于解决中世纪手稿数字化过程中的痛点——即 OCR 识别结果的不准确性与排版的不规则性。通过集成 Kraken OCR 引擎与 CATMuS 模型,本工具允许用户在本地完成从图片到文本的自动化识别,并提供了一个强大的可视化编辑器。不同于普通的文本编辑器,它支持像素级的多边形(Polygon)与基线(Baseline)调整,并引入了独有的单词级(Word-level)逻辑,能够完美处理中世纪文本中常见的单词粘连、跨行断词(Hyphenation/SUBS)以及特殊的组合字符。所有数据均严格遵循 ALTO XML 标准,确保学术研究的数据合规性。