11月16日消息,据媒体报道,谷歌旗下AI Studio平台正在测试一款尚未公开命名的AI模型,该模型在破译难辨认历史手稿方面取得了重要突破。该系统在核心字符识别准确率上表现出色,错误率仅为0.56%,专业程度已接近该领域资深学者的水准。
历史学家马克·汉弗莱斯通过专门构建的基准数据集对该模型进行了系统性评估。在测试所覆盖的五份18至19世纪高难度手稿中,模型的整体字符错误率约为1.7%,其中大部分错误集中在标点符号与书写规范等非核心问题,并未影响对文字本身的正确识别。

若排除这些非关键性误差,模型的字符错误率可进一步降至0.56%,相当于每转录200个字符才出现一处实质性错误,其表现已与专注于文献转写的专业工作者相当。
测试手稿涵盖了多样化的书写风格,包括字迹潦草、拼写不规范和语法不一致等复杂情况,充分验证了模型强大的适应能力。更值得注意的是,该模型不仅能完成文字转写工作,还展现出一定的上下文推理能力。
例如,在处理一份18世纪商人日记时,模型遇到一条未标注单位的购糖记录“145”。它通过反向核对手账总额,结合当时英国的货币与重量单位体系,成功推断出该数字代表“14英石5磅”。
汉弗莱斯也指出当前评估仍存在一定局限。由于该模型仅以A/B测试形式零星出现,难以进行大规模系统性验证,目前仅完成基准数据集中约10%样本的评估工作。

