2026年5月23日,OpenAI正式为ChatGPT解锁了一项新技能:AI填表。用户上传表单图片后,只需通过语音或文字说明要填的内容,系统就能自动识别字段、补全信息。这不仅仅是“打字替代”,而是把图像理解、语音交互和内容生成串成了一条完整的工作流。
在官方演示中,一个健身会员表单被上传到ChatGPT。用户不需要逐项手动录入姓名、地址和健身目标,而是像跟助手聊天一样,随口说出自己的资料,系统便自动在对应字段中填入。整个过程流畅自然,没有繁琐的点击和切换。
值得留意的是,这项功能背后的技术整合很巧妙。ChatGPT一边读取图片中的表单结构(比如姓名栏、地址栏),一边接收用户的口头指令,再结合上下文生成合适的填写内容。表单完成后,系统甚至还能继续生成相关的配图——比如一张健身计划图片。不过,当前输出的结果主要是静态图片,而非可直接编辑的PDF或交互式文档。这意味着,如果用户需要电子版存档或二次编辑,还得人工手动转录一遍。同时,上传文件的清晰度直接影响识别准确率,模糊或扭曲的图片很可能导致提取错误。
从实用角度看,这个功能对日常填表场景是个不错的效率提升,尤其适合手机拍照后快速填写简单表单。但距离真正的“无纸化办公”还有一段路——毕竟,拿到一张图片后,后续处理仍需人工介入。对于依赖表单数据的行业来说,这更像是“半自动化”的尝试,而非终点。
