许东教授解析大模型Prompt如何革新生物信息学研究

首页

热心网友

转载

2026-05-16

自2022年ChatGPT横空出世，人工智能领域便迎来了一场深刻的范式变革。大语言模型以其卓越的文本生成与理解能力，迅速成为技术研究与产业应用的核心。随之而来的一个关键问题日益凸显：如何与这些强大的模型进行有效沟通？于是，“提示词”从一个技术术语，逐渐演变为一门值得深究的学问。

那么，究竟什么是提示词？在早期的命令行时代，提示词是用户输入以驱动系统响应的指令。而在大模型的语境下，它更像是一句精心设计的引导语，旨在激发模型的深层潜力，指挥其完成文本生成、问答或特定任务。可以说，提示词的质量，直接决定了你从大语言模型这座“知识宝库”中能取出怎样的珍宝。

OpenAI的创始人Sam Altman曾将提示词工程比作一种“用自然语言编程”的黑科技，并视其为一项高回报技能。这并非虚言。在AIGC时代，能否让ChatGPT等模型输出令人满意的结果，很大程度上就取决于你如何巧妙地构建和优化那几句“咒语”。

然而，提示技术的探索之路并非一帆风顺。早期研究者的工作，某种程度上像是一场“炼金术”——通过大量试错寻找有效的“魔法咒语”，过程充满偶然性，缺乏系统方法论。要让这项技术真正走向成熟，就必须完成一场“从炼金术到化学”的蜕变，将其构建在可分析、可复现的科学原理之上。

这引发了一系列值得深思的问题：不同的提示词究竟如何影响模型的理解与输出？在不同的应用场景下，设计和优化提示词应遵循哪些核心原则？近日，一项发表于《International Journal of Artificial Intelligence and Robotics Research》的研究论文《Iterative Prompt Refinement for Mining Gene Relationships from ChatGPT》，为这些问题提供了一个来自生物信息学领域的生动案例。

该研究聚焦于利用大型语言模型挖掘基因关系，并提出了一种迭代提示优化技术来提升预测准确性。这项工作为生物信息学研究者如何借助ChatGPT优化工作流程、提升效率开辟了新思路。借此机会，密苏里大学哥伦比亚分校计算机系的许东教授也分享了他对AI大模型在生命科学领域应用的观察与思考。

生物信息学：迎接第二次繁荣期

回顾上世纪90年代，那堪称生物信息学研究的“寒武纪大爆发”时期。人类基因组计划启动、全球蛋白质结构预测竞赛兴起，生物学数据呈指数级增长，恰逢信息技术跨越式发展，几股力量交汇，共同将生物信息学推向了第一个黄金时代。如今，随着人工智能技术，特别是大模型的突破性进展，这个领域正站在第二次繁荣期的门槛上。

作为亲历了上一轮黄金期的学者，许东教授指出，AI大模型在生命科学中的应用已多点开花，主要集中在以下几个方向：

蛋白质模型：基于海量蛋白质序列训练的大模型，已能胜任新蛋白质设计在内的多种预测任务。

单细胞模型：单细胞转录组数据量极其庞大，一个实验往往涉及数百万细胞。针对此训练的大模型，正成为大规模单细胞数据分析的利器。

医学多模态模型：通过整合病历文本、医学影像、检查报告等多源数据训练出的模型，为复杂的医学数据分析提供了新工具。

此外，在核酸定位、蛋白质与核酸相互作用等领域，也涌现出相应的专用模型。这些应用的核心价值在于，它们能辅助研究者以更快的速度、更高的精度处理复杂问题，从而大幅提升研究效率并降低成本。

当然，挑战同样存在。大模型在生物信息学的应用仍处早期阶段，首要难题便是对高质量、大规模标注数据的依赖，而生物数据的质量与完整性本身就是一个瓶颈。同时，模型的可解释性不足以及难以避免的“幻觉”问题，也影响着研究结果的可靠性。

如何破局？许东教授认为，提示技术提供了一条灵活且易于实施的路径。尤其在数据资源有限的情况下，精心设计的提示学习，很可能成为发挥大模型潜力的主流方法之一。

用提示学习提升AI模型的精准度

在机器学习领域，将提示从“经验技艺”系统化为“科学工程”的过程，被称为“提示学习”。以ChatGPT为代表的聊天机器人高度依赖提示，是因为其预训练模型中已压缩了海量知识。为了更精准地调用这些知识，需要通过人类反馈强化学习等技术进行对齐。因此，设计出能获得有价值、准确且稳健响应的提示，至关重要。

提示学习的核心，在于将用户输入转化为特定的提示格式。主流有两种模式：一是自编码模式，使用带有占位符的自然语言模板，让模型在指定位置生成答案；二是自回归模式，为模型提供问题与背景信息，让其自由生成答案。这些方法的本质，都是为预训练模型设计明确的任务格式，包括输入模板、标签样式及输出映射关系。

前述论文的研究，正是在此基础上，将自回归模式的提示学习应用于复杂的生物信息学场景——基因关系挖掘。研究团队创新性地引入了迭代提示优化、思维链等技术，通过与ChatGPT的多轮交互，逐步优化提示，从而显著提升了预测准确性。

（利用 GPT 模型进行基因关系挖掘的迭代提示细化框架。该方法利用 GPT-4 的高级逻辑能力来自主改进提示，并利用 GPT-3.5 的低成本和高速进行初始基于事实的查询处理。）

这项工作的一个关键设计是元提示：通过为对话机器人设定特定角色和详细指令，来引导GPT-4进行更专业的提示优化。例如，指令可能包含“改变分析视角”或“省略冗余细节”，以此提升提示的有效性。

另一个核心是迭代优化流程：首先利用GPT-3.5生成初始的基因关系提示并评估其效果；接着，将预测结果与KEGG等权威数据库进行比对，识别错误与不足；然后，将这些反馈信息用于优化提示；最后，将优化后的模型在标准数据库上进行基准测试，验证其解析复杂基因关系网络的能力。

此外，研究还引入了思维链与思维树策略，引导模型进行更深入的逻辑推理，并将复杂问题分解为易于管理的子问题序列，逐步构建完整答案。这种方法特别适合处理基因关系网络构建这类复杂任务。

实验结果表明，通过迭代提示优化技术，ChatGPT在预测基因关系方面的准确性得到了显著提升，尤其在解析与疾病相关的复杂通路时，展现出了可观的有效性。

生物信息学研究的新动力

“提示技术在生物信息学领域具有独特优势。”许东教授总结道。首先，它对数据量的要求相对较低，在小数据集上也能表现良好，这正好契合了许多生物医学数据集规模有限的现实。其次，由于建立在大型预训练模型之上，其实施和应用的门槛相对较低。最后，生物信息学中大量问题本质上是“小数据问题”，这为提示技术提供了广阔的应用场景。

那么，迭代提示优化如何应对大模型令人头疼的“幻觉”问题呢？许东教授做了一个有趣的类比：这种现象并非机器独有，人类记忆同样会出现无意识的偏差或错误重构。

大型语言模型产生“幻觉”的原因大致可归为三类：一是误解用户意图；二是训练数据中的知识混淆导致输出混乱；三是缺乏自我反思能力，无法识别和纠正错误。而迭代提示优化技术正是针对这三点“对症下药”：通过多轮优化，模型能更精准地理解问题；增强的知识概括能力有助于区分混淆信息；最重要的是，迭代过程赋予了模型类似人类的自我反思能力，使其能够识别并改进自身输出。

与传统基于规则的系统相比，这种模拟人类学习与思考过程的方法，在处理复杂、非结构化问题时显得更为灵活和高效。因此，它在提升回答准确性与可靠性、减少“幻觉”方面效果显著，为生物信息学等领域的应用扫清了一大障碍。

当然，任何技术都有其边界。许东教授也指出，提示技术高度依赖于训练数据的质量与代表性，其泛化能力仍面临挑战。论文中也提到，模型性能存在波动，对训练数据较为敏感，这意味着未来仍需开发更先进的迭代算法与优化策略。模型定制、算法创新以及在更广泛问题上的有效性评估，将是接下来的重点方向。

“虽然并非所有生物信息学问题都适合用这种方法解决，”许东教授谈及未来时表示，“但可以肯定的是，有相当比例的问题能够通过大模型与提示技术找到更优的解决方案。当前，专门针对生物信息学领域训练的大模型尚且缺乏，随着这类领域专用模型的发展，提示技术必将发挥出更大的威力。”

来源:https://www.leiphone.com/category/academic/bt28wbKQtZa1E2Ei.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：百川智能获50亿元A轮融资国资入局与OpenAI搜索挑战谷歌下一篇：智谱AI获华策亿元投资共建影视AI平台杨红霞入职港理工蔚来首发智能驾驶世界模型