媒体关注

当前位置: 网站首页 -> 媒体关注 -> 正文

【中国科学报】8个小技巧“用好”大语言模型

发布日期:2024-05-30 浏览量:

用大语言模型,还需要技巧?在人们的印象中,这是个极其简单的操作:只需输入一个问题,立刻就能得到回答。

但实际上,如何有效地与这些人工智能模型互动,发挥出它们的最大潜力,却是一个经常被忽视的话题。

中国科学技术大学心理学系特任研究员林志成关注到这一话题,并在他最近的评论文章中提供了一系列的策略和指导,希望帮助人们更好地理解和“用好”这些先进的人工智能工具,生成更精准的回答。相关研究成果日前发表于《自然-人类行为》。

近日,《中国科学报》记者采访了林志成。“从本质上来看,大语言模型是一个数学模型,缺乏对语义的理解。它只能‘预测下一个文字’出现的概率,而不能生成‘真理’。”林志成建议在输入指令时,可以使用分解复杂任务、增加相关语境、角色扮演、提供具体示例等8个小技巧。

分解复杂任务

由于缺乏对语义的理解,因此想要大语言模型自己“举一反三”,是很难的。但是,它有海量的数据、珍贵的“记忆”,可以从中提取信息。这套记忆来源于训练数据——长期记忆,还有人们日常给予的指令——短期记忆。

因此,用好大语言模型,林志成给出的第一个小技巧是拆分复杂任务。

例如,不要直接给出“将文本翻译成中文”这样宽泛的指令,可以考虑把它拆解成两步:首先按字面意思翻译,保持含义不变;然后意译,让文本符合中文的语言习惯。

类似地,与其让它直接写出一篇1000字的论文,不如尝试把任务分解成子任务,用具体的指令分别生成概述、结论和中心论点。

林志成说,“清晰、逐步的指令,会降低模糊性和不确定性,因此可以生成更为准确的答案。”

添加相关语境

大语言模型比人类的“短期记忆”多太多了。因此,想要让它提供精准且符合问题语境的回复,在输入时提供相关的语境就很重要。这是第二个小技巧。

林志成说,一个限定语境的问题应当包含具体内容,将问题放在具体的细节中,这样才能引导大语言模型产生更为准确、相关的理解力,生成更有洞察力、更精细的回复。

例如,让大语言模型起草一份求职简历,事先要把企业发布的具体职位需求、个人基本情况等内容一并提供给它,如此一来,输出的简历则更具有针对性。

明确的指令

当你走进一间咖啡馆,想要点一杯喜欢的饮料,应该不会说:“请来杯咖啡。”而是会说,“来杯摩卡或者拿铁。”

同样地,你也不要期待大语言模型能读懂你的心。

林志成指出,要想降低模型预测时的不确定性,就要给出明确的指令。这是第三个小技巧。

例如,你让大语言模型修改文章,不要说“润色这篇文章”,而要具体到修改成什么风格、文章的目标受众是谁……

林志成说,一段更具体的指令甚至可以是“像个顶级期刊的顶级编辑那样,润色这篇文章,让它更为清晰流畅。”

让它提供多种选项

大语言模型还拥有巨大的“长期记忆”,超强的生产能力。你可以让它提供多种版本的选项,而不仅仅是一个版本内容。

“很多时候,人们潜意识里认为,大语言模型给出的就是最优答案。但就文本写作而言,它并不是一个简单量化的东西,它具备很多主观色彩。因此很难判断大语言模型第一次给出的就是最优答案。”林志成说,此时,可以让大语言模型提供多种选项,再鉴赏出符合个人需求的答案。这是第四个小技巧。

此外,林志成建议,除了要求大语言模型提供多种选项外,还可以考虑重复用同样的指令多次生成回复。

设定角色

大语言模型特有的“长期记忆”还意味着它能够模拟各种角色,提供专业的反馈或者独特的视角解读。

例如,模仿典型读者,提供写作上的反馈;扮演一名写作教练,帮助修订文稿;甚至可以扮演一只擅长人类生理学的西藏牦牛,以其独特的视角解释高海拔对心肺功能的影响。这是第五个小技巧。

林志成说,“让大语言模型扮演不同角色,不仅能获得更多有针对性和符合语境的回复,而且在这个过程中,还能获得更多乐趣。”

提供具体例子

大语言模型擅长小样本学习。林志成说,“一个特别有效的手段就是使用具体的例子丰富想法。就像你去理发店,对理发师描述想要的发型,最好的方法是拿一张照片,胜过千言万语。”这是第六个小技巧。

例如,不要模糊地说“以这些数据制图”,而是提供一个例子,如“为这些数据画个条形图,类似附件论文中的图”。另一个例子是,当你让大语言模型根据文稿生成摘要时,可以提供几个你打算投稿的期刊中的摘要样例。语言模型可以参考这些例子来生成符合期刊风格的摘要。

“这些具体的例子就像路线图一样,指导大语言模型朝着与你期望一致的方向生成内容。”林志成说。

声明想要的输出格式

林志成说,大语言模型经常“废话太多”。例如,让它修改一篇文章,它可能会把修改的细节一并反馈,但其实你只需要最后的成稿。

此时,可以要求大语言模型仅输出修改后的内容。类似地,可以指定回复的格式,包括列表格式、阅读水平和语气等。用列表格式和通俗的语气能够提升回复的可读性;限制回复的长度可以使内容更加简洁;设定阅读水平则有助于更好地理解。这是第七个小技巧。

例如,与其让其“总结关键发现”,不如声明回复格式:“用列表形式总结关键发现,并使用高中生能够理解的语言”。

实验、实验、再实验

“需要指出的是,如何使指令更有效,并没有确切的答案。有时,稍微调整一下,可能就会产生显著甚至意外的惊喜。”林志成说,实验、实验、再实验,是最好的办法。这也是第八个小技巧。

例如,在一系列推理问题中,在指令中简单加入“一步一步思考”就可以让大语言模型表现地更好。

更有意思的是,大语言模型还可以回应“情绪性的信息” 。假如你要让它修改一篇未经同行审议的论文,可以在指令中加入一些短语:“深呼吸一下,这事对我的职业生涯很重要。”

林志成说,这些例子证明大语言模型对指令非常敏感。但并非所有尝试都会成功,但每次尝试都会有新的收获,并在一定程度上提升工作效率,增加乐趣。

相关论文信息:https://doi.org/10.1038/s41562-024-01847-2

2024-05-28

原文链接:https://wap.sciencenet.cn/mobile.php?type=detail&cat=F&id=523502&mobile=1