世界模型又近了惊人研究:已模拟现实世界,绝非随机鹦鹉!翻译原理mit分类器

【新智元导读】MIT CSAIL的研究人员发现,LLM的「内心深处」已经发展出了对现实的模拟,模型对语言和世界的理解,绝不仅仅是简单的「鹦鹉学舌」。也就说,在未来,LLM会比今天更深层地理解语言。

LLM离世界模型,究竟有多远?

不仅如此,MIT最近又发现:在LLM的深处,发展出了一种对现实的模拟,它们对语言的理解,已经远远超出了简单的模仿!

具体来说,MIT计算机科学和人工智能实验室 (CSAIL)的两名学者发现——

尽管只用「预测下一个token」这种看似只包含纯粹统计概率的目标,来训练LLM学习编程语言,模型依旧可以学习到程序中的形式化语义。

这表明,语言模型可能会发展自己对现实的理解,以此作为提高其生成能力的一种方式。

因此,LLM在未来的某一天,可能会比今天更深层次地理解语言。

没有眼睛,LLM就「看」不到吗?

如果让GPT-4去闻一下被雨水浸湿的露营地的味道,它会礼貌地拒绝你。

不过,它仍然会给你一个诗意的描述:有新鲜的泥土香气,和清爽的雨味,还有松树或湿树叶的痕迹。

GPT-4没见过下雨,也没有鼻子,但它能模仿大量训练数据中存在的文本。

缺少一双眼睛,是不是就意味着语言模型永远无法理解「狮子比家猫更大」?

LLM能理解现实世界和各种抽象概念吗?还是仅仅在「鹦鹉学舌」,纯粹依靠统计概率预测下一个token?

LLM的工作原理,依旧是未解之谜。AI圈的大佬们,时不时就要因为这个问题展开一场论战。

LeCun坚定认为,LLM的智能绝对被高估了!他最著名的论断,就是那句「大语言模型不如家里养的猫」。

「猫可以记忆,可以理解物理世界,可以计划复杂的行动,可以进行一定程度的推理,这实际上已经比最大的模型要好了,意味着我们在概念层面有重要的缺失,无法让机器像动物和人类一样聪明。」

很多人将此解释为纯粹的统计现象,LLM只是在「鹦鹉学舌」,对大量训练语料中存在的文本进行模仿,并不是像人类一样拥有同等水平的智能或感知。

但现在,MIT的研究证明,并非如此!

LLM内部,绝对存在着对现实世界的理解。

LLM破解卡雷尔谜题,意味着什么

为了探究这个谜团,MIT CSAIL的研究者们,开发了一套小型卡雷尔谜题(Karel Puzzle)。

简单介绍下,什么是卡雷尔谜题

其中包括让模型用指令在模拟环境中控制机器人的行动。

卡雷尔语法规范

然后他们在训练LLM学习一种特定的解决方案,但没有演示其中的工作原理。

最后,作者提出了一种名为「探针」(probing)的机器学习技术,用于在模型生成新解决方案时,深入了解其中的「思维过程」。

研究者通过对随机参考程序进行采样来构建训练示例,然后对5个随机输入进行采样并执行程序,以获得相应的5个输出。LM由交错输入和输出组成的示例语料库上进行下一个token预测训练,然后是参考程序。在测试时,研究者向LM提供看不见的输入输出规范,并使用贪婪解码来预测程序

在超过100万个随机谜题上进行训练后,研究人员发现,模型自发地形成了对底层模拟环境的概念!尽管训练期间,它们并没有接触过这方面的信息。

这个结果,不仅挑战了我们对LLM的固有印象,也质疑了我们对思维过程本质的认知——

在学习语义的过程中,究竟哪些类型的信息才是必需的?

实验刚开始时,模型生成的随机指令几乎无法运行;但完成训练时,指令的正确率达到了92.4%。

论文一作Jin表示,「这是一个非常激动人心的时刻,因为我们认为,如果语言模型能以这种准确度完成任务,我们也会期望,它能理解语言的含义。」

「这给了我们一个起点,来探索LLM是否确实能理解文本,现在我们看到,模型的能力,远不止于盲目地将单词拼接在一起。」

打开LLM的大脑

在这项实验中,Jin亲眼目睹了这一进展。

LLM为什么会认为,这些指令指的是这个意思?

他发现,LLM已经开发了自己的内部模拟,来模拟机器人如何响应每条指令而移动。

而随着模型解决难题的能力越来越高,这些概念也就变得越来越准确,这就表明:LM开始理解指令了。

不久之后,LLM就能始终如一地将各部分正确地拼接在一起,形成工作指令。

通过不同的探针分类器测量的语义内容(绿色)

思维探针

而为上述发现做出主要贡献的,就是一种「思维探针」。

这是一种介入LLM思维过程的有效工具,论文将它称为「probing」。

具体而言,LM的状态中包含输入和生成程序的纯语法层面的记录,但probe似乎可以学习理解其中的抽象解释。

实际的实验中,作者首先构建LLM的状态跟踪数据集,再用标准的监督学习方法训练一个小型模型作为探针,比如线性分类器或2层MLP。

训练后半段当前和接下来两个抽象状态的语义内容(1层MLP)

然而,其中一个重要的问题在于,必须将probe和模型实际的思考过程或生成的指令进行分离。

虽然探针的唯一目的,只是「进入LLM的大脑」,但如果它也为模型做了一些思考,该怎么办呢?

研究者需要确保的是,LLM能够独立于探针理解指令,而不是由探针根据LLM对语法的掌握来推断机器人的动作。

想象一下,有一堆编码LLM思维过程的数据,其中probe的角色就像一名取证分析师。

我们把这堆数据交给了分析师,告诉ta:「这是机器人的动作,试着在这堆数据中,找出机器人是怎么动的。」分析师表示,自己知道这堆数据中的机器人是怎么回事。

但是,假如这堆数据只是对原始指令进行了编码,而分析人员已经想出了一些巧妙的方法来提取指令,并按照指令进行相应的操作呢?

在这种情况下,LLM就根本没有真正了解到这些指令的含义。

为此,研究者特意做了一个巧妙的设计:它们为模型打造了一个「奇异世界」。

在这个世界中,probe的指令含义被反转了,比如「向上」其实意味着「向下」。

例如,原始语义中的exec(turnRight,·)是将使机器人顺时针旋转90度,而exec adversarial(turnRight,·)是将机器人推进一个空间

这就保证了,probe并不是在「投机取巧」,直接学习理解LLM对指令的编码方式。

一作Jin这样介绍道——

如果探针是将指令翻译成机器人的位置,那么它应该同样能够根据离奇的含义翻译指令。

但如果探头实际上是在语言模型的思维过程中,寻找原始机器人动作的编码,那么它应该很难从原始思维过程中提取出怪诞的机器人动作。

结果发现,探针出现了翻译错误,无法解释具有不同指令含义的语言模型。

这就意味着,原始语义被嵌入了语言模型中,表明LLM能够独立于原始探测分类器,理解所需的指令。

上半部分描述了在干预前,两种情况如何导致测量的高语义内容。下半部分显示了为什么将两个假设分开: 如果LM表示仅包含语法(左下),那么应该可以训练探针alt来学习根据替代状态prog(粗体红色结果)解释记录;然而,如果LM表示编码原始抽象状态(右下),则探测alt需要从原始状态prog中提取替代状态'prog,从而产生较低的语义内容(粗体灰色结果)

LLM理解语言,就像孩童一样

有趣的是,Jin发现,LLM对语言的理解是分阶段发展的,就像孩子学习语言时分多个步骤一样。

开始,它会像婴儿一样牙牙学语,说出的话是重复的,而且大多数都难以理解。

然后,LLM会开始获取语法或语言规则,这样,它就能够生成看起来像是真正解决方案的指令了,但此时它们仍然不起作用。

不过,LLM的指令会逐渐进步。

一旦模型获得了意义,它就会像孩子造句一样,开始产生正确执行所要求规范的指令。

结果如图2所示,可以看出LLM对语言的理解大致分为3个阶段,就如同孩童学习语言一样。

牙牙学语(babbling,灰色部分):占据整个训练过程约50%,生成高度重复的程序,准确率稳定在10%左右

语法习得(syntax acquisition,橙色部分):训练过程的50%~75%,生成结果的多样性急剧增加,句法属性发生显著变化,模型开始对程序的token进行建模,但生成的准确率的提升并不明显

语义习得(semantics acquisition,黄色部分):训练过程的75%到结束,多样性几乎不变,但生成准确率大幅增长,表明出现了语义理解

实验使用了三种不同的probe架构作为对比,分别是线性分类器、单层MLP和2层MLP。

提前2步预测时,2层MLP预测准确率的绝对值高于用当前状态预测的基线模型。或许可以得出这样一种推测:LLM在生成指令前,其思维过程,以及生成指令的「意图」已经存储在模型内部了。

LLM = 世界模型?

这项研究解释了LLM如何思考训练数据中每条指令的含义,如何在内部状态中模拟机器人对指令的响应。

研究表明,LLM开发了一个模拟现实的内部模型,尽管它从未接受过开发该模型的训练。

而且,语言模型还可以进一步加深对语言的理解。

然而,仅靠一篇论文显然不能完全回答这个问题。

作者Jin也承认,这项研究存在一些局限性:他们仅使用了非常简单的编程语言Karel,以及非常简单的probe模型架构。

本文另一位作者Rinard表示,「一个有趣的悬而未决的问题是,在解决机器人导航问题时,LLM是在用内部现实模型来推理现实吗?」

虽然论文展现的结果可以支持这一结论,但实验并不是为回答这个问题而设计的。

布朗大学计算机科学和语言学系助理教授Ellie Pavlick高度赞扬了这项研究。

她表示,对LLM工作原理的理解,可以让我们对这项技术的内在可能性和局限性有更合理的期望。这项研究正是在受控环境中探索这个问题。

计算机代码像自然语言一样,既有语法又有语义;但与自然语言不同的是,代码的语义更直观,并可以根据实验需要直接控制。

「实验设计很优雅,他们的发现也很乐观,这表明也许LLM可以更深入地了解语言的『含义』。」

作者介绍

本文一作Charles Jin是MIT EECS系和CSAIL实验室的在读博士,导师Martin Rinard是本文的另一位作者,他的研究主要关注稳健的机器学习和程序合成。

Jin本科和硕士毕业于耶鲁大学,获得了计算机科学和数学双学位,曾经在Weiss资产管理公司担任分析师,博士期间曾在Google Brain担任研究实习生。

参考资料:

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

THE END
0.AI翻译护航人形机器人运动会:打破语言壁垒,共探人机协作未来从服务过北京冬奥会、成都大运会、世乒赛等顶级赛事的“讯飞同传”,到广泛应用于商务洽谈、日常交流的讯飞翻译机、讯飞翻译APP,其成熟的技术体系已在全球50余个国家、超40万场国际会议中得到验证。此次护航全球首届人形机器人运动会,是这套成熟技术体系在“机器人+AI”这一前沿交汇点上的又一次成功应用与焕新升级。它jvzquC41pg}t0|npc0ipo7hp1unbpp}wph{tjns14286/9=/385eg}fkn/oohvh|{o;8:><720yivvq
1.Robot是什么意思Robot的翻译音标读音用法例句首页 翻译 AI工具箱 AI 英文校对 词霸下载 其他 登录 翻译 、Robot 翻译 、机器人 以上结果来自机器翻译。 释义jvzquC41o0odkkf0eqs0'N8':2+93[tdqv
2.机器人的英文翻译机器人英文怎么说?机器人机器人 中文机器人 英文android; automaton; robot 【计】 robot 【化】 robotjvzquC41jctzkwlekfobp7goez4dqv4lksosgwdajctzkwlujq}0
3.robot中文(繁体)翻译:剑桥词典(robot在剑桥英语-中文(繁体)词典的翻译 © Cambridge University Press) robot的翻译 中文(简体) 机器, 机器人, 人… 查看更多内容 西班牙语 robot, robot [masculine, singular]… 查看更多内容 葡萄牙语 robô, robô [masculine]… 查看更多内容 更多语言 需要一个翻译器吗? 获得快速、jvzquC41fkiukxsct{4dcvgtkfmf0xwi1|nt1.J:'CL&:M*G7'>6'K=1'G>&:K*D3'K9'JK'CF3&G?*D3'>:'N='CH+BF6*G9'H:'A6'G6+CF.>51tucq}
4.机器人的英文机器人翻译机器人英语怎么说海词词典,最权威的学习词典,专业出版机器人的英文,机器人翻译,机器人英语怎么说等详细讲解。海词词典:学习变容易,记忆很深刻。jvzq<84fkez/ew4'G8+:E.GC'G;&;B*C:'K5'KF'DC
5.机器人感知与规划笔记(1)Introduction机器人控制涉及感应、处理和行动三个阶段,采用不同类型的控制架构,如协商式、基于行为的和混合架构。此外,强调了机器人在非结构化环境中的自治、临场能力和适应性。学习和适应是现代机器人的重要特性,包括通过监督学习、模仿和探索学习来解释传感器信息、学习新策略和任务。jvzquC41dnuh0lxfp0tfv8|gkzooa=8:839628ftvkimg8igvcomu862;8>4;?>
6.中国新闻网中国机器人在机器人世界杯上任翻译口译曾获第一中新社合肥7月19日电(记者张素吴兰)19日,在第19届RoboCup世界杯开幕式上,既担任安徽合肥市长张庆军的英文翻译,又为RoboCup国际联合会主席田野五十澍担任中文翻译的中国机器人“飞飞”流利的翻译、准确的发音,以及丰富的肢体动作和表情,获得在场观众好评如潮。 jvzq<84pgyy/w|ye0gjv0ls1kplp1:5781<74B<0jvs
7.【逸豆智能翻译机器人通用版/传奇黑参数】逸豆智能翻译机器人颜色传奇黑纠错 重量350g纠错 保修信息 客服电话400-178-6881纠错 加入对比栏复制表格|复制图文混排表格 *仅供参考,请以当地实际销售产品信息为准;如发现资料有误,请投诉 逸豆智能翻译机器人(通用版/传奇黑) 参考报价:¥599 评分:暂无评分 参数报价图片问答jvzquC41fgzbku3|qn4dqv3ep1735;4345779A4rctgn0|mvonEwkjBvqwii/ktvvqs
8.AI智能翻译写作机器人(v2.0)句子来源: 全部 标题 摘要 前言 方法 结果 讨论 句子推荐数量 默认全部 随机推荐1个 择优推荐10个 择优推荐20个 点击检索 写作区【系统使用指南】 导出到WORD一键翻译保存jvzq<84yyy4terwqdqz/exr0ep5
9.智能语音机器人翻译器v2.81下载智能语音机器人翻译器是一款翻译器软件,它包含了许多我们生活中需要用到的功能。这款软件拥有简洁的界面,但是它的功能很强大。我们无论是在日常生活中还是在办公的过程当中,都可以使用这款软件作为我们的工具。 软件简介 智能语音机器人翻译器绿色版是一款功能相当实用的翻译软件,智能语音机器人翻译器绿色版可以直接录入jvzquC41uqlu0
10.ThinkAI人工智能对话聊天翻译机器人ThinkAI - 人工智能对话聊天翻译机器人You Might Also Like ChatDog-AI智能聊天 Productivity 玛氏天眼 Productivity 优星人 Productivity Moss Plus ProductivityjvzquC41crvt0jurng4dqv4ep1gqr8yjkpqbk8nf86:7:A;688Em?ns(ugk.cuq?ewyuqvjtu/gmux2dqwmiv6frru
11.机器人电话软件的优势(自动化、高效、精准)机器人电话软件在运行过程中收集大量用户数据,为企业提供了有力支持。通过对用户反馈和行为数据的分析,企业能更好地了解用户需求,优化产品和服务,持续提升客户体验。 6.实时语音翻译 机器人电话软件新增实时语音翻译功能,使得跨语言沟通变得更加轻松。这项技术能够帮助用户在国际业务中消除语言障碍,促进全球化合作。 jvzquC41ogorkj3eqo5cnxl146651
12.意识机器人的英文意识机器人翻译意识机器人英语怎么说海词词典,最权威的学习词典,专业出版意识机器人的英文,意识机器人翻译,意识机器人英语怎么说等详细讲解。海词词典:学习变容易,记忆很深刻。jvzq<84o0fodv7hp1oyfc{hj0rnqAzB'G8+96.=H'G>&CO*:8'K7'BH'DC+F7.>;'C>&G=*DC'HB
13.科学家们预测,未来将会有许多的机器人英语怎么写科学家们预测,未来将会有许多的机器人 翻译结果(英语)1: Scientists predict the future there will be many robots 翻译结果(英语)2: Scientists have predicted that there will be many robot 翻译结果(英语)3: Scientists predict, the future there will be many robotsjvzquC41hctzk7goez4dqv4z62>7|voe:xrn{ƒdahctzk8
14.类似微信的即时通讯软件LINE国内最新注册及使用指南(电脑+下载+10. 巧用翻译机器人 LINE内建各式各样的翻译机器人,支援双向翻译,加入官方帐号后,只要输入中文它就会帮你翻译成英文,因为支援双向翻译,所以输入英文就会翻译成中文,非常方便。 11. 利用特定关键字进行搜寻 点选上方的放大镜图示,就可以输入关键字进行搜索了。 jvzquC41yy}/uqfmkpmdnxzf0eun1jwvkerf1ltpvgtu1;5452703@<0jvsm
15.专业翻译汉译英机器人翻译的就别来了!Hope to professional translators, translation machine translation do not need to answer! Because I also use translation machines, not Excuse you! Text is as follows Dear Teacher: I can sit here today, you accjvzquC41ygtxgw3uquu/exr1|1w2898:;:860qyo
16.使用easegress实现telegram翻译机器人最近,Easegress 发布了 2.0 版本,再次大幅增强了流量编排功能,使用户无需编写任何代码,就可以通过编排多个 API 来实现一个超级 API。本文,我们会通过编排一个 Telegram 翻译机器人来演示一下这个功能。这个机器人可以自动将收到的消息翻译为中文、日文和英文,并且,除了文字消息,还支持翻译语音和图片消息。 jvzquC41ogmbgjxg0eun0ls1|j5cnxl1428319>1325cwrqf/c3ugujitcs.v{fpungukxs/dqz.yryj/ggtgpwguu5
17.robot是什么意思翻译robot的意思用法同义词例句沪江词库精选robot是什么意思、英语单词推荐、用法及解释、中英文句子翻译、英语短语、词汇辨析 英音 ['rəubɔt] ; 美音 ['rəubɔt] ; 名词1.机器人2.自动机;遥控机械3.自动交通信号灯4.机器般的人;行动呆板的人5.【计】浏览器词形变化 形容词 robotic,robotlike jvzquC41yy}/j~okcpm/exr1ekqv1{tdqv
18.全球要闻:鲍威尔重申需要进一步加息美科技股承压下挫Shopify正在测试由OpenAI技术驱动的翻译机器人 据财联社,加拿大电子商务公司Shopify正在要求一些客户支持人员测试一个由OpenAI技术驱动的翻译机器人。该工具将聊天对话从多种支持的语言翻译成英语。 Shopify员工预计将于本月开始测试该新工具,并被要求就翻译的准确性提供反馈。 jvzquC41uvudm762lsqb0lto0et0497528831l;6:4<32@80ujznn
19.美股收盘:科技龙头进入调整状态三大指数悉数收跌【Shopify正在测试由OpenAI技术驱动的翻译机器人】 据媒体周三报道,加拿大电子商务公司Shopify正在要求一些客户支持人员测试一个由OpenAI技术驱动的翻译机器人。该工具将聊天对话从多种支持的语言翻译成英语。Shopify员工预计将于本月开始测试该新工具,并被要求就翻译的准确性提供反馈。 jvzquC41o0imu7hp1fkucrq135>639<