清华大学教授孙茂松：理解大模型机理建立AI新理论

2023-07-27 17:35:03 来源：DoNews快讯

DoNews7月27日消息，25日，清华大学人工智能研究院教授、欧洲人文和自然科学院外籍院士孙茂松在浦江基础科学发展论坛期间接受采访时表示，根据现有文本分析、不生成新文本的理解类大模型不存在“幻觉”。但像ChatGPT这样生成类的大模型，对话需要与事实对齐，这还要付出很大的努力，也是目前的研究热点。

澎湃新闻报道，孙茂松表示，当前业界对于ChatGPT的举一反三还处于“知其然，不知其所以然”的阶段，只有搞清楚大模型的机理，才有可能克服现有人工智能大模型的局限性，超越现有大模型，建立下一代人工智能理论和模型。而人工智能最前沿之争就是人才的竞争，顶尖高手决定了人工智能的高度，广泛的应用决定了人工智能的广度。

(相关资料图)

理解大模型机理，才能克服局限建立下一代AI理论

人们常常忽略语言的重要性，因为语言自然得就像空气一样。但只有人类才有语言能力，语言的地位极其重要。而ChatGPT的出现让机器也有了语言对话的能力，孙茂松说，这是5000年未有之变局，也会催生一系列新应用。

但对于ChatGPT，“现在是知其然，不知其所以然。OpenAI开发出了这样的现象，但为何会产生智能涌现这样的现象还说不清。现在人工智能领域的大公司、大机构都在拼命往前跑，把大模型效果做得更好，还没有时间停下来深刻地思考大模型的机理。”孙茂松表示，这就像蒸汽机带来了工业革命，但直到大约100年后在热力学三定律之下才解释清楚。

大模型里的元素事关数学，当前大模型的参数到了万亿级，应用数学家从来没有解过如此大的方程组，并且大模型涉及到的数学问题与经典数学完全不同，这为理解大模型机理带来了挑战。

但孙茂松认为，只有搞清楚大模型的机理，才有可能克服现有人工智能大模型的局限性，超越现有大模型，建立下一代人工智能理论和模型。而这不会再像蒸汽机那样需要100年才能理解机理，他相信三五年时间就能突破大模型的机理研究。

语料利用处于粗放阶段，减少大模型幻觉是研究热点

目前大模型的语料利用还处于粗放阶段，仅仅是从互联网上抓取语料，还没有涉及网页中的超链接和图片处理、文本结构的识别与利用等。孙茂松表示，“大模型写短文可以写得很好，但写长文、短篇小说不行，它没有办法保持大逻辑流畅、人物角色连贯。因为大模型就是对下一个词的预测，预测得再好，它对语料的利用还是有深刻的不足。”

除此之外，孙茂松表示，要对语料质量保持足够关注，剔除语言不通顺的语料、计算机生成的语料，利用质量好的语料。但水至清则无鱼，越纯的语料可能导致多样性损失，例如喂给大模型的都是“高大上的语料”，大模型就看不懂带有表情符号的语料。因此要追求平衡，根据应用判断什么是好的语料。

大模型存在“幻觉”，常常一本正经地“胡说八道”。但孙茂松表示，“幻觉”是能力强的表现，是创新的源泉。大模型分为生成模型和理解模型，前者如ChatGPT，孙茂松说，以前要让计算机通顺地说话是做不到的，因为词与词的组合关系复杂。现在做到了通顺，但并不意味着所说的话是正确的，语义层、语用层都需要和现实世界对齐。

“比如机器回答在上海城隍庙吃了上海小笼包和上海烤鸭，从语言角度来看，这都没有问题。哪个更符合事实，它就不知道了，这就需要人介入进来。”孙茂松表示，大模型的对话需要与事实对齐，这还要付出很大的努力，也是目前的研究热点。

对于后者，模型根据现有文本进行分析，不生成新的文本，只理解不说话，就不存在“幻觉”。利用这种理解模型，打通语料，让机器自主学习，就可以依靠模型查询相似诗句，例如哪一诗句和杜甫《绝句》中的“一行白鹭上青天”最接近？大模型的回答是宋代《野景》中的“白鹭一行登碧霄”，这就是大模型所擅长的。

AI最前沿之争是人才的竞争，顶尖高手决定高度

这一波人工智能浪潮起于2010年，彼时学术界和工业界都在开足马力研究，积累了充分的经验，ChatGPT的出现为人工智能点了一把火。孙茂松表示，国内的“百模大战”并非贬义，而是实力的象征。未来通用大模型支撑垂直模型的开发，绝大多数从业者将不会把主要精力放在基础模型上，而是面向行业应用开发垂直模型。

但在通用大模型方面，“我们确实在跟跑，跟领跑者的差距很明显。这半年我们把差距缩小了，但没有质的变化。”孙茂松表示，在ChatGPT之前，国内的大模型研究和国外相比差半个肩位，ChatGPT出现后甩开100米，这半年追了几十米，但在关键性能上还有差距。如果能够研究透彻大模型的机理，就可能棋高一着。

无论是模型还是应用，都离不开硬件厂商或云服务商，算力目前是最稀缺的资源。启明创投发布的《生成式AI》报告显示，GPU的性能实际上决定了这个新兴行业的步调，但从长期来看，人才对人工智能未来的影响超过算力。

孙茂松同样认为，人工智能最前沿之争就是人才的竞争，顶尖高手决定了人工智能的高度，广泛的应用决定了人工智能的广度。人工智能的发展需要一流的人才，这些人才除了具备顶尖的能力，还要有远大的科学理想、敏锐的洞察力和对技术的激情。

清华大学教授孙茂松：理解大模型机理建立AI新理论

理解大模型机理，才能克服局限建立下一代AI理论

语料利用处于粗放阶段，减少大模型幻觉是研究热点

AI最前沿之争是人才的竞争，顶尖高手决定高度

美称在华情报网络重建已取得进展，外交部回应

7月24日，外交部发言人毛宁主持例行记者会。问：据报道，20日，美国中

携号转网被要求交16.2万元违约金，又是吉祥号“惹的祸”

中国消费者报报道（记者李洪涛）随着2019年11月27日携号转网正式在全国

7月27日，2023世界汽车制造技术暨智能装备博览会，助推汽车产业跨越式发展！

2023世界汽车制造技术暨智能装备博览会，洞悉全球汽车产业格局，前瞻业

《逆水寒手游》战力系统怎么提升 战力系统详解

战力主要由装备、打造、武功、辅益四大板块构成，装备：共有5种品质，

美国43轮军援拱火俄乌冲突，俄驻美大使：已“突破道德和常理”

美国43轮军援拱火俄乌冲突，俄驻美大使：已“突破道德和常理”---

朱雀二号遥二发射成功 全球首枚成功入轨液氧甲烷火箭

7月12日，CNMO获悉，由蓝箭航天空间科技股份有限公司自主研制的朱雀二

短道速滑国家集训队主帅张晶：新赛季14项国际赛事，期待老将新人共成长

短道速滑国家集训队主帅张晶：新赛季14项国际赛事，期待老将新人共成长

保护古籍传承文脉 徐州从未缺席

彭祖园刘向雕像。徐州现存古籍。徐州现存古籍。徐州市图书馆珍藏古籍。

美国总统气候问题特使克里将访华

经中美双方商定，美国总统气候问题特使约翰·克里将于7月16日至19日访

拐点显现，指数的春天要来了？

隔夜外盘市场，欧美股市集体收高，道指涨0 93%，标普涨0 67%，纳指涨0

宣恩七姊妹山入选世界最佳自然保护地

7月9日，在2023生态文明贵阳国际论坛上，世界自然保护联盟授予中国13个

xboxones怎么连接笔记本(xboxones怎么连接笔记本电脑)

xboxone不仅可以在电视机上面游玩，也是同样支持在电脑上游玩的，我们

人福非布司他片获批上市

7月11日记者从宜昌人福药业公司获悉，近日，该公司收到了国家药品监督

火锅开在什么地段好？叶小辣火锅加盟为你全面分析开店细节！

目前的创业市场上，餐饮加盟是非常好的一个商机项目，所以大家也都很喜

大学文化建设：“the大学文化”与“a大学文化”须兼顾

近些年，大学文化一直是一个热门的话题，人们对此的讨论大致可以区分出

鸣剑曳影ol好玩吗 鸣剑曳影ol玩法简介

期待已久的手游鸣剑曳影ol即将登陆九游，这款手机游戏吸引了大批玩家的

五年级教案

乐乐学教研网精心为你收集整理了五年级教案（精选17篇），希望给你的工

东莞厚街开展7月份爱国卫生运动暨“洁净城市活动日”活动

文、图 羊城晚报全媒体记者王默为持续做好环境卫生整治提升工作，7月10

中国汽车流通协会：上半年二手车累计交易量同比增长15.6%

中国汽车流通协会：上半年二手车累计交易量同比增长15 6%：据中国汽车

金贵银业: 国泰君安证券股份有限公司关于郴州市金贵银业股份有限公司2014年公司债券违约后续进展的公告（2023年4-6月）

金贵银业:国泰君安证券股份有限公司关于郴州市金贵银业股份有限公司201

河南开展河湖安全保护专项执法行动 重点打击15种违法犯罪行为

河南开展河湖安全保护专项执法行动重点打击15种违法犯罪行为---中新网

央行发布2023年上半年金融统计数据报告

2023年上半年金融统计数据报告一、广义货币增长11 3%6月末，广义货币(M

河北景县铜胎画珐琅技艺：历经几十道工序的“烧瓷”

杨燕正在制作铜胎画珐琅。 高雷 摄手工艺人将敷釉后的铜胎放入炉内烧

上交所公开谴责广汇物流控股股东广汇集团及实际控制人孙广信

经查，广汇物流控股股东广汇集团、实际控制人孙广信在股票买卖、信息披

怎么查询历史机票价格（历史机票价格查询）

么查询历史机票价格，历史机票价格查询这个问题很多朋友还不知道，来为

马钢股份（600808）7月11日主力资金净买入20.27万元

截至2023年7月11日收盘，马钢股份(600808)报收于2 58元，上涨0 0%，换

2022浙江文化和旅游总评榜揭晓 温州市十大文旅项目榜上有名

青灯市集。陈明铭摄朔门古港掀起考古热潮、青灯市集卷起人间烟火、15分

房地产：加强房企融资支持 助力保交楼和防风险

房地产：加强房企融资支持助力保交楼和防风险

猪肉板块震荡下挫 巨星农牧跌超6%

上证报中国证券网讯7月11日，猪肉板块震荡下挫，截至14:02，巨星农牧跌

母婴第一股跌9%，实控人频频减持

母婴第一股跌9%，实控人频频减持,股价,母婴,金发拉比,公司股份

有限公司如何赔偿债务

有限公司由公司承担全部债务，股份有限公司也是一样，法人在股东不滥用

白羽肉鸡半年度总结：上半年先涨后跌，下半年或继续下探

【导语】上半年国内白羽肉鸡价格呈先涨后跌走势，整体处近年同期中高位

网信办：加强“自媒体”管理 加强信息真实性管理

据网信中国消息，为加强“自媒体”管理，压实网站平台信息内容管理主体

书香伴假期

同学们在浓浓的书香中度过假期，享受夏日美妙时光。本报记者许静本报见

多家公募下调基金管理费和托管费 公募基金降费改革拉开大幕

近日，证监会启动公募基金行业费率改革，支持公募基金管理人及其他行业

大奇山景区西瓜价钱偏高？官方：深表歉意，已要求商铺控制成本，让利于客

据浙江省杭州市桐庐县人民政府新闻办公室官方微博：7月10日，桐庐县文

怎样小额投资理财（怎样理财投资）

1、您好！ 适合理财的产品是很多的，除银行定期存款外，大致还

中东部地区有大范围高温天气 黄淮和四川盆地等地有强降雨和强对流天气

据中央气象台网站11日消息，预计7月11日白天，华北中南部、黄淮北

《逆水寒手游》战力系统怎么提升战力系统详解

朱雀二号遥二发射成功全球首枚成功入轨液氧甲烷火箭

保护古籍传承文脉徐州从未缺席

鸣剑曳影ol好玩吗鸣剑曳影ol玩法简介

文、图羊城晚报全媒体记者王默为持续做好环境卫生整治提升工作，7月10

河南开展河湖安全保护专项执法行动重点打击15种违法犯罪行为

杨燕正在制作铜胎画珐琅。　高雷　摄手工艺人将敷釉后的铜胎放入炉内烧

2022浙江文化和旅游总评榜揭晓温州市十大文旅项目榜上有名

房地产：加强房企融资支持助力保交楼和防风险

猪肉板块震荡下挫巨星农牧跌超6%

网信办：加强“自媒体”管理加强信息真实性管理

多家公募下调基金管理费和托管费公募基金降费改革拉开大幕

1、您好！　　　　适合理财的产品是很多的，除银行定期存款外，大致还

中东部地区有大范围高温天气黄淮和四川盆地等地有强降雨和强对流天气

乔任梁父亲突然住院确诊酮症酸中毒

中新网北京7月10日电 (记者高凯)第四届首都高端智库北京交通发展

北京时间7月10日，2023年温网女双第三轮，赛会16号种子张帅多勒海德6-

明日入伏降温防暑应该这样做

湖人40号秀合同细节佩总又赢：预测1度首轮中段夏联发挥逐步提升

因移民政策分歧荷兰政府宣布将集体辞职

腾势N7盲订突破2万台一个月完成订单

现在淘宝联盟商品内容库是淘宝联盟推出的一项优质服务，旨在为广大的

火箭四新援合同细节出炉：格林两年1920万不保障狄龙起薪2260万

　　6月份，内蒙古自治区全区监测的7大类现代煤化工产品价格1升6降，其

城市日期7月5日7月6日涨跌元吨大连18400-1850018400-185000广州18400

古诗词有哪些合集中国古诗词的书籍有哪些?