ChatGPT 访问量首次下滑，“降温”背后大模型需要冷思考

2023-08-25 11:46:54 来源：文汇

文汇报资料照片

大模型似乎没那么 " 热 " 了。今年 6 月，ChatGPT 访问量环比下滑 9.7%，为其推出以来首次下滑。从全球范围看，尽管不断有企业发布或更新大模型，但媒体和公众似乎没那么 " 上头 " 了。

在昨天举行的 2023 世界人工智能大会青年优秀论文奖颁奖仪式暨青年科学家论坛上，复旦大学计算机科学技术学院教授邱锡鹏直言，虽说是 " 百模大战 "，但各家大模型之间同质化严重，实质性的创新比较少。事实上，大模型远未到变成一个单纯的工程问题的时候，距离人们理想中的通用人工智能，其本身还有许多科学问题亟待解决。

" 百模大战 " 其实是挤同一条赛道

(资料图片仅供参考)

" 大模型还有科学价值吗？" 邱锡鹏在开场白中似乎就给大模型浇了一盆冷水。大模型的爆火并非偶然，是几十年科研不断推进的结果，但在 ChatGPT 爆火后，一个明显的变化是这一领域中科学进步少了，大家都寄希望于通过工程手段 " 大力出奇迹 "。

比如，现在几乎所有的大模型预训练都基于 Transformer 架构，这固然是一个非常好用的架构，但其弊端也愈发显现，它所耗费的计算资源非常庞大，需要超级算力的支撑。

另外，生成范式成为主流，这使得想要使用大模型，就必须将自己的任务变成生成式的，即便是那些非常复杂的结构化预测问题也都要用生成式方法解决。甚至，连生成式范式也在趋向统一，原先还有 Seq2Seq（一种用于序列到序列的深度学习模型）和 LM（语言模型）两大类，现在只剩下后者。

而且，研究领域也在萎缩。邱锡鹏说，以自然语言处理（NLP）为例，2015 年之前，这个领域还有多个不同方向，比如对话、问答、机器翻译等，那时的学者各自有着自己的研究，并从别的研究领域中获得灵感，而现在大家都涌向大语言模型这条单一赛道。

大模型面临 " 十大科学挑战 "

尽管大模型展现出通往通用人工智能的潜力，但这条路并不好走。邱锡鹏列出了大模型亟需解决的 " 十大科学挑战 "，包括架构设计、思维链、幻觉、多模态延展、自动化评价、平民化等。其中，大模型的架构创新是当务之急。邱锡鹏说，大模型之所以称为大模型，是因为其庞大的数据量使其拥有了涌现的能力，虽然人们至今不知道涌现是如何发生的，但是否有涌现是区别大模型与小模型的主要特征。换言之，想要大模型更智能，继续扩大其规模是一条显而易见的路。

但是，当下主流的 Transformer 架构已经制约了模型的进一步扩大。这是因为 Transformer 的复杂度是输入字符长度的平方级，每多输入一个字符，计算量就会以指数级增长。因此，" 只有找到更高效的新架构，才能支持未来模型规模的进一步扩张。"

另一个对大模型发展至关重要的问题是评价体系。尽管当下有许多测评大模型优劣的榜单，但业内对此并没有形成统一标准。而且对于擅长 " 刷题 " 的大模型来说，很多数据集上的表现已不足以衡量其真实能力。

颠覆性创新常在 " 冷门 " 处

深入研究创新规律不难发现，越是扎堆的 " 热门 " 圈子，往往难出颠覆性创新成果，ChatGPT 本身就是个 " 冷门选手 " 爆火的案例。在其火遍全球之前，在大语言模型领域，谷歌的 " 理解与生成相结合 " 的路线是绝对的主流，在这种情况下，研发 ChatGPT 的 OpenAI 公司仍然选择坚持走自己的路。

现在，原本默默无闻的生成式 AI 成为了 " 顶流 "。当人们一哄而上投入其中时，仍有一部分人还在坚持以 IBM 沃森机器人为代表的 "AI 符号主义 " 技术路线。以 " 爆款 " 常偏爱 " 冷门 " 的创新规律来看，或许未来的 " 核爆点 " 会奖励默默坚持的 " 少数派 "。

事实上，获得今年世界人工智能大会最高奖项 SAIL 奖（卓越人工智能引领者奖）的论文《机器学习结合阻抗谱技术预测锂电池老化》，就不是一个关于大模型的研究。文章第一作者、中山大学物理学院副教授张云蔚说，她只采集了 2 万个电化学阻抗谱，就实现了 AI 精准建模。比起海量数据，更重要的是思路。就是这样一个小模型，将过去需要花费几天才能实现的电池寿命预测缩短到了 15 分钟，且检测精度是原来的 10 倍。

在大模型爆火的半年多时间里，大家似乎形成了一种共识，即只有资金雄厚和数据储备充足的大厂才有进军大模型的资格。对此，邱锡鹏认为，大模型还有大量科学问题需要攻关，这些问题除了预训练阶段需要耗费大算力外，在对齐、指令微调等方面所需的算力并不高。而随着算法的优化，3090 显卡足以能完成大模型的研究，这是一条小公司也能 " 出奇迹 " 的赛道。

作者：沈湫莎

责任编辑：任荃

* 文汇独家稿件，转载请注明出处。

标签：

上一篇 : 今世缘：8月24日融券净卖出4967股，连续3日累计净卖出1.62万股

下一篇 : 最后一页

推荐阅读

ChatGPT 访问量首次下滑，“降温”背后大模型需要冷思考

文汇报资料照片大模型似乎没那么热了。今年6月，ChatGPT访问量环比下滑

08-25 11:46:54

今世缘：8月24日融券净卖出4967股，连续3日累计净卖出1.62万股

8月24日，今世缘（603369）融资买入1398 59万元，融资偿还1985 15万元

08-25 10:26:44

天神乱漫无忧无虑pc（天神乱漫无忧无虑）

大家好,小福来为大家解答以上的问题。天神乱漫无忧无虑pc，天神乱漫无

08-25 08:55:43

法媒：随着制造业衰退蔓延至服务业，欧元区经济正快速萎缩

法媒：随着制造业衰退蔓延至服务业，欧元区经济正快速萎缩,加息,法媒,

08-25 08:00:24

【盘中宝】算力芯片涨价不断，这一市场潜力增加，成为AI企业破局点，这家公司依托国资平台可为客户提供相关技术服务

财联社资讯获悉，机构指出，进入AI时代，算力资源稀缺问题严重。因供不

08-25 05:54:22

“风水大师”为何能精准算命？上海这37家美容美发店竟是帮凶

据新民晚报8月24日报道，犯罪团伙发展上海30余家美容美发店作为引流渠

08-25 01:34:16

普里戈任飞机坠前爆炸？俄媒：网传照片显示残骸上疑有弹孔，或与防空导弹有关

当地时间8月23日，俄方发布消息称，瓦格纳集团领导人普里戈任在坠机事

08-24 21:59:47

恒大物业(06666)发布中期业绩：持续经营稳定向好

8月24日，恒大物业发布半年报，多项核心指标在上半年实现了稳步增长。

08-24 20:26:28

北京发放消费券撬动消费增长

图片新闻PHOTONEWS北京发放消费券撬动消费增长近期，全国多地通过发放

08-24 18:59:08

南京玄武区举办垃圾分类“邻”距离篝火晚会

扬子晚报网8月24日讯（通讯员王鸿实习生李树节记者张可）为进一步普及

08-24 17:26:45

发力IPv6+关键技术新华三筑基算力网络新底座

8月23日，备受业界瞩目的第七届未来网络发展大会在南京启幕。两院院士

08-24 16:06:51

新岚图FREE正式上市，售价26.69万元

新岚图FREE图企业官网外观内饰方面新岚图FREE略做调整，在车身轮廓基

08-24 14:32:25

关于股指期货知识的一些信息

今天佳肖财经网就给我们广大朋友来聊聊,以下关于的观点希望能帮助到您

08-24 13:03:08

拓维信息：8月23日融资买入9241.72万元，融资融券余额12.29亿元

8月23日，拓维信息（002261）融资买入9241 72万元，融资偿还1 11亿元，

08-24 11:18:55

健康养羊有“凉”策

健康养羊有“凉”策---开启水帘和风机，降下PE防晒网……10分钟后，浙

08-24 10:12:19

上海农商行上半年归母净利润69.28亿元，非息净收入同比增长近三成

8月23日晚间，沪农商行（SH601825）发布半年报。2023上半年，上海农商

08-24 09:03:47

保利发展：8月23日融券卖出金额357.02万元，占当日流出金额的1.1%

同花顺数据中心显示，保利发展8月23日获融资买入2398 21万元，占当日买

08-24 07:52:47

小米12 Pro推送MIUI 14最新版升级谷歌7月安全补丁

【手机中国新闻】小米12Pro是小米品牌旗下一款非常经典的旗舰机型，目

08-24 05:44:37

这么刺激？女主整容后大杀四方，反杀渣男别太爽！

先给大家讲个俗套的故事。这个女孩叫春爱，在酒吧唱跳谋生↓在她好

08-24 01:03:58

七年后，我终于“港漂”上岸

香港还没内地“卷”？

08-23 21:54:58

韩国盐比中国盐好吗专家：没必要效仿韩国囤盐基本情况讲解

1、韩国盐比中国盐好吗2、专家：没必要效仿韩国囤盐3、以上就是关于【

08-23 20:11:16

自然资源部：目前仍处主汛期加强会商研判监测预警

8月23日，自然资源部召开新闻发布会，相关负责人表示，目前我国仍处于

08-23 18:13:46

助力相城“双中心”建设 “相助企航”法律服务工作站揭牌

　　苏报讯（记者王小兵通讯员丁莉华）昨天下午，“聚合涉外司法智慧助

08-23 17:04:53

走，带大家一起走进神秘的楼兰古城景区

今天给大家介绍的是神秘的“楼兰古城”，其实楼兰古城是古丝绸之路上的

08-23 15:46:48

8月23日装修装饰板块跌幅达2%

8月23日14点33分，装修装饰板块指数报438 329点，跌幅达2%，成交15 36

08-23 14:39:17

初秋时髦女人要穿“过膝裙”，遮肉显瘦还高级，散发独特魅力

时尚圈的发展速度真的很快，也有很多人都在说自己的衣品急需提升，可是

08-23 13:10:45

凌晨2点!陈梦传来重磅好消息：刘国梁做出英明决定，球迷齐声点赞

北京时间8月23日凌晨2点，中国乒乓球传来最新消息，据国内媒体报道，随

08-23 11:26:28

2023年上半年全国大学英语四、六级考试成绩24日可查

原标题：2023年上半年全国大学英语四、六级考试成绩24日可查（记者孙竞

08-23 10:12:43

海外势力作“保护伞” 跨境电诈侦办难在何处

近年来，随着数字技术的不断发展，短视频平台成诈骗高发区，跨境电信诈

08-23 08:50:57

华润三九08月22日获深股通增持80.51万股

08月22日，华润三九获深股通增持80 51万股，已连续3日获深股通增持，共

08-23 08:02:05

萌植大作战好玩吗萌植大作战玩法简介

期待已久的手游萌植大作战即将登陆九游，这款手机游戏吸引了大批玩家的

08-23 05:26:54

亿利洁能：截至本公告日公司对全资、控股子公司（含孙公司）已提供的担保余额为50.65亿元

亿利洁能（SH600277，收盘价：3 1元）8月22日晚间发布公告称，截至本公

08-22 23:56:07

如何选择合适的量化交易服务器

更多精彩内容，欢迎关注公众号：数量技术宅，也可添加技术宅个人微信号

08-22 21:32:11

借址办学、校舍维修……洪灾过后，能顺利开学吗？记者探访

开学在即，遭受过洪涝灾害的地区能确保孩子们如期返校开学吗？近日，北

08-22 19:46:09

正阳县交通运输综合行政执法大队召开2023年上半年执法工作总结会

驻马店网讯（通讯员蒋军华）8月18日，正阳县交通运输综合行政执法大队

08-22 18:55:43

永兴县：退役军人勇救落水女子

8月10日，永兴县银都集团员工李光红在自家窗边突然听到南大桥方向有人

08-22 17:45:23

东吴证券：数据资产作为10万亿级别市场具备足够资本驱动力接过土地财政（近10万亿市场）的大旗

投资要点数据要素市场对外构筑国家竞争新优势、对内构建经济增长新动力

08-22 16:40:09

鲁媒：黄河体育中心迈入屋盖钢结构施工阶段，项目预计明年底竣工

直播吧8月22日讯据《济南日报》消息，黄河体育中心专业足球场全面迈入

08-22 15:25:26

倩女幽魂手游灵兽元神攻略,倩女幽魂手游灵兽元神攻略大全

倩女幽魂手游灵兽元神攻略灵兽元神是倩女幽魂手游中非常重要的角色，可

08-22 14:14:30

店铺更名通知（更名通知）

大家好,小福来为大家解答以上的问题。店铺更名通知，更名通知这个很多

08-22 12:57:53

浙江一农商银行被罚75万元

浙江一农商银行被罚75万元【大河财立方消息】8月22日，浙江舟山普陀农

08-22 11:54:35

潘石屹旗下SOHO中国中报后市值缩水10%,近20亿土地增值税未支付

朝阳门SOHO在SOHO中国（00410 HK）披露完公司2023年上半年业绩之后的第

08-22 10:56:34

典型碳化硅功率模块的二三事

本文基于典型的SiC模块封装，讨论一下其涉及到的几个热门问题。典型SiC

08-22 10:18:48

最伤腰的3种睡姿！不想腰椎间盘突出症加重，别这样睡

每个人生活习惯不同，在睡觉时姿势也千奇百怪，但不同姿势带来的影响不

08-22 09:39:57

96家公司获机构调研

数据宝统计，近5个交易日（8月15日至8月21日）两市约96家公司被机构调

08-22 08:54:03

浙江工商业用户电价机制上新，对企业影响几何

近期，工商业用户收到一份全新的电费单。大家发现电价项目不同了，后续

08-22 07:30:33

赖斯本场数据：1关键传球 1解围2封堵1拦截1抢断获评7.4分

直播吧8月22日讯阿森纳在本轮英超1-0小胜水晶宫，新援赖斯本场数据如下

08-22 05:19:59

以真金白银向市场传递信心

近日，证监会有关负责人就活跃资本市场、提振投资者信心答记者问，回应

08-21 23:54:06

皇氏集团：上半年归母净利润同比增121.71%至2.13亿元

皇氏集团8月21日发布2023年半年度报告，上半年实现营业收入18 18亿元，

08-21 21:36:54

重仓环保，明天计划满上！

开盘多点开花，乱涨一气，环保其貌不扬，一个小时过后，大部分冲高回落

08-21 19:54:20

精彩推送

今世缘：8月24日融券净卖出4967股，连续3日累计净卖出1.62万股

天神乱漫无忧无虑pc（天神乱漫无忧无虑）

法媒：随着制造业衰退蔓延至服务业，欧元区经济正快速萎缩

【盘中宝】算力芯片涨价不断，这一市场潜力增加，成为AI企业破局点，这家公司依托国资平台可为客户提供相关技术服务

“风水大师”为何能精准算命？上海这37家美容美发店竟是帮凶

普里戈任飞机坠前爆炸？俄媒：网传照片显示残骸上疑有弹孔，或与防空导弹有关

恒大物业(06666)发布中期业绩：持续经营稳定向好

北京发放消费券撬动消费增长

南京玄武区举办垃圾分类“邻”距离篝火晚会

发力IPv6+关键技术新华三筑基算力网络新底座

新岚图FREE正式上市，售价26.69万元

关于股指期货知识的一些信息

拓维信息：8月23日融资买入9241.72万元，融资融券余额12.29亿元

健康养羊有“凉”策

上海农商行上半年归母净利润69.28亿元，非息净收入同比增长近三成

保利发展：8月23日融券卖出金额357.02万元，占当日流出金额的1.1%

小米12 Pro推送MIUI 14最新版升级谷歌7月安全补丁

这么刺激？女主整容后大杀四方，反杀渣男别太爽！

七年后，我终于“港漂”上岸

韩国盐比中国盐好吗专家：没必要效仿韩国囤盐基本情况讲解

自然资源部：目前仍处主汛期加强会商研判监测预警

助力相城“双中心”建设 “相助企航”法律服务工作站揭牌

走，带大家一起走进神秘的楼兰古城景区

8月23日装修装饰板块跌幅达2%

初秋时髦女人要穿“过膝裙”，遮肉显瘦还高级，散发独特魅力

凌晨2点!陈梦传来重磅好消息：刘国梁做出英明决定，球迷齐声点赞

2023年上半年全国大学英语四、六级考试成绩24日可查

海外势力作“保护伞” 跨境电诈侦办难在何处

华润三九08月22日获深股通增持80.51万股

萌植大作战好玩吗萌植大作战玩法简介

亿利洁能：截至本公告日公司对全资、控股子公司（含孙公司）已提供的担保余额为50.65亿元

如何选择合适的量化交易服务器

借址办学、校舍维修……洪灾过后，能顺利开学吗？记者探访

正阳县交通运输综合行政执法大队召开2023年上半年执法工作总结会

永兴县：退役军人勇救落水女子

东吴证券：数据资产作为10万亿级别市场具备足够资本驱动力接过土地财政（近10万亿市场）的大旗

鲁媒：黄河体育中心迈入屋盖钢结构施工阶段，项目预计明年底竣工

倩女幽魂手游灵兽元神攻略,倩女幽魂手游灵兽元神攻略大全

店铺更名通知（更名通知）

浙江一农商银行被罚75万元

潘石屹旗下SOHO中国中报后市值缩水10%,近20亿土地增值税未支付

典型碳化硅功率模块的二三事

最伤腰的3种睡姿！不想腰椎间盘突出症加重，别这样睡

96家公司获机构调研

浙江工商业用户电价机制上新，对企业影响几何

赖斯本场数据：1关键传球 1解围2封堵1拦截1抢断获评7.4分

以真金白银向市场传递信心

皇氏集团：上半年归母净利润同比增121.71%至2.13亿元

重仓环保，明天计划满上！

鹤壁市淇滨区金山街道：党建引领“三重奏” 环境整治“再提升”

X 广告

行业动态

行业资讯

植物科普

植物收藏

园林景观

绿色生活

ChatGPT 访问量首次下滑，“降温”背后大模型需要冷思考

中老铁路开通在即，建设者回味在“水豆腐”里打隧道的日子

四川宜宾：震后突发山体滑坡村民提前预警紧急转移无人受伤

全省县级唯一！长兴县融媒体中心亮相中国网络媒体论坛

杭州新增两名无症状感染者 156名接触人员核酸结果阴性

青海省西宁市全面解除防范区管控

浙大紫金港校区封闭式管理后：校门口的有序和温暖

ChatGPT 访问量首次下滑，“降温”背后大模型需要冷思考

中老铁路开通在即，建设者回味在“水豆腐”里打隧道的日子

四川宜宾：震后突发山体滑坡 村民提前预警紧急转移无人受伤

全省县级唯一！长兴县融媒体中心亮相中国网络媒体论坛

杭州新增两名无症状感染者 156名接触人员核酸结果阴性

青海省西宁市全面解除防范区管控

浙大紫金港校区封闭式管理后：校门口的有序和温暖

四川宜宾：震后突发山体滑坡村民提前预警紧急转移无人受伤