当前位置: 首页 > 时讯

天天观点：AI大模型之战，大厂为何都在“重复造轮子”？

发布时间：2023-04-14 19:26:45 来源：光锥智能

“不敢下手，现在中国还没跑出来一家绝对有优势的大模型，上层应用没法投，担心押错宝。”投资人Jucy向光锥智能表示，AI项目看得多、投得少是这段时间的VC常态。

ChatGPT点燃AI大爆炸2个月中，中国一直在等待自己的GPT-3.5。

AI真的冒犯到了打工人。游戏团队替代掉30%的原画师，电商团队用AIGC生成低成本数字人模特，基础程序员也感受到了被降维打击的焦虑……眼看着GPT在国外要将所有领域都重新做一遍的趋势，科技颠覆裹挟着金钱的味道滚滚而来。

【资料图】

于是，除了焦虑的打工人，企业急着用大模型降本增效，创业者急着接入大模型推出新产品，股市急着用ChatGPT概念割韭菜，培训机构更是先赚一波为敬。

衬托之下，反而显得喜欢追逐风口的中国科技巨头们比以往更沉得住气。果然，周期使人成长，公司也是。

终于，众望所归、望眼欲穿、姗姗来迟，4月第二周，中国也迎来了新一代大模型的密集发布。

继通义千问开放测试4天后，张勇在接手阿里云后首次亮相，宣布所有阿里产品未来将接入“通义千问”大模型，进行全面改造；
商汤科技在10日的技术交流会上，演示了“日日新”大模型的能力：对话、AI绘画、编程、数字人，第二天开盘大涨9%；
华为盘古大模型在8日低调亮相，并于10日发布新产品；
明星创业者王小川公开亮相，携手搜狗老搭档茹立云正式开启AI创业的新征程，将在下半年推出百川智能的大模型；
毫末发布首个自动驾驶大模型DriveGPT雪湖·海若，把人类反馈强化学习引入到驾驶领域；
就连游戏公司昆仑万维也赶来凑热闹，宣称“中国第一个真正实现智能涌现”的国产大语言模型将于17日启动邀请测试，但随后被媒体质疑其借热点炒作股价。

热热闹闹、真真假假，大模型一时竟然有点乱花渐欲迷人眼。中国的大模型怎么就一下子如雨后春笋般都冒了出来？如果不重复造轮子，大家还能干点什么？

虽然是摸着Open AI过河，但中国大模型也都迈入了无人区。

涌现之前：亦步亦趋，又分道扬镳

如果要为AI大模型找一个时间节点，2019年应该是关键的一个。

这一年2月，远在大洋彼岸的OpenAI推出了GPT-2，恰好也是这个时间点，微软慷慨地投入了10亿美元，让OpenAI从“非营利性”组织变成了“盈利上限”组织。

大概在一个月之后，太平洋的另一边，百度发布了ERNIE1.0，成为中国第一个正式开放的预训练大模型。

但这种第一其实有很多，比如华为的盘古大模型，业界首个千亿参数的中文语言预训练模型；比如阿里的M6，中国首个千亿参数多模态大模型；再比如腾讯HunYuan，国内首个低成本、可落地的NLP万亿大模型……

总之，只要定语加的足够多，就总能在某个领域当第一。那段时间，从硅谷到北京西二旗、再从五道口到上海临港，包括华为、阿里、腾讯、商汤在内，凡是有能力的企业，都开始涉足AI大模型的相关研究。

但中国第一波AI大模型的“涌现”却是在两年之后。

2021年，曾任职过微软亚洲工程院院长、后被雷军亲自邀请到金山接替求伯君任CEO的张宏江，牵头成立的智源研究院发布“悟道1.0”，包括国内首个面向中文的NLP大模型、首个中文通用图文多模态大模型和首个具有认知能力的超大规模预训练的模型等等。

智源成立于2018年，也就是OpenAI发布GPT-1的前五个月，作为北京市和科技部牵头成立，并集合学界和头部科技企业资源的研究机构，智源其实是中国早期探索AI大模型的一个代表。

可以说，“悟道1.0”其实为中国后来所有AI大模型的一个样本。除此之外，智源研究院还为中国构建了大规模预训练模型技术体系，并建设开放了全球最大中文语料数据库WuDaoCorpora，为后来其他企业发展AI大模型打下了基础。

也正是在“悟道1.0”之后，中国大模型开始出现井喷的状态。

2021年，华为基于昇腾AI与鹏城实验室联合发布了鹏程盘古大模型。2022年，阿里发布了“通义”大模型系列，腾讯发布混元AI大模型……

在中国AI大模型如雨后春笋般涌现的同时，国外的AI大模型也走到了从量变到质变的节点。

2022年11月，OpenAI发布了基于GPT-3.5的ChatGPT，彻底打开了人工智能的魔盒，然后就是席卷全球的AI 2.0浪潮。

事实上，如果以2018年GPT-1发布为节点，中国的AI大模型的发展与国外的发展脉络一直都亦步亦趋，但ChatGPT为什么并没有出现在中国？

这其实和国内外AI大模型两种不同的发展路径有关。

从目前国外具有代表性的AI大模型产品来看，比如ChatGPT、Midjourney、Notion AI或者Stable diffusion等等，都是以C端用户为基础的产品。

而反观国内，目前大模型的主要应用场景都在B端。

比如阿里的“通义”大模型的典型应用场景包括电商跨模态搜索、AI辅助设计、开放域人机对话、法律文书学习、医疗文本理解等等，而腾讯的HunYuan-NLP-1T大模型则应用在腾讯广告、搜索、对话等内部产品落地，或者像商汤的大模型，为自动驾驶、机器人等通用场景任务提供感知和理解能力支持。

之所以选择To B，一个重要的原因是，B端更容易进行商业化。

To B的行业特点导致中国的AI大模型并不需要做到非常大的参数规模，甚至于当ChatGPT出来之后，国内的公司讨论的一个重要方向，是如何将已有的大模型规模“做小”，应用到具体的行业上。

所以中国采用谷歌BERT路线的AI大模型会比较多，以更小的参数，做更有效率、更适合垂类的场景。

所以某种程度上，从出生的第一天，中国大模型就带着商业化的任务。

而国外To C的大模型则不同，如ChatGPT的用户在短短两个月就达到一亿，其底层预训练大模型GPT-3.5作为通用大模型，“大”成为参数的一个基本要求。

这在某种程度上促进OpenAI不停为GPT增加参数，然后激发更强大的“涌现”现象，最终实现“大力出奇迹”的ChatGPT。

因此，To B和To C两种完全不一样的发展路径，也将中国和美国的AI大模型引向了两种完全不同的发展方向。

不要重复造轮子，但大家都想当轮子

“基建狂魔”的称号在大模型上再次得到验证。

到目前为止，中国已经发布的AI大模型产品已经发布了5个，而这之后，还有5个AI大模型产品正在赶来的路上。

模型大乱斗已经开始。

大部分国内的大模型能力都在GPT-2的水平上，但关注度却远远高于GPT-2推出时，这就造成了一种尴尬的局面——明知道还没有完全准备好，但却不得不积极地在推进模型发布，似乎稍微晚一点就会错过整个市场。

的确，无论是市场还是技术本身，都在要求企业更快地将大模型推向市场。

从技术上讲，越早进入市场就能越早地获得用户的使用数据，进而推动模型优化迭代。从市场角度而言，当国外AI大模型与产业结合带来更高效率的同时，国内企业也存在同样的需求。

比如目前，光锥智能向多个SaaS公司调研发现，几乎都已经接入GPT-3.5，目前在同步测试文心一言中。

而对于推出大模型的企业来说，这个时候抢占市场先机就变得尤为重要。

某头部机构负责AI的投资人告诉光锥智能，“中国现在被排除在ChatGPT生态之外是非常危险的。”

他认为，虽然应用层存在更大的创业机会，但应用层的所有应用却都依赖于大模型而存在。就像PC互联网时代，所有的桌面应用都基于Windows开发，而移动互联网时代所有APP又都基于Android或iOS系统一样，在模型即服务的时代，也需要出现一些“操作系统”级别的底层大模型。

目前国外GPT-4已经明确可以成为这样的存在，但国内还没有相应的大模型出现。因此，在底层大模型的格局还未明朗的情况下，一旦大模型的市场格局发生变化，建立在大模型之上的应用也将付之东流。

这也成为许多投资人不愿意现在就下场的原因，他们想让这个市场再跑一跑，等待一个明确能够成为“操作系统”级别的底层大模型出现。

所以，无论是百度还是阿里，在推出大模型之后，第一件关心的事就是——是否有更多企业能够达成合作。

比如，在2月份明确文心一言推出计划后，百度就开始积极推进不同行业的企业接入文心一言，到3月16日百度发布文心一言时，已有超过650家企业宣布接入文心一言生态。而在4月7日，阿里官宣“通义千问”之后，第一件事也是向企业开放测试邀请。

如今国内的AI大模型正处在竞争“谁能成为底层操作系统”的阶段，各家积极推出自己的大模型，开放内测，引导企业入驻，一个核心目标就是围绕大模型建立起自己的模型生态。

这是大厂能否在下一个时代继续成为大厂的关键。下一个AI时代的船票并不是大模型，而是围绕大模型建立起来的生态。

因此，即便所有人都在口口声声表示不要重复造轮子，不要浪费资源建立一个同样的大模型，但机会当前，所有人都在重复造轮子。

但如今从百度到阿里，再从华为到商汤，底层大模型的战争也才刚刚开始，毕竟不只是像腾讯、字节这样的科技巨头，还有像王小川、王慧文、李开复等创业大佬也在虎视眈眈。

王小川、王慧文都先后入驻搜狐网络科技大厦，五道口似乎又恢复了之前的荣光。

毕竟，许多人都感觉到，“这是一次文艺复兴”。

到目前为止，更多具有竞争力的玩家还没有完全下场，但底层大模型的“百团大战”却已经一触即发。

AI热“两极化”，中间真空

大模型让AI公司越来越重。

4月10日，商汤在公布“日日新SenseNova”大模型体系的同时，其实还提到另一个关键点，即依托于AI大装置SenseCore实现“大模型+大算力”的研发体系。

为了满足大模型海量数据训练的需求，原本可以轻装上阵的算法公司，开始自己做云，也自建人工智能数据中心。

另一个案例就是毫末，这家自动驾驶公司为了用大模型训练数据，也建了自己的智算中心。

这些垂类的AI巨头和独角兽，之所以要自己做得这么重，最重要的原因之一，就是市面上几乎没有高性能的现成产品可以满足。

近年来，大模型参数量以指数级的速率提升，而数据量随着多模态的引入也将大规模增长，因此就必然会导致对算力需求的剧增。例如，过去5年，超大参数AI大模型的参数量几乎每一年提升一个数量级。过往的10年，最好的AI算法对于算力的需求增长超过了100万倍。

一位商汤员工表示，商汤上海临港AIDC的服务器机柜设计功耗10千瓦~25千瓦，最大可同时容纳4台左右英伟达A100服务器，但普通的服务器机柜普遍设计功耗以5千瓦居多，而单台A100服务器的功耗即高达4.5千瓦左右。

科技巨头就更是如此，每个巨头都希望在自己的生态中形成闭环，一定程度上也是因为整个国内开源的生态不够强大。

目前，大模型产业链大致可以分为数据准备、模型构建、模型产品三个层次。在国外，AI大模型的产业链比较成熟，形成了数量众多的AI Infra公司，但这一块市场在国内还相对空白。

而在国内，巨头们都有一套自己的训练架构。

比如，华为的模型采用的是三层架构，其底层属于通识性大模型，具备超强的鲁棒性的泛化性，在这之上是行业大模型和针对具体场景和工作流程的部署模型。这种构架的好处是，当训练好的大模型部署到垂类行业时，可以不必再重复训练，成本仅是上一层的5%~7%。

阿里则是为AI打造了一个统一底座，无论是CV、NLP、还是文生图大模型都可以放进去这个统一底座中训练，阿里训练M6大模型需要的能耗仅是GPT-3的1%。

百度和腾讯也有相应的布局，百度拥有覆盖超50亿实体的中文知识图谱，腾讯的热启动课程学习可以将万亿大模型的训练成本降低到冷启动的八分之一。

整体来看，各个大厂之间的侧重点虽然有所不同，但主要特点就是降本增效，而能够实现这一点，很大程度上就是受益于“一手包办”的闭环训练体系。

这种模式在单一大厂内部固然有优势，但从行业角度而言，也存在一些问题。

国外成熟的AI产业链形成了数量众多的AI Infra公司，这些公司有的专门做数据标注、做数据质量、或者模型架构等。

这些企业的专业性，能够让他们在某一个单一环节的效率、成本、质量上都要比大厂亲自下场做得更好。

比如，数据质量公司Anomalo就是Google Cloud和Notion的供应商，它可以通过ML自动评估和通用化数据质量检测能力，来实现数据深度观察和数据质量检测。

这些公司就像汽车行业的Tier 1，通过专业的分工，能够让大模型企业不必重复造轮子，而只需要通过整合供应商资源，就能快速地搭建起自己模型构架，从而降低成本。

但国内在这一方面并不成熟，原因在于：一方面国内大模型的主要玩家都是大厂，他们都有一套自己的训练体系，外部供应商几乎没有机会进入；另一方面，国内也缺乏足够庞大的创业生态和中小企业，AI供应商也很难在大厂之外找到生存的空间。

以谷歌为例，谷歌愿意将自己训练的数据结果分享给它的数据质量供应商，帮助供应商提高数据处理能力，供应商能力提升之后，又会反过来给谷歌提供更多高质量数据，从而形成一种良性循环。

国内AI Infra生态的不足，直接导致的就是大模型创业门槛的拔高。

王慧文刚下场做光年之外的时候曾提出5000万美金的投入，这笔钱其实是李志飞为他算的，具体可以分为2000万美金搞算力，2000万美金找人，1000万美金做数据。这体现出一个直接的问题，如果将在中国做大模型比喻成吃上一顿热乎饭，那必须从挖地、种菜开始。

目前，在AI 2.0的热潮中，一个重要的特点就是“两极化”：最热门的要么是大模型层、要么就是应用层。而类似AI Infra的中间层，反而有很大的真空。

别都盯着造轮子，能造一颗好的螺丝也很重要。

结语：巨头&创新者

王小川和百度的隔空口水战，成为最近大模型混战中一个热闹的插曲。

“高富帅”李彦宏认为，中国基本不会再出OpenAI，用巨头的就可以了。

“直男”王小川说，“行业中有些人”对未来的观点从来就没有判断对过，一直活在平行宇宙里。

除了陈年恩怨，这大体上可以看作是巨头和创业者之间的立场对立：巨头都喜欢包揽一切，而创业者则喜欢打破常规。

而科技行业的成功似乎更依仗于创新。毕竟，从打造AlophaGo的DeepMind，到发布ChatGPT的OpenAI，没有一个是从巨头中孵化出来的。

这就是创新者的窘境。

对于科技巨头而言，自己造轮子固然重要，但能找到、孵化出下一个OpenAI又未尝不可呢？

标签：

湖南农资类产品抽查合格率均维持在90%以上质量状况总体平稳

2022-03-18

企业

新当家人相继到位白酒行业发展也进入量质并进阶段

财经

丽人丽妆一季度净利预减109.75% “抖音转型”或成主因

2022-08-08

全国“100个城市消费者满意度”排名出炉宜昌位居第12位

2022-03-18

天天观点：AI大模型之战，大厂为何都在“重复造轮子”？

天天观点：AI大模型之战，大厂为何都在“重复造轮子”？

两极热，中间空

环球速递！北京大学，签约天津！

北京大学，签约天津！

天天微速讯：哲理故事大全：“井水”哲理相关作文 执著与放弃的哲理故事相关

抄写作文网小编为大家提供哲理故事大全：“井水”哲理相关作文执著与放弃的哲理故事相关来供大家参考，欢迎阅读。哲理故事大全：“井水”哲理

全球快资讯丨深圳：一季度人民币贷款增加4540.8亿元 存款增加6021.19亿元

深圳一季度人民币存款增加6021 19亿元，同比多增5286 31亿元；一季度人民币贷款增加4540 80亿元，同比多增2128 09亿元。

环球新资讯：藏龙卧虎？快船的板凳新人竟然是发展联盟赛场的顶级中锋？

藏龙卧虎？快船的板凳新人竟然是发展联盟赛场的顶级中锋？,内线,快船队,nba

观天下！全球最大FSRU型LNG船舶将进靠香港LNG接收站

13日从广州海事局了解到，全球最大FSRU(浮式储存再气化装置)型LNG船“挑战者号”在广州海事局与香港海事部门精心组织下，经担杆定线制顺利抵达

世界即时：电力安全警示心得体会 电力方面警示录的读后感(100分)

今天来聊聊关于电力安全警示心得体会，电力方面警示录的读后感(100分)的文章，现在就为大家来简单介绍下电力安全警示心得体

世界今头条！半导体库存周期是否拐点已至？北方华创：由供需决定

半导体库存周期是否拐点已至？北方华创：由供需决定,北方华创,库存周期,半导体设备

全球通讯！石家庄市长丰街道保利花园第二社区开展“健康成长，安全童行”活动

2023年4月12日，石家庄市长安区长丰街道保利花园第二社区党总支、保利花园第二社区新时代文明实践站联合长丰街道社工站，在哈鲁幼儿园开展“健

世界看热讯：消博会上看消费·跨境供需对接 交易合作活跃

第三届中国消博会正在海南海口举办，65个国家和地区带来4000多件消费精品。消博会在激发国内消费市场潜力的同时，也在为世界经济复苏提供动力。

当前热门：游园赏景，乐享春日时光

随着天气转暖，长春市民纷纷走出家门，游园赏景，乐享春日时光。伴随着“顶流”大熊猫“花花”的走红，全国各地刮起了“熊猫旋风

环球热讯:中电联与隆基绿能举行交流座谈

中电联与隆基绿能举行交流座谈4月12日，中电联与隆基绿能科技股份有限公司举行交流座谈并洽谈合作事宜。中电联党委委员、秘书长郝英杰，隆基绿

焦点播报:有人骂你野心勃勃是什么歌_有人骂你野心勃勃是歌曲脆弱星球

欢迎观看本篇文章，小勉来为大家解答以上问题。有人骂你野心勃勃是什么歌，有人骂你野心勃勃是歌曲脆弱星球很多人还不知道，现在

世界新消息丨4月13日基金净值：华安安华灵活配置混合A最新净值1.6023，跌1.04%

4月13日，华安安华灵活配置混合A最新单位净值为1 6023元，累计净值为1 6023元，较前一交易日下跌1 04%。历史数据显示该基金近1个月下跌2 97%，

快播：TRX Gold(TRX.US)：2023年Q2财报实现营收1009.8万美元

TRXGold(TRX US)：2023年Q2财报实现营收1009 8万美元，前值为333 4万美元，预期值为1235万美元，比市场预期低18 23%。

全球简讯:【歌词翻译+平假名+罗马音】パドドゥ（双人舞）「ヨルシカ」

这次试着加入了罗马音，为可能想要学着唱的人降低了点难度…歌词及翻译依旧来自“时光旅人passerby”，歌词解读在这里如有错误或不足请指正優(

环球新动态：县人大常委会副主任刘春娟带领县人大环资委人员到下达河乡、河栏镇调研全县森林防灭火工作

县人大常委会副主任刘春娟带领县人大环资委人员到下达河乡、河栏镇调研全县森林防灭火工作

每日关注!你的行为或在小区内“上榜”！端州120个小区设置红黑榜

车辆按规定有序停放上红榜居民在电线晾晒衣物上黑榜……从2021年开始，端州区在60个社区、共120个小区设置了“文明行为红黑榜”公示制度，通过

环球今亮点！水发集团进入转型升级高质量发展新阶段

水发集团进入转型升级高质量发展新阶段---4月12日，水发集团举行转型升级高质量发展座谈会。邵泽武指出，水发集团要切实深化改革，不断提升经

天天热点！天娱数科涨停分析：海南自由贸易港，虚拟数字人

天娱数科涨停收盘，收盘价6 6元。该股于9点37分涨停，1次打开涨停，截止收盘封单资金为6584 82万元，占其流通市值0 62%。4月13日的资金流向数据方面

【世界新要闻】中百集团：关于同业竞争承诺目前仍在履行期限内，公司暂未收到股东新的进展情况

中百集团00075904月13日在投资者关系平台上答复了投资者关心的问题投资者董秘您好2021年7月公司第一大股东武商联就同业竞争承诺进行了变更自股

【焦点热闻】聚焦消费提振年 真金白银旺消费

4月7日，游客在洛阳市瀍河区“洛城中街”文商旅综合体街区休闲游玩。近日，洛阳市推出文旅消费集聚区点亮活动，推动“夜经济”

环球看热讯：分布式系统中跟踪的重要性

在现代计算机系统中，分布式系统的出现越来越普遍。分布式系统由多个计算机节点组成，这些节点之间通过网络通信来共同协作完成任务。在这种系

快消息！如何让法治护航“绿色工地”？杭甬复线二期这样做

近日，杭甬复线二期TJ-3标项目部2023年度每周普法课堂开讲，钢筋加工厂一角的“双普”（“工程专业知识普及+法律知识普及”）示范基地迎来了各

天天要闻：头显又要跳票？苹果内部出现大分歧

苹果的混合现实MR头显已经经过多次跳票，不过由于多种原因，这款产品的发布将再度推迟，据新的爆料消息，苹果公司在上周召开了

湖南农资类产品抽查合格率均维持在90%以上 质量状况总体平稳

新当家人相继到位 白酒行业发展也进入量质并进阶段

丽人丽妆一季度净利预减109.75% “抖音转型”或成主因

全国“100个城市消费者满意度”排名出炉宜昌位居第12位

天天微速讯：哲理故事大全：“井水”哲理相关作文执著与放弃的哲理故事相关

全球快资讯丨深圳：一季度人民币贷款增加4540.8亿元存款增加6021.19亿元

世界即时：电力安全警示心得体会电力方面警示录的读后感(100分)

世界看热讯：消博会上看消费·跨境供需对接交易合作活跃

【焦点热闻】聚焦消费提振年真金白银旺消费

湖南农资类产品抽查合格率均维持在90%以上质量状况总体平稳

新当家人相继到位白酒行业发展也进入量质并进阶段