logo

AI中场战事,大厂大佬瞄准大模型

2023-04-13 17:15:24

一石激起千层浪,年前ChatGPT的横空出世给人工智能领域带来的震撼,不仅余热未消,反而更加火热。

这股浪潮在大洋彼岸的中国互联网科技圈表现尤甚。最新的消息是在4月11日,阿里云宣布阿里所有产品未来将接入通义千问进行全面改造,并开放通义千问,为每家企业打造专属大模型。

仅此前一周,多个广为大家熟悉的企业,相继披露在大模型领域的最新进展:昆仑万维和商汤科技分别发布大模型产品“天工”和“日日新”;华为云对外介绍盘古大模型;京东将在今年发布新一代大模型“ChatJD”;360则将于近日开启基于360GPT大模型开发的人工智能产品矩阵“360智脑”的内测……

论捷足先登,当属百度,在一个月前已发布类ChatGPT聊天机器人“文心一言”,让人领略了一番它的文学创作能力。而接下来,腾讯、字节跳动、同花顺等企业的AI大模型产品也将陆续亮相。

可以说,从算力到应用,中国人工智能领域已经在AI大模型这条赛道上按下了狂飙盘。

科技大佬联袂登台

除了科技大厂纷纷下场外,大模型的这股热潮,也点燃了诸多科技大佬的创业热情。如果按照背景来划分的话,可以将他们分成“大佬队”“大厂高管队”和“学院派”几大队伍。

最被外界看好的“大佬”当属王小川。4月10日,离开搜狗已经500多天的王小川低调亮相。在媒体沟通会上,他正式宣布开启人工智能大模型领域创业,与前搜狗COO茹立云联合成立人工智能公司百川智能,旨在打造中国版的OpenAI,研发并提供通用 AI 服务、基础大模型及颠覆性上层应用。

大模型研究首先比拼的是专业人才。王小川表示,过去几个月,百川智能以前搜狗团队为基础,快速融合来自知名科技公司的核心团队,预计在4月底公司将打造一只50人规模的精英团队。

最高调的“大佬”非前美团联合创始人王慧文莫属。2月,王慧文发布了一则“AI英雄榜”,打响2023年大佬下场AI创业的第一枪。他宣布打造中国的OpenAI,成立“光年之外”,个人出资5000万美元,估值2亿美元,自有资金占股25%。3月8日,美团创始人王兴宣布以个人身份参与“光年之外”的A轮投资。

AI大牛李开复也是高调入场。3月19日,其在朋友圈宣布成立Project AI 2.0公司。

在“大厂高管队”中,一部分是赶着AI热潮选择离职下场创业。3月20日,素有“AI框架领域第一华人”之称的阿里VP贾扬清从阿里离职。据传新创业方向,就是关注包括大模型在内的AI应用。

另一部分则是在前几年就已经入局创业。快手前MMU李岩在2022年下半年成立了AI公司“元石科技”,主要进行多模态大模型的研发;曾担任京东集团高级副总裁、集团技术委员会主席的周伯文在2021年成立的衔远科技,入局人工智能大模型;出门问问创始人李志飞则是在2020年底开始训练自己的大模型UCLAI。

以清华大学和复旦大学为代表的“学院派”也不甘示弱。如“智谱AI”,便是由清华大学计算机系唐杰教授
参与创立,在去年9月就获得数亿元人民币B轮融资;由交互式人工智能(CoAI)课题组教授朱小燕和其学生黄民烈团队领导的聆心智能,也是一支赫赫有名的清华系NLP(自然语言处理)队伍,他们先后提出过SentiLARE、StoryGPT等预训练模型。

复旦大学的大模型灵魂则是复旦邱锡鹏教授团队。今年2月,这个团队携上海人工智能实验室发布了“国内第一个对话式大型语言模型MOSS”。

并非一朝一夕之功

励志话语中有一句,开始行动就算成功了一半。但这句话丝毫不适用于大模型。

业内人士称,全国做大模型的人才规模仅100人左右,在市场上属于“一将难求”的状态,仅此一项要求,就淘汰了何止99.9%的公司和跃跃欲试的大佬。

更何况大模型需要庞大的资金支持。华为大模型负责人田奇就表示,大模型开发和训练一次就需要1200万美元。也难怪在王慧文宣称出资5000万美元时,被海通证券分析师郑宏达一顿diss,“互联网的人啥都不懂,就只会营销,一点都不踏实”。

不过,与这些“人精”大佬靠着极强的汇聚资金和人才整合能力,才获得难得的入场券不同,尽管大模型是在ChatGPT大火之后才更多被镁光灯关注,但互联网大厂们早已开始行动并取得了一定的积累。

例如最先发布类ChatGPT“文心一言”的百度。王小川表示,创业搜狗的背景是他带领团队做大模型的最大优势。“搜索就是做语言,在 AGI 方向,做语言是很大的优势。”

话说到这里,百度自然也有话语权。在AI领域,自2012年成立AI部门开始,百度在10年时间里累计投入到AI方面的研发费用超过了1000亿元,是全球大厂中极少数具有能支撑训练大语言模型的公司。在2019年,百度推出了文心大模型ERNIE 1.0。目前,ERNIE 3.0每天接受数十亿用户的搜索请求和其他百度移动生态App的训练。

作为阿里的研发大脑,阿里达摩院也从2019年开启了对大模型的研究,并在2020年初启动了中文多模态预训练模型M6项目。2021年3月,M6于首次发布,后来通过480块GPU更迭至万亿参数,并成功在10天内训练出10万亿模型,其参数规模与GPT-3相当,但能耗仅为其1%。去年9月,阿里达摩院发布了通义大模型底座。

不过,相较于展示通义千问的技术硬参数,阿里云更热衷展示它为业务带来的想象空间。所以阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇就表示,阿里巴巴所有产品未来都将接入通义千问大模型,进行全面改造。而“我们将开放通义千问的能力,帮助每家企业打造自己的专属大模型”,则有点当初阿里云抢占云计算市场的味道了。

同样是基于自身优势,腾讯公司则于上月底对外发布了全新的AI智能创作助手“腾讯智影”。AI大模型方面,2022年4月,腾讯首次对外披露“混元”大模型研发进展—“混元”集CV、NLP、多模态理解能力于一体。去年年底,腾讯“混元”进一步推出国内首个低成本、可落地的NLP万亿大模型,并再次登顶自然语言理解任务榜单CLUE。

根据田奇的介绍,华为云从2020年9月开始推动立项。2022年11月,盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型同期亮相。

目前,这几大模型已经陆续投入应用。其中,盘古CV大模型覆盖了工业质检、物流仓库监控、时尚辅助设计等行业;盘古NLP大模型覆盖了智能文档检索、智能ERP、小语种大模型等领域,比如去年交付了一个阿拉伯语的千亿参数大模型;盘古科学计算大模型也用在了气象预报、海浪预测等方向。

值不值得投?向左还是向右?

据瑞银此前预计,整个生成式人工智能应用程序的市场规模或高达1万亿美元。

资本是最敏感的。ChatGPT在语义理解和内容生成方面的突破性表现,直接点燃了资本市场的“热情”,诸多ChatGPT概念股大涨。

以三六零公司为例,喜欢抢风口的三六零,曾经跨界至浏览器、手机、智能家居、国产游戏以及新能源车等领域,但都没掀起多大风浪。如今在这波热潮下,集人工智能、数据安全和ChatGPT于一身的三六零,成为最大的受益者之一:

截至4月4日收盘,三六零股价报收20.08元,涨4.58%,总市值1435亿元。而在今年年初,三六零股价仅为从6.54元,涨幅超200%,市值大涨967.43亿元。

在业内人士看来,这是1月微软被传投资100亿美元与OpenAI合作所带来的羊群效应。

但在清明节过后,此前连续上涨的ChatGPT概念股迎来集体回调。截至4月12日收盘,三六零股价已经跌至16.90元,相比4月4日,市值跌去200多亿元。有业内人士表示,从估值上看,很多上市公司的股价,已经逼近市场能够炒作的极限了。这次ChatGPT大跳水,资本“收网”的味道很浓。

不过在一级市场,即便大模型自带“真香”定律,但基于其自研所需动辄数亿元的“钞能力”,VC表现了出看多投少的态度。据猎云网,有投资人直言,真实情况是项目根本抢不起来。一是估值体系还不成熟,二是国内存在商业化落地以及时机的不确定性。

确实,虽然AI大模型带来了革命性的技术革新,但商业模式的探索和实践仍需要时间和大量的资源投入。

而当下中国AI大模型的发展阶段,按照知名互联网专家郭涛的说法,则是“正处在从实验室走向大规模商业化的早期阶段,存在核心技术不成熟、成熟落地场景较少、生态系统不健全等突出问题”。

另外,这一领域带来的安全问题也十分值得关注。就连一向以脑洞大开著称马斯克,近日也与上千名人工智能专家及AI行业高管签署联名信,呼吁暂停训练比OpenAI推出的GPT-4更强大的人工智能系统至少6个月,理由是这种系统对社会和人类构成潜在风险。而基于数据隐私的考虑,意大利已经禁止使用聊天机器人ChatGPT,并限制开发这一平台的OpenAI公司处理意大利用户信息。英国、法国、德国甚至ChatGPT的大本营美国等也提出了对这一问题的关注。

就在通义千问发布当天,国内也出台了相关完善政策。4月11日,国家互联网信息办公室发布关于《生成式人工智能服务管理办法(征求意见稿)》公开征求意见的通知,对生成式人工智能产业给出较为详尽的规定。

但不论如何,在百度创始人李彦宏眼里,深度学习算法已是第四次科技革命的标志。那么,已然投身大模型的公司该如何做?或许正如阿里云智能CTO周靖人在阿里云峰会所说,不应追求速胜,而是应该坚持打“持久战”,花时间将上述问题一一填平,筑牢发展的根基,从而在这场不可缺席的较量中保持底气和信心。

作者:华秋实 来源:柒财经 

分享到:  

热点

推荐

快讯