来源:华尔街见闻原标题:《全球顶尖大模型厂商巡礼》作者:刘高畅
(资料图片)
从正式发布ChatGPT,到推出更强大的GPT-4,再到为ChatGPT插上互联网的翅膀,$微软(MSFT.US)$力挺的OpenAI在短短四个月内不断颠覆外界对互联网的想象,也不断挑动其他科技公司的神经。
微软老对手$谷歌-C(GOOG.US)$率先反击,$Meta Platforms(META.US)$、$亚马逊(AMZN.US)$、$特斯拉(TSLA.US)$、$苹果(AAPL.US)$等紧随其后,国内$百度(BIDU.US)$也推出了文心一言。一场由OpenAI引领的全球AI军备竞赛就此打响。
国盛证券认为,ChatGPT Plugins的发布意味着AIOS大时代的来临,AIOS既是系统也是入口,具有大模型能力潜力、生态能力优秀的科技厂商会更加重要。以OpenAI为代表的基础模型能力边界还在不断的拓宽,有望占据价值链中最主要的环节,成为AIOS时代赔率最高的方向。
在4月2日发布的研报中,国盛证券分析师汇总了欧美布局大模型赛道的科技公司,梳理其类ChatGPT产品的进展情况和未来应用前景。
Plugins发布,开启AIOS超级时代
两周前,OpenAI宣布为ChatGPT添加对插件的支持,这使得ChatGPT能访问其他第三方网站与相关应用,呈现简单的一站式操作。插件具备三大基本功能(检索实时信息、检索知识库信息、代替用户操作应用),开发与调用极其便利。
在国盛证券看来,Plugins的发布意味着AIOS时代的到来,而大模型是AIOS时代赔率最高的方向,有望占据生态链价值量核心。
现阶段大模型生态链分为三类:基础模型、AIInfra、AI应用。
短期来看,以OpenAI为代表的基础模型能力边界还在不断的拓宽,会占据价值链中最主要的环节。
中期来看,随着模型发展速度逐步稳定,Infra层会有更稳定的机会出现,同时应用层也会出现深入某个垂直领域。
由于现阶段大模型的能力还在不断提升,我们预计将会产生类似操作系统的下游生态。因此我们认为,在AIOS超级时代中,价值量最大的环节将是形成生态壁垒的大模型公司。
谷歌、OpenAI两大王者巅峰对决
在AI竞赛中,Google与OpenAI率先布局,两者相辅相成,并各自具备侧重点。
一方面,OpenAI在transformer架构、RLHF、InstructionTuning上与Google同源;另一方面,OpenAI与Google在技术架构与应用层面形成两条发展路线。
在技术架构上,OpenAI的GPT是纯解码器模型,属于侧重生成的单向模型,而Google的BERT是纯编码器模型,属于侧重理解的双向模型。
BER与GPT相似之处,都是基于在海量文本数据中进行无监督的预训练,之后用户根据具体任务再做微调;但由于基础架构区别,与GPT的自生成模式不同,BERT做的更多的是语义预测,对句子整体的理解任务。
在应用领域上,OpenAI更具通用性,GPT模型微调与多模态构成万物互联基础,使用基础模型做细分领域数据微调具备极大优势,效果上基础模型通用性高。
Google向全能型发展,相比GPT-4,PaLM-E在机器人操作规划、视觉问题解答、生成字幕等方面更加全能,可处理视觉、语言和传感器,极可能应用到工业生产。
其他科技大厂:多角度寻找切入点,团队建设相对早期
除了谷歌和OpenAI,其他科技大厂也在火速布局,以Meta、亚马逊、特斯拉、苹果为代表的其他科技大厂由于切入相对较晚,从硬件端、模型端、应用端等多角度各自发力,寻找侧重点追赶AI浪潮。
META:模型体量相对较小,参数范围包括7B、13B、33B和65B,LLaMA-13B在大多数基准测试中都优于OpenAI的GPT-3(175B),有望成为小型企业的福音。
Amazon:AWS与AI创企HuggingFace扩大合作,加速构建生成式AI应用的大型语言模型和大型视觉模型的训练、微调和部署,云计算客户可通过AmazonSageMaker程序访问HuggingFace的AI工具,针对特定用例进一步优化其模型的性能,侧重缩短时间与降低成本。
Tesla:根据TheInformation报道,马斯克与前DeepMind研究员IgorBabuschkin接洽,希望由他领导建立AI实验室。
目前Dojo在经典图像分类模型ResNet-50下,可实现比A100更高的帧率;在自动标注和占用神经网络下,性能远超A100,未来随着大模型在通用机器人领域应用,特斯拉有望获得更大空间。
苹果:公司正在测试自然语言生成,代号为“Bobcat”的新项目将从最新的tvOS16.4测试版开始进行测试,最终将进入苹果的其他操作系统。
六大初创公司:人才与资本加速入局,顶尖闭源落后开源
大厂之外,初创公司也在加快追赶,Anthropic和Adept.ai进展最为迅猛。
Anthropic:由OpenAI前元老创立,目标为AI安全与大模型研究,已获谷歌4亿美金投资。已推出聊天机器人产品Claude,与ChatGPT构成竞争,在部分任务上,可以表现出比GPT3.5更优秀的响应速度。
Adept.ai:成立于2022年,致力于完成一款能够代替人类使用电脑、操控软件的AI助手,旗下模型ACT-1还处于雏形阶段,但根据公司给出的demo,已经可以完成通过自然语言指令自动在房产网页上寻找合适房源,或者在Salesforce上自动添加人员信息等任务。
Character.AI由由前谷歌研究人员Shazeer和DeFreitas创立,Shazeer为Transformer作者之一,代表产品为带有角色特征、人物个性,及上下文对话的聊天机器人,用户可选择不同角色(可以是真实,也可以是虚构的)对话,同时在对话中可影响角色。最近一轮融资估值已达10亿美元。
InflectionAI由LinkedIn联合创始人Hoffman、DeepMind联合创始人Suleyman、前DeepMind研究员Simonyan联合创立,即将开始测试一款消费类产品,目前正在构建的会话型人工智能,并不会回答每一个主题的问题,但将专门协助用户的在线任务,如进行预订和购买。InfelctionAI目前已获得2.25亿美元的股权融资。
Cohere公司是NLP模型提供商,创始人来自谷歌AI团队,包括transformer作者,正在开发面向企业用户的类ChatGPT模型。
HuggingFace公司开发使用机器学习构建应用程序的工具,包括各种机器学习库,并运营让用户共享模型和数据集的开源交流平台。
编辑/Jeffrey