今年应该没有什么人没听过OpenAI这个公司的大名。
其发布的ChatGPT以震惊世界的形式登场,真正意义上让人感受到AI的智能,2个月就拥有上亿的月活,一跃成为这轮AI浪潮的领导者。
在此之前,其实很多人都没有听说过这个公司。
(资料图片)
OpenAI究竟是一家什么样的公司?未来,它是否能继续引领AI时代,成为一个绕不开的名字?
一、为理想而生
OpenAI成立于2015年,就在前一年,谷歌收购了Deepmind。因为害怕谷歌对于AI技术的垄断,一群大佬坐在一起讨论共同建立一家AI实验室,就是OpenAI。
这些大佬包括硅谷孵化器YC总裁 Sam Altman、Google Brain 的 Ilya Sutskever、互联网支付处理平台 Stripe CTO 的 Greg Brockman 以及大家熟悉的马斯克等。
他们思考的是,如何让AGI在未来更加安全?他们认为首先确定的是,掌握技术的公司不能受任何资本的控制。
于是非盈利组织OpenAI诞生了,大佬们承诺向该企业捐赠超过10亿美元,其中马斯克是最大的资助者。
由Brockman负责,随后公司开始招人,需要最厉害的人。
Brockman会见了深度学习“奠基人”之一的Yoshua Bengio,他给Brockman起草了一份该领域“最佳研究人员”名单。
Brockman选了10位比较重要的人才,做他们的思想工作(挖墙脚),最终有9位愿意加入。他们的薪酬原来超过了“NFL顶级四分卫”的成本(数百万美元年薪),但他们甚至拒绝了原大厂里提高2-3倍要留住他们的天价,加入这个初创企业,拿着“普通”的高薪。
OpenAI第一年的支出是1123万美元,其中超过665万是50多名员工的工资。去掉首席科学家Ilya Sutskever的薪水约190万美元和另外一个首席研究员Ian Goodfellow的80万美元,剩下的平均没多少。
一名谷歌员工表示,他愿意离开谷歌加入 OpenAI,“部分原因是因为团队非常强大,很大程度上是因为它的使命”。这个使命就是:为全人类开发有益、安全的通用人工智能。
这种宏大的愿景,对于顶尖人才真是致命吸引。
所以OpenAI的初始阵容是很豪华的。
OpenAI的诞生背面其实是为了对抗谷歌,但成立后,在2018年底之前,OpenAI各种被谷歌吊打。
先是2016年谷歌DeepMind的AlphaGo击败了围棋顶级选手李世石,然后2017发布了Transformer架构,2018年发布Bert模型,全是AI界的里程碑时刻。而OpenAI几乎没有什么成果。
马斯克很气,不知道他们在干什么,认为不如让自己来搞。于是提议亲自接管 OpenAI,但遭到董事会拒绝。于是马斯克愤然离开了 OpenAI,并立即停止了捐赠。因为是分批兑现,他兑现的捐赠仅在1亿美元,后续数亿美元无法兑现。
AI模型训练非常烧钱,马斯克不给钱,OpenAI可能要倒闭了。
没办法,Sam Altman只好站出来了,毕竟一开始的局是他发起的。
Sam是个牛人,又一个退学大佬。1985年出生,8岁学会编程,本科考上斯坦福,大二选择退学创业,进入硅谷孵化器YC的首批孵化项目、开发了一个名为Loopt的应用,在2012年以4300万美元被收购,27岁的Sam因此获得了500万美元的第一桶金。随后,他和他的兄弟Jack Altman一起创建了Hydrazine Capital,一个专注于早期投资的风险投资公司,投资YC的一些项目,很成功,没几年就财务自由了。2014年,Altman 被YC联合创始人Paul Graham任命为总裁,影响力大增。
2019年Sam辞去了YC总裁的职位,将工作重心转移到OpenAI,并担任CEO,并带着OpenAI走向商业化,形势开始扭转。
2019 年3月11日,OpenAI宣布在母公司OpenAI Inc的非营利主体下,创建一个限制性营利实体OpenAI LP。OpenAI从非营利性转变为“上限”营利性,利润上限为任何投资的100倍。未来一旦累计分红超过100倍的回报,资金就会自动流入OpenAI Inc非营利组织的账户中。
Sam没有在新架构中拥有任何持股,收入只够交保险。站在理想主义的最高点,有点类似以前乔布斯的行为。只要我不从中获得利益,没人能对我的行为动机进行质疑。
除了活下来还要继续达成使命。Sam认为实验室最终可能需要“比任何非营利组织筹集的资金都多”才能实现通用人工智能。
于是OpenAI选择和微软合作。接触的时候,比尔-盖茨亲自参与了对OpenAI合作的审查中,并表示自己不喜欢这项投资。但微软现在的CEO纳德拉不听,2019年7月,微软宣布与 OpenAI 建立合作伙伴关系,并投资10亿美元。
这个10亿美元大部分以微软的Azure云服务的形式兑现,相当于OpenAI免费用微软的云服务来训练和运行AI模型。而微软获得了OpenAI技术的独家权。
OpenAI在Sam的带领下,开始展现出应有的实力。
OpenAI在2020年5月发布的GPT3引发了业内轰动,2021年推出了可以根据自然语言描述生成数字图像DALL-E,在2022年底发布基于GPT3.5的ChatGPT震惊世界,2023年发布GPT4让马斯克等行业大佬直呼别再往上搞了。
2023年年初,微软决定加码,投资额度是100亿美元,持股OpenAI的49%。两边都不吃亏,微软大部分都是给的算力资源以及潜在100倍的回报,OpenAI依旧不会被任何资本控制,还可以得到微软的全力支持,微软赚够了需要无偿交出股权。
根据路透社报道,2024年OpenAI有望实现10亿美元的收入。似乎赚钱对他们来说就和吃饭一样简单,只是愿不愿意吃的问题。
二、为理想而战
OpenAI的GPT-4是目前唯一一个有大量用户愿意为其买单的大语言模型。
UC伯克利主导的组织LMSYS Org发起了一项针对大语言模型(LLMs)的排位赛,截至7月20日的最新版排名共统计了40款AI大模型,前五名都是闭源模型(Proprietary),分别是GPT-4、GPT-3.5-turbo和Claude的三款模型。
OpenAI用不足300人的团队成功超越科技巨头Google成为LLM领域的新领导者,核心在于组织的文化使命和被这个文化所吸引的顶级科技人才。
OpenAI致力于构建安全的通用人工智能(AGI)以造福人类,而如何开发安全的AGI造福于全人类,这里存在两个问题,一个是技术安全问题,另一个是社会安全问题,要确保人工智能技术被引导安全地使用。技术安全还好说,都是顶尖大牛,想做还是有办法,社会安全就较为复杂。
为此他们保持独立,从组织形式,到思考方式,塑造这样的文化氛围,并从内心相信自己所在的是一个非常追求真理的组织,而不是为钱在工作。
只要他们觉得你是对的,是更接近真理的方案,即使是对手谷歌做的,他们依旧会认可并采用。
OpenAI有三个主要的基础模型:GPT、DALL-E 和 Whisper。GPT 是训练用来处理文本内容的最流行的模型之一、DALL-E 可以基于自然语言输入生成图像、Whisper 是一个将语音转换为文本并将一种语言翻译成另一种语言的模型。这三个模型以及在ChatGPT里立大功的“思维链”和人类反馈强化学习(RLHF)技术,它们底层的技术和理论都来自于谷歌。
GPT系列模型和Whisper模型都是基于谷歌在2017年提出的Transformer架构;DALL-E模型使用了谷歌在2020年提出的VQ-VAE2技术;思维链的概念最早由谷歌大脑的研究员 Jason Wei 在2022年1月提出,并在多个任务上展示了其优越的性能和可解释性;至于RLHF,早在2017年6月由DeepMind率先提出。
从技术路径来看,OpenAI完全地实用主义。谷歌有很多技术的思考和储备,都是业内领先并认可的,谷歌不够重视,而OpenAI用起来了,并将它们产品化。
OpenAI视谷歌为对手吗?无疑是的,但是他们的目光却在远方。
从公司架构,到文化使命,到行动逻辑,可以感受到OpenAI确实在贯彻他们的理想。Sam:“我们公司的结构比较特殊,是一家非营利性组织,因此,如果资本高度集中到OpenAI中,那它并不会由股东持有,而是归公司所有,并最终向全世界分配。当利润向全世界分配的时候,就可以考虑UBI(Universal Basic Income,全民基本收入),并以这种方式分配资源。”
近期有消息称,王小川对媒体表示,OpenAI正在测试1000万张显卡同时计算的模型,相当于英伟达目前10年的产能,“完全是登月计划(级别)”。这种离谱的言论如果发生在其他公司身上,大家都会不屑一顾,如果对象是OpenAI,现在会让人觉得或许有那么一点可能性是真的。
三、结语
在GPT4发布的两周后,马斯克联合1000多人,其中不乏很多业内知名科学家和科技领袖签署公开信,以人工智能的安全担忧为由,呼吁所有 AI 实验室应立即暂停训练比 GPT-4 更强大的 AI 模型,为期至少 6 个月。
而不久后《金融时报》报道,马斯克从2月份就开始组建AI团队,已经从英伟达购买1万张GPU芯片,并从谷歌的人工智能部门DeepMind招募了两名大将,也开始加入AI混战。相比相信Sam,他可能更相信自己,能带来真正安全的AI世界。
现在各大科技巨头的AI军备竞赛一旦开始,就很难停下来了,巨头们都纷纷开始行动,瞬间开启百模大战。
OpenAI有优势,但不多,更多来自于领先地位的优势,受众具备领先规模。技术路径上其他科技公司并非做不到,只是之前没想到。
Google被反超或许是一直没有人能够给它造成威胁,但是相信已经紧张起来。众多AI的底层技术理论都来自谷歌,实力很强,只是缺乏紧迫感。
Meta携手微软发布开源可商用版本的LLaMA 2模型,此外多个大模型宣布加入开源模型行列,包括阿里。之所以选择开源,也是看到OpenAI的实力和先发优势,当下与它硬碰硬还不如选择另外一条还没有明显龙头的路。除了谷歌,其他的厂家可能都竞争开源生态为主。仿佛过去安卓面对ios的另辟蹊径。
AI格局未定,在星辰大海面前,OpenAI没有理由停下。
至少第二阶段,OpenAI领跑还是问题不大。8月1日,有外媒报道称,OpenAI 已经为 GPT-5 申请了商标。
编辑/lambor