文/福布斯中国
(资料图片)
阿里大语言模型突然亮相。
4月7日中午,阿里云宣布自研大模型“通义千问”开始邀请用户测试体验。公司称,现阶段该模型主要定向邀请企业用户进行体验测试,用户可通过官网申请,符合条件的用户可参与体验。
此前,业内均猜测,阿里大语言大模型将于4月11日举行的“2023阿里云峰会”上公布,因此并未料到今日就开放内测。
据悉,阿里达摩院在NLP自然语言处理等前沿科研领域早已布局多年,并于2019年启动大模型研发。继多模态大模型M6、语言大模型PLUG之后,阿里达摩院于2022年9月发布“通义”大模型系列。
从官方网站提供的“职场助理”“电影脚本”“写封邮件”“撰写短文”四个示例可以看出,阿里这个大模型主要提供的功能是问答,实现输出简单文字、故事以及资料的收集等等。本质上,通义千问就是一个大语言模型,基本功能就是文本生成。
对于命名缘由,官方并未透露。通义千问的回答是:“通义千问”这个名字来源于两个方面,“通义”意味着该模型具有广泛的知识和普适性,可以理解和回答各种领域的问题。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具备了跨领域的知识和语言理解能力。
“千问”代表了模型可以回答各种问题,包括常见的、复杂的甚至是少见的问题。它表达了通义千问致力于满足用户在不同场景下的需求,无论问题多么复杂或者独特。综合起来,“通义千问”这个名字表达了这款人工智能语言模型的强大功能和广泛适用性。
例如,网站“百宝袋”页面提供“效率类”“生活类”“娱乐类”三大类别,以及“写提纲”“SWOT分析”“商品描述生成”“小学生作文”“写情书”“为你写诗”等九大场景,供用户内测。值得注意的是,“商品描述生成”正与阿里的电商业务相匹配。
相比3月16日公布的文心一言,通义千问只提供了文本生成功能,并没有强调语音、图片等多模态功能,但从用户需要的场景出发,提供了易用性和亲和力。
通义千问并不完美,但其自然语言处理、上下文理解等方面的表现都中规中矩,毕竟目前仍处于内测阶段,生成式AI需要经历不断深度学习和打磨。
目前,大语言模型已成为互联网和初创企业加速布局的热门赛道。如今,百度、阿里两家都开启了大语言模型的内测,华为、腾讯等势必也不会落后太久,所以一场大语言模型的竞争热潮已经来开帷幕。