如今,人工智能已经深入到社会的方方面面,渗透到每个人的日常生活,从自动驾驶到人脸识别,再到机器翻译。
然而,大家似乎只知人工智能,却少有人了解机器学习。其实,人工智能得到广泛应用,其底层基石正是机器学习。
绝大多数涉足人工智能的公司,无论是提供解决方案的科技公司,还是应用人工智能的行业用户,都会把机器学习作为其主要业务领域之一。
未来,随着人工智能的社会普及和行业深入,机器学习在产业界的重要性会得到进一步加强。在新兴的大模型领域,会有机会涌现出一批科技创新企业,成为人工智能赛道上真正的明珠。
机器学习是人工智能的基石
机器学习就是让计算机来模拟人类的学习行为,是人工智能的核心,是使计算机具有智能的根本途径。
机器学习具有两个典型的过程,一是训练,二是推理。这两个过程,都需要大量的算力作为保障,尤其是“训练”,不仅需要庞大的AI算力,往往还需要海量的数据。
机器学习的训练和推理,相当于人类的学习和工作。其中训练的过程尤其重要,就像人类要通过16-20年的漫长学习才能具备工作能力一样。训练的结果则是“模型”,类似于人类的知识。而推理的过程则是把模型(知识),应用到实践工作中。
以自动驾驶为例。自动驾驶汽车上都安装了很多摄像头和传感器,用于探测路况。根据采集到的视频等数据,做出判断之后,决定下一步操作:转弯、并线、加速、减速等。这个过程就是推理,推理依赖的不仅是实时采集到的数据,更需要使用训练产生的模型。
训练的工作是在推理之前完成的。自动驾驶公司要进行数十万,甚至上百万公里的实际道路学习。对于测试中获得的图片和影像数据,通过人工等标注方式,告诉计算机什么是路人、什么是车道、什么是限速牌等等。计算机需要通过各种算法对数据进行分析,最后形成了模型,被装载到自动驾驶汽车上。
目前,机器学习被普遍采用的部署方式是:在云侧进行训练,因为需要大量的数据和算力;在边侧或者端侧进行推理,因为需要低时延和贴近应用。
机器学习的不同实现方式
当前,人工智能的主要处理对象是自然语言、图片、视频等,从这些数据中提取信息,进行处理分析,并加以理解,最终落地实际应用。机器学习的对象,也正是这些数据。如何从数据中获得知识,一直是科学界和产业界共同努力的方向。
在机器学习的训练过程中,算法至关重要,有决策树算法、朴素贝叶斯算法、随机森林算法、神经网络算法等等。但这些是科学家们需要努力攻关的,对于产业界而言,更为关注的是机器学习的实现方法。
按照训练(学习)方式的不同,机器学习通常可以分为监督学习、非监督学习和强化学习三大类。
监督学习,也被称为有导师的学习,如同老师教学生一样。在监督学习过程中,训练的每个示例都是要有标注的,就像上面提到的自动驾驶实际道路学习一样。监督学习依赖于高质量的数据,包括数据的质和量。质——必须准确,否则计算机就会学到错误的知识,导致推理出错;量——要覆盖到实际道路的所有情况,否则计算机就不知道该如何应对该情况。
非监督学习,即没有导师的学习,训练的数据不需要做标记,减少了人工做数据标识的工作量,而且能够覆盖人想象不到的情况。比如在AI工业质检中,可能的产品缺陷种类太多,人工很难穷举。非监督学习的实现难度更大,是机器学习的未来发展方向。
强化学习也叫增强学习,其训练过程不需要数据,而是通过特定环境中一系列行为的后果进行学习。强化学习输入的是环境反馈,即奖惩信号,类似于马戏团的动物训练过程。
此外,深度学习和联邦学习,也是机器学习正在快速兴起的两个分支。前者已经在AlphaGo上得到成功实践,后者则由于数据安全的要求而随着隐私计算得到应用。
迅速壮大的行业应用市场
市场研究公司IDC的预测数据显示,未来五年,全球人工智能IT投资规模的年复合增长率约为26.5%;到2026年,中国市场的规模有望达到266.9亿美元,全球占比约为8.9%,位列全球第二。
在这个快速增长的市场中,机器学习算力、机器学习开发平台、机器学习行业应用,将占据非常重要的组成部分。
在算力层面,除了专业的芯片公司,很多科技公司也在开发用于机器学习的芯片。比如,华为的昇腾芯片、AWS的训练芯片Trainium和推理芯片Inferentia、阿里云的推理芯片含光800等。
人工智能应用要想落地,还必须要有机器学习开发平台的支持,这是一个面向开发者、数据科学家、业务分析师的PaaS平台。目前,机器学习开发平台的提供商大致有两类,一类是云服务商,比如AWS的SageMaker、华为云的ModelArts等;另外一类是专业的人工智能公司,比如第四范式的Sage Platform、九章云极的DataCanvas等。
在应用层面,随着越来越多的企业开始数字化转型以及智能化升级,机器学习在行业市场得到了广泛应用,为人工智能赋能产业提供助力。除了人脸识别、自动驾驶、机器翻译等消费级应用,工业质检、新药开发、金融风险评估等企业级应用,也越来越多。
制造行业的AI视觉质量检测,是机器学习最成熟的应用场景之一。IDC预计,到2025年中国工业AI质检整体市场将达到62亿元,年均复合增长率为28.5%。中科创达在Amazon SageMaker之上构建了创达智慧视觉检测系统,帮助某面板制造企业取代人工质检,检测时间从3.5秒降低到0.1秒,准确率从85%提升到99%。
另外比如蛋白质结构研究,是生命科学领域的基础问题。深势科技与阿里云机器学习 PAI 团队合作,通过全新的蛋白质结构预测推理加速方案FoldAcc,结合深势Uni-Fold最新模型代码和参数,将单次预测能支持的最大氨基酸序列长度提升至6.6k,覆盖99.992%已知的蛋白序列。
无论是机器学习的行业应用还是通用应用,未来都会有更多的科技创新企业涉足其中。这也对其提出了更高的要求——既要懂前沿的AI科技,也要有深度的行业洞察,两者缺一不可。
正在快速兴起的大模型市场
从机器学习的实现方式可以看出,“模型”是机器学习的关键环节,它是“训练”的结果,也是“推理”的基础。要得到一个好的模型,需要海量的高品质数据,也需要海量的算力支持,可谓成本高昂。
一方面是模型训练的投资巨大,另一方面是每个行业应用都是差异化的,这就导致需要重复进行大量的模型训练,使得机器学习的成本居高不下,阻碍了行业应用的普及。
大模型的概念,由此而快速兴起。国内一些头部科技公司亦涉足其中,比如华为的盘古和百度的飞桨等。
大模型更准确的叫法应该是基础模型,是大规模预训练的结果,因为有着多达千亿甚至上万亿的参数,而被称为大模型或者超大模型。
大模型被称为规模化生产高性能机器学习模型的生产线:通过提炼各大领域的共性来进行大规模预训练,生产出标准化的基础大模型;然后再根据各个行业不同的共性需求,训练出行业预训练大模型;最后根据具体应用场景的需求,通过少量定制开发形成推理模型,从而落地应用。
这样的逐级训练大模型的方式,可以最大程度降低全社会在机器学习成本上的投入,实现AI应用的规模化落地。仍以自动驾驶为例,如果每个整车厂都要从头开始做模型训练,无疑是很大的浪费,毕竟大家面临的道路情况是一样的。如果有专业第三方公司来训练和提供标准化的大模型,就可以避免重复投入。这样,既降低成本又能提升性能,使自动驾驶更快落地。
大模型市场才刚刚起步,未来发展空间很大,当然变数也很大。训练好大模型和应用好大模型,同样重要。在这两个环节上,未来或许会涌现出一批创业企业,尤其是专注于生产行业大模型的科技创新企业。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。