互联网

艾瑞:回归基础,整合资源,人工智能的升级探索

来源:艾瑞咨询 作者:黄琪丹 2022/3/11 16:32:53

导语:人工智能产业整体正处于从发展期向成熟期过渡的阶段,其作为关键性的新型信息基础设施与技术,为数字经济时代注入新动能,且在行业的辐射广度不断扩大,渗透深度不断加强,逐步蔓延至各行业场景与业务环节。

导语:人工智能产业整体正处于从发展期向成熟期过渡的阶段,其作为关键性的新型信息基础设施与技术,为数字经济时代注入新动能,且在行业的辐射广度不断扩大,渗透深度不断加强,逐步蔓延至各行业场景与业务环节。此外,预训练大模型这一通用人工智能解决方案被广为热议,对应的大小模型云-边-端协同发展模式也被提出。以上的主要趋势演变都对人工智能三要素——算力、算法、数据,提出了新的发展要求,相应领域的应对方案与整合式的人工智能基础设施也随之出现。

一、人工智能的宏观现状及趋势演变

1、人工智能正处于向成熟期跨越的发展阶段

随着2016年AlphaGo战胜人类棋手,开启了新一波人工智能浪潮,人工智能技术及产业进入加速发展期;2021年DeepMind团队开源AlphaFold2数据集,其利用人工智能技术解决蛋白质结构预测问题,供全世界科研人员使用。AI技术应用于生物领域取得的前瞻性进展有力推动了生命科学发展,也代表随着AI算力提升及算法的不断突破创新,AI技术在各行业领域的增量式技术改进、系统性前瞻性研发等重要产业改造环节提供价值。作为智能化转型工具,人工智能在各产业中的参与度逐渐加深,推动各产业的AI模型生产向效率化、工业化的生产阶段演进,而在这一特殊的跨越期内,产业大环境的蜕变对人工智能提出了更高的要求,这就需要人工智能三要素即算力、算法、数据迭代进化。

image001.png

2、人工智能为数字经济时代注入新动能

数字经济是以数据为关键生产要素、以现代信息网络为重要载体、以数字技术应用为主要特征的经济形态。发展数字经济,微观上可能重塑传统的企业经营模式和经营理念;宏观上,数据作为生产要素的重要性不断提升,将对现有基于要素比较优势而形成的国际分工格局带来影响。发展数字经济,将打通供应链上下游、产业链的不同环节与服务链的各个节点,通过产业的数字化升级,实现效率变革、动力变革、质量变革,助力新发展格局的形成与发展。

在此背景下,加快推动数字产业化、推进产业数字化转型成为了企业顺应时代发展、打造数字化优势的主动选择,而人工智能作为数字产业化的商业应用与产业数字化的技术工具,迎来了难得的发展机遇,促使机器学习、NLP、知识图谱等数据治理相关的算法、计算海量大数据所需的算力以及数据数量与质量做出升级与改变。例如,算力需要算法开发平台,AIDC等资源,而数据需要数据基础服务、持续的数据治理能力等资源,以促进多环节提效与AI技术价值的释放,解决需求方人工智能生产力稀缺问题。

3、人工智能正在横纵渗透各行业场景与业务环节

近年来,人工智能技术及产品在企业设计、生产、管理、营销、销售多个环节中均有渗透且成熟度不断提升。同时,随着新技术模型出现、各行业应用场景价值打磨与海量数据积累下的产品效果提升,人工智能应用已从消费、互联网等泛C端领域,向制造、能源、电力等传统行业辐射,这意味着各行业碎片化、多样化的场景将衍生出更多的模型,而跨行业的模型难以复用、模型训练需求增大的情况也会进一步加剧,跨行业通用算法、大型计算中心、差异化开发等针对人工智能三要素的产品与解决方案也就随之产生。

image003.png

4、大小模型云-边-端协同发展

大模型,即超大规模预训练模型,其对运算速度与算法的要求极高,因而需要充足的芯片资源支持与复杂的机器学习算法支撑。自2020年6月OpenAI发布GPT-3以来,各大学术机构与科技企业争先参与到大模型竞赛中,大模型于2021年迎来了大爆发。尽管大模型的研发取得了较大进展,其发展却面临诸多卡点:1)数据方面,国内可用的中文数据集有限,这意味着开发者使用的数据集可能会重复,进而导致各家的大模型能力相近。2)算法方面,参数越多、模型越复杂,模型越难以解释,复杂的大模型成为了“黑箱”,让业务使用者甚至是研发者都无法获知模型的结果与特征之间的关系。3)投入产出方面,成本与回报难匹配,训练所需的芯片成本过高、训练时间过长、碳排放量过高,而训练出的模型可能局限于某些行业业务、普适性差,让大模型沦为一次性的模型,浪费大量资源。4)应用使用方面,客户更注重模型的实用性,很多中小企业研发的小模型即可满足客户的业务需求,且成本更低,性价比更高。然而,宏观经济运行与监管、航空航天量子计算、医药研发、细胞分类等社会与自然科学领域的重大分析任务,以及跨行业的通用模型研究又恰恰需要大模型这一先进工具。对此,大小模型云-边-端协同发展的模式被提出:云端提供充足的算力与数据存储空间,容纳大模型的训练与演变,云端大模型为边、端小模型输送通用知识与能力;而在边与端侧,小模型快速执行推理任务,专注于特定场景的极致化,并向云端大模型反馈数据、成效,解决大模型数据集单一的问题,最终实现功能独立的大模型的全社会共享。这一发展模式,实际上是对算力与算法结构进行了新的构思与畅想。

image005.png

5、可信人工智能将推动行业规范化与技术商业化

新一代人工智能技术迅猛发展,并向社会各个领域加速渗透,这给经济和社会发展带来了新的变革性机遇,也给人类生产生活带来了深刻的变化,与此同时,科技伦理也成为了当前AI产业技术发展与产业应用中的“必答题”。可信人工智能的核心原则是让AI应用满足可靠、安全、可解释、隐私保护、责任明确等条件,是落实AI治理的重要实践,其所遵循的可信特征与AI伦理和相关法律法规等要求一脉相承,均将以人为本作为其本质要求。可信AI使用系统稳定技术、可解释增强技术、隐私保护技术、公平性技术等,促成AI的可靠可控、透明可释、数据保护、明确责任、多元包容,期望解决算法安全应用风险、“黑箱”风险、数据歧视风险、责任主体界定风险、隐私泄露风险等问题。

AI企业作为人工智能技术产品化的主体,在可信人工智能的发展实践中正发挥着日益积极的作用,谷歌、微软、百度、京东、旷视等一批国内外企业纷纷投身其中。科技巨头们在可信人工智能上的投入除承担社会公益和行业引领的责任外,在AI商业化上面临越来越多的限制和挑战也是关键驱动因素。以可信人工智能所包含的隐私保护为例,部分AI企业在接受监管机构上市问询时,被重点要求说明其技术、业务及产品中涉及到数据应用的具体环节,相关数据来源与合规性,以及保证数据合规的具体措施等。这种自上而下的监管推动也将与企业内驱形成合力,共同推动可信人工智能的发展与实践,可信人工智能也将成为AI产业下一阶段发展的重点。

二、迭代发展的人工智能三要素

1、算力:产业新篇章的驱动力

算力资源以芯片作为物理硬件载体,并嵌入运算逻辑与规则,完成训练与推理过程。芯片与服务器进行组装组合,组成数据中心或超算中心,为企业、政府、个人用户提供计算能力与存储空间,驱动各类设备端的AI运算程序。AI芯片与超算中心是应对跨行业碎片化模型、预训练大模型等发展趋势算力解决方案。

以GPU、ASIC、FPGA为代表的AI芯片被广泛应用于云计算、安防、自动驾驶、移动终端等领域,高效支撑AI技术落地应用,成为了算力突破的新增长点。AI应用的算法模型的复杂度不断提升,模型包含的数据密度与量级也在变大,对传统芯片构成了较大的挑战,而AI芯片可针对大规模的数据量、特殊场景模型等情况进行优化设计,满足日渐增长的算力需求,解决算力资源稀缺问题。当前,我国的AI芯片行业仍处于起步期,市场空间有待探索与开拓。据预测,2021年我国AI芯片市场规模为297亿元,到2026年,我国AI芯片市场规模将达到1917亿元,2021-2026年的相关CAGR=45.2%,市场保持快速增长态势。(数据来源:2021年中国人工智能产业研究报告(Ⅳ))

超算中心是解决算力资源稀缺问题的又一解决方案,其以“多”与“大”为特征。“多”指中心内部的服务器与芯片的数量多、可同时承载的模型数量多;“大”指中心的占地面积大、单位算力大、建设运维耗资大。超算中心可分为两类:第一类以国家或地方为建设单位的G端超算中心,服务对象主要为国家牵头的重点科研单位、高校研究院等,此类超算中心是解决国家安全、科学进步、经济发展与国防建设等重大挑战性问题的重要手段,近两年受国家与地方的高度重视与扶持,建设与升级超算中心的趋势愈加明朗。第二类以人工智能厂商、智能云厂商、IDC服务商为建设供应主体的B端超算中心,为企业、事业单位、政府等提供主机托管、计算或存储资源的出租、增值或应用服务。目前,超算中心的建设尚处于起步阶段,其规模空间有待开拓,社会价值也将随着建设的落地而进一步凸显。

2、算法:模型运行的规则指令

算法资源让模型遵循指定的规则指令,让输入的数据按照拟定好的步骤转化为结果输出。一方面,AI技术不断横纵渗透进入传统业务与环节,导致长尾需求不断产生,原有的算法需持续更新;另一方面,企业、政府受限于成本投入、人才培养等因素,在算法开发领域的专业度有限,仅依靠其自身难以推动算法的开发与升级。因此,AI技术开放平台、AI应用模型效率化生产平台等便捷式的算法开发工具产生。依靠AI技术开放平台,企业或个人开发者可直接调用AI技术领先企业的先进算法能力与资源,且开放者可利用开发者的创新应用所编制的算法来反哺开放平台;依靠AI应用模型效率化生产平台,企业或算法工程师可借助专业的AI企业开发能力,针对不同行业的具体业务专门研发算法,并融合低代码开发工具,实现经济合理、高效简易的敏捷开发操作。

3、数据:模型跑动的生产资料

数据资源作为AI模型跑动的生产资料,贯穿AI模型诞生、发展、调整、废弃这一完整生命周期的始终。然而,在挖掘模型数据时,往往面临数据数量与数据质量两大方面的问题。在数据数量上,吻合AI模型的数据数量在成熟应用领域呈现出数据过剩的状态,在新兴应用领域则呈现出数据稀缺的状态,如人脸识别领域所需的图像数据获取难度与标注难度低,人脸数据积累多,而在公安知识图谱领域,数据保密性强且标准不一,数据的获取与处理难度增大,数据积累不足。在数据质量上,数据质量参差不齐,进而导致模型与数据往往无法拉齐,如原有基础数据不达标导致大量脏数据存在,暗数据挖掘不足,按照传统数仓方法论治理后的数据与AI模型要求的数据有差异等,种种质量问题指向丞待展开的数据治理工作。对此,围绕于AI模型的数据治理工程这一概念产生,即面向AI的数据治理。

面向AI的数据治理是指,以具体业务产生的AI模型开发与训练为目的,使用各个数据组件与人工智能技术,对数据进行针对性与持续性的诊治与管理。面向人工智能的数据治理的先后使用NLP——知识图谱——机器学习三项认知智能技术,这三项技术作用于数据治理的多数组件,影响着数据处理能力的强弱,进而影响着AI应用系统智能化程度的高低。读时模式数据完成接入与汇聚后,NLP便开始一系列提高数据可读性、可用性与准确率的工作,将数据转化为人类可理解的文本。知识图谱是紧随其后的一项技术,主要负责构建具备逻辑推理关系的框架、模型,进行知识挖掘与符号推理,但当前NLP大数据处理的准确率有待提升,所以知识图谱的应用还比较受限。机器学习比较特殊,其作为一种底层算法,运用于除数据接入与汇聚外的所有组件,发挥自动化处理的效果,提高数据处理效率。此外,其也是技术环节的最后一环,首先提取知识图谱网络中的特征,然后不断调优算法、训练模型,完成决策与行为动作。至此,面向人工智能的数据治理的类脑信息系统建设基本告一段落。

image007.png

三、人工智能三要素的一体化解决方案架构呈现:商汤科技

为满足人工智能三要素即算力、算法、数据三方面迭代发展的需求,商汤构建了新型人工智能基础设施——SenseCore商汤AI大装置。其通过整合强大的算力基础和领先的算法能力,致力于拆解与碰撞海量数据、深入挖掘数据的潜在价值、打破认知和应用的边界。

1、SenseCore推动实现高效率、低成本、规模化AI创新与赋能

伴随着AI技术的日臻成熟,AI逐渐加快进入产业化落地阶段,但在AI赋能企业数字化转型中,场景碎片化、AI模型开发效率低导致无法满足市场的大量长尾需求、以及工业级应用所需的高性能AI模型生产成本高昂都是不可绕开的痛点。在此背景下,商汤科技打造了新型人工智能基础设施——SenseCore商汤AI大装置,以满足深度学习网络模型不断攀升的算力需求、多行业长尾细分的应用需求以及摆脱人力密集型的开发模式。SenseCore商汤AI大装置通过整合强大的算力基础和领先的算法能力,致力于拆解与碰撞海量数据、深入挖掘数据的潜在价值、打破认知和应用的边界。作为三位一体的业务智能化发动机,其构建了一整套端到端的架构体系,打通算力、平台和算法之间的连接与协同,大幅降低人工智能生产要素的成本,从而实现高效率、低成本、规模化的AI创新和赋能,推动人工智能进入工业化发展阶段。

image009.png

2、SenseCore商汤AI大装置为各行业提供精准服务

AI作为新兴数字产业是“打造数字经济新优势”的重要抓手,对推动产业数字化进程具有不可替代的价值,但在AI赋能企业数字化转型中,场景碎片化问题是不可绕开的痛点。如果这些长尾的需求没有一个统一的AI方法来解决,那么必然要面临大量的人力支出来收集巨量样本。而从技术本身来看,如果技术仍停留在聚焦单一问题以及大量数据的单一训练,将无法实现更好的泛化。因此,AI如何赋能实体经济数字化转型仍存在不少的实施问题。商汤以通用底层基础设施,以工业化AI生产助力覆盖海量长尾场景,成为产业转型、拥抱数字经济的新思路。以商汤服务京沪高铁接触网巡检这一长尾场景为例,基于SenseCore合作推出智能分析系统“星空”,实现了京沪高铁全线智能化检测,助力高铁实施预测性维修。“星空”在设计中,考虑了高铁接触网超过上百类零部件的安装和紧固方法,梳理出高达上千种需要识别的缺陷项点,并融合传统视觉算法和深度学习算法以适配高铁接触网的复杂场景,最终极大提高了检出效率与效果。

image011.png

(本文为艾瑞网独家原创稿件 转载请注明出处)
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 合作伙伴| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15021772号-10

扫一扫,或长按识别二维码

关注艾瑞网官方微信公众号