9月20日,在2023中国信息通讯业发展高层论坛上,IEEE卓越行业翘楚、全球云网宽带产业协会董事会主席、中国电信原总经理李正茂作题为《人为智能:从大衔接到大数据再到大模型》的宗旨演讲。李正茂在演讲中指出,电信运营商作为大衔接的建设者、大数据的出产者和大模型的索求实际者,在人为智能发展中表演了沉要角色,有基础、有优势,更有远景。
今年以来,以ChatGPT(Generative Pre-trained Transformer,天生型预训练变换模型)为代表的大说话模型忽然爆火,很快引发了“百模大战”。对全球新一轮的人为智能较量,电信运营商应该怎么意识,从中找准定位并确定下一步发展方向,李正茂结合人为智能的发展史,从大衔接、大数据和大模型三个方面颁发了自己的概想。
大衔接是人为智能发展的基础
人为智能的概想产生于20世纪50年代,是钻研开发用于仿照、延长、扩大和进建人类智能的理论、步骤、技术及利用系统的一门新技术科学。
李正茂暗示,人为智能的钻研指标是使机械可能胜任一些通常必要人类智能能力实现的复杂工作,并出产出能以人类智能类似的方式作出反映的智能机械,其重要钻研领域蕴含机械人、图像鉴别、智能语音,以及说话处置和理解、规划、决策等,要解决的主题问题是构建与人类类似,甚至超过人类的推理、知识、规划、进建、互换、感知、移动和操作物体等能力。
20世纪70年代以来,很多国度先后发展人为智能钻研,全球人为智能的发展经历了几次大起大落。在发展过程中,人为智能领域重要形成了三大学派。
一是符号主义(symbolicism),又称为逻辑主义、生理学派或推算机学派,重要钻研抽象思想,主张用正义和逻辑系统仿照人的思想过程,搭建一套人为智能系统。符号主义者最先提出“人为智能”的概想,并在20世纪80年代获得很大发展。
二是衔接主义(connectionism),又称为仿生学派或生理学派,重要钻研形象思想,主张仿照人类的神经元,用神经网络的衔接机造实现人为智能。衔接主义的重要道理为神经网络及神经网络间的衔接机造与进建算法,被业界称为“最普遍的人为智能”。
三是行为主义(actionism),又称为进化主义或节造论学派,蕴含工程节造论和生物节造论等,重要钻研感知思想,早期钻研沉点是仿照人在节造过程中的智能行为和作用,后来发展到智能节造和智能机械人系统。
李正茂指出,在上个世纪,符号主义和衔接主义此消彼长;直到本世纪初,衔接主义的重要技术之一神经网络技术以“机械进建”(Machine Learning)“深度进建”(Deep Learning)为名,在图像鉴别、语音鉴别等领域获得了瞩主张成就,衔接主义成为人为智能技术发展的主流,由此极大地推进了人为智能产业发展,先后开创了机械进建、深度进建和大模型这三幼我工智能发展沉要的里程碑。
在简要追忆人为智能的发展史之后,李正茂以为,从衔接主义到机械进建,再到深度进建,神经网络间的衔接机造与进建算法不休演进,引领着人为智能技术发展。而究其性质,是网络衔接,是成立在复杂网络衔接上的多层处置,这一概想与电信行业常说的“大衔接”“泛在衔接”的概想是一致的。
李正茂暗示,从本原上看,电信业移动互联网、物联网等的繁华,为人为智能衔接主义(机械进建、深度进建)技术发展创造了前提,推动了人为智能、云推算等发展,共同推进全社会实现“大衔接”,加快进入万物互联的数字化、智能化时期。
因而,李正茂以为,大衔接是人为智能发展的基础。
大数据是人为智能发展的关键
人为智能的主题技术有推算机视觉、机械进建、天然说话处置、机械人技术及语音鉴别技术等,支持这些技术发展的有三大身分:算力、算法和数据。李正茂以为大数据在其中阐扬了沉要作用,是人为智能技术和利用发展的关键。
移动互联时期,全球数据量加快增长。2010年左右,全球进入移动互联时期,4G和5G业务利用、物联网、产业互联网、视频业务等相继繁华,共同带头数据量呈指数级增长,深刻到经济社会生涯的方方面面。
据统计,2011年全球数据总量达到1.8ZB,2020年全球数据总量达到60ZB,十年间增长了32倍多。而在2021年、2022年两年间,全球数据总量又增长了35.5%,2022年全球数据总量达到81.3ZB。
李正茂强调,高速增长的数据总量,奠定了人为智能等新技术突破的基础。人为智能技术发展的第二个里程碑“深度进建”,正是以大量的数据处置为基础,在2012年实现了图像鉴别与分类技术上的突破,并在2016年以人为智能机械人AlphaGo战胜韩国职业围棋棋手李世石为标志,登上“深度进建”的顶峰。
随着算法和算力网络能力不休提升,人为智能的产业利用越来越宽泛,大数据、海量数据越来越阐扬着关键作用。数字经济时期,数据身分是新的出产力。
当前,我国正处于数据身分市场建设索求起步阶段,但数据身分市场的需要已被激活。
李正茂暗示,人为智能技术与大数据技术相互推进、共荣共生,一方面,将进一步增壮大数据的“5V”个性。即增壮大数据的Volume(海量数据规模)个性、Velocity(高速数据处置)个性,成倍扩大大数据的Variety(多样数据类型)个性,深刻挖掘大数据的Value(利用价值)个性,并不休提升数据质量,加强Veracity(真实性)。另一方面,大数据“5V”不休赋能人为智能技术,催生其现实利用场景成熟,推进人为智能技术大规模、普适性发展及利用落地,越发智能化地挖掘数据中蕴含的价值,将多样化的数据资源转化为有价值的数据资产,全面支持数字经济社会发展,为人类社会带来全新的智慧出产模式和生涯方式。
因而,李正茂以为,大数据是人为智能发展的关键。
大模型是人为智能发展的精华
2020年5月,美国人为智能钻研公司OpenAI颁布说话模型GPT-3,是人类科技史上的里程碑事务。GPT-3证了然一个拥有高水平复杂结构和大量参数的人为智能大模型能够实现深度进建,从而让大模型的概想得到前所未有的关注。
2022年11月,OpenAI公司基于GPT-3.5架构的大型说话模型,开发出天然说话处置工具ChatGPT,在两个月内用户数超过1亿户,成为汗青上用户数增长最快的消费者利用,迅速引发了全球新一轮的人为智能较量。ChatGPT及一大批类似大模型的发展,标志取信息社会进入了大模型主导的新阶段。
李正茂指出,大模型是基于蕴含数学、统计学、电脑科学、物理学、工程学、神经学、说话学、哲学、人为智能学等多技术学科融合的一次突变。
在此基础上,人们形成了关于大模型的一些根基共识。
李正茂暗示,大模型时期对人类社会带来了三大革命性变动,一是大模型推动弱人为智能向通用人为智能(Artificial general intelligence,AGI)跃升,二是大模型推动出产力从算力向机械智力跃升,三是大模型推动数字社会向智能社会跃升。从三大变动来看,我们断言,大模型将带来前所未有的扭转,并不为过。
李正茂以为,大模型引领着人为智能2.0时期发展。在2.0时期,大模型分工愈来愈明确,并且有两个发展方向值得关注。
一是开源大模型。“百模大战”中,已经形成了以美国“OMG”和中国“BAH”为代表的两大群体,“OMG”指OpenAI公司的ChatGPT、MetaAI公司的LLaMA、Google公司的Gopher和LaMDA,“BAH”指百度的“文心一言”、阿里的“通义千问”和华为的“盘古”等。其中,MetaAI公司的LLaMA就是开源大模型?创竽P涂赡茉椒⒔媒莸厥迪址制缋米楹,更拥有竞争优势。
二是行业大模型。在通用大模型之表,行业大模型更具发展潜力。与通用大模型相比,行业大模型拥有解决专业领域问题的能力更强、训练和部署成本更低、升级和迭代越发矫捷蹬着点D芄辉じ,将来全球大模型的布局,将是十几个通用大模型,与成百上千个行业大模型互为补充。
因而,李正茂暗示,大模型引领着人为智能2.0发展,是人为智能发展的精华。
电信运营商在人为智能发展中表演沉要角色
与此同时,大模型的发展也面对着较多挑战。好比,人为智能天生内容(AIGC)将对说话学、符号学、人类学、哲学、生理学、伦理学和教育学等广义思想文化领域产生冲击,对天然科学技术产生全方位冲击,进而影响到经济状态、社会结构,甚至会影响国际关系等。再好比,大模型对能源的亏损和对环境的影响,据估计,目前人为智能的能源亏损约占全球能源亏损的3%,据此揣度,到2025年,人为智能将亏损15%的全球电力供给。不言而喻,大模型等人为智能的急剧发展,必要在政策和技术等方面提供解决规划。
综合上述论说,李正茂以为,电信运营商作为大衔接的建设者、大数据的出产者和大模型的索求实际者,在人为智能发展中表演了沉要角色,有基础、有优势,更有远景。
李正茂指出,对于电信运营商而言,大模型发展带来的新机缘不言而喻。
基于这些判断,李正茂强调,在新的机缘刻下,进一步加强对人为智能技术发展的理解,提升对大衔接、大数据和大模型的认知,能力找准定位,索求出更好的发展方向。
附演讲全文:
人为智能:从大衔接到大数据再到大模型 李正茂 今年以来,以ChatGPT(Generative Pre-trained Transformer,天生型预训练变换模型)为代表的大说话模型忽然爆火,很快引发了“百模大战”。对全球新一轮的人为智能较量,电信运营商应该怎么意识,从中找准定位并确定下一步发展方向,我简要结合人为智能的发展史,从大衔接、大数据和大模型三个方面,谈一谈自己的设法,供各人参考。 第一个方面,大衔接是人为智能发展的基础 各人都知路,人为智能的概想产生于20世纪50年代,是钻研开发用于仿照、延长、扩大和进建人类智能的理论、步骤、技术及利用系统的一门新技术科学。它的钻研指标是使机械可能胜任一些通常必要人类智能能力实现的复杂工作,并出产出能以人类智能类似的方式作出反映的智能机械,其重要钻研领域蕴含机械人、图像鉴别、智能语音,以及说话处置和理解、规划、决策等,要解决的主题问题是构建与人类类似,甚至超过人类的推理、知识、规划、进建、互换、感知、移动和操作物体等能力。20世纪70年代以来,很多国度先后发展人为智能钻研,全球人为智能的发展经历了几次大起大落。在发展过程中,人为智能领域重要形成了三大学派: 一是符号主义(symbolicism),又称为逻辑主义、生理学派或推算机学派,重要钻研抽象思想,主张用正义和逻辑系统仿照人的思想过程,搭建一套人为智能系统。符号主义者最先提出“人为智能”的概想,并在20世纪80年代获得很大发展。二是衔接主义(connectionism),又称为仿生学派或生理学派,重要钻研形象思想,主张仿照人类的神经元,用神经网络的衔接机造实现人为智能。衔接主义的重要道理为神经网络及神经网络间的衔接机造与进建算法,被业界称为“最普遍的人为智能”。三是行为主义(actionism),又称为进化主义或节造论学派,蕴含工程节造论和生物节造论等,重要钻研感知思想,早期钻研沉点是仿照人在节造过程中的智能行为和作用,后来发展到智能节造和智能机械人系统。在上个世纪,符号主义和衔接主义此消彼长;直到本世纪初,衔接主义的重要技术之一神经网络技术以“机械进建”(Machine Learning)“深度进建”(Deep Learning)为名,在图像鉴别、语音鉴别等领域获得了瞩主张成就,衔接主义成为人为智能技术发展的主流,由此极大地推进了人为智能产业发展,先后开创了机械进建、深度进建和大模型这三幼我工智能发展沉要的里程碑。 简要追忆人为智能的发展史,能够看到,从衔接主义到机械进建,再到深度进建,神经网络间的衔接机造与进建算法不休演进,引领着人为智能技术发展。而究其性质,是网络衔接,是成立在复杂网络衔接上的多层处置,这一概想与电信行业常说的“大衔接”“泛在衔接”的概想是一致的。从本原上看,电信业移动互联网、物联网等的繁华,为人为智能衔接主义(机械进建、深度进建)技术发展创造了前提,推动了人为智能、云推算等发展,共同推进全社会实现“大衔接”,加快进入万物互联的数字化、智能化时期。所以,我们说,大衔接是人为智能发展的基础。这是我的第一个思虑。 第二个方面,大数据是人为智能发展的关键 人为智能的主题技术有推算机视觉、机械进建、天然说话处置、机械人技术及语音鉴别技术等,支持这些技术发展的有三大身分:算力、算法和数据。其中,大数据阐扬了沉要作用,是人为智能技术和利用发展的关键。 移动互联时期,全球数据量加快增长。2010年左右,全球进入移动互联时期,4G和5G业务利用、物联网、产业互联网、视频业务等相继繁华,共同带头数据量呈指数级增长,深刻到经济社会生涯的方方面面。据统计,2011年全球数据总量达到1.8ZB(1ZB蹬宗1万亿GB),2020年全球数据总量达到60ZB,十年间增长了32倍多。而在2021年、2022年两年间,全球数据总量又增长了35.5%,2022年全球数据总量达到81.3ZB。高速增长的数据总量,奠定了人为智能等新技术突破的基础。人为智能技术发展的第二个里程碑“深度进建”,正是以大量的数据处置为基础,在2012年实现了图像鉴别与分类技术上的突破,并在2016年以人为智能机械人AlphaGo战胜韩国职业围棋棋手李世石为标志,登上“深度进建”的顶峰。 随着算法和算力网络能力不休提升,人为智能的产业利用越来越宽泛,大数据、海量数据越来越阐扬着关键作用。我们说,数字经济时期,数据身分是新的出产力。当前,我国正处于数据身分市场建设索求起步阶段,但数据身分市场的需要已被激活。人为智能技术与大数据技术相互推进、共荣共生,一方面,将进一步增壮大数据的“5V”个性。即增壮大数据的Volume(海量数据规模)个性、Velocity(高速数据处置)个性,成倍扩大大数据的Variety(多样数据类型)个性,深刻挖掘大数据的Value(利用价值)个性,并不休提升数据质量,加强Veracity(真实性)。另一方面,大数据“5V”不休赋能人为智能技术,催生其现实利用场景成熟,推进人为智能技术大规模、普适性发展及利用落地,越发智能化地挖掘数据中蕴含的价值,将多样化的数据资源转化为有价值的数据资产,全面支持数字经济社会发展,为人类社会带来全新的智慧出产模式和生涯方式。因而,我总结为,大数据是人为智能发展的关键,这是我的第二个思虑。 第三个方面,大模型是人为智能发展的精华 2020年5月,美国人为智能钻研公司OpenAI颁布说话模型GPT-3,是人类科技史上的里程碑事务。GPT-3证了然一个拥有高水平复杂结构和大量参数的人为智能大模型能够实现深度进建,从而让大模型的概想得到前所未有的关注。2022年11月,OpenAI公司基于GPT-3.5架构的大型说话模型,开发出天然说话处置工具ChatGPT,在两个月内用户数超过1亿户,成为汗青上用户数增长最快的消费者利用,迅速引发了全球新一轮的人为智能较量。ChatGPT及一大批类似大模型的发展,标志取信息社会进入了大模型主导的新阶段。 大模型是基于蕴含数学、统计学、电脑科学、物理学、工程学、神经学、说话学、哲学、人为智能学等多技术学科融合的一次突变。在此基础上,人们形成了关于大模型的一些根基共识,其中最底子的有:一、大模型是大说话模型(Large Language Model,LLM),也是多模态模型(Multimodal Model)。二、GPT(Generative Pre-trained Transformer,天生型预训练变换模型)是大模型的一种状态,G代表天生性的(generative),P代表经过预训练(pre-trained),T代表变换器(transformer)。三、大模型引发了人为智能天生内容(Artificial Intelligence Generated Content,AIGC)技术的质变。因而,人们说,人类进入了大模型时期。 大模型时期对人类社会带来了三大革命性变动:一是大模型推动弱人为智能向通用人为智能(Artificial general intelligence,AGI)跃升,二是大模型推动出产力从算力向机械智力跃升,三是大模型推动数字社会向智能社会跃升。从三大变动来看,我们断言,大模型将带来前所未有的扭转,并不为过。 大模型引领着人为智能2.0时期发展。在2.0时期,大模型分工愈来愈明确。我幼我以为,大模型有两个发展方向值得关注,一是开源大模型。“百模大战”中,已经形成了以美国“OMG”和中国“BAH”为代表的两大群体,“OMG”指OpenAI公司的ChatGPT、MetaAI公司的LLaMA、Google公司的Gopher和LaMDA,“BAH”指百度的“文心一言”、阿里的“通义千问”和华为的“盘古”等。其中,MetaAI公司的LLaMA就是开源大模型?创竽P涂赡茉椒⒔媒莸厥迪址制缋米楹,更拥有竞争优势。二是行业大模型。在通用大模型之表,行业大模型更具发展潜力。与通用大模型相比,行业大模型拥有解决专业领域问题的能力更强、训练和部署成本更低、升级和迭代越发矫捷蹬着点D芄辉じ,将来全球大模型的布局,将是十几个通用大模型,与成百上千个行业大模型互为补充。因而,我总结为,大模型引领着人为智能2.0发展,是人为智能发展的精华。 与此同时,大模型的发展也面对着较多挑战。好比,人为智能天生内容(AIGC)将对说话学、符号学、人类学、哲学、生理学、伦理学和教育学等广义思想文化领域产生冲击,对天然科学技术产生全方位冲击,进而影响到经济状态、社会结构,甚至会影响国际关系等等。再好比,大模型对能源的亏损和对环境的影响,据估计,目前人为智能的能源亏损约占全球能源亏损的3%,据此揣度,到2025年,人为智能将亏损15%的全球电力供给。大模型等人为智能的急剧发展,必要在政策和技术等方面提供解决规划。 综合三个方面的论说,能够得出:电信运营商作为大衔接的建设者、大数据的出产者和大模型的索求实际者,在人为智能发展中表演了沉要角色,有基础、有优势,更有远景。 对于电信运营商而言,大模型发展带来的新机缘不言而喻。一是将极大地推动算力基础设施建设,要求我们加快算力网络和算力资源发展,优化算力网络和资源布局。二是带来了全新的AI市场,运营商的网络衔接优势,丰硕的用户数据、行业数据,以及5G、云推算、大数据等技术能力,为AI技术创新利用提供了有利前提,可能在推动大模型规;梅矫娌锔笞饔。三是利用AI技术大幅度提升网络智能化能力和服务智能化能力,降低运营成本,加快推动产业转型升级,等等。在新的机缘刻下,进一步加强对人为智能技术发展的理解,提升对大衔接、大数据和大模型的认知,能力找准定位,索求出更好的发展方向。 (凭据9月20日在2023中国信息通讯业发展高层论坛演出讲稿整顿,略有删节)
附PPT全文:
领导:新文