您现在的位置是:首页 > 人工智能 >
中兴通讯股份有限公司高级副总裁张万春: 算力蕴藏无限可能 全球进入AI驱动的产业革命
2024-05-10 11:26:24作者:郦雨婷来源:
摘要2024年4月28日,在2024中国移动算力网络大会上,中兴通讯股份有限公司高级副总裁张万春在AI进阶,开启极智算网新时代的主题演讲中表示,算 ...
2024年4月28日,在2024中国移动算力网络大会上,中兴通讯股份有限公司高级副总裁张万春在“AI进阶,开启极智算网新时代”的主题演讲中表示,算力蕴藏无限可能,全球进入AI驱动的产业革命。
算力蕴藏无限可能
近年来,大模型生成式AI的发展高速迭代、日新月异。
“各大咨询公司对智算的发展给出了较为积极的预测,据IDC预测,到 2027年,中国智算年复合增长率将达到47%。”张万春说,“未来五年的算力增长将达到 1000 倍。”
这些数字的背后蕴含着无限的可能与巨大的发展空间,运营商应势而变,全面拥抱生成式的AI技术,包括对内的提效、对外的赋能。运营商围绕“数智战新”策略,以最新的技术实现更加敏捷、高效、优质的创新拓展。
对于AI的进阶,张万春表示,中兴通讯有三个核心的观点,分别是开放解耦,以网强算,训推并举。
开放解耦,构建繁荣生态
张万春在演讲中表示,AI技术目前正处于高速的迭代期,从产业的视角来看,存在着生态封闭、缺乏标准、风险集中、选择受限等一系列问题,这些问题制约了智算产业快速的、良性的发展。而中兴通讯倡导构建开放解耦的全栈智算方案,在基础设施层面做到软硬解耦、硬件兼容,适配国内外的多种GPU(图形处理器) 、CPU(中央处理器),支持OCR(光学字符识别)、GSE(全调度以太网)等开放的标准,为客户提供多样化的选择。
其中,在软件方面,张万春表示,应支持异构的资源管理、异构的集合通讯、训推的作业调度;在算力网络方面,强调算网协同;在能力平台方面,配套Tensorflow 等主流框架,自动实现向后端平台的变异和优化,并提供从语料处理模型的开发、训练、优化、部署、评估等“端到端”的工具链,支持全生命周期的保障和管理。
张万春指出,开放的技术生态才能够构建共赢的商业生态。开放解耦的全栈直通方案是产业良性发展的关键。通过软硬解耦、训推解耦、模型解耦来推动各类组件化共享赋能,构建开放的技术生态。除此之外,通过产业内的芯片厂家、整机厂家、模型开发商、应用开发商来形成优势互补,共同做大做强,实现共赢的商业生态。
以网强算,打造高效基座
在智算领域中,高速连接通常至关重要,包括芯片内裸带之间的互联、芯片之间的互联、服务器之间的互联、DC之间的互联。
针对芯片内裸带之间的互联,张万春表示,结合中兴自研的系列IP,再通过乐高式的架构,一定程度上能突破工艺制程方面的制约,实现芯片的异构集成;
针对芯片之间的互联,中兴通讯通过芯片之间的高速交换,解决目前在Mesh互联灵活性差,和带宽约束的问题,进一步突破单机的算力,适应更大规模的智算场景的要求;
针对服务器之间的互联,中兴通讯在完善GSE(全调度以太网)的产业生态,打造无阻塞、高带宽、超低时延的新型智算中心网络,致力于后续万卡场景的驱动,加速突破,助力产业的发展;
针对DC与DC之间的互联场景,中兴通讯将全力支持全球规模最大的400G OTN(指实现单波速率高达400G的光传送网)的商用网络部署完成。
训推并举,加速商业闭环
“要以训练创造能力,以推理应用价值,构建数据飞轮,双循环促进 AI 能力的迭代和商业变现,从而锻造核心的优势。”张万春说,“在具体操作上,我们需锚定高价值的行业和天使客户,做到优势互补,树立标杆。L0的模型从0到1突破之后,要基于L1的领域大模型实现‘从1到N’的应用拓展。”
中兴通讯提供基于算力、网络、能力、智力等方面的全栈开放解决方案。在算力维度,芯片侧兼容国内外多家GPU和CPU;在网络维度方面,中兴通讯将和合作伙伴一起建立开放的GPU互联Open Link(开放链接)标准,也将全面融入中国移动的OISA(全向智感)架构,实现单机更大规模的 TP 计算;在能力方面,统一的云管平台支持异构的资源管理、训推的作业调度以及异构的即刻通信,AIS的训推平台提供大模型工程化全栈的工具链和引擎,高效的推理实现千亿模型单卡部署;在智力方面,中兴的星云大模型集中发力于算法创新、数据工程和高效的算力平台。
(本文不涉密)
责任编辑:郦雨婷
算力蕴藏无限可能
近年来,大模型生成式AI的发展高速迭代、日新月异。
“各大咨询公司对智算的发展给出了较为积极的预测,据IDC预测,到 2027年,中国智算年复合增长率将达到47%。”张万春说,“未来五年的算力增长将达到 1000 倍。”
这些数字的背后蕴含着无限的可能与巨大的发展空间,运营商应势而变,全面拥抱生成式的AI技术,包括对内的提效、对外的赋能。运营商围绕“数智战新”策略,以最新的技术实现更加敏捷、高效、优质的创新拓展。
对于AI的进阶,张万春表示,中兴通讯有三个核心的观点,分别是开放解耦,以网强算,训推并举。
开放解耦,构建繁荣生态
张万春在演讲中表示,AI技术目前正处于高速的迭代期,从产业的视角来看,存在着生态封闭、缺乏标准、风险集中、选择受限等一系列问题,这些问题制约了智算产业快速的、良性的发展。而中兴通讯倡导构建开放解耦的全栈智算方案,在基础设施层面做到软硬解耦、硬件兼容,适配国内外的多种GPU(图形处理器) 、CPU(中央处理器),支持OCR(光学字符识别)、GSE(全调度以太网)等开放的标准,为客户提供多样化的选择。
其中,在软件方面,张万春表示,应支持异构的资源管理、异构的集合通讯、训推的作业调度;在算力网络方面,强调算网协同;在能力平台方面,配套Tensorflow 等主流框架,自动实现向后端平台的变异和优化,并提供从语料处理模型的开发、训练、优化、部署、评估等“端到端”的工具链,支持全生命周期的保障和管理。
张万春指出,开放的技术生态才能够构建共赢的商业生态。开放解耦的全栈直通方案是产业良性发展的关键。通过软硬解耦、训推解耦、模型解耦来推动各类组件化共享赋能,构建开放的技术生态。除此之外,通过产业内的芯片厂家、整机厂家、模型开发商、应用开发商来形成优势互补,共同做大做强,实现共赢的商业生态。
以网强算,打造高效基座
在智算领域中,高速连接通常至关重要,包括芯片内裸带之间的互联、芯片之间的互联、服务器之间的互联、DC之间的互联。
针对芯片内裸带之间的互联,张万春表示,结合中兴自研的系列IP,再通过乐高式的架构,一定程度上能突破工艺制程方面的制约,实现芯片的异构集成;
针对芯片之间的互联,中兴通讯通过芯片之间的高速交换,解决目前在Mesh互联灵活性差,和带宽约束的问题,进一步突破单机的算力,适应更大规模的智算场景的要求;
针对服务器之间的互联,中兴通讯在完善GSE(全调度以太网)的产业生态,打造无阻塞、高带宽、超低时延的新型智算中心网络,致力于后续万卡场景的驱动,加速突破,助力产业的发展;
针对DC与DC之间的互联场景,中兴通讯将全力支持全球规模最大的400G OTN(指实现单波速率高达400G的光传送网)的商用网络部署完成。
训推并举,加速商业闭环
“要以训练创造能力,以推理应用价值,构建数据飞轮,双循环促进 AI 能力的迭代和商业变现,从而锻造核心的优势。”张万春说,“在具体操作上,我们需锚定高价值的行业和天使客户,做到优势互补,树立标杆。L0的模型从0到1突破之后,要基于L1的领域大模型实现‘从1到N’的应用拓展。”
中兴通讯提供基于算力、网络、能力、智力等方面的全栈开放解决方案。在算力维度,芯片侧兼容国内外多家GPU和CPU;在网络维度方面,中兴通讯将和合作伙伴一起建立开放的GPU互联Open Link(开放链接)标准,也将全面融入中国移动的OISA(全向智感)架构,实现单机更大规模的 TP 计算;在能力方面,统一的云管平台支持异构的资源管理、训推的作业调度以及异构的即刻通信,AIS的训推平台提供大模型工程化全栈的工具链和引擎,高效的推理实现千亿模型单卡部署;在智力方面,中兴的星云大模型集中发力于算法创新、数据工程和高效的算力平台。
(本文不涉密)
责任编辑:郦雨婷