您现在的位置是:首页 > IT基础架构 > 计算存储 >
人工智能场景下的存储选择
2024-04-26 14:55:57作者:于帆来源:
摘要随着人工智能应用场景的进一步扩大,存储需要适应数据快速增长和人工智能对数据处理高效率的要求。要挖掘数据最大价值,构建可用、可信、可控的先进存力是当前的关键课题。...
随着人工智能技术的深入发展,算力为王的论调贯彻整个变革浪潮。算力集群存在“木桶效应”,如果存储和网络性能无法支撑大规模数据存储、读写和传输,高性能计算芯片将无法物尽其用,算力最终会大打折扣。
全球数据量爆发式增长,数据是当前的关键生产要素和国家基础战略性资源。存储作为数据载体,必须提到和算力同等重要的高度。
存储市场有望形成新格局
IDC预测,全球数据总量将在2025年达到175ZB(每ZB等于1万亿GB)。中国工程院院士、中国科学院计算技术研究所研究员倪光南在2023世界半导体大会上表示,预计2025年中国数据量将从7.6ZB增至48.6ZB,超过美国成为全球第一,但当前中国算力中心存力不足,存在重算力轻存力的倾向。
随着人工智能应用场景的进一步扩大,存储需要适应数据快速增长和人工智能对数据处理高效率的要求。要挖掘数据最大价值,构建可用、可信、可控的先进存力是当前的关键课题。
当前国内存储市场的传统厂商包括华为、曙光、浪潮等,他们的产品定位是面向大而全的应用场景,主要用于适应传统客户需求,但这种面向大而全场景的存储架构难以适应专用的新兴业务场景,如人工智能(大模型)和高性能数据分析等业务。除了自主研发外,传统巨头厂商们或选择与国外存储产品合作,快速形成市场竞争力,但在后续服务能力会受限于国外厂商的支持。
焱融科技联合创始人兼副总裁黎俊鸿告诉《中国信息化周报》记者,新兴的存储厂商有机会通过专业化的服务和对新技术的快速响应来获得市场机会,改变现有的市场格局。
焱融科技联合创始人兼副总裁黎俊鸿
存储市场呈现多技术路线特征。开源技术能以较快速度获得大量试用的用户,给中小客户带来快速试用的存储方案,而自研技术拥有更高的自主度和灵活性,不必受限于开源社区的方向和发布节奏,使得企业能够快速响应市场变化和客户需求。
黎俊鸿表示,焱融科技定位在高性能分布式存储,保持充分的战略定力,深入特定应用场景和垂直市场。与其勉强适配全业务场景,不如做垂直市场的最佳选择。随着人工智能的发展,高性能计算存储扮演的角色越发关键,高性能存储市场的规模正在快速增长。黎俊鸿表示,预计未来几年,国内高性能存储的市场规模有望达到百亿级别。
如何保证产业链供应链的安全稳定,成为企业建立市场信心的当务之急。
黎俊鸿表示,焱融科技从两大维度出发,维护企业供应链的安全稳定。第一,选择通用规格芯片,保证持续良性供货。第二,做好极端场景备案,积极拥抱国产平台架构。通过软件层面的优化,构建芯片、应用、算力多维度的健康生态。
在智算中心的建设中,需要综合考虑算力和存力的适配。黎俊鸿表示,客户选择智算中心时会进行综合评估,除了算力规模,还会考虑工作负载的最大化发挥,这需要算力与存力之间的协同效应。只有两者平衡发展,智算中心才能实现最佳性能和用户黏性。
存力“加速度”追赶人工智能
回顾存储产业的发展,新变化不断出现。关系型数据库的普及帮助企业完成了第一次信息化,对集中式外部存储的需求带动了快照、备份、容灾等技术的发展。进入云时代,大规模计算的出现推动了分布式存储技术的兴起。
当前,人工智能的发展,尤其深度学习、机器学习等算法的广泛应用,大量的小文件训练数据需要频繁进行数据加载,对存储技术提出了新的要求。生成式人工智能的出现,催生了大小混合文件、混合读写的存储需求,使得存储场景变得更加复杂。
黎俊鸿表示,人工智能的普及,为存储技术带来了四大变化。第一,存储介质的变革。新型存储介质如固态硬盘(SSD)和高性能内存盘等,在AI时代的企业生产环境中得到广泛应用。第二,软件性能的变革。为适配大规模AI计算场景,数据交换技术向高吞吐量、高IOPS(计算机存储设备每秒的读写次数)、高带宽、低延时靠拢,存储软件面临适应新硬件、提高性能的挑战。第三,应用场景的变革。生成式人工智能等技术变革使得大模型部署更多推理场景,单一云服务或数据中心无法提供所需算力。如何服务分散的算力场景,对存储技术提出了新需求。第四,人工智能的发展使得数据呈爆发式增长,如何治理海量数据是一个新挑战。
存储技术的发展是一个不断适应新技术和新应用需求的过程,每一步变革都是为了更好地处理和存储日益增长的数据,并满足不断变化的业务需求。当前,超长文本、文生视频等功能接连问世,存储技术的发展或将继续与人工智能呈现交织态势。
黎俊鸿表示,未来存储的发展存在四大技术趋势。
第一,未来数据规模将持续增长,除语音、图片、文本等自然增长的数据,还有人工智能模型在训练和推理过程中产生的大量中间数据。第二,面对海量数据,存储技术的数据治理和数据管理的能力变得尤为重要,既要确保数据的质量和可用性,同时需要降低这些数据长期存储和使用的成本。第三,存储技术需适配新的应用平台,如Kubernetes(基于容器技术的分布式架构解决方案)等容器编排平台,以支持微服务架构和云原生应用,存储解决方案需灵活地与这些平台集成,提供高效的数据访问和管理能力。第四,随着边缘计算资源的增加,数据需要在分散的算力中心之间高效流动。存储技术需要支持数据的快速分发和处理,确保分散在边缘的大量计算能力得到充分利用。
(本文不涉密)
责任编辑:于帆
全球数据量爆发式增长,数据是当前的关键生产要素和国家基础战略性资源。存储作为数据载体,必须提到和算力同等重要的高度。
存储市场有望形成新格局
IDC预测,全球数据总量将在2025年达到175ZB(每ZB等于1万亿GB)。中国工程院院士、中国科学院计算技术研究所研究员倪光南在2023世界半导体大会上表示,预计2025年中国数据量将从7.6ZB增至48.6ZB,超过美国成为全球第一,但当前中国算力中心存力不足,存在重算力轻存力的倾向。
随着人工智能应用场景的进一步扩大,存储需要适应数据快速增长和人工智能对数据处理高效率的要求。要挖掘数据最大价值,构建可用、可信、可控的先进存力是当前的关键课题。
当前国内存储市场的传统厂商包括华为、曙光、浪潮等,他们的产品定位是面向大而全的应用场景,主要用于适应传统客户需求,但这种面向大而全场景的存储架构难以适应专用的新兴业务场景,如人工智能(大模型)和高性能数据分析等业务。除了自主研发外,传统巨头厂商们或选择与国外存储产品合作,快速形成市场竞争力,但在后续服务能力会受限于国外厂商的支持。
焱融科技联合创始人兼副总裁黎俊鸿告诉《中国信息化周报》记者,新兴的存储厂商有机会通过专业化的服务和对新技术的快速响应来获得市场机会,改变现有的市场格局。
焱融科技联合创始人兼副总裁黎俊鸿
存储市场呈现多技术路线特征。开源技术能以较快速度获得大量试用的用户,给中小客户带来快速试用的存储方案,而自研技术拥有更高的自主度和灵活性,不必受限于开源社区的方向和发布节奏,使得企业能够快速响应市场变化和客户需求。
黎俊鸿表示,焱融科技定位在高性能分布式存储,保持充分的战略定力,深入特定应用场景和垂直市场。与其勉强适配全业务场景,不如做垂直市场的最佳选择。随着人工智能的发展,高性能计算存储扮演的角色越发关键,高性能存储市场的规模正在快速增长。黎俊鸿表示,预计未来几年,国内高性能存储的市场规模有望达到百亿级别。
如何保证产业链供应链的安全稳定,成为企业建立市场信心的当务之急。
黎俊鸿表示,焱融科技从两大维度出发,维护企业供应链的安全稳定。第一,选择通用规格芯片,保证持续良性供货。第二,做好极端场景备案,积极拥抱国产平台架构。通过软件层面的优化,构建芯片、应用、算力多维度的健康生态。
在智算中心的建设中,需要综合考虑算力和存力的适配。黎俊鸿表示,客户选择智算中心时会进行综合评估,除了算力规模,还会考虑工作负载的最大化发挥,这需要算力与存力之间的协同效应。只有两者平衡发展,智算中心才能实现最佳性能和用户黏性。
存力“加速度”追赶人工智能
回顾存储产业的发展,新变化不断出现。关系型数据库的普及帮助企业完成了第一次信息化,对集中式外部存储的需求带动了快照、备份、容灾等技术的发展。进入云时代,大规模计算的出现推动了分布式存储技术的兴起。
当前,人工智能的发展,尤其深度学习、机器学习等算法的广泛应用,大量的小文件训练数据需要频繁进行数据加载,对存储技术提出了新的要求。生成式人工智能的出现,催生了大小混合文件、混合读写的存储需求,使得存储场景变得更加复杂。
黎俊鸿表示,人工智能的普及,为存储技术带来了四大变化。第一,存储介质的变革。新型存储介质如固态硬盘(SSD)和高性能内存盘等,在AI时代的企业生产环境中得到广泛应用。第二,软件性能的变革。为适配大规模AI计算场景,数据交换技术向高吞吐量、高IOPS(计算机存储设备每秒的读写次数)、高带宽、低延时靠拢,存储软件面临适应新硬件、提高性能的挑战。第三,应用场景的变革。生成式人工智能等技术变革使得大模型部署更多推理场景,单一云服务或数据中心无法提供所需算力。如何服务分散的算力场景,对存储技术提出了新需求。第四,人工智能的发展使得数据呈爆发式增长,如何治理海量数据是一个新挑战。
存储技术的发展是一个不断适应新技术和新应用需求的过程,每一步变革都是为了更好地处理和存储日益增长的数据,并满足不断变化的业务需求。当前,超长文本、文生视频等功能接连问世,存储技术的发展或将继续与人工智能呈现交织态势。
黎俊鸿表示,未来存储的发展存在四大技术趋势。
第一,未来数据规模将持续增长,除语音、图片、文本等自然增长的数据,还有人工智能模型在训练和推理过程中产生的大量中间数据。第二,面对海量数据,存储技术的数据治理和数据管理的能力变得尤为重要,既要确保数据的质量和可用性,同时需要降低这些数据长期存储和使用的成本。第三,存储技术需适配新的应用平台,如Kubernetes(基于容器技术的分布式架构解决方案)等容器编排平台,以支持微服务架构和云原生应用,存储解决方案需灵活地与这些平台集成,提供高效的数据访问和管理能力。第四,随着边缘计算资源的增加,数据需要在分散的算力中心之间高效流动。存储技术需要支持数据的快速分发和处理,确保分散在边缘的大量计算能力得到充分利用。
(本文不涉密)
责任编辑:于帆