随着AI的广泛采用,未来几年的数据生成量将呈爆炸式增长。根据Recon Analytics的一项全球调查(该调查由希捷委托并资助),本地存储可能无法满足AI生成的数据需求,因此云存储正成为各行业企业的首选。调查显示,未来3年内存储需求将增加两倍。
调查显示,AI的采用已经非常广泛,72%的受访企业已经在使用AI技术,另有28%计划在未来3年内采用。云存储已成为应对AI驱动数据增长的首选方式。2024年,65%的AI相关数据存储在云端,预计到2028年这一比例将增加到69%。
图1:当前与未来客户存储中云使用占比(图片来源:Recon Analytics)
在存储容量方面,情况变得更加复杂:对于使用超过100PB存储容量的组织,87%将AI训练检查点保存在云环境或硬盘与固态硬盘的组合中。频繁的检查点保存非常普遍,28%的公司每天保存一次,43%每周保存一次,这进一步推动了存储需求的增长。
图2:企业为应对AI带来的数据增长需求采取的措施(图片来源:Recon Analytics)
调查还显示,企业也在优先考虑更长时间地保留AI训练数据,这被认为是提高模型准确性的关键。90%的受访者认为,更长的数据保留时间可以带来更好的AI结果。对于每天保存检查点的公司,32%表示会保留这些数据超过12个月,而29%会保留6到12个月。这种对数据长期性的关注反映了历史数据在优化AI模型中的重要性。
在基础设施优先事项中,安全性是最关键的,25%的受访者将其列为首位。存储容量则排在第二位,占比18%。其他重要的基础设施问题还包括数据管理、计算资源、网络容量和法规合规性。
图3:AI基础设施组件重要性(图片来源:Recon Analytics)
企业也在积极适应AI带来的存储需求增长。61%的企业采用了可扩展的云存储解决方案,56%实施了先进的数据管理软件,55%升级了现有基础设施。此外,49%的企业利用数据压缩技术来管理AI生成的大量数据。这些策略突显了对可扩展和高效解决方案的关注,以应对指数级的存储增长。
图4:按当前存储使用量划分的更长数据保留时间对AI结果的改善(图片来源:Recon Analytics)
数据复制已成为确保数据完整性和优化AI结果的另一种策略。约80%的受访者认为复制对他们的AI战略非常重要或中等重要,尤其是在存储容量较大的组织中。使用超过100PB存储容量的公司更可能强调复制对于维持其AI模型的准确性和可靠性至关重要。
图5:按当前存储使用量划分的AI模型训练检查点频率(图片来源:Recon Analytics)
展望未来,随着企业从本地设置转向云端环境,云存储预计将占据主导地位。这一趋势是由云解决方案的可扩展性、成本效率和便利性推动的。
图6:存储容量超过100PB的公司检查点备份频率和位置(图片来源:Recon Analytics)
随着AI的采用变得更加普遍,预计存储需求将随着公司从试验阶段转向全面实施而呈指数级增长。频繁的检查点保存、更长的数据保留时间和复制实践将保持重要性,这突显了需要强大的存储基础设施和先进的管理工具来支持AI驱动的未来运营。