而在大模型时代浸润一年后的今天,业内基本达成共识:大模型就是一趟加速狂奔列车,如果赶上,能享受时代带来的一红利,必须抢先入局,拿到这趟车的车票。
做大模型的人纷至沓来,大模型的产业链上下游也迎来前所未有大爆发,其中,让人感知最深就是算力。“哪家云厂囤卡比较多”、“A100、A800根本没货”.....算力紧俏的话语经常听到。
得算力得天下,国内这一轮大模型都在围绕算力奔忙,许多投资者遵循这一逻辑,购买相关资产配置,算力公司的市值也由此大涨,而许多做算力相关的渠道商,也因为这一波大模型赚得盆满钵满。
实际上,大模型带来的机会远不止在算力,随着大模型深入发展,大模型下一个需求大爆发在于存储。近期,雷峰网近期参加联想凌拓2024技术大会。联想凌拓首席执行官陆大昕在演讲中表示:“数据怎么存储、怎么管理、怎么保证数据安全……这些都是后续大模型建设中的刚需。”
如果将大模型比作孩子,那么数据就是营养丰富的菜肴。只有提供足够和高质量的数据,这个“孩子”才能健康成长,变得更强壮和聪明。数据存储则像是烹饪这些菜肴的大厨,需要精心准备和烹制,以确保数据的质量和丰富性。
相比于传统AI的需求,大模型的场景具有数据量大、参数规模大、训练周期长等特点。相对应的,它对存力提出了更高的要求,更强调高吞吐、高IOPS、高带宽、低延时等极致性能。
近期,很多数据存储商动作不断,接连推出了大模型时代AI存储新品,为基础模型训练、行业模型训练、细分场景模型训练推理提供数据管理支持。
其中新推出的NetApp AFF C系列在适应大模型的存储容量上有了很大的改进。“新一代的SSD最小容量是15TB,未来还会推出30TB的SSD。”联想凌拓产品管理与营销高级总监林佑声称。“在2U的空间能够给大家提供1.5PB的全闪容量,它能够提极高的高性能以及大容量,能耗能够更好的降低85%,占地面积可以一下子就下降95%。”
与此同时,大模型的训练还需要存大量的图片、语音等非结构化数据。NetApp AFF C系列秉承了ONTAP完全统一的数据管理概念,统一了文件、对象、数据块等多项数据类型,实现在AI复杂数据环境中帮助客户去做简化。
第二是数据处理速度要快。海量数据的处理涉及多个环节,包括数据的收集与整理、训练与计算,以及应用的部署与相关服务的提供。这其中,数据从边缘到数据中心,再到云端的流动,以及各种不一样的数据管理,都构成了复杂的数据环境。而大模型训练场景却要求在几个小时内就要达成目标。在这样的背景下,简化数据管理显得很重要。
在联想凌拓技术大会上,雷峰网(公众号:雷峰网)了解到,升级后的联想凌拓MagnaScale 4.0秉承了Data Fabric的战略思想,让数据流动更方便快捷,在存储平台的内部,实现了数据热度的智能分层,支持一键上云和一键下云,释放了数据的流动性。目前MagnaScale已广泛服务于在医疗的PACS、制造业的自动检验测试、生命科学等领域中应用。
仅仅强调数据容量和处理速度还并不够,对公司而言,还需要仔细考虑落地与成本问题。在这次大会上,雷峰网注意到,联想凌拓展示了在人机一体化智能系统、智慧医疗、智能交通系统和智慧金融行业的解决方案。
其中,在智能制造业,联想凌拓采用工业智能质检系统,通过采用高性能、高可靠的 NetApp ONTAP NAS,自研的 Lenovo ThinkSystem DXN 分布式存储一体机,提供卓越性价比的归档存储空间。
在智慧医疗领域,联想凌拓带来了“救急1110”解决方案。通过采用该解决方案,医疗行业用户都能够获得1分钟数据全备份、1分钟数据全恢复、10分钟单项应用容灾的业务连续性保障和数据安全性保障,满足法规要求。
智算时代,随着千亿级参数大模型的不断涌现,多样性算力需求进一步增长,数据作为推动AI发展的核心生产要素,其所释放出的价值日益凸显。而数据规模及质量决定了AI智能的高度。兼顾二者,构建大容量、高性能的存力底座,俨然成为了AI大模型时代致胜的关键。
上一篇:KiCon Asia 2023完美落幕 华秋在行动 助力KiCad生态繁荣
下一篇:车载显示中的车规级别简析