助力AI产业革新!浪潮信息重磅推出AIGC存储解决方案
北京2024年7月2日 /美通社/ -- 6月28日,助力重磅浪潮信息"元脑中国行"全国巡展杭州站顺利举行。产业存储会上,革新浪潮信息重磅推出基于新一代分布式存储平台AS13000G7的浪潮AIGC存储解决方案。通过加持EPAI/AIStation的信息资源调度能力、新一代分布式存储AS13000G7自身产品优势,推出新方案从容应对大模型应用对存储性能、解决容量以及数据管理等方面的助力重磅苛刻要求。同时,产业存储浪潮信息尝试性提出GPU计算集群算力与存储集群聚合带宽的革新推荐配比,实现检测点数据60秒内写入和读取恢复,浪潮提高大模型训练效率。信息
大模型时代,数据基础设施挑战升级
随着数字经济的解决蓬勃发展,AI技术正逐渐成为推动企业业务变革和创新的助力重磅重要动力,大模型已经成为驱动数字经济深度创新、引领企业业务变革、加速形成新质生产力的重要动能。
会上,存储产品线副总经理刘希猛表示,随着大模型参数量和数据量的极速膨胀,多源异构数据的传、用、管、存,正在成为制约生成式AI落地的瓶颈之一,在AI大模型数据归集、训练、数据归档与管理等阶段,面临着数据归集时间长、模型训练效率低、数据管理复杂度高等针对数据基础设施的新挑战,用户亟需构建支持多协议、高带宽、低延迟、数据高效流转的大模型存储底座。
作为率先在业界提出分布式融合存储的厂商,浪潮信息聚焦行业客户的大模型落地需求与核心痛点,打造基于NVMe SSD高效适配和优化的分布式全闪存储AS13000G7-N系列。依托自研分布式文件系统构建了新一代数据加速引擎DataTurbo,在缓存优化、空间均衡、缩短GPU与存储读取路径等方面进行了全面升级,提供TB级带宽、千万级IOPS、EB容量,满足大模型存储在性能和容量方面的要求。
剑指AIGC主战场,打造面向大模型应用的存储解决方案
在大模型数据处理全流程中,要想使训练效率达到极致,减少不必要的资源浪费,算力和存力需要均衡配置,训练阶段的数据读写性能成为发挥存力最大作用的关键。而想要提升存储效率、降低模型训练成本,必须要在存储技术上进行创新。对此,浪潮信息推出基于AS13000G7的AIGC存储解决方案,该方案通过浪潮信息AIStation人工智能平台进行智能资源调度和深度数据管理,与EPAI"元脑企智"平台深度集成,数据在热、温、冷、冰四个存储资源池中高效流动,最大限度满足AIGC不同阶段对高性能、易管理的存储需求。首先,通过与上层EPAI/AIStation的深度定制,依托智能数据预读和智能故障处理等技术,为行业用户提供经验证的、更成熟的存储整体方案,目前已累计服务AIGC用户超100家,其中百PB级用户超10家;其次,通过全局命名空间、多协议实时互通、数据冷热分层等技术实现横向数据自由流动,提升存储效率和降低用户TCO 20%以上,方案更加简约;最后,通过AS13000G7-N系列强大的智能缓存优化、智能空间均衡和GPU直通存储等优势实现纵向数据高效访问,缩短大模型训练时间50%,方案更加高效。凭借成熟的深度定制能力、卓越的产品性能优势以及数据全生命周期管理能力,浪潮信息基于AS13000G7的AIGC存储解决方案充分满足大模型训练阶段高性能、归档阶段低成本的存储需求。
算存黄金比例,加速大模型训练
倪光南院士曾提出,"对于AI智能计算中心来说,要想均衡配置存力、算力和运力,一定要注意比例相当,不能失调,才能取得最大的经济和社会效益。"为了最大限度发挥大模型潜能,解决存算比例不平衡的难题,需要制定最佳的存算比例,保障模型的高效训练。浪潮信息最新发布的AIGC存储解决方案尝试给出了模型训练时GPU算力与全闪存储性能、容量的配置推荐。
性能方面:大模型训练过程中检测点文件读写对存储系统读写性能带来巨大挑战。万亿模型需要12~13TB模型参数,写检测点需要耗费大量的时间,未经优化的存储集群一次写入检测点需要3个小时。基于对存储集群读写带宽与大模型检测点恢复时间的分析,为提高大模型的训练效率,实现检测点数据60秒以内的写入和读取恢复,前端GPU计算集群算力(单位采用每秒千万亿次浮点预算PFLOPS)与存储集群聚合带宽(单位采用每秒千亿字节也就是常说的TB/s)的推荐配比为35:1。当然,如果期望获取更低的CHK写入和恢复时间,可以继续增加集群带宽,但其收益率相对较低。
全闪容量方面:模型训练场景中,除了初始加载的训练数据集要存放在全闪池中,还有过程训练中的CHK数据要保存。随着万卡时代的到来,当出现掉卡或训练中止现象,用户通常会每隔一段时间就保存一次Check point数据,可以用来恢复训练或用于模型评估和推理。经过一年多的实践,建议大模型用户2~4小时做一次Checkpoint,检测点数据保存两周时间,实现存储集群容量的合理利用。通过模型分析,结合产品特点,便可推算出全闪热存储池的存储配置要求。当然,用户需求还会涉及到用于收集原始数据、准备原始数据的温存储池,用于归档的冷数据存储池。这些温冷池的容量一般在热存储池容量的10-20倍左右,达百PB级。
"元脑中国行"杭州站现场吸引了来自天目山实验室、网易伏羲、英特尔等300余位专家学者、产业领袖、行业客户,现场围绕生成式人工智能、Al for Science、大模型的AIGC应用等行业热点话题进行分享。浪潮信息还在会上举行了"EPAI种子计划"签约仪式,名都科技、启帆信息、图灵软件、天健远见等浙江区域的10位元脑伙伴正式加入"EPAI种子计划",共同加速AI应用创新发展,推动大模型应用落地实践。
-
文章
41
-
浏览
89537
-
获赞
3
热门推荐
-
江西通报“鼠头鸭脖”事件调查情况:判定异物为老鼠类啮齿动物的头部
针对江西工业职业技术学院“6·1”食品安全事件,省教育厅、省公安厅、省国资委、省市场监督管理局组成的联合调查组,本着实事求是原则开展调查,现将有关情况通报如下。联合调查组经勘察现场,调取监控视频发现,福州红庙岭垃圾焚烧发电厂三期项目正式动工
昨日,“攻坚2017”项目福州市危险废物综合处置项目、红庙岭垃圾焚烧发电厂三期项目正式动工,市水务集团公司施工单位已进场施工。福州市危险废物处置项目位于福州市红庙岭垃圾场内,占地面积约206亩,项目设热度口碑爆棚 《楚乔传H5》狗仔游戏狂欢在即!
这个夏天最火爆电视剧是什么?相信除了《楚乔传》如果排第二的话,没有电视剧敢排第一,播出后仅仅半个多月的时间,播放量就突破一百亿,现在更是朝着二百亿突飞猛进。《楚乔传》电视剧带来的巨大影响力,除了赵丽颖品质为王,擎科生物如何成为客户的首选?
北京2024年11月15日 /美通社/ -- 随着科学研究和生物制药领域对使能技术支撑产品质量要求的不断提升,品控已成为企业竞争力的关键。如何在激烈的市场中脱颖而出,成为客户心中值得信赖的合作伙伴?擎“北大包丽案”一审宣判:牟林翰犯虐待罪获刑三年二个月
2023年6月15日,@北京海淀法院 对被告人牟林翰涉嫌犯虐待罪刑事附带民事诉讼一案依法公开宣判,以虐待罪判处被告人牟林翰有期徒刑三年二个月,同时判决被告人牟林翰赔偿附带民事诉讼原告人蔡某某被害人之母乐朋投资发展(深圳)有限公司加快转型工作进行合力
党的十八大以来,各家企业都在抓住新一轮科技革命的新机遇,实施网络强国战略,加快数字中国建设,大力推动“互联网+”行动计划,促进互联网与社会各个领域融合发展,积极打造新的竞争WIMC大佬观察:赛伯乐风投方式有什么不同?
刚刚结束不久的世界移动互联网大会,将移动互联网推向了一个新高潮,也吸引了来自企业界、投资界等各界大咖齐聚一堂,共同探讨互联网形势下的新经济。其中,以赛伯乐投资集团董事长朱敏、总裁王阳为代表的投资界福州红庙岭垃圾焚烧发电厂三期项目正式动工
昨日,“攻坚2017”项目福州市危险废物综合处置项目、红庙岭垃圾焚烧发电厂三期项目正式动工,市水务集团公司施工单位已进场施工。福州市危险废物处置项目位于福州市红庙岭垃圾场内,占地面积约206亩,项目设性价比|轻资产|地板界的“小米”百格贝特起航
【建材网】8月1日至3日,百格斯特家居科技江苏)有限公司百格贝特地板事业部展开为期三天的“组 织激活、遇见真我”工作会议。会议期间,百格斯特家居科技江苏)有限公司总经理柴永家先盈科旅游武汉分公司夏日社区送清凉 贴心服务到身边
企业的转型与发展—乐朋商务服务有限公司助力“一带一路”
与其他国家相比,中国商务服务行业仍处于发展阶段。如上图1所示,服务业对中国GDP贡献低于40%。远低于美国、英国、新加坡、韩国和马来西亚这些国家,它们的贡献率可以达到70%。家装瓷砖美缝亲身经历大分享!不看后悔!
最近半年一直在忙新房的装修,中间断断续续在论坛里发过装修日记,也得到了大伙的不少好建议,现在装修基本完工,再次跟亲们说声谢谢!上个月硬装完工后做了瓷砖填缝,觉得非常有推荐价值,这里简单给大伙做个汇报~别冲动!瓷砖空鼓不一定非得撬开重铺!还有其他补救方法!
【建材网】瓷砖铺贴不好,极易出现空鼓脱落问题,空鼓处瓷砖不受力,当受到外力过大时容易破裂,还会逐渐扩大空鼓范围,终导致瓷砖翘起或脱落,砸坏家具电器,甚至给人身安全造成一定威胁。地砖空鼓则会导致起拱起翘酷骑单车:带你遇见最美骑行路线
共享单车绿色游作为一种城市绿色出游方式,不仅利于缓解交通压力、降低环境污染,且可使游客更快到达短途周边目的地,提高游玩效率及体验度。近期,酷骑单车又依次进驻无锡、武汉、临潼、商丘、邯郸、义乌、广州、上乐朋投资发展(深圳)有限公司加快转型工作进行合力
党的十八大以来,各家企业都在抓住新一轮科技革命的新机遇,实施网络强国战略,加快数字中国建设,大力推动“互联网+”行动计划,促进互联网与社会各个领域融合发展,积极打造新的竞争