北京2023年8月31日 /美通社/ -- 与狭义的浪潮人工智能相比,通用人工智能通过跨领域、信息效率跨学科、模型跨任务和跨模态的百花大模型,能够满足更广泛的齐放场景需求、实现更高程度的算力速度逻辑理解能力与使用工具能力。2023年,决定随着 LLM 大规模语言模型技术的浪潮不断突破,大模型为探索更高阶的信息效率通用人工智能带来了新的曙光。通用人工智能进入了快速发展期,模型在中国,百花大模型已经呈现出百花齐放的齐放态势,各种大模型层出不穷。算力速度
要想在"百模争秀"的决定时代占得先机,AI开发团队需要着力化解算力、浪潮算法、数据层面的巨大挑战,而开发效率和训练速度是保障大模型市场竞争力的核心关键因素,也是未来的核心发力点。近日,浪潮信息人工智能与高性能应用软件部 AI 架构师Owen ZHU参与首届由CSDN、《新程序员》联合主办的NPCon大会,发表重要技术演讲,分享面向新一轮AIGC产业革命,AI大模型的算力系统解决之道,并强调算力、算法、数据和系统架构等多个方面的综合优化对大模型训练到了至关重要的作用。
以下为Owen ZHU在NPCon大会的演讲实录整理:
大模型研发的核心技术是由预训练与Alignment组成的,第一部分就是预训练,需要用大量的数据使模型收敛速度更快、性能更好。第二部分则是Alignment,Alignment不完全等于强化学习,其通过使用多种方式/策略优化模型输出,让AI在和人的交流反馈中学会如何沟通表达,这两部分是提升大模型质量的核心要素。
目前来看,模型基础能力取决于数据、模型参数量和算力。模型参数量越大、投入的训练数据越大,模型泛化能力越强。由于资源限制,在两者不可兼得的时候,应该如何进行取舍呢?OpenAI的研究结论认为,与增加数据量相比,先增大模型参数量受益则会更好,用一千亿的模型训练两千亿的Token和两千亿模型训练一千亿的Token,后者的模型性能会更高。
由此可见,参数量是衡量模型能力的一个重要指标,当模型参数量增长超过一定阈值时,模型能力表现出跃迁式的提升,表现出来语言理解能力、生成能力、逻辑推理能力等能力的显著提升,这也就是我们所说的模型的涌现能力。
模型规模多大能产生涌现能力呢?现在来看,百亿参数是模型具备涌现能力的门槛,千亿参数的模型具备较好的涌现能力。但这并不意味着模型规模就要上升到万亿规模级别的竞争,因为现有大模型并没有得到充分训练,如GPT-3的每个参数基本上只训练了1-2个Token,DeepMind的研究表明,如果把一个大模型训练充分,需要把每个参数量训练20个Token。所以,当前的很多千亿规模的大模型还需要用多10倍的数据进行训练,模型性能才能达到比较好的水平。
无论是提高模型参数量还是提升数据规模,算力依旧是大模型能力提升的核心驱动力:需要用"足够大"的算力,去支撑起"足够精准"模型泛化能力。当前大模型训练的算力当量还在进一步增大,从GPT-3到GPT-4算力当量增长了68倍。算力当量越大,交叉熵越小,模型能力越强。随着训练的token数、模型参数、计算量的增加,语言模型的loss在平滑下降,这就意味着大语言模型的精度可以随着计算量、参数规模、token数扩展进一步提升。
大模型能力来源于大量工程实践经验,预训练的工程挑战巨大,这表现在如下几个方面:首先,AI大模型的演化对于集群的并行运算效率、片上存储、带宽、低延时的访存等也都提出了较高的需求,万卡AI平台的规划建设、性能调优、算力调度都是很难解决的难题;其次,大规模训练普遍存在硬件故障、梯度爆炸等小规模训练不会遇到的问题;再次,工程实践方面的缺乏导致企业难以在模型质量上实现快速提升。
作为最早布局大模型的企业之一,浪潮信息在业界率先推出了中文AI巨量模型"源1.0",参数规模高达2457亿。千亿参数规模的大模型创新实践,使得浪潮信息在大模型领域积累了实战技术经验并拥有专业的研发团队,为业界提供AI算力系统参考设计。在算力效率层面,针对大模型训练中存在计算模式复杂,算力集群性能较低的情况,源1.0在大规模分布式训练中采用了张量并行、流水线并行和数据并行的三维并行策略,训练耗时约15天,共计训练了180 billion token,并将模型最后的loss值收敛至1.73,显著低于GPT-3等业界其他语言模型。首次提出面向效率和精度优化的大模型结构协同设计方法,围绕深度学习框架、训练集群IO、通信开展了深入优化,在仅采用2x200G互联的情况下,源1.0的算力效率达到45%,算力效率世界领先。在集群高速互联层面,基于原生RDMA实现整个集群的全线速组网,并对网络拓扑进行优化,可以有效消除混合计算的计算瓶颈,确保集群在大模型训练时始终处于最佳状态。
当前,中国和业界先进水平大模型的算力差距依然较大,从算力当量来看,GPT-4的算力当量已经达到了248,842PD,而国内大多数主流的大模型算力大量仅为数千PD,差距高达近百倍。
同时,中国和业界先进水平大模型在算法、数据方面也存在巨大差距。在算法方面,虽然开源为国内大模型发展带来了弯道超车的良机,但LLaMA等开源大模型相比GPT4等顶级水平自研模型的性能,开源模型的能力存在"天花板"。
在数据方面,中文数据集和英文数据集相比较,在规模、质量上均存在显著差距,相较于动辄数千亿单词量级的英文数据,中文大模型的数据量级仅为百亿左右,而且开源程度较低,封闭程度较高。
开发大模型、发展通用人工智能是一项非常复杂的系统工程,我们亟需从系统层面为未来大模型的良好生态发展寻找最优解。从实战中走来,通过构建高效稳定的智算系统,加速模型开发效率提升。
日前,浪潮信息大模型智算软件栈OGAI(Open GenAI Infra)——"元脑生智"已正式发布。浪潮信息正通过"工具化、系统化、全链条"的全栈赋能能力,让炼大模型省时、省力,让大模型更快、更稳、更智能,助力百模真正实现"竞速AIGC"。
文章
8
浏览
564
获赞
621
提高群众学法、用法意识 引导新时代公民道德建设
本报讯为大力培育和践行社会主义核心价值观,充分发挥法治宣传教育基础性作用,切实加强雨城区公民思想道德建设。近日,雨城区人社局立足于实际,从农民工服务、劳动用工、社会保险、就业创业等多个方面开展法治宣传神灵宝宝长大了 《新蜀门》神灵升华大进化
望着蓦然增大许多的宝宝会不会令你合不上嘴巴呢?《新蜀门》3.61版本新开放的神灵系统已经把宝宝的辅助功能发挥到极致,宝宝不仅仅是身后带着翅膀的天使,而是在与对手对战时在他残血的时候给予致命一击的小刺客百度携手共同运营 《出发OL》首度进军国战网游市场
国内网游新锐企业“天之游”正式宣布:将携手国内最大的搜索引擎公司——百度、共同运营旗下3D大型国战题材网络游游戏《出发OL》!目前该款产品双方平台对接正《神武》推出全新爆笑动画片:一个萝卜引发的血案!
《神武》推出全新动画片,一个萝卜引发的爆笑血案!新动画的男女主角都是《神武》新内容“月海传说”中的新宠物,配角还有那只超贱的黄色小鸡——吉祥。事件的起因2022年度我市“创业明星”名单公布
本报讯3月31日,2022年度雅安市“创业明星”颁奖仪式暨市级创业孵化基地授牌仪式举行,现场为10位2022年度雅安市“创业明星”颁奖,授予雅安市创新创业服务中心等6家单位为“市级创业孵化基地”。此前百台iphone5强势入驻!《新剑侠世界》周年庆典现场
《新剑侠世界》10月16日震撼公测,小龙女驾到剑侠情缘首推古墓派、新战场首创战车玩法、超省钱 8418元来就送、新玩法畅爽通宵游戏的激情、新视觉1080P电影级画面,6大新动作浓墨献映,全新江湖,不只不止萌系鬼怪 《聊斋Q传》雀圣传奇
《聊斋Q传》源自于文学奇葩《聊斋志异》,然而它又青出于蓝胜于蓝,在原著的基础上加上流行“萌元素”,可谓是大俗大雅、雅俗共赏。《聊斋Q传》中可不是仅仅有萌死人的小妖小怪哟,更有&萌宠醉可爱《醉八仙》宠物玩法有诀窍
极品萌宠相伴永久,快乐修仙精彩无限。2D回合制Q版网游《醉八仙》人气火爆,引发修仙狂潮!2D回合制Q版网游《醉八仙》夏日全服人气火爆,丰富的线上活动,精彩的游戏副本,海量更新游戏内容让玩家体验到了八仙铁拳出击护民生 铁腕治乱促发展
本报讯3月29日,石棉县召开“春雷行动2022”新闻发布会,通报石棉县“春雷行动2022”执法行动工作开展情况。今年该县“春雷行动”从2021年12月20日开始,到2022年3月31日结束。截至目前,江湖再起波澜 三大惊喜空降九阴
九阴江湖从来都是耐不住寂寞的,没有平淡的江湖,也没有寂静的武林,来到九阴,就是为了体验惊喜,长假之后,新版本全新来袭。“华山论剑”将带来全新感受,延续武林大会的激情,开启武侠连白羊座男和水瓶座女的性格合不合 能结婚吗
生命是短暂的,爱是绵长的,两个人恋爱到了一定程度,就会想要步入婚姻的殿堂,一起经营一个小家,生儿育女。当然,婚姻是一件神圣的事情,在此之前,我们都会考虑自己的另一半是不是真的适合自己,两个人结婚会不会人多礼多乐趣多 《诺亚传说》公测盘点
2012题材人气网游《诺亚传说》自宣布10月12日战放公测以来,从紧急加开抢注服到开测当天服务器的持续爆满,可见诺米们的热情和此款游戏的超高人气!大家是不是已按捺不住你的那颗爱热闹之心,想去体验一下呢加强风险管理 防范电信网络诈骗
本报讯近期,浦发银行、农业银行等多家银行相继发布公告,下调个人账户线上相关业务交易限额,包括线上转账限额及网上支付交易限额等。记者从我市多家银行了解到,此次调整原因主要是为了防范电信网络诈骗。对线上业属猪白羊座和属龙巨蟹座会幸福吗 缘分怎么样
在情侣还没有开始恋爱关系的时候,两个人的面前就像蒙了一层雾气。而两个人在一起以后,雾气就会慢慢的消散,他们就会坦诚相待了。关于星座和生肖的配对关系,属猪白羊和属龙的巨蟹座两个人在一起会幸福吗?这对合适《远征OL》双线新服今日13时开启 五档创招火热上线
真热血PK网游《远征OL》双线新服【御风】今日13:00隆重开启。六大开区活动同时进行,上线三重豪礼不断放送,让你轻松享受游戏。新人冲级大赛,主城抢down争霸,新区双料争夺激情四射。更有全新开放的五