金融行业迎来大模型时代,存算基建成决胜关键
北京2023年9月21日 /美通社/ -- 去年年底,金融基建键ChatGPT诞生,行业凭借强大、模型精准的时代胜关自然语言理解和生成能力,令全球用户为之一震。存算成决
自此,金融基建键各行各业纷纷投身大模型研发竞赛,行业掀起新一轮技术创新热潮。模型金融行业更是时代胜关如此。如何构筑面向大模型时代的存算成决新型算力和存力基础设施,实现大模型能力向金融领域的金融基建键迁移,成为金融机构热议的行业话题。
金融大模型 在哪些场景有用武之地?模型
作为AI新基建,大模型在金融行业有着广泛的时代胜关应用场景。
在前台,存算成决智能客服,是AI在金融领域最常见的应用方向之一。还记得钢铁侠电影里的AI管家贾维斯(Jarvis)么?金融大模型将大幅提升客户经理的专业水平和服务能力,大幅降低客户经理的运营成本,让每个人都拥有类似Jarvis的24小时在线的专业客户经理。
在中台,AI大模型有机会改变金融机构内知识获取、内容创作、会议与沟通、代码开发与测试的方式,提升内部办公效率,甚至引发研发测试模式变革,全方位提升金融机构内部运营效率。
在后台,大模型将成为智能科技底座的标配,大幅降低智能技术应用的门槛,只需少量标注数据就可以让智能技术覆盖广泛的场景。
总之,AI大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力,在金融行业有广泛的应用前景。
万卡规模、万亿参数,大模型有"高门槛"
大模型的快速迭代,需要高效算力和存储基础设施的加持。
一方面,算力是大模型的引擎。语言类、视觉类模型容量和相应的算力需求都在快速扩大,金融大模型发展的背后是庞大的算力支撑。如果用"算力当量"(PetaFlops/s-day,PD),即每秒千万亿次的计算机完整运行一天消耗的算力总量,来对人工智能任务所需算力总量进行度量,大模型训练需要几百甚至几千PD的算力支持,也意味着需要巨大的算力成本。
算力是大模型发展核心要素
例如,OpenAI在2020年推出的GPT-3,对算力的需求至少要上万颗A100 GPU,一次模型训练总算力消耗约3,640PD的算力。又如,浪潮信息推出的"源"中文语言大模型有近2500亿个模型参数,算力消耗达4000PD。再如,当前GPT-4和PaLM-2的算力当量已经达到GPT-3的数十倍。这还不算,谷歌正在开发的下一代多模态大模型Gemini,其训练量碾压GPT-4,达到后者5倍。
快速攀升的AI算力消耗,有限的IT预算,让大多数金融机构陷入两难境地:想做大模型,但资源匮乏、成本压力大、人才稀缺;不做大模型,又只能坐看机会错失。
对此,分而治之或许是一种可行的办法。所谓分,就是把大模型分为通用大模型和行业大模型。金融机构不用自己打造通用大模型,而是基于第三方的通用大模型,在此基础上专注打造行业大模型。根据信通院发布的《行业大模型标准体系及能力架构研究报告》,通用大模型缺乏专业知识和行业数据,而且构建和训练成本很高,难以实现商用。为更好解决特定行业为题,行业大模型应运而生。行业大模型可以满足特定场景需求,更好地为行业提供优质的服务,促进行业智能化转型升级。
浪潮信息AI服务器产品专家郭磊表示,"金融机构可以集中资源在行业大模型上,不是'在一千米的地上挖一米深的沟',而是'在一米的地方挖一千米深'"。
大模型训练四个阶段
具体来看,大模型训练的第一阶段是无监督预训练阶段,训练周期往往持续数十天到数月,需要数千张GPU卡同时计算,算力消耗巨大,训练时间非常长,训练出来的模型是基础语言模型。金融机构可以通过使用开源平台或者第三方合作(如浪潮信息的"源"大模型),获得基础语言能力。第二到第四阶段是有监督精调阶段、奖励模型训练和强化学习,这3个阶段需要数十张乃至上百张GPU卡同时计算,算力消耗的规模和训练时长相比第一阶段都有明显下降,所以金融机构可以在这三个阶段进行训练,打造有金融行业优势的大模型。
另一方面,大模型光有算力远远不够,还取决于数据规模和数据质量。
大模型的优势在于海量信息的搜集、提取和分析能力,这是人类难以企及的。
近几年,通用大模型的参数量快速增长。2016年OpenAI发布Gym强化学习平台,2018年GPT-1问世,模型参数为1.17亿,经过不断迭代,GPT-4参数规模达到1.76万亿。Google从2017年发布Transformer(6500万参数)架构以来,陆续发布BERT(2018年,3亿参数)、T5(2019年,110亿参数),参数规模逐步提高。近期,Google发布通才模型PaLM-E,这是迄今为止全球最大的视觉语言模型,包含5620亿参数。
在垂直行业,金融大模型的数据集在通用大模型基础上还需包含诸如金融研报、股票、基金、银行、保险等方向的专业知识,通过在训练过程中加入大量金融对话数据并针对金融领域进行特定的预训练调优,提升其在金融垂直领域的表现。
同时,多模态、跨模态成为常态,金融大模型的数据类型变得更加丰富。其中无监督数据,即原始数据,数据格式可以是网页、文本或语音数据;有监督数据,即经过标注的数据,格式可以为json或Query。此外,为了给投资者提供实时市场舆情和风险预测等服务,金融机构还要高效处理金融行业新闻、股票交易,乃至社交评论等金融数据。这些巨量、多模态、实时的金融数据新需求、新特征,传统集中式存储难以应对,需要弹性、灵活的新型分布式存储架构来支撑。
由此可见,随着金融大模型的演进,整个数据中心的架构都会发生改变,从AI服务器、到存储、再到网络的全栈方案都需要适应大模型时代的需求。
基础设施 如何"存得下、算得快、传得稳"
只有数据"存得下"、算力"算得快"、网络"传得稳",数字基础设施才能充分发挥数据要素价值,推动大模型应用落地,带动新业态繁荣发展。
对此,浪潮信息基于智慧计算战略,从算力、算法、数据、互联四方面推进产品创新,为大模型打造强大底座。
算力方面,浪潮信息通过千亿参数规模的大模型创新实践,已在算力集群构建、算力调度部署、算法模型开发等方面,构建起全栈领先的大模型算力系统解决方案,助力大模型训练开发。其中最新一代融合架构的AI训练服务器NF5688G7采用Hopper架构的GPU, 较上代平台大模型实测性能提升近7倍,同时支持最新的液冷解决方案,可实现更低的集群能耗比与运行成本,PUE小于1.15,以一个4000卡的智算中心为例,每年可节电620万度、降碳1700吨。
存储方面,浪潮信息生成式AI存储解决方案用一套AS13000融合存储支撑生成式AI的全阶段应用,提供全闪、混闪、带库、光盘四种介质,支持文件、对象、大数据、视频、块多种协议。结合AIGC数据处理的五个阶段:数据采集、准备、训练、推理和归档,浪潮信息由同一套存储提供端到端的数据流支持,满足文本、音频、图像、视频、代码等多模态数据的存储和处理需求。
浪潮信息存储产品
在集群高速互联层面,浪潮信息基于原生RDMA实现整个集群的全线速组网,并对网络拓扑进行优化,可以有效消除混合计算的计算瓶颈,确保集群在大模型训练时始终处于最佳状态。
当前,国有大行、股份制银行以及部分城商行,均已经开展或计划开展金融大模型研发,AI算力和数据基建将迎来高速发展。根据IDC预测,未来5年中国智能算力规模的年复合增长率将达52%,分布式存储增速将达到中国市场增速的2倍。大模型时代,金融机构需要以AI的场景、架构为抓手,结合各行的数据特点,打造新一代智算基础设施。
-
文章
7
-
浏览
37
-
获赞
118
热门推荐
-
8年干出900亿估值,“步步高系”复制下一个极兔
极兔速递正向港交所发起冲击。 视觉中国/图)在中国狂奔3年后,极兔速递向港交所发起冲击。其于2023年6月16日晚间递交的招股书显示,计划募资5亿-10亿美元,最快将在年内上市。极兔速递是一家加盟制快先睹为快!告诉你中国马术巡回赛魅力现场如何炼成
2015中国马术巡回赛上海站即已于5月29日周五)开赛,比赛为期三天。看过精彩纷呈的首日比赛后,你一定想知道这魅力现场是如何炼成的?马儿在赛前的临时马房里是怎么住的?赛前大家都在准备什么吗?骑手们共同猩便利CEO吕广渝:创业公司的成功之道在于“势起人成”
2018年1月14日,猩便利创始人兼CEO吕广渝受混沌大学之邀,开展了一场以《从上帝视角看公司运营》为主题的演讲。吕广渝创造性地提出了公司运营的四大框架,首次公开分享了自己在数十年职业生涯中所累积的宝垃圾分类是城市实现现代治理的一个课题,难以推行只因居民素质差?
近日,上海市生活垃圾分类减量推进工作联席会议办公室印发《对不符合分类质量标准生活垃圾拒绝收运的操作规程试行)》的通知以下简称《操作规程》),对不符合分类质量标准的生活垃圾拒绝收运的操作规程进行制定。垃建设多元文化的人文湾区:“要充分挖掘‘两制’的价值和潜力”
港珠澳大桥海上日出。新华社 李建束/图)“人文湾区要打造一个文化创造力兴盛活跃、文化产业体系完善、文化交流国际水平极高、文化消费动力充足的优质生活圈。”在6月8日举行的2023文化强国建设高峰论坛上,中国第一批赛马硕士上《非常了得》被大连选手猜中身份
作为中国第一批赛马硕士,而且还是女生,李想也因此登上了江苏卫视《非常了得》节目的舞台。“节目是去年录的,今年播的。当时,浙江卫视的节目组知道我们这个专业开始招生后,就找到了学校,想邀请一名学生参加节目许海峰:中国马术巡回赛促进了中国马术竞技水平的提高
国家体育总局自行车击剑运动管理中心副主席许海峰致辞并宣布开幕2015中国马术巡回赛跟去年相比您觉得最大的亮点是什么?许海峰:去年的中巡赛上海站我也来了。今年的中巡赛与去年相比,办赛场地比去年要好。整个猩便利的“便利·蜂窝”前景何在?
最近被舆论缠身的猩便利昨天发出了官方声明,表示遭到质疑的“门店关店”情况属于门店迭代迁址,属于猩便利打造“便利·蜂窝”商业模式、构筑行业壁阿里集团宣布换帅:张勇9月卸任董事长和CEO,蔡崇信和吴泳铭接任
今天,阿里巴巴控股集团董事会主席兼CEO张勇通过全员信宣布,阿里的自我变革正顺利平稳推进,1+6+N的全新业务集群基本成型,各业务集团董事会已开始运行,多个业务的上市和融资计划也已开展,控股集团将主要冰狗网:事无大小,谨慎对待版权侵权
随着互联网时代的来临,信息的快速传递,大量免费的信息被使用。但是,随之而来的问题是版权问题纠纷屡见报端,更甚者使用者无意的行为已经构成侵权行为。那么,哪些行为属于版权的侵权呢?今天,冰狗网便为大家来一华中地区诞生首匹汗血马驹
5月27日早上7点,华中地区首匹汗血宝马马驹在武汉东方马城诞生。这匹新生马驹是由国产“代孕马妈”经过胚胎移植后顺利生产,其父母同为汗血宝马,分别来自俄罗斯和乌兹别克斯坦。去年3月,马城旗下的武汉赛马俱“佛脚爸妈”完美制胜 创维让孩子在家享受黄冈北大名师授课
期末考试,很多家长临时抱佛脚,陪着孩子突击复习,成为“佛脚爸妈”,不仅给孩子施加很大的学习压力,家长们自己也是苦不堪言。其实,比“佛脚爸妈”更令人心高考志愿填报市场规模近10亿元,推广实时动态志愿模式可倒逼行业良性发展 丨议教
2023年6月27日,南京,首场高校招生志愿填报咨询会。 视觉中国/图)近年来,高考志愿咨询行业日趋火爆,和其他新生行业一样,自然存在着良莠不齐的现象。艾媒咨询发布《2023年中国高考志愿填报及就业前武汉商学院国际马术学院6名大学生马模引围观
昨天,武汉商学院国际马术学院6名大学生马模,将10多幅与马匹的合照在网上晒出,迅速引来围观。身着盔帽皮靴的马模金蕾说,她们用7小时拍了上千张,“主要是为了展示不一样的校园生活”。来源:中国马术|赛马|购房移民塞浦路斯,享超低税务制度
近日,塞浦路斯财政部发表公告称,塞浦路斯与沙特阿拉伯于2018年1月3日就收入征税和防止逃税签署了一项双重税收协定。