浪潮云海刘健:"一云多芯+云原生"是算力异构最优解
北京2023年8月24日 /美通社/ -- 浪潮云海秉承开放兼容、浪潮刘健分层解耦的云海云多原生异构技术理念,面向全行业用户提供领先的算力私有云产品与解决方案,助力企业构建坚实云基座,最优实现数字化重构与转型。浪潮刘健在金融领域的云海云多原生异构云原生和云计算建设过程中,浪潮云海积累了丰富的算力实践经验,凭借创新务实的最优实干理念,以客户需求为核心的浪潮刘健服务意识,得到了行业和客户的云海云多原生异构广泛认可。
浪潮数据云计算方案总监刘健
本文系浪潮数据云计算方案总监刘健演讲实录,以下内容将从云计算的最优发展趋势、金融云的浪潮刘健趋势及挑战、浪潮云海在云原生基础设施建设过程中的云海云多原生异构实践成果三部分进行相关经验的分享和观点的探讨。
一、算力云计算发展趋势:下一代云数据中心
目前,AI、5G、大数据这些词汇已和云计算密不可分,在这样的环境下,浪潮云海认为开放硬件、开放软件以及软硬件分层解耦已成为数据中心发展的重要趋势,同时,面对更为多样的计算场景,云计算体系架构的演进、模型即服务、多元算力的管理能力也成为下一代云数据中心的进化方向。
软硬件同步优化
为满足用户对产品性能和使用体验的需求,在倡导软硬解耦的基础上,浪潮云海同样关注软硬件的同步优化。在云计算领域,通过对硬件的深度优化,可大幅提升产品性能,以此解决软件层容器和虚拟化的损耗问题;通过DPU改变底层的高可用架构,从而实现虚拟机高可用的逻辑切换。
广泛的软硬件协同
计算系统架构的解耦和计算设备之间的互操作性是未来计算可持续发展的关键。在网络层面,硬件SDN和网络设备极易绑定,在解耦的阶段,通过云上软SDN和任意厂商网络设备,配合GPU和智能网卡加速,就可以做到解除绑定和性能提升;在存储系统层面,也可以通过同样的办法实现存储系统的加速;在安全层面,以DPU做加强,可实现计算机系统负荷的卸载。以上都是通过硬件优化来实现软件的性能提速。
模型即基础设施
随着ChatGPT的持续火热,模型已经和算力、算法一样,成为了下一代云的基础设施标准。但从归属划分上看,公有云上训练得到的模型仍属于公有云,只有在私有云上基于自己的数据进行训练,才能得到专属的大模型,这也是国内大型金融机构目前致力发展的方向。
多元算力
支撑新兴业务发展,助力多元算力场景。现在的数据中心从物理资源层上看基础设施更加多元,X86和ARM设备的混部已成为常态;用户对算力引擎的需求也囊括了虚拟化、裸机、容器,且这一状态将长期持续;算力类型上也从单纯的CPU向GPU、FPGA扩展。
二、金融云趋势及挑战
金融云发展趋势
金融云发展大致可分为三个阶段:IOE时代、业务云化时代、云原生时代。云原生能力又可概括为以下三点:应用的容器化,服务的Mesh化及Serverless。金融IT本质上是为组织和业务服务的,所以上层技术的变化往往源于组织架构的变迁。业务架构从单体、到服务化再到微服务架构,数据架构从统计分析到数据服务湖仓一体,技术架构对应发展到服务网格,最终形成组织架构和开发框架的变革。每个阶段组织架构和技术架构都需要匹配,这是一个逐步演进的过程。
金融云建设挑战
IaaS层的建设经验较为通用,但是PaaS层的建设则更加复杂,对此我们做出以下分析:
- IaaS和PaaS都有明显的行业属性,如果一个云厂商卖给所有客户的PaaS都是一样的,则它是不具备行业属性的。每个行业的业务不同,要求的PaaS指标和组件也不同,标准化产品未必适用。
- 容器即服务,很多场景下用户认为PaaS不好用、不灵活是因为厂商将PaaS的基础设施跟PaaS的服务整合在了一起,极端情况可能是每个产品都附带了容器平台。对此,浪潮云海的建设经验是把PaaS的功能解耦出来,使之成为容器即服务。
- 在业务层的搭建过程中,我们建议用户建设一个统一的云基础设施,并选择业务可解耦的PaaS厂商,将解耦后的能力架设在统一的容器即服务平台上。
微服务体系的建设也存在多架构并存和逐步演进的过程:在微服务框架里面,Dubbo和SpringCloud是目前较为流行的应用分布式、微服务开发框架,在金融行业应用广泛;而Istio目前的发展趋势则是平台级别的服务治理框架,可进行无侵入的遗留系统微服务改造。当然,微服务架构的选择和平台规划、公司规划是密不可分的,同时也需要逐步去演进。
对于微服务的运维,我们建议将IaaS层和PaaS层打通,形成垂直运维体系。这里面临如下挑战:PaaS组件版本、开发框架多,不同的PaaS组件有不同的硬件资源,导致部署效率低;在业务数据网络隔离的情况下,如何解决PaaS的跨域使用。对此我们建议在网络分区的情况下,根据使用环境需求按需部署、按需编排,并构建统一发放的网络,把中间运维侧打通,通过运维网络将PaaS发放到不同的域里面去,通过就近部署、就近访问,统一运维,实现PaaS层的统一。
三、浪潮云海云原生基础设施创新与实践
目前,浪潮云海主要着力于建设云原生基础设施的底层,参考信通院发布的《云原生能力成熟度标准》,聚焦两个方向来开展工作:第一,技术架构,主要是资源管理、运维保障、研发测试等;第二,业务应用,主要是弹性、高可用、自动化、可观测等。
"一云多芯+云原生"
在金融云的建设实践中,"一云多芯"是金融行业云的一项重要的基础指标。一云多芯"可满足用户算力多样化需求,并且可有效规避算力孤岛;是打破小生态、构建大生态的关键纽带; 并且可有效降低供应链风险 。无论是从业务角度、技术角度,还是产业链角度,践行"一云多芯"已经成为当下及未来云计算产业发展的关键,是产业链相关厂商的必然选择,现在,能源、电力行业也对一云多芯提出了明确的要求。
浪潮云海认为"一云多芯+云原生"是解决算力异构的最优解,我们根据无状态和有状态两种业务形态总结出以下实践经验:
- 对于无状态应用,基本都基于Java开发,编译过程并不难,重新编译后的应用,都能运行在多芯集群里,对底层CPU或服务器并无太多限制;
- 对于有状态的数据,最重要的是保障数据库数据无丢失,不一定要追求一云多芯。但可以进行相关尝试,如在一云多芯环境中部署分布式数据库,可以用X86算力支撑primary集群或写操作,用非X86算力承载standby或者读操作,这是数据库一云多芯的一种实现方式。这种模式也可以应用在数据库层面的容灾建设中。
除了考虑业务形态,我们在实践过程中还总结了以下几个建设要点:
- 集群内的算力自动等价调度:因为不同架构服务器之间有算力的换算问题;对此,我们联合信通院及多家厂商,进行过算力自动等价调度测试;
- 流量切换:在实践中可通过网关切换来实现;
- 无感切换:目前我们的产品已经具备这种能力,用户底层基础设施的架构并不会影响上层业务运行,用户可基于不同架构的底层资源进行动态的调整和资源的调用。
微服务架构体系的建设
对于微服务架构体系的建设,如上提到,首先是开发框架的并存问题。对此,我们建议通过配置中心将各架构统管起来,先把共性的东西抽离出来,再进一步做融合。其次是多数据中心的问题,目前用户普遍都有多套数据中心,对此,可以通过级连的方式做管理,用总分总的模式进行管理。
高可用设计
下一代云的高可用设计在云原生层面不难实现,但并不是所有业务都是云原生的,这就使得难以从上层解决高可用的问题。作为基础设施厂商,我们提倡通过底层建设,即使不依赖云原生也能实现高可用。所以对于下一代的高可用架构,我们希望可以在这两个维度上来回切换,同时也希望能打通裸机和虚拟机的控制平面,实现多引擎间的高可用。这其中还有很多挑战,仍需逐步演进。
目前浪潮云海已经服务了15000多家客户,在各个行业全面开花,涵盖金融、能源、交通、医疗、企业、教育等关键领域,是客户数字化、智慧化转型的重要云底座。这其中包括国内最大规模的金融生产云,承载客户的双11业务;最大规模、芯片种类最多的省级政务云,承载4套公共应用服务,104个业务系统;以及汽车、轨交、科学计算实验室等多个千万级大项目。
-
文章
414
-
浏览
3376
-
获赞
2
热门推荐
-
轩尼斯门窗携手《匠心品牌对话》栏目,向世界诠释门窗工匠精神
【建材网】一个出 色的匠人,面对自己和自己的作品,心中有神,诸相庄严,就是匠心。---朱光潜时代需要一种“工匠精神”,以一种敬业精益、专注创新的态度,对抗日渐炽热的浮躁之风。轩新疆野化最成功野马群连续三年添丁8匹
大陆赛马网讯 据阿勒泰福海县三个泉野马管理站消息,三个泉野马野放点野马种群近三年连续添丁8匹,目前该种群已由最初的6匹发展到现在的19匹,完全适应了大自然的环境,成为野化最成功的野马群。新疆野马繁殖研恒大健康携手莱德马业将举办速度赛马全国邀请赛暨国际马术文化节
大陆赛马网讯 11月30日,“恒大健康·莱德马业2019一2020速度赛马全国邀请赛启动暨国际马术文化节启幕”新闻发布会将在云南昆明恒大莱德嘉丽泽马会隆重举行。近日,恒大莱德嘉丽泽马会正式挂牌,意味着浙江省目前为止最高规格马术比赛将在杭州市中心体育场举行
青马网www.qingma.org)讯 12月6日-8日,由浙江省体育局主办,浙江省黄龙体育中心、浙江省射击射箭自行车运动管理中心、浙江黄龙体育发展有限公司、 浙江省马术运动协会共同承办的浙江省马术全 面发力!亿合门窗品牌战略升级引 领行业裂变
【建材网】风正时济,自当破浪前行;任重道远,更需快马加鞭。「万家灯火守护由我」——亿合门窗品牌战略升级暨715首届世界全防护日全 球发布会以震撼点亮小蛮腰为高彩时刻圆满落幕。焕固定资产投资创历史新高、新增实名登记无人机110.3万架……这个会议信息量巨大!
2025年全国民航工作会议今日9日)在北京召开,中国民用航空局以下简称“民航局”)官网发布的会议信息透露,2024年全行业完成固定资产投资1350亿元,连续5年超千亿,创历史新高;全年新增通航企业14CHC杰士马主俱乐部新星赛驹新西兰横空出世!2岁公马“联合”首秀夺冠获高度赞誉
大陆赛马网讯 新西兰当地时间11月23日,奥克兰南部的普基科希公园Pukekohe Park)赛马场见证了CHC杰士马主俱乐部一匹2岁新星赛驹的横空出世!在当天下午第三场途程1100米、奖金5.5万纽多彩矮绣球为什么比较受文旅类彩化项目欢迎
随着人们生活水平的提高和旅游市场的不断扩大,文旅项目逐渐成为旅游市场的一大亮点。越来越多的人开始注重旅游的文化内涵和体验感,这也促使了文旅项目的快速发展。而多彩矮绣球为什么比较受文旅类彩化项目规划人员浙派延安专卖店成交率破百,浙派活动加速燃爆!
【建材网】·星星之火代言从浙派电器总部出发到浙派陕西延安专卖店,浙派电器身披朝露出发,脚踏星辰而归,为的是将厨房未来式带给更多的家庭,为的是用时尚厨房的理念去守护更多家庭。7月17日,在抑郁症行业平台助力国人提高生命品质
沈阳和平善悦堂中医综合诊所坐落于辽宁省沈阳市和平区南堤西路355号,由何千里老师创办。善悦堂中医以“帮助更多人得到健康”为使命,以倡导与践行“关爱抑郁症患者&rd湖北省首支赛马赛事监管常驻队伍成功组建
大陆赛马网讯 湖北省赛马赛事监管培训班结业典礼11月26日晚在武汉商学院举行。唐敏、王晓宇、杜智军、林雨麒、王宇昕等14名学员经过重重考核,从培训班的80余名学员中脱颖而出,组建成湖北省首支赛马赛事监浙江省体育局主办2019浙江省马术总决赛暨全国马术公开赛
青马网www.qingma.org)讯 12月6日-8日,2019浙江省马术总决赛暨全国马术公开赛将在浙江省黄龙体育中心举行。本次赛事共设50CM-60CM级别个人赛、80CM-90CM级别个人赛、1应急管理部:今年重特大事故有所反弹,长峰医院火灾严重冲击安全底线
2023年6月8日上午,国务院新闻办公室举行“权威部门话开局”系列主题新闻发布会。南方周末记者李桂 图2018年到2022年,全国生产安全事故总量和死亡人数分别下降80.8%、51.4%,自然灾害死亡生态环境部“取消环评机构资质许可答记者问 给业界吃了一颗“定心丸”
关于“取消环评机构资质许可”,生态环境部环评司终于出来说话了。据环评司相关负责人表示,取消环评机构资质许可,非但不是不管,反而管的更严了。监管更加严格,处罚更加严厉,对环评违法违规者严惩不贷,同时优胜2024年全国纪检监察机关立案省部级及以上干部73人
2024年,全国纪检监察机关共接收信访举报356.3万件次,其中检举控告类信访举报100.7万件次。处置问题线索217.5万件。立案87.7万件,其中立案省部级及以上干部73人、厅局级干部4348人、