亚马逊云科技推出新一代AI训练芯片Amazon Trainium3
全新Amazon EC2 Trn2实例采用亚马逊云科技最新的亚马Trainium2 AI芯片,性价比较当前基于GPU的逊云宣布EC2实例提升30-40%
全新Amazon EC2 Trn2 UltraServers采用NeuronLink超速互连技术,将四个Trn2服务器连接成一个大型服务器,科技可用能够在亚马逊云科技上为超大规模模型提供超快速的实例训练和推理
北京2024年12月5日 /美通社/ -- 亚马逊云科技在2024 re:Invent全球大会上,宣布基于Amazon Trainium2的正式Amazon Elastic Compute Cloud(Amazon EC2)Trn2实例正式可用,并推出全新的亚马Amazon EC2 Trn2 UltraServers,让用户以优越的逊云宣布性价比训练和部署最新的人工智能模型,以及未来的科技可用大语言模型(LLM)和基础模型(FM)。此外,实例亚马逊云科技还发布了新一代Amazon Trainium3芯片。正式
Amazon Trainium2芯片
Amazon EC2 Trn2 UltraServers
Amazon EC2 Trn2 实例服务器模块
亚马逊云科技计算和网络副总裁 David Brown表示:"Amazon Trainium2是专为支持大型、前沿的生成式AI工作负载而设计的,能够满足训练和推理的需求,并在亚马逊云科技上提供卓越的性价比。随着模型参数接近万亿,我们意识到客户需要一种创新的方法来高效训练和运行规模庞大的工作负载。在亚马逊云科技上,全新的Amazon EC2 Trn2 UltraServers提供超快速的训练和推理性能,帮助各类企业以更快的速度和更低的成本训练和部署世界上最大的模型。"
随着模型规模的不断扩大,客户希望缩短训练时间和推理延迟,这对计算和网络基础设施提出了更高的要求。亚马逊云科技已提供广泛的Amazon EC2加速实例选择,包括基于GPU和机器学习芯片的实例。然而,即使是目前最快的加速实例,客户仍希望实现更高的性能和更大的可扩展性,以更低的成本更快地训练这些日益复杂的模型。随着模型复杂性和数据量的增加,因为并行化的限制,单纯扩大集群规模已无法有效缩短训练时间。同时,实时推理的需求也超出了单实例架构的承载能力。
Amazon EC2 Trn2实例为深度学习和生成式AI提供卓越性能
与当前基于GPU的EC2实例相比,Amazon EC2 Trn2的性价比提升30%至40%。单个Trn2实例集成了16个Trainium2 芯片,通过NeuronLink超速高带宽、低延迟的芯片之间的互联,可提供高达20.8 Petaflops浮点算力,非常适合训练和部署数十亿参数的模型。
Amazon EC2 Trn2 UltraServers满足全球超大模型日益增长的AI计算需求
对于需要更强算力的超大模型,Amazon EC2 Trn2 UltraServers使客户能够突破单个Trn2实例的限制进行扩展,从而减少训练时间,加快投放市场的速度,实现快速迭代以提高模型准确性。作为全新的EC2产品,Trn2 UltraServers利用NeuronLink超速互联将四个Trn2服务器连接为一个巨型服务器。客户通过全新Trn2 UltraServers,可以在64个Trainium2芯片上扩展他们的生成式AI工作负载。在推理工作负载方面,客户可以使用Trn2 UltraServers提升生产环境中万亿参数模型的实时推理性能。亚马逊云科技正在与Anthropic共同构建一个名为Project Rainier的 EC2 UltraCluster计算集群,该集群由Trn2 UltraServers组成,能够在数十万个Trainium2芯片之间通过第三代低延迟的PB级EFA网络进行分布式模型训练——其运算能力比Anthropic当前一代领先AI模型训练所需算力高出5倍以上。该项目完成后,预计将成为全球最大可用的AI计算集群,供Anthropic构建和部署未来模型使用。
Anthropic专注于AI安全和研究,致力于打造可靠、可解释和可控的AI系统。Anthropic的旗舰产品Claude是全球数百万用户信赖的大型语言模型。作为Anthropic与亚马逊云科技深化合作的一部分,Anthropic已开始优化Claude模型,以便在亚马逊最先进的AI硬件Trainium2上运行。Anthropic将使用数十万个Trainium2芯片,该规模是其之前集群的五倍以上,为使用Amazon Bedrock上的Claude 客户提供卓越的性能表现。
Databricks Mosaic AI使企业能够构建和部署高质量的智能体系统。该系统基于数据湖仓原生架构,用户可以轻松、安全地使用企业数据定制模型,从而提供更准确和特定领域的输出。得益于Trainium的高性能和成本效益,客户能够以较低的成本在Mosaic AI上扩展模型训练。随着全球客户对Mosaic AI需求的不断增长,Trainium2的推出将为Databricks及其客户带来重大优势。作为全球最大的数据和AI公司之一,Databricks计划使用Trainium2为客户提供更优的性能,并将总体拥有成本降低多达30%。
Hugging Face是全球领先的AI开发者开源平台,拥有超过200万个模型、数据集和AI应用,其用户社区涵盖了超过500万名研究人员、数据科学家、机器学习工程师和软件开发者。在过去几年中,Hugging Face与亚马逊云科技合作,帮助开发者通过Optimum Neuron开源库体验Amazon Inferentia和Amazon Trainium的性能与成本优势。该库已集成到Hugging Face Inference Endpoints中,并在新的HUGS自部署服务中进行了优化,用户可以在亚马逊云科技Marketplace获取。随着Trainium2的发布,Hugging Face用户将享受更高的性能,从而更快地开发和部署模型。
poolside致力于构建一个由AI驱动的世界,以推动有经济价值的工作和科学进步。他们相信,软件开发将成为神经网络中第一个达到人类智慧水平的重要能力。为此,poolside正在打造基础模型(FMs)、API和助手应用,以将生成式AI的优势带给开发者。而为了实现这一目标的关键就在于他们构建和运行产品所用的基础设施。借助Amazon Trainium2,poolside的客户将获得优于其他AI加速器的性价比扩展其服务。此外,Poolside计划利用Amazon EC2 Trainium2 UltraServers训练未来的模型,这将比使用Amazon EC2 P5实例预计可节省40%的成本。
Amazon Trainium3芯片,专为新一代前沿生成式AI工作负载的高性能需求而设计
亚马逊云科技发布了新一代AI训练芯片Amazon Trainium3。Trainium3是亚马逊云科技首款采用3纳米工艺制造的芯片,在性能、能效和密度上树立了新标杆。搭载Trainium3的UltraServers性能预计将是Trn2 UltraServers的4倍,使客户在构建模型时能够更快迭代,并在部署时提供卓越的实时性能。首批基于Trainium3的实例预计将在2025年末上线。
Amazon Neuron Software助力客户充分发挥Trainium2性能
Amazon Neuron SDK包括编译器、运行时库和工具,帮助开发者优化模型以在Trainium上运行。它让开发者具有在Trainium芯片上优化模型以获得最佳性能的能力。它与JAX和PyTorch等热门框架原生集成,使客户在Trainium上使用现有代码和工作流时只需进行少量代码修改。同时,Neuron支持Hugging Face模型库中的超过10万个模型。通过Neuron Kernel Interface(NKI),开发者可以直接访问裸机的Trainium芯片,编写计算内核以最大限度地提升计算密集型工作负载的性能。
Amazon Neuron旨在简化使用JAX等流行框架在Trainium2上训练和部署模型,同时尽量减少代码更改和对特定供应商解决方案的依赖。谷歌支持亚马逊云科技通过其原生的OpenXLA集成,使客户能够使用JAX进行大规模训练和推理,提供简单灵活的编码路径,帮助用户快速上手Trn2实例。随着行业内广泛的开源协作,以及Trainium2的推出,谷歌预计JAX在机器学习社区的应用将显著增加,这将成为整个机器学习生态系统的重要里程碑。
目前,Amazon EC2 Trn2实例在美国东部(俄亥俄)区域已正式可用,其他区域也即将推出。Amazon EC2 Trn2 UltraServers目前预览可用。
了解更多信息,请访问:
免责声明:
本新闻稿中提及的生成式AI新发布服务暂时仅在亚马逊云科技境外区域可用,亚马逊云科技中国仅为帮助您了解行业前沿技术和发展海外业务选择推介该服务。
文章
5
浏览
2536
获赞
269
大熊猫国家公园天全片区监测到黑颈鹤
黑颈鹤经过天全县境 黄志强 摄本报讯3月18日,记者从天全县获悉,从3月11日开始,大熊猫国家公园四川天全管护总站工作人员在喇叭河区域连续监测到国家一级保护动物黑颈鹤迁徙的画面,目前已记录到17个黑颈滁阳街道“三个新”画出民族团结最大同心圆_
近日,滁阳街道以铸牢中华民族共同体意识为主线,深化民族团结进步宣传教育,开展了一系列民族团结进步宣传教育主题活动。固根本,在法治教育中宣讲民族团结新声音。街道与社区组织联动,以宣讲会形式向辖区少数民族筑牢钢铁运输线 舍生忘死保家国
在抗美援朝战争中,有一支特殊的部队,他们冒着敌人漫天的炮火抢修铁路、架桥开路,在朝鲜战场上筑起了一条“打不断、炸不断的钢铁运输线”,保证了志愿军急需物资源源不断地输送到前线,在战争史上书写了光辉的一页鏖战开学季《机动战士敢达OL》新活动上线
时至尾声,八月的,夏天的,假期的。此时此刻小编只想给小伙伴们放一首歌“任时光匆匆流去我只在乎你”,不管时间多快,假期多短,《敢达OL》也只在乎与小伙伴们共处的美好时光。开学季来瞄准目标狠抓落实 将专项行动融入重点业务
本报讯自2月启动“转作风、树新风、作表率、抓落实”专项行动以来,雅安发展投资有限责任公司以下简称:雅投公司)扎实开展相关工作,下属子公司蜀天商贸公司、蜀天开建公司紧紧围绕主题,结合实际,多措并举,扎实滁阳街道组织观看爱国主义记录电影《单声》主题活动_
为弘扬爱国精神,传承民族文化,9月15日下午,滁阳街道组织单位职工集体观看爱国主义题材纪录电影《单声》。影片通过单声的家人、朋友的真情叙述,运用写实的手法突出展现了单声先生崇高的爱国主义情怀,反映了广“他们口中的小事,是我们天大的事!”_
“00后”战士勇救落水群众;被救者辗转一个多月终于找到施救者并上门致谢——“他们口中的小事,是我们天大的事!”11月9日,位于滁赠台大熊猫“团团”疑似癫痫 国台办:愿提供帮助、盼尽快康复
中新社北京9月28日电 (刘玥晴 杨程晨)大陆赠台大熊猫“团团”近日疑似发生癫痫症状,国务院台办发言人朱凤莲28日在北京表示,大陆方面愿意在专业领域提供技术支持和帮助,期盼“团团”尽快康复。大熊猫“团争分夺秒警车开道 护送小女孩就医
本报讯2月15日下午,在经开区公安分局交巡警的护送下,一名全身抽搐的女童被及时送到医院,得到救治。“我的女儿全身抽搐,急需就医,请交警帮忙护送。”15日下午6点半左右,经开区公安分局交巡警大队接到一名半个游戏圈为岛2打call!《冒险岛2》不删档首日盛况
8月30日,萌趣冒险造物网游《冒险岛2》不删档正式开服,等待已久的岛民争先恐后“上岛”体验。开服不到十分钟,服务器已达“爆满”状态,主城特莱雅王城中的玩滁阳街道“三个新”画出民族团结最大同心圆_
近日,滁阳街道以铸牢中华民族共同体意识为主线,深化民族团结进步宣传教育,开展了一系列民族团结进步宣传教育主题活动。固根本,在法治教育中宣讲民族团结新声音。街道与社区组织联动,以宣讲会形式向辖区少数民族站起来别躺着!网易《秘境对决》3D人物特效大赏
从1993年美国数学家理查·加菲博士发明万智牌至今,对战卡牌这个古老的游戏类别已经走过了24年的历史。这期间对战卡牌游戏经历过数次变革,特别是近年来无线网络的成熟和移动端用户的普及,让电抓进度重环保 项目建设有序推进
青山环绕,林木叠翠。沿大渡河两岸建设的泸石高速公路宛如一条游龙,穿梭于山河间,衔接着雅西、雅康高速公路。作为川西两条交通大动脉的联络通道,截至目前,自开工累计完成投资60.14亿元,占概算总投资174商务部:全力保障国庆假期生活必需品市场供应充足
中新网9月29日电 29日,商务部发言人束珏婷在例行新闻发布会上表示,国庆假期临近,商务部将积极采取措施,做好生活必需品市场节日供应和应急保供。以“保总量、保基本、保市场、保民生”为目标,保持应急保供《仙侠世界2》结婚系统双人飞行与双人坐骑首曝!
待我长发及腰时,少年娶我可好……巨人网络首款全境飞行仙侠巨作《仙侠世界2》将于9月15日开启飞天公测!今日,游戏内结婚系统正式上线,还有双人飞行玩法与双人坐骑助攻&ldqu