浪潮信息发布源2.0基础大模型,千亿参数全面开源
北京2023年11月27日 /美通社/ -- 11月27日,浪潮浪潮信息发布"源2.0"基础大模型,信息并宣布全面开源。发布源2.0基础大模型包括1026亿、源基518亿、础大参数21亿等三种参数规模的模型模型,在编程、千亿全面推理、开源逻辑等方面展示出了先进的浪潮能力。
当前,信息大模型技术正在推动生成式人工智能产业迅猛发展,发布而基础大模型的源基关键能力则是大模型在行业和应用落地能力表现的核心支撑,但基础大模型的础大参数发展也面临着在算法、数据和算力等方面的模型诸多挑战。源2.0基础大模型则针对性地提出了新的千亿全面改进方法并获得了能力的提升。
算法方面,源2.0提出并采用了一种新型的注意力算法结构:局部注意力过滤增强机制(LFA:Localized Filtering-based Attention)。LFA通过先学习相邻词之间的关联性,然后再计算全局关联性的方法,能够更好地学习到自然语言的局部和全局的语言特征,对于自然语言的关联语义理解更准确、更人性,提升了模型的自然语言表达能力,进而提升了模型精度。
数据方面,源2.0通过使用中英文书籍、百科、论文等高质量中英文资料,降低了互联网语料内容占比,结合高效的数据清洗流程,为大模型训练提供了高质量的专业数据集和逻辑推理数据集。为了获取中文数学数据,我们清洗了从2018年至今约12PB的互联网数据,但仅获取到了约10GB的数学数据,投入巨大,收益较小。为了更高效地获得相对匮乏的高质量中文数学及代码数据集,源2.0采用了基于大模型的数据生产及过滤方法,在保证数据的多样性的同时也在每一个类别上提升数据质量,获取了一批高质量的数学与代码预训练数据。
算力方面,源2.0采用了非均匀流水并行的方法,综合运用流水线并行+优化器参数并行+数据并行的策略,让模型在流水并行各阶段的显存占用量分布更均衡,避免出现显存瓶颈导致的训练效率降低的问题,该方法显著降低了大模型对芯片间P2P带宽的需求,为硬件差异较大训练环境提供了一种高性能的训练方法。
源2.0作为千亿级基础大模型,在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试,测试结果显示,源2.0在多项模型评测中,展示出了较为先进的能力表现。
源2.0采用全面开源策略,全系列模型参数和代码均可免费下载使用。
代码开源链接
https://github.com/IEIT-Yuan/Yuan-2.0
论文链接
https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2.0_paper.pdf
-
文章
96195
-
浏览
99
-
获赞
12488
热门推荐
-
浪子伊布退役,足坛再无“大奉先”
2023年3月18日,AC米兰队球员伊布拉希莫维奇右一)打入点球后与队友庆祝。他也刷新了意甲历史最年长进球球员纪录新华社/图)2023年6月5日,意甲最后一轮AC米兰3-1战胜维罗纳后,41岁的伊布突腾讯连续三年荣膺BrandZ最具价值中国品牌
近日,2017 BrandZ最具价值中国品牌100强年度排名发布活动在京举行。在最新出炉的中国百强品牌榜单中,腾讯位居第一,连续第三年获得“最具价值中国品牌”称号,并成为首个药明合联赢得2024 World ADC大奖,蝉联"最佳CDMO冠军"
中国上海和美国圣地亚哥2024年11月8日 /美通社/ -- 全球领先的专注于提供抗体偶联药物ADC)等生物偶联药物端到端CRDMO服务的药明合联WuXi XDC,股票代码:2268.HK),近日在2上海浦东新区周家渡镇下水道清洗污水处理公司54439698
上海随发管道疏通清洗服务公司15821583298 联系人 王先生上海抽粪公司供应龙泽抽粪 抽污水服务合作承包价格优惠 保质保量。龙泽抽粪服务介绍:抽粪 化粪池清理、砖砌化粪池、化粪池池清掏、隔油池清澳磊再聚首厦门石材展,惊艳绽放闪耀新“石”界!
【建材网】7月30日,因疫情原因多次推迟的第二十二届厦门国际石材展览会在万众瞩目中盛大开幕。作为厦门石材展的忠实伙伴,澳磊22年从未缺席。今年,澳磊也不例外地,以崭新面貌亮相厦门石材展。本次石材展,澳气力垃圾收集输送系统,垃圾回收不出小区
居民将垃圾投到楼道的垃圾投放口,垃圾顺着管道自动从地下垃圾回收管网中来到垃圾收集站,在分离器的高速旋转下实现分类。接下来,在微生物处理车间,垃圾中的油脂部分被制成皂粉或者生物柴油,有机部分被制成了土壤浙江将立法管理餐厨垃圾 建议给垃圾办“身份证”
近两年,食客们谈地沟油色变,“舌尖上的安全”成为全国人民最关心的问题之一。垃圾焚烧知与行 为垃圾的出路讲“实话”
当有的人还坚定地认为在垃圾处理设施和技术上“国外的月亮就是比国内圆”的时候;当有的人还在为“垃圾焚烧”究竟是“天使”还是&ldq网暴与网络批评的区别在哪里?丨法眼
日前,三部门联合发布了《关于依法惩治网络暴力违法犯罪的指导意见征求意见稿)》。 人民视觉/图)日前,最高人民法院、最高人民检察院、公安部联合发布了《关于依法惩治网络暴力违法犯罪的指导意见征求意见稿)》CCTV证券资讯频道财富终端——守护每一个中国家庭
理财,目前对每一个中国人来说并不陌生,但在现实生活中,大家对于理财并不了解,有些股民甚至都没有了解股票究竟是什么就盲目入市了。其实任何一款理财产品,并不是“低买高卖”这么双十一,邂逅 A.O. 史密斯自旋式洁霸洗碗机,开启品质生活新篇章
南京2024年11月7日 /美通社/ -- 我们在忙碌的日子里穿梭,渴望着一份宁静与舒适。而厨房,这个充满烟火气的地方,往往是家庭温暖的核心,却也常常成为我们疲惫的源头。忙碌了一天的傍晚,你拖着疲惫的浙江将立法管理餐厨垃圾 建议给垃圾办“身份证”
近两年,食客们谈地沟油色变,“舌尖上的安全”成为全国人民最关心的问题之一。【趋势精品】法兰尼新一代真富锶矿化净水机FLN
【建材网】5月净水大事件,2022年法兰尼“K”系列趋势精品FLN-600G-K6发布会于5月5日在线上重磅举行应疫情防控要求),作为法兰尼新一代真富锶矿化净水机,FLN-60重庆银行开启银税互动,好企贷破解小微企业融资难
随着经济转型的深入,小微企业融资难的问题已然引发社会各界的关注,各大银行也纷纷设立小微企业的普惠金融服务。为解决小微企业主融资难、融资贵的问题,并适应互联网+的市场需求,重庆银行充分发挥自身优势,秉DXC Technology倡导以STEM教育推动创新和多元化发展
弗吉尼亚州阿什本2024年11月8日 /美通社/ -- 全球领先的《财富》500强科技服务供应商DXC Technology纽约证券交易所股票代码:DXC)宣布,将通过一系列全球性举措持续推动科学技术