AICC圆桌对话:打破跟随,实现大模型创新能力突破
北京2023年12月12日 /美通社/ -- 2023年,圆桌全球科技领域最重要的对话打破大模事,就是跟随新一轮人工智能大模型竞赛。随着OpenAI公司发布ChatGPT一鸣惊人,实现国产大模型如雨后春笋般喷涌而出,型创新"百模大战"盛况吸引全球关注,力突大模型的圆桌发展速度日新月异。然而,对话打破大模大模型早已从单一技术比拼,跟随升级为整个体系生态的实现竞争,决胜关键点在于谁能夯实基础、型创新系统布局,力突更好迎接AI驱动的圆桌"算力时代"。
近日,对话打破大模在AICC 2023人工智能计算大会上,跟随新智元创始人&CEO杨静在大模型创新主题圆桌论坛,与循环智能AI负责人陈虞君、中国科学院自动化研究所研究员张家俊、浪潮信息人工智能软件研发总监吴韶华围绕大模型时代的智算机遇、痛点与破局之道展开思想碰撞。
与会嘉宾指出,中国大模型发展与应用落地仍处于探索时期,需要在算法、数据、算力三方面进行创新,通过用户反馈和实践创新反哺大模型,进一步夯实基础大模型技术,推动大模型的场景化落地。
以下是圆桌问答实录整理:
杨静:百模大战各显神通,头部的玩家结合自己的优势布局大模型,也想请各位分享一下各自的大模型业务布局。
陈虞君:"提升大模型长文本能力,降低幻觉问题"
循环智能基于ToB的服务经验,我们希望能够让大模型的长文本能力尽可能在各种企业应用上产生价值,同时降低大模型幻觉问题。我们的业务也是基于如何提升改善大模型这两个能力展开的,希望利用这两个特性产生一些针对企业的更好用的大模型应用。
张家俊:"打造多模态大模型,解决实际问题"
我们暂时还没有成立工程实体,业务布局更多的是ToB和ToG。除此之外,我们在做多模态大模型,可以更容易地落地行业场景。我们不强调是大语言模型或者多模通用,而是在实际场景当中解决实际问题,通过我们的探索,确实比以前降本增效了,之前解决不了的问题能够解决了。
吴韶华:"筑基基础大模型,助力行业落地"
浪潮信息始终把精力投入在基础模型创新层面,全面的赋能应用层的开发者、元脑生态伙伴去触达最终的用户。我们认为当前在大模型领域,只有先把基础模型能力真正提上去了,大模型在行业应用层面才能真正解决碎片化的问题,才能更好的支撑行业场景的落地。
杨静:基础大模型发展的技术突破口是什么?我们应该如何破局,才能创造出高性能的大模型,尽快追赶上GPT4?
吴韶华:"算法数据双创新,打造内部飞轮"
如果想接近甚至超越GPT4的能力,一定要同时考虑算法和数据。首先是算法,不能一味的使用LIama结构或者Transformer结构,而不做任何创新。其次是数据,OpenAI的数据飞轮效应是非常显著的,他们可以通过各种途径收集非常多的实际用户的真实反馈。在这种情况下,想要接近甚至超过GPT4的核心是创新,尤其是算法和数据两方面的创新。
基于源2.0的实践,为了获取高质量的中文数学数据,我们清洗了从2018年至今约12PB的数据,最后仅得到10GB的中文数学数据。而这不到10GB数据还有很大的质量提升的空间。对此,我们选择用大模型合成数据,构建了内部的数据清洗工具和平台,利用工具快速实现了内部获取非常紧缺的数据、高质量的数据。
张家俊:"跟随无法超越,大胆创新、大胆尝试,利用专长能力解决实际问题"
在追赶和超越GPT4的过程中,我们面临着不知道它的算法,不知道用了哪些数据的问题,这使得我们无法跟随和全面验证GPT4,只能在某些数据集上,在某些能力上超越了GPT4,没有一个全面的、公认的度量标准。所以跟随它永远超越不了,我觉得应该是创新。一方面要从数据配比层面创新,另外从模型算法创新,在模型结构上大胆尝试、大胆变化,跟随是解决不了根本问题的。
值得注意的是,我们并不一定需要达到GPT4的能力才能将技术应用于实际场景中,比如我们解决了模态方面的理解问题,解决了可控性,安全性的问题,很多领域都可以用,没有必须达到GPT4的能力。
陈虞君:"以终为始,加强用户共创,发现模型局限性问题,实现创新突破"
对于大模型来说不存在真正意义上的突破点,比如没有大模型技术之前,谷歌的机器翻译做的就很好了。不同的问题会有不同的临界点,我们需要具体分析,有些问题可能大模型可以直接解决,而有些问题则可能需要长时间的迭代。其次,我们不应只追求如何追赶或者超越GPT4,从构建、训练一个大模型的角度来说,我们更应该去思考怎么样让大模型理解人类的意图,让大模型真正帮助我们完成任务。
我们以终为始去看这个问题,发现当前的模型存在很多局限性,比如不能支持长文本、存在幻觉、语义理解输出不稳定,包括GPT4也存在一些局限。这块我们做了两方面努力,一方面,所以我们孵化了一家ToC的公司,与所有使用模型的用户进行共创。另一方面,我们也广泛的和我们B端的合作伙伴进行共创,让模型在合作伙伴身上产生价值。我们相信,只有尽可能多的使用模型,才能知道模型的局限点在哪里,才能够有所创新突破。
杨静:目前堆算力一直被认为是驱动大模型进化的有效手段,但是算力荒已经成为业界共有的问题,从贵公司的发展状况来看,对于创新基础设施,提升大模型训练效率层面有哪些可以分享的经验?
陈虞君:"用尽可能少的真实的数据实现尽可能好的训练效果"
算力荒现在是普遍存在的问题,OpenAI也会存在算力荒。我们能够做的就是在尽可能少的资源的情况下,能够通过算法、数据上的创新,来应对这一问题。我们可以利用尽可能少的真实的数据实现尽可能好的效果,我们节省了很多算力的情况下达到了相近或者更好的效果这种形式。从算法上来说我们借助非常好的训练方法,让模型尽可能需要少的算力的情况下达到尽可能好的效果。
张家俊:"算力是重要因素,但算力荒不会阻碍创新"
算力在训练大模型时确实是一个重要因素,OpenAI使用大算力训练出的模型表现确实优于小算力训练出来的小模型,这是公认的事实。然而,这并不意味着我们必须拥有与OpenAI相当的算力才能进行创新,算力不会阻碍我们的创新。尽管我们可能需要训练更长的时间,比如OpenAI训练两个月的时间我们需要训练半年,但只要我们拥有适当的算法和数据,我们仍然可以实现创新。
吴韶华:"大模型结构、分布式训练算法、数据协同优化,降低算力需求"
这个问题的本质在于大模型训练时,大家普遍认为算力越大模型性能越高,但实际上这个观念主要来自于早期的研究,当模型参数量和数据量增大时,模型的精度会有所提升。但这种提升会被折算到算力上,导致形成了算力越大模型性能越高的观念。但现在的大模型训练范式已经发生了变化,引入了指令微调,几千条高质量的数据就可以提升模型能力,所以是否需要在预训练阶段投入大量算力成为了一个问题。
根据开发源2.0的经验来看,我们清洗了互联网上12PB的数据,只得到了10GB的中文数学数据。在这种情况下追求数据的体量没有意义,如果能够找到有效的手段把数据量降下来,算力需求就会降下来。在源2.0的开发过程中,我们整体数据体量并不大,但是内部评估质量非常高,这是提升算力效率的一个非常有效的手段。同时在设计模型结构的时候,在相同的架构下尽可能降低参数量,这样能提升参数效率,也能节省算力,相当于从算法层面考虑算力的开销。除此之外,目前成型的分布式训练算法,实现的前提是芯片之间的P2P带宽要足够高,要满足张量并行对于通信巨大的需求。对于这种情况,我们针对算力大规模分布训练做了额外的工作,可以降低大模型训练过程中对于通信带宽的需求,可以用更多样化的设备训练大模型。
杨静:大型预训练模型已经展现出了强大的性能,但在行业中的应用仍然面临一些挑战,如部署、定制化、数据隐私和安全性等问题。那么,大家认为大型预训练模型应如何走向行业并发挥其潜力呢?
陈虞君:"携手合作伙伴、行业专家教授大模型行业知识"
循环智能从2019年开始做商业化落地,一直在思考如何实现AI模型落地行业,所以在推出相关产品的时候,也关注了一些包括银行、保险、汽车、房产等在内的十个左右的行业需求。今年在使用大模型去解决各个行业问题的时候,我们发现大模型落地一个比较有挑战的点是每个行业都有不一样的专业知识和knowhow,比如法律公司对模型的输出准确性要求非常高,需要模型读懂整篇的法律法规,并且必须一字不差地输出法规内容,同时需要模型记住法律法规对应的章节号;而在房地产营销的场景,通过对销售与客户沟通场景的抽取,我们发现类似于"200的500"这种的行业"黑话",代表了房子面积是200平米,对应的是500万的价格;而对于金融行业需要理解财报表格信息,这些都是大模型落地行业过程中我们遇到的问题。所以实现大模型落地行业的最重要的一个步骤,就是和合作伙伴、行业专家一起去教授大模型行业知识。同时,我们也在构建一个合作的形式,能够让尽可能多的合作伙伴加入一起打造大模型,通过大量的客户反馈,发现模型当前存在的问题,找到下阶段的进化方向。
张家俊:"放低姿态,用户预期管理,多接触,多耐心"
第一,放低姿态。我们的大模型是让大家拿去直接用的,很多场景下我们要放低自己的姿态。第二,用户预期管理。我们需要给出一个解决问题所需时间的预期,因为不同行业会有各种不同的问题需要解决,我们要避免给客户过高的预期,实事求是地解决问题。第三,多接触。让大家多使用,发现问题、解决问题,从用户反馈的角度会越来越好。第四,多耐心。不管做大模型,还是作为用户,培养大家多耐心,未来肯定越来越好。
吴韶华:"大模型共训,赋能开发者触达应用场景"
对于源2.0模型来说,我们推出大模型共训计划,这个计划的核心出发点希望能够让我们的研发团队,能够接触到所有的开发者。开发者提出自己的应用或场景的需求,提供1~2条示例,由我们来准备训练数据并对源大模型进行增强训练,训练后的模型依然在社区开源。同时,我们还有另外一种形式,浪潮信息会赋能合作伙伴,把我们在模型能力上的经验提供给他们,助力伙伴们把这些应用到行业当中。
杨静:现如今大家都面临着算力紧缺的问题,大模型训练也离不开充足算力的支持。所以请问各位嘉宾,目前看到或者正在做哪些工作来适应算力多元化的时代趋势的?
陈虞君:"避免算力重复和浪费,集中行业知识合作共训"
大家的训练应该是合作共训的逻辑,不同的行业会有不同的知识,我们应该尽可能地汇聚这些知识,利用有限的算力资源共训,这样就能够达到节省算力的地步,避免大量算力的重复和浪费。
张家俊:"不会把鸡蛋放在一个篮子里,走国产化大模型之路"
我们的做法是不会把鸡蛋放在一个篮子里,我们也会用到国内外的各种算力。我们从2020年开始走国产化的大模型道路,一直坚持这条路,几乎国内所有的芯片算力都适配过,这样可以保证我们有能力保留训练大模型的方案。
吴韶华:"从系统层面应对算力多元化趋势"
浪潮信息开发了一套框架,利用这套框架里面的一层,可以专门管理各类算力,我们从系统的角度为业界面向多元算力提供一个方案。
-
文章
25779
-
浏览
9811
-
获赞
395
热门推荐
-
郑州警方通报“男子悬赏千万寻狗”:消息系杜撰,发布者已行拘
中升乙源建设工程有限公司受邀参加2020品牌强国经济论坛暨(第四届)创新成果发布活动
2020年12月11日至12日, “2020品牌强国经济论坛暨(第四届)创新成果发布活动”在京召开。本届活动由经济日报社(集团)《经济》杂志社、国务院国资委主管/中国企业家协会中国砀山国际马术耐力赛主题LOGO、主视觉、吉祥物震撼发布
大陆赛马网讯 2019年中国砀山国际马术耐力赛将于9月21日-22日在安徽砀山华丽开赛,今年的赛事将全面升级,首先体现在赛事品牌形象上——官方赛事logo、主视觉、吉祥物近日正式发布!砀山国际马术耐力淮北市环保局积极抓好环境执法大练兵工作
一是自选动作上抓好“新”字诀。努力完成“规定动作”的同时,积极创新“自选动作”,搭建异地互查作为大练兵活动平台。每月开展一轮,采取“双随机”“三不两直”方式,每月更换互查县区排列,互查组对检查发现的问缔造高 端场景,毕圣罗与医冠装饰达成战略合作!
【建材网】签约图片)昨日, 毕圣罗·高 端安全门窗与医冠装饰广东)达成签约战略合作,双方就当前高 端建材行业发展进行了深入交流,并达成重要共识;同时医冠装饰广东)对毕圣罗品牌实力给予高度企业发红头文件“禁止婚外情和出轨”,公司回应:家庭和谐才能稳定工作
近日,浙江温州乐清市一企业发布“关于禁止婚外情和出轨通知”的红头文件,称公司已婚员工如有婚外情、出轨、包养小三等不良情况,将辞退处理。6月12日,该公司回应极目新闻称,这则通知旨在倡导员工保持家庭和谐安徽省组织召开2017年国家重点生态功能区县域生态环境质量监测评价与考核工作培训班
为进一步做好“十三五”期间国家重点生态功能区县域生态环境质量监测评价与考核工作,10月16日至18日,省环保厅在合肥市组织召开2017年安徽省国家重点生态功能区县域生态环境质量监测、评价与考核工作培训中国马术队副领队贾大鹏:比赛结果配得上队员们的付出
青马网www.qingma.org)讯 中国马术队副领队贾大鹏在赛前抽签仪式中,帮助中国队抽到了2号签。比赛结束后,中国场地障碍赛队刚好以资格赛G组第2名身份晋级东京奥运会。说到这里,贾大鹏副领队笑得现场火爆丨广州建博会罗兰德式门窗首日人气爆棚,客商云集“共赢·筑建未来”
【建材网】今天,7月8日,第二十四届中国建博会在广州琶洲广交会展馆盛大开幕)罗兰德式门窗携系列新品闪耀亮相,引发了现场观众的围观热潮!罗兰德式门窗的展位位于琶洲展馆C区14.2-13本届中国广州)国际国和和雅酱香酒落户山东,新布局、新征程,再创新高
国泰民安辞旧岁、狮舞九州贺新年,2021年元月1日,新年第一天,国和山东)酒业有限公司在,孙维泽书记、华亿集团副总经理刘偲渝、贵州国和酒业股份有限公司副总经理王柏、市场部总监彭雷、国和山东)酒业有限公脱口秀演员李昊石演出剧院被罚10万元
南方网讯 据北京市文化市场综合执法总队网站消息,近日,中日青年交流中心有限公司世纪剧院被北京市文旅局罚款10万元,处罚事由为演出场所经营单位、演出举办单位发现营业性演出有禁止情形未采取措施予以制止并同王军宁赛驹“小家碧玉”2019玉龙国际赛马公开第2比赛日夺冠
大陆赛马网讯 5月18日,玉龙国际赛马场继续上演精彩赛事。2019玉龙国际赛马公开第2比赛日——红磨坊主题赛马日举行。当天,共计5场大赛,64匹赛驹出赛,赛事总奖金额34万元人民币。第二场途程1000引 领智慧新生活,星络智能家居闪耀2022广州建博会
【建材网】近年来,随着5G、物联网和人工智能技术的不断完善,智能家居消费潜力持续释放。与此同时,智能家居赛道入局者众多,市场规模不断扩大,星络智能家居厚积薄发,迅速成为行业内冉冉升起的新星。2022年“手绘地图寻亲案”一审宣判 两名被告人获刑
据“云南省盐津县人民法院”微信公众号消息,2023年6月13日,盐津县人民法院依法对被告人贺某奎、王某元拐卖人口案一审公开宣判。以拐卖人口罪判处被告人贺某奎有期徒刑十一年、判处被告人王某元有期徒刑十年聚多佳品成功的背后,竟是这样的!
聚多佳品是一款火爆的社交电商平台,以其强大优势,短时间内便迅速引爆行业,其前景可以说无限光明。这么成功的聚多佳品,靠的不是虚张声势,凭空捏造,而是它强大的实力作为支柱,加以每个用户好评的宣传!之所以聚