2025, AI进入“飞天”时刻
图片系AI生成
全球大模型的发展犹如大江奔流,局部掀起一朵浪花很快就被潮涌覆盖。进入
2025年开局已经传递出一种焦虑:零一万物退出超级大模型训练场景,时刻转型考虑商业化可能性。飞天Kimi背后公司陷入股权纷争。进入国内AI“六小虎”从百模大战中突围后,时刻不得不再次面临新的飞天拐点。更早前,进入OpenAI转型盈利方向,时刻出现核心人员集中离职;而本身就是飞天OpenAI离职高管创办的Anthropic连续获得亚马逊和谷歌大手笔注资……
大模型终究是少数人的竞技场。这一过程会大浪淘沙,进入让从业者逐渐找准各自的时刻市场位置,提升资源消耗和技术的飞天产出价值。那些在公共云时代依靠自研积累起技术宝藏的进入公司,那些有全栈创新思维的时刻公司,将在新时期赢得先发先机。这一预判也得到IDC研究机构的认可:过往在AI+云计算领域有双向积累的公司正在获得先发优势。AI时代对云有了新要求,“AI云”应运而生。
AI云不是新事物,而是一种技术沉淀与战略思维,也预示AI未来趋势。2024年,阿里云在全球云计算3A格局中取得了多项重要技术突破。过去一年正是它在AI云战略视角下对大模型、AI应用开发、AI基础设施领域集中迭代升级的时期。从当年写下第一行飞天代码就一直坚持自研创新的这家公司,将迎来AI的“飞天”时刻。
燎原之势后的大模型
2024年第三季度末,通义开源模型超过美国Meta公司的Llama,成为世界第一模型群,当时其原生模型和衍生模型总数超过7.4万个。由于衍生模型是在原生数据模型基础上为匹配特定场景所做的调整,衍生模型规模从一定程度上能反映大模型对于开发者的受欢迎程度和应用价值,这也是对阿里云坚持开源的最好回应。
在大模型风靡全球的这两年,行业中存在两条泾渭分明的路线,一条是闭源路线,一条是开源路线,阿里云是国内大模型开源路线的绝对信徒,在2023年8月在国内率先加入开源行列后,便沿着全尺寸、全模态方向陆续推出了多款开源大模型。
与此同时,2023年云栖大会上释放的一个明确信号就是“打造AI时代最开放的云”。阿里云坚信不开放没有生态,没有生态就没有未来。
事实上,通过降低大模型使用门槛,吸引更多开发者和企业用户一起参与和促进技术产品的迭代升级、推动创新效率提升、发现并解决新技术的问题,最终实现技术落地,构建大模型的繁荣生态,更好满足市场灵活化和定制化的需求。这一预判也在当前企业使用多个模型组合应用的趋势上得到印证。
与此同时,也只有站在更先进更稳定的技术能力之上,才有开放的底气。通义开源模型不断进取迭代,仅2024年一年就实现了三次重要更新。
2024年2月,Qwen1.5开源了包括6种不同规模的Base和Chat模型,并在多项基准测试中展示了卓越的语言理解、推理能力及多语言处理性能,尤其在长序列支持和人类偏好对齐方面取得了显著进步。随后,4月份又开源了首个千亿级大模型Qwen1.5-110B。
6月,Qwen2发布,包含5个尺寸的预训练和指令微调模型。全球著名开源平台Hugging Face的CEO Clem曾在社交平台上将通义QWen2-72B视为“王者”,中国在开源模型中具备统领地位。这是他去年6月份使用300块H100芯片对全球100多个主流开源大模型进行评估后得出的排名。
9月,在2024年云栖大会上,阿里云发布了更为强大的Qwen2.5系列,该系列覆盖了从0.5B到72B的不同参数规模的语言模型,可适应不同复杂度的任务及应用场景需求;并推出了针对编程的Qwen2.5-Coder和针对数学的Qwen2.5-Math模型。其中旗舰模型Qwen2.5-72B性能超越Lama 405B。
同样在云栖大会上,通义万相也迎来升级,发布了全新的视频生成模型,可生成影视级高清视频。继文生文和文生图后,文生视频、图生视频的需求增多,在影视制作、动画设计、广告设计领域的应用扩大了AI生产力的范围。在最新的升级中,通义万相2.1视频生成模型解决了在复杂物理场景中肢体运动扭曲的难题,即便是游泳、花样滑冰、跳水等运动视频里也能保持肢体协调。
阿里云通过全尺寸、多模态的模型家族提供的灵活性,进一步丰富了模型落地场景。一方面,千亿级参数的模型能尽可能提升模型能力的天花板,另一方面小参数的模型,诸如Qwen-1.8B可以补足智能终端落地的诸多场景,为以大训小,端云协同提供更多可能。
在刚刚结束的2025 CES(国际消费电子展)上可以看到,包括AI伴侣、AI耳机、AI眼镜、AI手杖、AI投篮机等AI硬件新物种百花齐放,各类应用场景的机器人产品也是一大亮点,车企及产业链公司在智驾前沿技术上也大秀肌肉。
AI给终端设备带来全新想象空间,也面临诸多挑战。边缘智能场景下,从端侧发起的AI模型调用需求越来越多,但端侧设备在算力、功耗、成本上不具备优势,就迫使业界将模型小型化、蒸馏模型,并催生边缘智能体、云+端协同的演进。
过去一年,通义大模型基于端云架构已服务汽车、手机、PC、电视、教育硬件、穿戴硬件等千行百态智能终端,实现AI能力进化。在这背后,是通义提供大模型端云架构,通过异构算力适配、多源模型供给、端云平台协同、全链路安全保障,全面支撑千行百态智能终端各类AI应用。
近日,雷鸟创新正式发布雷鸟V3 AI拍摄眼镜。这款新品上搭载了其与阿里云通义共同打造的业内首个专门面向智能眼镜的AI大模型。这是国内首个大模型与AR眼镜硬件厂商开展的深度定制合作。基于通义系列大模型底座,双方设计了整体多模态交互架构,定制化开发“云+端”模型,帮助产品实现高响应、低延迟、高质量的多模态AI交互体验。
这些硬件智能场景常常需要将推理请求转发到终端设备之外进行,对推理能力本身和云端协同通信提出更高要求。2024年11月,阿里云通义团队发布全新AI推理模型QwQ-32B-Preview, 并同步开源,在百炼、Hugging Face等平台可用。据评测数据显示,预览版本的QwQ已展现出研究生水平的科学推理能力,它在数学和编程方面表现尤为出色,在国外社交媒体上赢得业内赞誉。这是阿里云首个开源的AI推理模型。
回顾大模型领域两年来的发展,通义千问不是最早的,却在能力上后来居上。从2023年第二季度对外揭晓,随即接入钉钉触达用户,到第三季度正式上线,并在随后快速完成多模态产品布局。
据公开数据显示,目前通义大模型已接入30万企业客户,包括中国一汽、三得利(中国)、携程、喜马拉雅、微博、联想等知名企业。在互联网客户之外,工业生产领域对通义大模型的需求增加是一个亮点。其中,传统企业对于通义灵码的依赖性在增强。
自上线一年来,通义灵码已累计为程序员生成超10亿行代码,也使得阿里云成为目前唯一进入AI代码助理魔力象限中 “挑战者”象限的中国科技企业。1月,通义灵码正式发布AI程序员,成为全球首个同时支持VS Code、JetBrains IDEs开发工具的AI程序员。
回看通义大模型一路迭代,技术创新和规模效应主导了这一过程,坚持开源开放、全尺寸多模态、AI工程化的方向让通义千问在全球大模型中脱颖而出。
向AI原生时代迁跃
如文章开头所述,零一万物将与阿里一起成立“产业大模型联合实验室”,并将涉及相关人员划拨。此前的资金链紧张、被大厂收购等一系列传闻已被该公司创始人站出来澄清。
这不仅反映出大模型初创公司的整体处境与审时度势,也说明生成式AI市场需求的务实特点,一味卷大模型、消耗大量资源最终还是要回归到用户需求和成本收益综合考量上。一线云厂商也纷纷在开发应用平台层面开展了军备竞赛。
2024年5月,阿里云百炼2.0发布,从模型开发、应用开发到算力底座全面升级。“当下企业应用大模型存在三种范式:一是对大模型开箱即用,二是对大模型进行微调和持续训练,三是基于模型开发应用,其中最典型的需求是RAG,以企业数据对大模型进行知识增强。围绕这些需求,百炼打造了模型中心和应用中心,提供最丰富的模型和最易用的工具箱。”阿里云智能集团首席技术官周靖人介绍。例如,针对当下企业最关注的RAG链路,百炼提供灵活开放的企业级检索增强服务,5到10行代码即可搭建RAG应用,让大模型拥有“最强外挂”。
在亚马逊AWS最大的年度峰会上,有关AI应用开发托管平台Amazon Bedrock的动态已连续两届成为大会上最受关注的焦点,风头和戏份甚至盖过了基础模型和自研推理芯片等发布。这说明,全球厂商已深刻意识到,随着生成式AI逐渐改变越来越多企业业务,推理将成为每个应用的核心部分,客户开发者迫切需要平台释放更多便捷的功能,平台能力受到市场检验。
比如模型幻觉是全球厂商目前着力解决的问题一环。所谓模型幻觉是模型生成的内容与现实世界事实或用户输入不一致、甚至误导性倾向的现象,大多产生在原始数据、模型训练、推理流程中。模型幻觉是整个行业面临的一个根本挑战,特别是在金融、政务、医疗等强监管行业中,会限制客户对生成式AI的信任。对此,流程上的监测、自动化检查等措施被引入平台。
阿里云此前已实现AI应用链路全栈可观测,业内领先的多层级Trace体系具备完善的监控告警机制。全新AI原生全栈可观测平台首次实现了云上AI大模型从训练到推理再到应用的全链路实时观测、告警与诊断。阿里云可观测产品家族同步实现全新升级,最常用的日志服务SLS相较于自建体系运维监控综合成本可降低30%。
去年,阿里云升级了全新的大模型全生命周期的安全防护体系。在数据的采集、模型设计、训练、评测、部署和使用阶段都提供了丰富的安全产品,既包括在模型生成阶段的内容安全产品,也有数据安全中心、数字水印等数据安全产品。
为了实现对数据安全的保护,阿里云基于百炼平台,设计实施了一系列数据安全防护方案,包括专有网络访问通道、Prompt加密、数据存储、应用层传输加密,以及存储加密等方式方法,确保企业数据安全。
这些技术在客户侧的应用正积极推进,反过来也在不断从客户侧获得宝贵的需求反馈,反哺平台。作为一个为AI开发者提供丰富的模型接口与易用工具的平台,百炼自发布一年多以来已历经数次重要迭代。当厂商意识到未来卷的不再是基础模型而是应用层面时,可发现百炼真正是在提前布局,解决用户在AI发展中的需求。
开发平台的演进方向是在提升用户便捷度的前提下降低用户使用成本。像百炼新近增加的Context Cache功能,针对在使用文本生成模型时,不同的推理请求之间可能会有重合的输入内容这类场景,通过缓存重复性输入大量数据,对于公共上下文仅收取一次费用,经测算最高可节省90%的成本;同时在Context Cache对这些请求的公共前缀内容进行缓存后,可在推理时减少重复运算量,显著提升模型响应速度。
Amazon Bedrock新增的提示词缓存技术与此理念类似,也是针对批量处理推理问题时减少重复的场景,比如一家律师事务所创建的生成式AI聊天应用程序,用于回答律师有关文本的问题。类似的还有Anthropic API上推出的Prompt Cache功能。可见,大厂间都在着眼于在细微的用户体验上做不断改善。
AI基础设施竞赛升级
在基础模型快速迭代和应用开发逐渐深入背后,一个转变正在悄然发生。
生成式AI时代不再仅仅是大模型训练能力的内卷,一方面资源消耗压力会让一些角色逐渐掉队,另一方面比“拼卡”更重要的是工程化落地的能力,需求已经从模型训练转向模型推理和AI应用落地。这需要有自己的一套技术架构和范式,更需要紧贴客户需求,在包括基础模型、应用开发和AI基础设施在内的完整体系和生态上均有过硬实力与市场洞察。
图片系AI生成
当前,企业对大规模算力需求增加。“在新增算力市场上,超过50%的新需求由AI驱动产生,AI算力需求已经占据主流地位。这一趋势还会持续扩大。过去一年,阿里云投资新建了大量的AI算力,但还是远远不能满足客户的旺盛需求。”阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在云栖大会上说。
无疑,AI对基础设施提出了更严苛的新要求,这也是眼下最卷的一条赛道,像算力、成本、时延、安全等,时代在推着云厂商不松懈地往前跑。大厂从自研推理芯片到数据平台、网络架构都在针对AI进行优化升级,改变是全栈式的,不光在与同行赛跑,还要和用户需求赛跑。
同时,企业越来越注重AI应用落地,对多模态数据(包括结构化、半结构化和非结构化数据)处理能力要求进一步提升。但具体来看,客户需求并不完全相同:有的企业业务复杂、数据量大,需要从微调训练等早期阶段开始定制化开发,与AI技术深度融合;也有企业则更倾向于轻量化推理,实现业务流和数据流的结合,简化数据库管理、提升数据治理水平。
面对企业当前的综合性需求,阿里云推出了OpenLake解决方案,可以实现整合大数据处理、AI分析以及多模态数据管理一体化,显著降低数据管理和分析的复杂性,并加速从数据中提取价值的过程。
具体来说,OpenLake基于OSS的统一存储,使用Metadata Service (Data LakeFormation)统一纳管结构化、半结构化和非结构化的多模态数据,提供对湖仓表和数据文件的安全访问以及IO加速。向上,提供对大数据搜索和人工智能平台的多引擎对接,包含流、批、增量、搜索多样化计算支持,实现引擎平权的联合计算,满足秒级到小时级数据处理能力。最后,基于Dataworks Notebook的一站式SQL与Python开发,让数据与模型训练的工作流无缝连接。
而数据库系统也在进一步顺应AI时代的数据管理需求,让多模处理和实时分析能力像搭建积木一样易用、好用。为此阿里云发布了由Data+AI驱动的多模数据管理平台DMS,创新设计了统一、开放、跨云的元数据服务OneMeta及DMS+X的多模联动模式OneOps。
其中,OneMeta首次打通不同数据系统,可支持全域40+种不同数据源,支持他云、自建数据源无缝对接,提供数据血缘和数据质量的一站式Data+AI数据治理。OneOps则可实现DMS+X的多模联动模式,将X( 即云原生数据库PolarDB、云原生数据仓库AnalyticDB、云原生多模数据库Lindorm等多样化的数据存储、分析、计算、AI引擎)集结到统一平台进行一站式数据和模型任务编排。数据显示,DMS可为客户降低高达90%的数据管理成本,使业务决策效率提升10倍。
为进一步实现灵活高效的异构资源管理,阿里云上线了PAI训推一体调度引擎,即一体化的智算管理与调度系统PAI Serverless引擎。它是一个集本地训练、云端训练和端侧验证部署于一体的一站式工作流,最高可扩展10万卡,有效算力利用率超90%。不难看出,开放与一站式一直是阿里云AI基础设施搭建过程中的理念坚持。
业界已经强烈感受到,大模型的到来以及生成式AI的场景落地使人工智能的发展明显提速,其发展节奏对比主要以机器学习为主的AI 1.0时期,要快得多。前期技术储备不足的公司已出现掉队或调整倾向,一直坚持技术创新的公司方能适应、引领这个节奏。
中国工程院院士、阿里云创始人王坚认为,人工智能和云计算的结合会带来云计算的第三次浪潮,它不会在一年、两年完成,它可能会在十年、几十年里让足够多的创新在云计算时代诞生。如今新的浪潮已来。
基础大模型、AI应用开发、AI基础设施共同构成了AI云,而AI云正是面向企业AI落地需求全栈升级的云,更是云计算在AI时代的延伸。这样的新趋势正在席卷全球AI领域,引领一场新的变革。
2009年飞天云计算操作系统问世,掀开了中国云计算的第一页,阿里云产品技术创新以此为起点,十几年间秉承初心,持续提升技术实力和创新能力,已经成为推动AI云趋势变革的重要力量。
产品技术创新之路没有终点,如果想了解更多阿里云未来产品技术能力的更新,或回顾阿里云近一年在产品与技术上所做的升级发布,可进入“阿里云飞天发布时刻”平台——以最前沿的技术和实践,共同见证AI的“飞天”时刻。(本文首发于钛媒体APP)
-
文章
9198
-
浏览
563
-
获赞
5
热门推荐
-
女性申请“杰青”,年龄上限放宽至48岁
国家自然科学基金委员会决定,将女性申请“杰青”的年龄限制由45周岁放宽至48周岁。人民视觉/图)2023年7月6日,国家自然科学基金委员会明确,从2024年起,将女性科研人员申请“杰青”的年龄限制由4首艘国产大型邮轮爱达•魔都号顺利完成首航
上海2024年1月7日 /美通社/ -- 今日,爱达邮轮有限公司旗下国产首艘大型邮轮"爱达•魔都号"顺利完成首航,3000余名来自16个国家和地区的乘客完成了7天6晚前往韩国济州与再见2023:一串数字,一组成绩,国民度假品牌君澜进行时
杭州2024年1月3日 /美通社/ -- 凡是过往,皆为序章。在2023年的尾声,君澜用一组令人欣喜的数据,与你分享更好的君澜。2023年,随着消费者对旅游的需求逐渐多元化、品质化,以休闲度假为目的的太平金科携手浪潮信息:释放算力新生产力,加速业务创新
北京2024年1月2日 /美通社/ -- 当前,算力已然成为助推金融行业高质量发展的核心力量,而太平金融科技服务上海)有限公司以下简称"太平金科")作为中国太平保险集团旗下一级子公花34亿给22公里河道贴瓷砖?郑州市城乡建设局通报金水河综合整治工程情況
金水河是贯穿郑州主城区的一条城市河流。金水河综合整治工程前期研究工作于2020年6月启动,主要是为了解决金水河行洪排涝能力不足、服务设施陈旧、河道生态功能及服务功能缺失等问题,是集行洪排涝、生态功能修香港时间廊荣获由世界品牌论坛颁发的"2023
香港2024年1月3日 /美通社/ -- 总部设在香港的知名钟表零售商时间廊(City Chain),被世界品牌论坛(WBF)评为享有盛誉的"2023-2024年度最佳钟表零售商品牌&quo极速换电刷新网约车补能效率 快快出行与奥动签署战略合作协议
广州2024年1月5日 /美通社/ -- 深圳市快快汽车租赁有限公司以下简称"快快出行")与奥动新能源汽车科技有限公司以下简称"奥动新能源")共同宣布达成战略合Vantage基金会携手Duotech为当地社区送欢乐
新加坡2024年1月5日 /美通社/ -- Vantage基金会联合本地企业Duotech共同发起了一项暖心合作项目,旨在培育社区凝聚力,并在刚刚过去的节日季为需要帮助的人们带来了更多希望。凭借Van在世界人口日回望近百年人口趋势丨有数
2023生命科学十大创新产品评选拉开帷幕
广州2024年1月4日 /美通社/ -- 从击败围棋冠军的AlphaGo,到成功预测蛋白质结构的AlphaFold,再到如今风靡全球的ChatGPT,人工智能AI)不仅惊艳了全人类,也对生命科学领域产新年伊始,侬好晨光 2023
上海2024年1月2日 /美通社/ -- 作为海派文化的发源地和中西文化交汇地的核心区域,徐家汇书院与foo’mart東西公园在新年伊始之际,正式推出以“壹宜以意”为主题的一周年特别企划。作为扎根于上锦州市隆正健康管理服务有限公司|走好健康之路,享受健康人生
要把人民健康放在优先发展的战略地位,以普及健康生活、优化健康服务、完善健康保障、建设健康环境、发展健康产业为重点,加快推进健康中国建设,努力全方位、全周期保障人民健康,为实现“两个一百年&“泰坦”探险“泰坦尼克”号悲剧重演 “灾难性内爆”5人全部罹难
这张照片拍摄的是美国海洋之门勘探公司的“泰坦”号深海潜水器。 新华社/美联/图)96小时生死救援,多国力量参与,但奇迹终究还是没有发生。当地时间2023年6月22日下午,美国海岸警卫队在新闻发布会中确药明康德多肽产能实现3倍增长 泰兴原料药生产基地迎来正式投运
多肽固相合成釜总体积提升至32,000L,以满足激增的市场需求上海2024年1月8日 /美通社/ --药明康德今日宣布其位于江苏常州及泰兴两个基地的多肽生产车间正式投产,多肽固相合成釜总体积提升至32Unity中国深耕本土科技生态,团结引擎创世版震撼来袭
上海2024年1月2日 /美通社/ -- 2023年8月,作为全球领先的实时3D渲染引擎Unity在华的合资公司,Unity中国宣布即将推出专为本土开发者打造的团结引擎,开启本土化进程的全新篇章。经过