IBM专家解读watsonx新功能: 硬币的两面
北京2024年7月9日 /美通社/ -- 今年五月,在美国波士顿举行的新功一年一度 THINK 大会上,IBM宣布了watsonx 平台的两面几项新的更新和新推出的数据与自动化功能,旨在使人工智能(AI)对企业而言更具开放性、家解成本效益与灵活性。新功为了帮助中国客户和合作伙伴进一步了解这些新功能的两面业务价值,IBM中国科技事业部的家解数据与人工智能资深技术专家吴敏达撰文做了以下解读。
IBM专家观点: 硬币的两面
作者:吴敏达
IBM科技事业部 数据与人工智能资深技术专家
引言
IBM Think 是年度盛会,每年都会有令人兴奋的两面新技术推出。作为一家在人工智能(AI)领域有着深厚积淀的家解百年企业,IBM在今年五月的新功 Think 大会上宣布了 watsonx 平台上的新功能,并且在六月发布了这些新功能的两面产品和版本。从这些新发布中我看到了硬币的家解两面,看到了IBM 在 AI 实践中的新功成熟思考。
AI 从创新技术走向商业价值需要全面整体地通盘考虑,两面并不是单一技术就能解决的,这会包含很多的两面性问题,而这些两面性又是相辅相成,最后构成企业自己的最佳实践。比如,AI 技术要与咨询服务相辅相成,重塑利用 AI 开展业务;有效的 AI 模型,需要安全可靠的管控,启用可信任、透明且可解释的数据和 AI 工作流程。
“此两者同出而异名,同谓之玄;玄之又玄,众妙之门”,只有把硬币的两面充分结合,才能让企业真正从生成式 AI 中获益。本文试图结合 Think 2024 带来的产品最新能力来解剖这些两面性,帮助理解 watsonx 解决方案独特的价值和魅力。
IBM专家解读watsonx新功能: 硬币的两面
分与合
企业级 AI 应用的未来在于开放和开源,在过去一年中可以看到国内外大模型百花齐放。社区开源可以让大模型变得更有活力,企业有更多的可供选择的基础大模型,这是“分”的好处。但是硬币的另一面,也要考虑“合”的问题,需要让社区方便地协作并更新现有的大模型,而不是创建多个克隆,依然处于“分”的状态。现在HuggingFace 上有超过两万个 llama 模型分支,这也证明缺少好的方法让社区协作为大模型做出贡献,可以想像如果这两万个分支能合作在一起,将会产生更强大的模型。
其实这个问题不仅仅在社区存在,企业应用也是一样,一家公司希望跨部门在企业内部做大模型的迭代升级,希望利用内部获取的技能和知识进行更新。如何跨部门内部获取技能,重复使用技能,如果不解决“合”的问题,各部门用自己的大模型各自为政,不仅成本高,知识也无法共享。
IBM专家解读watsonx新功能: 硬币的两面
在Think 2024大会上,IBM 和 红帽联合推出了 InstructLab 这一首创的模型对齐技术,这是围绕大模型推动开源创新的革命性方法,可将开源社区的资源直接引入大语言模型。与此同时,watsonx.ai 也最新引入 InstructLab 来解决“分”与“合”的问题,亮点是易于理解、结构良好的分类法,它是一个根据共享特征或关系将实体分类和组织为层次类别的分类树。 InstructLab 分为三个主要分支:知识、核心技能和组合技能。 例如,在这个企业财务领域知识的例子中,企业可以自己添加自己的知识分类,叶节点就是企业自己的知识文档,可以是手册等文档。用分类驱动的方法取代了原来在“分”时候的随机选择,通过关注每个叶节点内的特定企业示例,从而保证“合”的多样性和模型质量。
IBM专家解读watsonx新功能: 硬币的两面
在 watsonx.ai 使用 InstructLab 有四个步骤:首先选择合适的大模型进行尝试,找到不足的知识或技能,并可以通过模型的训练分类法标签看到知识分类和每个分类的知识问答示例。比如以下图示的例子里看到的是有关 IBM 历史的知识以及在知识分类的位置。
IBM专家解读watsonx新功能: 硬币的两面
然后添加知识或技能,并生成训练数据。训练数据立足于源材料,根据与新主题相关的特定文档、手册或书籍生成问题和答案,这确保了信息准确且来源可靠。在评估和验证阶段,模型充当评估器,检查生成的响应是否忠实于原始材料。 这样就能保持新知识的完整性和准确性,最后再学习新的知识和技能“合”成新的模型。
解决“分”与“合”的问题,可以帮助企业的大语言模型与最新的技能和知识保持同步,InstructLab 可以帮助企业获得最新的社区贡献技能并保持最新状态。很多企业希望了解训练大型语言模型需要做些什么,以便能够更有效地调整模型,watsonx.ai 分类法探索器可以帮助 AI 开发人员了解训练模型所需的技能和知识结构,并能够轻松识别差距。
IBM专家解读watsonx新功能: 硬币的两面
IBM watsonx Code Assistant for Z 使用 InstructLab 对 COBOL 编程语言转 Java 进行训练相较于传统方法训练,从原来需要9个月、14次迭代的过程减少为 1周、1次迭代,通过这一方法,代码转化效能提升了20%。
纵与横
企业从生成式 AI 的试验阶段转向生产阶段, 通常有“纵”与“横”两种消费模式:“纵”是从应用出发,企业采用预打包的AI 解决方案;“横”是从平台出发,企业基于工具平台来构建自有 AI 应用。
IBM专家解读watsonx新功能: 硬币的两面
人工智能助手就是为“纵”的需求而生的,是针对企业最关注的特定领域量身定制的开箱即用的应用:代码现代化应用 watsonx Code Assistant、重塑客户服务的应用 watsonx Assistant、工作流程自动化应用 watsonx Ochestrate 和智能对答业务分析应用 watsonx BI Assistant。通过部署人工智能助手,企业可以利用自然语言理解和机器学习技术来自动化业务流程,将各种数据转化为个性化的见解和及时的自动化操作,从而为团队提供所需的专业知识,达成更高水平的绩效,包括更快回应和解决客服问题,提高开发人员工作效率等。
IBM专家解读watsonx新功能: 硬币的两面
watsonx BI Assistant 是最新推出的人工智能业务分析助手,提供真正的自助分析同时保持数据一致性、治理和可组合的全栈解决方案。它的底层是接受过企业相关内容训练和可信的大模型;语义自动化层可以自动理解数据并构建语义模型,根据值得信赖且经过行业验证的业务词汇表训练大模型以丰富元数据的语义。指标目录定义并发布分析指标,能够提取第三方数据模型和语义层中定义的指标。最后以自然语言对话方式,零学习曲线的体验为业务用户提供高级分析和个性化洞察的能力。
比如提问:“今年每个市场所有产品的收入是多少?”,watsonx 助手不仅能给出数据和报表,还能给出洞察:“新款 Tablet-5 出人意料地增长了 10%,英国市场增长了 15%”,最后会根据数据给出行动指导:“建议将资源转移到这些增长领域”。
IBM专家解读watsonx新功能: 硬币的两面
watsonx Code Assistant 是不断发展的一系列代码助手,均由专为代码生成而设计的 IBM Granite 模型提供支持,不仅有广泛的客户采用,而且 IBM内部也利用该能力进行更有效地进行软件开发。适用于 Ansible Lightspeed、主机的 COBOL和 Java 的代码助手,因为专注所以专业,开箱即用地提供基于特定编程语言的预训练模型,以确保代码生成的可信和准确。
IBM专家解读watsonx新功能: 硬币的两面
watsonx 最核心的产品集watsonx.data、watsonx.ai、watsonx.governance 就是解决“横”的需求,提供完整的平台工具。企业可以使用 wasonx 平台根据特定业务数据、专业知识对模型进行调整。随着时间的推移,它变得越来越专业,对业务也越来越有价值。由于企业可以控制平台、 流程和数据,结合强有力的人工智能治理能力,企业累积的价值随时间推移变得越来越大。
在实际的企业自己的最佳实践中,“纵”与“横”往往会交错在一起,watsonx 在打造这一体系的时候也是采用同样的技术架构,每个人工智能助手都是构建在 watsonx 平台上的应用程序,这使得企业在任何阶段都能够无缝叠加应用或平台的能力。最终企业要无感知地应用人工智能,SDK 和 API 也是很重要的环节,所有的人工智能都是嵌入式的,“纵”与“横”的体系中间是通过生态系统整合在一起的。
知与行
企业采用人工智能技术的目的是运用,所以“知”“行”合一变得尤为重要。 在大模型时代,企业的大模型是数据的表现形式,这是人工智能模型的本质,也是企业的竞争优势,不要外包它,而应该保护它。模型和数据都是企业最重要的资产,IBM Knowledge Catalog 就是“知”的部分:它是 AI 时代的智能数据目录,可帮助企业采取智能自助的方式发现数据、模型等。
Knowledge Catalog 最新采用大模型能力来丰富元数据以实现分类自动化,生成数据描述以解释数据属性和值,生成数据名称并将业务术语映射到列,可以通过对话和搜索进行知识目录中的数据查找和操作。
IBM专家解读watsonx新功能: 硬币的两面
最新发布 IBM Data Product Hub 是“行”的部分:它是数据和模型资产消费解决方案,通过简化企业内部生产者和消费者之间的数据产品共享,帮助加速企业实现数据驱动的成果。采用“将数据作为产品进行管理”的方法,数据所有者和数据管理员等数据生产者将能够管理和发布数据产品(数据集、报表、模型、代码和定制的数据衍生品集合)。 这些数据产品易于发现、管理和可重用,确保业务分析师、业务线用户、数据科学家和其他数据消费者可以迅速找到并使用。
IBM Data Product Hub 从 IBM Knowledge Catalog 导入数据资产,并将其打包以供整个企业的自助服务使用,并管理整个数据产品生命周期,从数据产品的加入到报废。新增的数据合同定义了包含条款和条件以及服务水平协议的数据共享协议,将为数据生产者和数据消费者提供相互保证,确保数据以合规的方式共享和使用,从而在数据交换过程中融入信任。整个方案采用生成式人工智能技术来加速数据产品的发现、创建和消费。
IBM专家解读watsonx新功能: 硬币的两面
通过“知”“行”合一,可以根据不同的场景,通过文件、API 和自然语言查询等方法自动向业务用户交付数据产品,从而更快地 AI 在企业大规模应用,产生业务价值。可以在企业内外实现大规模的数据共享,为业务用户构建单一入口,以便浏览整个企业的数据产品,形成真正的数字化“超级”市场。“尔来看此花时”,一旦找到精选的稳定数据产品,“则此花颜色一时明白起来”。
总结
企业广泛采用人工智能的时代已经到来,AI 正从企业内部的小型实验试点转向大规模实施,但这是马拉松长跑,而不是百米冲刺,在过程中需要从不同的维度循序渐进地迭代展开。 具体实践中会遇到很多“硬币”的两面,本文抛砖引玉谈到了“分”与“合”、“纵”与“横”、“知”与“行”。在数据和人工智能项目中还碰到更多的两面,例如:“虚”与“实”:数据是逻辑的集中(“虚”: Data Virtualization)还是物理的集中(“实”:watsonx.data);“动”与“静”:管道实时可观测(“动”:Databand)还是数据血缘和沿袭(“静”:Manta),等等。
作为数据和人工智能的领导者,IBM 不仅服务于众多企业客户,而且自身也在利用生成式人工智能进行着改变。随着 watsonx 产品系列每季度的迭代更新和发展,越来越多的硬币两面会被注意到,并统一在 watsonx 中:“夫道一而已矣”。IBM 愿与您携手,以开放与创新共参 AI 之道!
IBM专家解读watsonx新功能: 硬币的两面
作者简介:吴敏达是 The Open Group 卓越级技术专家(Distinguished Technical Specialist),同时拥有计算机技术与软件专业系统架构设计师技术资格。他现在是 IBM 科技事业部数据与人工智能资深技术专家,拥有 20 多年数据分析软件相关技术经验,是 IBM 认证的大数据架构师和 Watson 开发者,专长是大数据、人工智能等领域。他是 IBM Developer 的大师级作者,已经发表了 40 余篇技术文章和教程。现从事大数据、人工智能相关技术支持和架构设计工作。
IBM专家解读watsonx新功能: 硬币的两面
-
文章
943
-
浏览
651
-
获赞
3
热门推荐
-
居家、囤货、“要不要回国”……“兵变”中的俄罗斯生活
“现在的形势有点危险,在莫斯科的人还是待在家里比较安全。”当地居民安娜告诉南方周末。2023年6月24日,莫斯科街头路人行色匆匆。就在前一日即6月23日,瓦格纳私人军事集团PMC)创始人叶甫根尼·普里纳斯:仍然对球队保持乐观 我们只是需要恢复健康
直播吧1月16日讯 NBA常规赛,76人在主场以119-125加时不敌尼克斯。赛后76人主帅纳斯接受了记者的采访。谈到本场比赛的失利,纳斯说道:“我们只是需要恢复健康。我仍然对球队保持乐观。我相信当我高质量发展调研行丨“山香野果”的“涅槃”重生
在浙江省衢州市常山县有一种特别的水果,叫常山胡柚,它属于酸橙的栽培变种,距今已有600多年的栽种历史。常山县得天独厚的土壤地质条件赋予了胡柚独特的口感,“十分新鲜中混合着五分甜、三分酸、二分苦”。因为流感高发,99%是甲流丨周一健
2024年12月27日,上海,近期流感已进入高发季节,医院呼吸科门诊前来就诊的呼吸道感染患者激增。视觉中国|图焦点【流感高发季,样本病例99%以上是甲流】2025年钟声敲响,人们欢庆新年的同时,发现身打开 “天价”粽子又来了:动辄近千元,人参当馅料......
端午节临近,记者在部分省份采访发现,“燕窝粽”“人参粽”“鲍鱼粽”等“天价”粽子现身市场,馅料名贵、包装奢华。为躲避监管,奢华粽子多由商超销售转向预约订制,由实物礼品变为虚拟礼券,并打价格“擦边球”搞盲人的眼、老人的耳,AI能否帮助残障者重连世界
谭畅使用AI工具生成看不见电极、导线,亦无操纵杆,坐在轮椅上的人通过移动头部、眼球以及眨眼,便能自如地操控轮椅向四周移动。这样的轮椅已经在实验室里诞生。2024年12月13日,位于广州市海珠区的琶洲实“AI味太浓了”:AI代写作业,正在挑战传统教学
何海宁使用AI工具生成/图)很少有人能说清,这是一场始于何时的“攻防战”。2022年,当AI刚刚爆发时,许多大学生只将它当做某种难以名状的科技图腾。他们好奇地与之对话,试图弄清它的“头脑”能否跟上人类中国消费者协会“慧眼计划”升级 可直接为消费者提供真假鉴别服务
中国消费者报北京讯记者任震宇)6月28日,中国消费者协会宣布即日起,中消协“慧眼计划”将直接为消费者提供品牌真假鉴别服务,后续将通过网络向全国消费者提供远程鉴别服务,打通消费维权真假鉴别难的堵点,推进【趋势精品】法兰尼新一代真富锶矿化净水机FLN
【建材网】5月净水大事件,2022年法兰尼“K”系列趋势精品FLN-600G-K6发布会于5月5日在线上重磅举行应疫情防控要求),作为法兰尼新一代真富锶矿化净水机,FLN-60伪劣产品商人、百万粉丝网红,攒出“打击偷拍摄像头”剧本
2024年7月,“影子”团队自称在某地宾馆空调管处发现了摄像头,中间为“影子”。几甘摄2024年是主播“影子不会说谎”以下简称“影子”)打击偷拍摄像头的第一年,也是最后一年。一场发酵于2024年9月的赵露思重病后首露面!确定1/25复工 身体现况曝光
26岁女星赵露思因长期忧郁问题,去年开始出现干呕、晕眩等躯体化症状,日前被目击送医,好友也证实赵露思有失语症状。 然而今15)日有饮料品牌宣布,赵露思1月25日将出席活动,引发外界疑虑。 品牌方稍早也马伊琍官宣30岁小男友,吴昊宸像黄轩又像赵文卓,满脸开心和娇羞
明星姐弟恋又喜添一对!不光是姐弟恋,还是年龄差十八岁,还是无论颜值、演技、品行都甩前夫十八条街的姐弟恋。咱们大女主马利伊的这个新恋情,这也太好磕了吧。最近,一则关于马伊琍的十分轰动的新闻让网友们炸开了“他们无法放弃中国市场”
当地时间2023年6月3日,新加坡,香格里拉对话会期间,在香格里拉酒店举行的韩美日三国防长会谈前,韩国国防部长李钟燮(右)、美国国防部长奥斯汀(中)、日本防卫大臣浜田靖一合影留念。 视觉中国/图)作为中国铁路北京局调整三季度列车运行图 暑期运行图同步实施
中国消费者报讯记者董芳忠)记者近日从中国铁路北京局集团有限公司以下简称中国铁路北京局)获悉,7月1日零时起,中国铁路北京局将调整实行2023年第三季度列车运行图,新图实施将显著提升京津冀路网整体功能和2024年全国安全生产事故死亡人数为历史新低
2024年7月17日,新疆石河子,国家矿山安全监察局新疆局矿山安全生产明查暗访组在兵团第八师新疆天富集团南山煤矿小沟四号煤矿检查。视觉中国/图)2024年全国生产安全事故起数和死亡人数同比分别下降11