1月28日凌晨,多模态大模型Janus-Pro悄然上线,美股这也是市场国内AI创业公司DeepSeek在一个月内上线的第三款大模型。受到“DeepSeek冲击”影响,中美英伟达股价暴跌6000亿美元,竞争甚至殃及美股和日股市场。格局改变
再赢一局
继大语言模型V3和推理模型R1之后,干崩Deepseek毫无预兆地发布了多模态模型Janus-Pro,美股分别有10亿和70亿两个参数规模。市场几小时内,中美均在AI社区Hugging Face上引发了激烈的竞争讨论。
DeepSeek公布的格局改变技术文档显示,Janus-Pro模型能实现文字和图像的干崩双向识别,相当于AI能看懂图片并用文字描述,美股同时也能通过文字指令生成图片。市场
这并非Deepseek首次推出多模态大模型,Janus-Pro是此前发布的JanusFlow的迭代版本。通过优化训练策略、扩展训练数据,Janus-Pro在多模态理解和文本到图像的指令跟踪功能方面都取得了重大进步,同时还增强了文本到图像生成的稳定性。
DeepSeek披露的测试结果,在文生图GenEval和DPG-Bench基准测试中,Janus-Pro-7B的准确率较前代Janus大幅提高,准确率测试结果分别为80%和84.2%,也高于OpenAI DALL-E 3、Stable Diffusion在内的其他对比模型。
多模态模型Janus-Pro的测试结果。
几乎同一时间,通义千问也宣布开源视觉模型Qwen2.5-VL的多尺寸版本,其中旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军。新的Qwen2.5-VL能够更准确地解析图像内容,支持超1小时的视频理解。
“DeepSeek冲击”
或许DeepSeek自己都未曾想到,一个月内连发三款大模型,能给大洋彼岸的华尔街一记重创,被媒体称为“DeepSeek冲击”。
“DeepSeek-V3总训练成本仅为557.6万美元,而GPT-4o的成本高达1亿美元,但是两者却效果相当。”钟俊浩认为,DeepSeek的四两拨千斤,也让业界对算力需求有了重新的预估。
最先受到冲击的便是英伟达。美股时间1月27日收盘,英伟达公司股价下跌16.97%,市值一日内蒸发近6000亿美元,创下华尔街股票市值单日最大跌幅的纪录。其他半导体企业也受到波及,博通下跌17%,AMD下跌6%,微软下跌2%,纳斯达克综合指数跌去了3.1%,相当于损失超过1万亿美元。“DeepSeek冲击”并未止步于美股市场,日本股市也延续颓势,爱德万测试、东京电子、瑞萨电子等均迎来大跌。
突然爆火让DeepSeek遭遇网络攻击。
甚至连电力市场也受到冲击。美国联合能源公司股价下跌21%,电力“黑马”Vistra暴跌29%,与OpenAI密切相关的核裂变反应堆公司Oklo,股价也止涨转跌,一日跌去25%。
真正的“OpenAI”
“这是开源模型的胜利。”图灵奖得主杨立昆将DeepSeek的成功,归因为“开放研究和开放源代码的力量”。
DeepSeek从创始之初坚持开源,V3、R1以及Janus-Pro等最新大模型均通过技术文档面向所有人公开。目前,已经有不少人通过公开技术路线,成功复现了DeepSeek的测试结果。
钟俊浩告诉记者,DeepSeek采用MIT许可协议,完全开源,不限制商用,且无须申请,并且明确允许用户可以随时随地访问这一资源,让每个人都能平等获取知识与信息。比如,DeepSeek-V3不仅开源了模型权重,还支持本地部署。开发者可以根据自己的需求对模型进行定制和优化,甚至可以将其部署到自己的服务器上,完全掌控数据隐私。
相比之下,冠以“open(开放)”为名的OpenAI反而走向了闭源道路,在GPT-3发布之后限制了对模型的访问权限,仅通过API提供服务,GPT-4同样隐藏了训练数据和模型权重,彻底闭源了。即便是GPT-2的开源也并非基于MIT许可协议,有相当多的限制。难怪不少人认同“DeepSeek才是真正的‘OpenAI’”。
无论是大模型能力的赶超,还是对美股市场的冲击,以及坚守开源的胜利,DeepSeek的成功,侧面也反映出中美在AI全球竞争地位也在悄然发生改变。
正如DeepSeek创始人梁文锋此前采访时说,过去很多年,中国公司习惯了别人做技术创新,然后拿过来做应用变现,现在随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。
DeepSeek的口号,或许便是最好的阐释——探索未至之境。
栏目主编:李晔 题图来源:上观题图
来源:作者:解放日报 查睿
文章
2
浏览
25518
获赞
2
揭秘缅北“前世今生” 四大家族电骗吸血
图:云南公安机关与缅甸相关地方执法部门加强边境警务合作,近日密集开展抓捕行动,一大批电信网络诈骗犯罪嫌疑人相继落网。真相故事11月12日,浙江温州公安局发布对缅甸电骗“新势力”如何做专业的趋势报告?
【建材网】趋势,是事物发展的动向;报告,是总结分析的结果。从不确定的行业风向,到充满机会的市场主流,一份国际瓷砖趋势报告的出炉,需要具备哪些因素?如何确保报告的专业、严谨和准确?2015年10月20日木门企业加强质量的提高 向中国“质”造努力
【建材网】“德国制造”被称为是世界上产品质量上乘,制作精美的一个代名词。只要一提起德国制造,大家无不对它的质量、品质竖大拇指。然而较近发生的一件丑闻,却砸了“德国制《幻想水浒传1+2HD复刻版》高清画面实机演示公开!
科乐美官方公开了《幻想水浒传 1+2 HD 复刻版》的新实机演示,本次公开的是《幻想水浒传2》中的部分,新的演示展示了高清化的后面,并未展示其他的系统,该作将于3月6日发售,登陆Switch、PS、X官方:32岁金特罗加盟哥伦比亚卡利美洲,身披8号球衣
直播吧1月29日讯 哥伦比亚俱乐部卡利美洲官方宣布,32岁哥伦比亚中场金特罗加盟球队。卡利美洲官方发布公告,确认从阿根廷竞技签下金特罗,球员将身披8号球衣。根据德国转会市场的信息,双方签约至2027年外媒谈《黑神话》空气墙:开放性方面逊色FS社游戏!
近日,外媒thegamer发文谈到了这《黑神话:悟空BLACK MYTH WU KONG)》空气墙,并表示与FS社的游戏相比显得不太开放。文章指出:“每当我试图探索时,总会遇到空气墙的阻碍家装“线上+线下” 硝烟滚滚何时休
【建材网】“互联网家装”这个概念,在国内市场其实早已萌芽,但近年来,整个市场却如“军阀混战”般硝烟弥漫,不论是互联网家装还是传统家装公司,都纷纷扑向这个发售12年以后 《武装突袭3》终于支持CPU多线程了!
《武装突袭3》于2013年发布,当时这款游戏存在严重的CPU问题,因为这款游戏是单线程的,这对它的性能运行表现产生了极大的负面影响。而如今,12年过去了,新的测试版游戏终于较好地提供了CPU多线程的支港珠澳大桥小客车出境通关能力将提升近50% 港澳车“北上”更便捷
澳门月刊 澳门新闻通讯社29日讯 9月29日,港珠澳大桥珠海公路口岸“小客车通关效率提升项目”一期建成启用、二期建设启动暨“大桥口岸服务区”揭牌仪式在港珠澳大桥珠海公路口岸举行。随着“澳车北上”“港车如何做专业的趋势报告?
【建材网】趋势,是事物发展的动向;报告,是总结分析的结果。从不确定的行业风向,到充满机会的市场主流,一份国际瓷砖趋势报告的出炉,需要具备哪些因素?如何确保报告的专业、严谨和准确?2015年10月20日国庆装修狂欢 十一再添个大件!
【建材网】俗话说得好,金九银十,又到了一年装修的旺季,很多朋友开始为新家忙碌起来。在装修的过程中每一项细节都能忽视,更何况有些建材、装饰对家装整个过程起着举足轻重的作用,更是不容小觑。装修过的人都有相AGON爱攻荣获《电脑报》2024中国科技风云榜“年度爆款产品奖”!
近日,《电脑报》2024年度中国科技风云榜正式出炉!AGON爱攻迅猛龙AG246FK电竞显示器赛事专属版因其在2024上海Major赛事中的卓越表现,以及在技术创新领域的优异成果,一举斩获&ldquo《家庭装饰装修服务标准》正式开启编制
近日,由中国建筑装饰协会住宅装饰装修和部品产业分会、中国质量认证中心联合主编的《家庭装饰装修服务标准》在京举办第一次编制工作会议开题会。 《标准》锁定“服游戏项目总监回应 道德系统是否会回归《质量效应5》
昨天小编发了一篇粉丝猜测道德系统将回归《质量效应5》的新闻:有一位粉丝在《质量效应》游戏的官方宣传图片中找到了“楷模/叛徒”系统的一个隐藏彩蛋,由此推测道德系统将回归《质量效应红木产业艰难求生:原材料枯竭、创新乏力
【建材网】木工师傅谭顺安骨节突出的手掌,轻轻落在方桌上竖着摆放的条形木块上,五指并拢,朝外拨了拨,然后捏住一头抬起来,弯下腰,斜着的眼睛将目光汇聚成一条线,瞄向木头直挺挺的边角。“看到好木