OD体育全站app下载中国入口 大模子第一梯队该有谁? 云知声用U2投了一票



大模子正堕入一场“武备竞赛”式的狂欢。参数畛域从千亿到万亿,落魄文窗口从1万到100万,各家厂商你追我赶,仿佛谁投更多算力、堆更大参数,谁就能赢下这场AI竞赛。但扣问标明,单纯增多参数带来的性能进步正在急剧递减。
斯坦福大学发布的《大模子畛域定律》指出,当参数跨越5000亿后,模子在推理才气、学问连气儿等中枢主义上的进步幅度从早期的30%以上降至不及5%,而窥探本钱和能耗却呈指数级增长。
企业真确需要的,是一个参数天文数字的“万能选手”,照旧一个弥漫明智、弥漫低廉、能实果然在干活的“专科搭档”?
6月8日,云知声发布自主研发的下一代原生智能体模子U2,一款有近3000亿参数的MoE寥落模子,声称能在无数任务上并列万亿参数模子。更错误的是,其推理本钱显耀低于同尺寸畛域大小模子。
当大无数玩家还在比谁的模子“更大更强”,云知声遴荐了一条“强而小、强而省、强而能落地”的互异化旅途。这条旅途的逻辑是什么?底气从哪来?能否撑起“国产第一梯队”的所在?
1
大模子界的
“反内卷选手”
现在主流的万亿参数级别大模子,动辄需要上千张GPU卡才能跑起来,单次推理的电力本钱和算力本钱高到让大部分企业规避而视。而U2的近3000亿总参数,激活参数目只消百亿级别,按照MoE架构的寥落特质,每次推理只调用约十分之一的各人参数。
这背后的底层公式,是云知声创举东说念主黄伟冷漠的一个见地:AI公司行业价值=智能密度×Token价值。
什么叫“智能密度”?黄伟的清晰是:不是单纯强调模子小,而是在模子性能达到民众第一梯队水平后,进一步探究每单元参数里承载了若干知识、推理才气和任务责罚效劳。
用一句更直白的话说:你用十个参数颖异别东说念主一百个参数的活儿,你的智能密度就更高。
而“Token价值”则是另一个被行业忽视的维度。往时两年,大模子厂商可爱比“生成多快”“生成若干”,黄伟把这个逻辑反过来问:如果生成的Token莫得业务价值,那它不是收入,是本钱。Token价值不是看数目,是看每次调用能否真确漂泊为业务闭幕。
U2是云知声自研、基于快慢念念考会通的寥落羼杂各人(MoE)架构通用大语言模子,从假想之初就锚定“为实行而生”,而非“为生成而生”。

其领有许多工夫亮点,举例在高智能密度方面,通过知识爽朗编码、语义压缩优化,近3000亿参数的U2在无数纯文本任务接近以致超过国内万亿参数模子,参数效劳接近后者约5倍。用更少参数承载更高密度知识与推理才气,告别无效参数堆砌。
“Agent+Harness协同演进”是U2的另一个错误标签。
传统大模子骨子上是“嘴强王者”,能恢复问题、能写著述,但真要让它去完成一个复杂的多格式任务,比如自主调用器具、有筹办旅途、实行操作并验收闭幕,就得在外面包上一层厚厚的“应用壳”。
U2的器具调用、情景料理、多步有筹办均为模子原生才气,可自主连气儿所在、拆解任务、调用器具、实行验收,适配复杂长程任务,而非靠外挂终了智能体效果。主淌若依赖旅途有筹办实行与harness协同演进,立异假想原生推理旅途蒸馏机制,构建筹办-环境探索-实行-验收全链路闭环才气,高效独霸复杂长程任务。
具体而言,U2将模子原生Agent才气的进步与Harness(任求实行脚手架)的迭代优化纳入团结窥探闭环,酿成双向强化的协同演进机制。一方面,Harness字据刻下模子才气畛域与特质合手续迭代,为模子提供更精确的任务环境与反应接口;另一方面,模子诈欺优化后的Harness复返的高质料轨迹数据,合手续强化多步有筹办、器具调用、流程纠错与闭幕验收才气。
这种底层窥探机制的夺胎换骨,在直不雅的应用层带来了全新的使用体验。哪怕是在纯当然语言的交互场景下,它的原生实行力也体现得大书特书。以我最近测试的一个前端拓荒任务为例,笔者行为别称文科生,从来不会写任何代码,我只需要在U2对话框里输入一段指示:帮我写一个单文献的网页小游戏,模拟烟花飞到空中然后盛开。条件画面独特炫酷,五颜六色的线条轨迹,况且我不错用鼠标去互动。
令东说念主惊喜的不仅是它在不到2分钟内一次性寄托了无Bug的制品代码,更在于它在生成流程中展现出的“原生有筹办感”——它无需外部教导,便自主完成了从底层canvas逻辑构建、五彩线条轨迹的物理模拟,到鼠标交互事件的精确挂载。全程单次交互便达到验收模范,直不雅考据了其内化的任务领悟与实行才气。

个东说念主的惊艳体验并非孤例,畛域化的评测数据也为这种“高实行力”提供了严谨的佐证。U2在最新的综合评测中展现了非常求实、面向果然企业级落地场景优化的高大实力。评测深度障翳了智能体才气(AgenticCapacity)、实战化智能体专项(ClawSpecific)、长文本才气(LongContext)、知识与推理(Knowledge&Reasoning)以及指示解雇(InstructionFollowing)五大中枢维度,障翳范围与U2的中枢假想取向高度契合。
让东说念主惊喜的是,在6月10日国外巨擘AI模子评测平台LLMStats更新的榜单中,云知声U2登上两项错误评测:在LLMStatsScore综合才气榜单中干涉模子总榜前30,按厂商最好模子收货位列民众模子厂商第九。此外,LongBench-V2评测名次中,U2的长文本才气以54.4%的准确率超过ClaudeOpus4.7(53.9%),仅过期GPT-5.4(55.6%)1.2个百分点,名次民众第二。意味着其中枢的落魄文信息提真金不怕火、跨段落推理才气已达到民众第一梯队水平。


此外,评测闭幕全面印证了U2“双高+原生智能体”的中枢主张,建造了其行为新一代高效Agent模子的行业地位。领先是三大基础才气全面夺魁,印证“高智能密度”;其次是代码工程与Agent实战稳居第一梯队,彰显“原生智能体”本色;临了是极致能效带来压倒性降本上风,践行“低本钱高产出”策略。

「枪弹财经」发现,U2的底层逻辑,是先达到一流智能水平,再把本钱打到最低。如同造车不是马力越大越好,而是在保证速率与安全前提下作念到最省油。
黄伟的譬如直白又精确:“我不需要一个中国科学院院士来开滴滴。许多任务场景不需要最高智能,硕士博士水平就够了。”
2
十几年的“长征路”
许多东说念主对云知声的印象还停留在“作念语音识别”,这个领略偏差其实不小。
在AI1.0期间,它的闻名度远不如商汤、旷视那批“AI四小龙”。但黄伟有一个很异常旨真谛的不雅点:云知声不是从语音走向大模子,OD体育(中国)而是从智能交互走向大模子。
翻开时辰轴,不错看到云知声的一条发展干线:语音仅仅进口,背后是意图连气儿,再背后是任求实行。
2012年创立,同庚攻克“5米远讲”工夫;
2013年发布业内首款语音电子病历,走进协和病院;
2014年推出语义云,业内首提“云霄芯”一体化策略;
2018年自研AI芯片“雨燕”面世;
2023年发布山海通用大模子;
2024年山海医疗大模子登顶MMDU、MedBench等民众榜首;
2025年6月,云知声在港交所挂牌上市,被誉为“AGI第一股”。

这十多年里,云知声险些在每个工夫周期王人提前下了注,只不外“踩早”是有代价的。黄伟我方说得坦率:“踩早总比踩晚好。踩早了你付出的是时辰本钱,踩晚了你连入场的契机王人莫得。”
上市近一周年,首份年报交出的数据颇有看头。2025年全年,云知声总营收12.11亿元,同比增长29.0%。其中大模子相干业求终了收入6.1亿元,同比增长逾10倍,占全体营收比重攀升至50%以上。大模子业务从早期的工夫探索阶段,转换为复旧云知声发展的中枢驱能源。
还有一个值得柔顺的数字,2026年5月,云知声Token调用收入的ARR环比暴涨600%,瞻望6月将络续保合手高增长。这意味着公司收入与客户AI使用强度已深度绑定,业务的畛域天花板全面绽放。
买卖落地的案例最能证实问题。云知声业务聚焦贤达医疗和贤达生存两大中枢领域:在医疗端,其AI接济病历生成系统已在北京友谊病院等多家三甲病院畛域化应用,前年仅顺义院区就生成跨越45万份病历,径直援用率超90%;在金融端,其车险理赔AI责罚决议匡助头部保障公司控费率进步3%,每年省俭保费约一二十亿元。这些落地闭幕充分考据了云知声工夫的买卖价值。
站在更大的视角看,云知声在AI医疗领域的探索也曾有近十年。适度2025年末,公司已累计与世界近450家病院联接,世界综合名次A++及以上病院障翳率接近35%。

这些数字背后是一个果然的买卖逻辑:模子不是靠参数堆出来的,是靠场景喂出来的。
黄伟将其轮廓为“模数共振”,模子的性能离不开高质料数据,而好的模子如果不落地,既无法创造价值,也难以在果然场景中取得高质料数据来鼓励工夫迭代。如今,云知声的贤达医疗业务已凡俗应用于智能电子病历、临床接济会诊等中枢场景,恰是“模数共振”的典型案例。
这个正反应一朝开动,就很难停驻来。
3
大模子第一梯队,
凭什么有云知声?
大模子下半场的竞争焦点,也曾从“谁更强”转向“谁能以更低本钱、更理会方式寄托弥漫强的才气”。在这个新维度上,云知声正凭借多年积聚的数据壁垒、工程化才气和买卖化考据,踏进大模子第一梯队。
行业形式远不决型——这是黄伟反复强调的判断。他说:“2018年东说念主们也合计形式已定,然后许多公司就死掉了。”AI2.0期间留在牌桌上的公司比1.0期间少得多,但市集空间比以前大多了。
黄伟把往时三年界说为“热身赛”:2023到2025年,国内企业和OpenAI的差距从3—5年松开到3—6个月,但Agent仅能完成单步肤浅任务。2026年才是“正赛”的启程点,AI从生成式升级为“分娩力AI”,Agent能零丁完成复杂任务,买卖化窗口真确绽放。
开源模子能责罚70%—80%的日常问题,但剩下20%专科用户的20%专科问题,才是真确的护城河。高价值行业的“临了一公里”,一定是通用模子加上行业know-how来共同责罚。
云知声可能是少数几家真确有阅历这样说,也稀有据这样作念的公司之一。
领先是数据壁垒。云知声在医疗领域深耕了十三年,积聚了超10亿条合规脱敏的医疗病历数据,这些数据在互联网上搜不到,是跑过果然业务、经过医师履行使用千里淀下来的。在物联网领域,联接伙伴跨越2万家,端侧AI芯片出货量破裂1亿颗。十几年的场景数据不是想买就能买、想抄就能抄的。

其次信任壁垒通常蹙迫。云知声劳动了跨越400家三甲病院,联接病院中85%为三级病院,三分之一联接年限跨越3年。在B端市集,替换本钱极高,一朝切入就锁定了后续收入。这酿成了一种飞轮效应:越多的行业数据,带来越好的模子效果;越好的模子效果,带来越多的客户信任;越多的客户信任,又千里淀越多的行业数据。
临了是工程化壁垒。云知声能把大模子压缩到零点几B的大小跑在离线末端芯片里,车载场景下,大模子蒸馏至0.5B参数即可终了端侧无损交互。复杂声学环境下的定向识别、多东说念主谈话离别工夫,国内能作念到的公司仅两三家。

有了U2,云知声的买卖模式正在发生质变。ToB端,兽牙智能体平台正在加快落地,中标障翳医疗、医保、交通、客服、工牌等多个领域;ToC端,公有云MaaS的OPC生态合手续产生Token收入。一个形貌寄托周期从3个月裁减到1周,本钱臆造80%。
4
收尾
回看云知声走过的十几年,从语音识别到智能交互,从AI芯片到大模子,每一次工夫海浪驾临前,它王人在牌桌上。但“踩早”的代价也很现实。
从U2的“智能密度”道路,到年报里大模子收入暴增10倍的考据,再到400多家三甲病院的信任托底,云知声用一种不太“互联网”的方式,走到了大模子第一梯队的门口。它莫得选最吵杂的路,但选了一条最难被复制的路。
正赛哨声已响。问题不再是云知声能不可坐上这张桌子,而是当大模子的竞争从“写得好”变成“干得好”OD体育全站app下载中国入口,这张桌子上的法例,会不会被改写?

备案号: