~/ai-daily-insights
返回 AI Daily 首页 cd ~/news
2026-07-01-星期三 · #Anthropic · #Sonnet5 · #Etched · #美团 · #LongCat · #寒武纪 · #月之暗面 · #Kimi · #OpenAI · #立讯精密 · #AI推理芯片 · #国产算力 · #开源大模型 · #内存涨价 · #港股IPO · status: parsed

❯ Anthropic Sonnet 5 据传今日上架、Fable 5 改用量积分并要身份验证,官方未证实

[模型上新] 多个泄露账号称 Anthropic 最快今日上线 Sonnet 5,同时让 Fable 5 改走单独”用量积分”、须通过身份验证后才发放额度——以上均来自社区爆料、官方尚未公布。爆料给出的细节相当具体:Sonnet 5 已进模型选择器、以 2 美元 / 10 美元每百万 token 的促销价起步、附带 100 万 token 上下文变体,知识截止 2026 年 1 月。

[爆料拼图] 这组消息由几条线索拼起来。泄露账号 @testingcatalog 从 Claude 应用字符串里读到 Fable 5 将”按计划之外单独计费”,并写明”额度在身份验证通过后发放”;@kimmonismus 援引爆料者 synthwavedd 给出上述 Sonnet 5 价格与上下文规格,并推测会和 Fable 5 重新上架同步发生。关键背景是:Anthropic 此前明确说过身份验证只针对被标记的异常账户、与 Fable 无关,而如今验证文案恰好和 Fable 5 的积分变更一起出现,这才是社区炸锅的由头——口径在前后一个月里掉了头。

[谁要重判] 真假未定的当口,欧洲及非美区用户已经开始担心被”美区限定”一刀切断,只能退而用更弱的 Sonnet 5 顶替 Fable 5。对每天靠 Claude 干活的开发者,要先攥着两个问号别急着换主力模型:促销价会不会到期跳涨、身份验证会不会把团队里的部分账号挡在门外。在官方页面挂出来之前,这条都该当成**“强信号、未坐实”**来读。

signal: 真假难辨先按住,先看 Anthropic 把”身份验证”绑到旗舰模型这一步——它比版本号更能改写谁能用上最强模型。

❯ AI 推理芯片公司 Etched 走出隐身,累计融资 8 亿美元、在手合同超 10 亿美元

[隐身出山] AI 推理芯片公司 Etched 结束隐身,宣布累计融资 8 亿美元、已签超 10 亿美元客户合同,首批机架式产品今夏开始出货——投资方包括量化交易巨头 Jane Street,以及一家与台积电关联的创投。消息来自彭博记者 Dina Bass。这家公司专做面向 Transformer 推理的专用芯片,押注”把模型架构焊死在硅片上”换取速度与成本优势。

[钱与硅片] 几个硬事实支撑它的底气。Etched 称在不到三年里于台积电 N4P 工艺上实现首版流片(A0)即成功,目前正与客户验证首款机架级产品;据彭博报道,此前最近一轮为去年 12 月的 5 亿美元融资、投后估值 50 亿美元。投资人名单里还有 Peter Thiel,以及 Hudson River Trading、Jump Trading、Two Sigma、Stripes 等一众量化与对冲资本。这串名字耐人寻味——最懂”延迟即金钱”的高频交易公司,集体押注一家要把推理做得更快更便宜的芯片初创。当下推理需求暴涨、而单位成本是企业最大的痛点,正是这类专用芯片想撕开的口子。

[谁要重判] 对采购 AI 算力的公司,议价桌上第一次出现了英伟达之外、带着量产硅片和真实订单的另一个名字。能不能真撼动格局,要看两道坎:从 A0 流片成功到大规模稳定交付之间还有多远,以及绑定单一架构的芯片,会不会被下一代模型结构甩下车。先紧张起来的,是那些把”推理只能买英伟达”写进预算假设的算力团队。

signal: 英伟达之外第一次有人带着出货合同和量产硅片叫板推理市场,订单先于估值说话。

❯ 美团开源 1.6 万亿参数 LongCat-2.0,称在 5 万卡国产芯片集群完成训练

[国产训练] 美团开源 1.6 万亿参数大模型 LongCat-2.0,并称其在一个 5 万卡国产芯片集群上完成全流程训练与推理——这是它主打的卖点。模型走混合专家(MoE)路线,每个 token 只激活约 330 亿到 560 亿参数,上下文长度拉到 100 万 token,已在 OpenRouter 以”Owl Alpha”代号开放测试。据路透报道。

[技术底牌] 这是一款面向智能体编码的模型。据美团技术报告,其自报成绩是 SWE-bench Pro 59.5 分,略高于 GPT-5.5 的 58.6,并称整体能力对标谷歌 Gemini 3.1 Pro——这些都是公司自评、未经独立复现。更受关注的是训练底座:美团用了华为的集合通信库(HCCL),外界普遍推测硬件是华为昇腾 910C,但官方此前并未点名具体芯片型号。它自称是”业内首个在 5 万卡国产算力集群上完成万亿参数全流程训练与推理”的模型,权重已挂上 Hugging Face 的 meituan-longcat 组织页。

[谁要重判] 把”万亿参数”和”纯国产卡训练”两件事凑到一起,LongCat-2.0 给中国 AI 圈递了一个样板:在英伟达受限的前提下,国产算力链能端到端跑通一次前沿规模训练。对盯着算力自给的国内厂商,值钱的不是这一个分数,而是这条”不依赖进口卡也能造大模型”的路被走通了一遍。自报基准的水分要等第三方复测,但工程意义上的那道坎已经被跨过去了。

signal: LongCat-2.0 卖的不只是一个模型,是国产算力链能端到端跑通一次前沿训练的证据。

❯ 寒武纪盘中涨超 8% 市值首破万亿,成科创板首只万亿市值股

[见证历史] AI 芯片龙头寒武纪 6 月 30 日盘中涨超 8%、总市值首次突破 1 万亿元,成为科创板史上首只万亿市值股,跻身 A 股总市值第九位、仅次于贵州茅台。截至午盘报 1613 元、年内已涨超 77%。这家曾长期亏损的芯片公司,用一年时间把自己送进了 A 股头部俱乐部。

[业绩拐点] 撑起这轮估值的是真金白银的业绩反转。据寒武纪财报,一季度营收 28.85 亿元、同比增长 159.56%,归母净利润 10.13 亿元、同比增长 185.04%;2025 全年营收 64.97 亿元、归母净利润 20.59 亿元,正式结束上市以来的连年亏损。换句话说,这不是纯炒概念——国产替代的订单第一次实打实变成了利润表上的数字。年报数据显示,“85 后”创始人陈天石直接与间接合计持股 29.34%,对应市值已近 3000 亿元。

[谁要重判] 万亿市值落在一家 AI 芯片公司头上,本身就是一份定价表态:A 股给国产算力开出的估值,已经追上了市场对”英伟达替代”的全部想象。对二级市场的投资者,接下来要算的不再是寒武纪能不能扭亏,而是这份高增速能撑多久、以及万亿之上还剩多少空间——业绩兑现的速度,会直接决定这个估值是地板还是天花板。

signal: 万亿市值落到一家 AI 芯片公司头上,A 股给国产算力的定价已经追上了想象。

❯ 月之暗面 Kimi 完成 200 亿美元估值交割,新一轮投前估值升至 315 亿美元

[估值跳级] 月之暗面已完成上一轮 200 亿美元估值融资的交割,新一轮融资随即启动、投前估值升至 315 亿美元——半年里估值跳了一个量级。据 IT 之家等媒体报道,这家 Kimi 背后的公司今年上半年几乎每月都有融资落地。支撑跳价的,是一条开始显形的收入曲线。

[收入提速] 几个数字把故事讲清楚了。据媒体梳理,截至 6 月中旬,Kimi 的年度经常性收入(ARR)突破 3 亿美元,其中 API 收入占比已超七成并持续走高,增长主要由模型迭代带动的开发者调用放量驱动。报道称,此前上半年这六个月里月之暗面已完成五轮融资、累计金额接近 60 亿美元。多家媒体用同一个类比形容它的商业化节奏:开发者调用放量、API 占比抬升、海外付费用户增长,初现 Anthropic 早期那条曲线的形状。需要提醒的是,315 亿美元为投前估值、以媒体报道口径为准,最终交割数字仍需以正式披露为准。

[谁要重判] 半年五轮、估值六倍跳,一级市场赌的并不是 Kimi 当下的模型排名,而是这条 API 收入曲线能不能真的复刻 Anthropic。对跟投的资本,掂量的重点从”模型够不够强”换成了**“收入增速能不能撑住这个倍数”**;对国内同行,月之暗面把融资节奏和收入叙事绑在一起的打法,已经成了新一轮估值竞赛的参照系。

signal: 半年五轮、估值六倍跳,资本赌的是 Kimi 的 API 收入曲线能不能复刻 Anthropic。

❯ 中国开源模型把推理价压到 18 美分,企业按 token 比价转向更便宜模型

[价格分水] 据路透援引花旗的研究报告,中国开源模型已把推理价格压到每百万 token 约 18 美分,而头部模型平均约 4 美元——价差超过二十倍;OpenRouter 上的开源 token 处理占比,从 1 月的 34% 一路升到 6 月的 65%。当账单按用量计费,模型选型正从”比谁更强”变成”比谁更省”。

[成本倒逼] 这股转向有具体的推手。据路透报道,Coinbase CEO Brian Armstrong 公开称,公司在自家的大模型网关里默认路由到 GLM 5.2、Kimi 2.7 等中国开源模型,这一做法此前已在业内引发讨论,他按任务难度分流——前沿模型留给规划环节,纯执行用它们就是”杀鸡用牛刀”。OpenRouter 上最受欢迎的几款模型如今清一色是中国模型、DeepSeek 居首。研究机构 Gartner 甚至估计,到 2028 年 AI 编码的开销将超过开发者的平均薪资。横在面前的唯一关卡仍是安全顾虑:开源与中国模型在初创公司里普及很快,却因合规和数据顾虑难以攻进大型企业的核心场景。

[谁要重判] 当模型选型变成一道”按 token 比价”的成本题,最先被动的是 OpenAI 和 Anthropic 的定价权——企业买家能逐个任务比价,而不再把”最大的模型”当默认答案。受冲击的不只是价签:以”能力领先”为唯一卖点的定价逻辑正在松动,头部厂商得给出”贵得有道理”的新理由。安全这道门槛能挡多久,决定了这场价格迁移会停在初创圈,还是一路烧进大企业的预算表。

signal: 当模型选型变成按 token 比价,最先承压的是头部厂商的定价权,而不是它们的技术领先。

❯ 立讯精密领衔五家中国公司同日招股,香港单日拟募资至多 56 亿美元

[扎堆招股] 五家中国科技与先进制造公司 6 月 30 日同日在港启动招股,合计拟募资至多 441 亿港元(约 56 亿美元),创下今年香港最繁忙的 IPO 日之一;苹果供应商立讯精密以至多约 31 亿美元的发行额领衔。据路透报道。这是北京推动”优质制造资产就近上市”的一次集中落地。

[一日五单] 招股细节相当密集。据招股文件,立讯精密计划全球发售约 3.83 亿股 H 股、最高发售价每股 63.28 港元、预计净募约 240 亿港元,挂牌日定在 7 月 9 日,募资将主要用于扩产与研发。另外四家覆盖了先进制造的多条赛道:电子陶瓷厂商潮州三环、晶圆代工厂晶合集成(Nexchip)、印制电路板精密刀具商广东大族(Dtech),以及当日最小一单的珞石机器人。更大的背景是,香港上半年 IPO 募资额同比激增 57% 至 224.5 亿美元,为五年来最强开局。

[谁要重判] 五单同日开闸,资金在用脚投票:在中美脱钩与 A 股估值承压的夹缝里,优质制造资产正加速把上市地选回港股。对全球配置资金,香港重新成了买入”中国先进制造”的主通道;对仍在排队的拟上市公司,这波密集招股的认购冷热,会直接定调下半年还有多少家敢往里挤。立讯把第一大客户集中度的老问题带进招股书,定价能不能扛住,是这单的看点。

signal: 五单同日开闸,钱在用脚投票——优质制造资产正加速回流港股这条主通道。

❯ 内存涨价挤压手机厂,小米把 2026 出货目标再砍三成至约 9500 万部

[二次砍单] 据日经亚洲,小米、OPPO、vivo 已告知供应商再度下调 2026 年出货目标、最多砍 30%,其中小米从约 1.35 亿部砍至约 9500 万部——直接推手是 AI 服务器正与手机厂争抢同一批内存。这已是三家今年内的第二轮下调,1 月刚砍过一次。

[内存抢夺] 这条线背后是一场算力对消费电子的挤出。日经称,OPPO 与 vivo 的 2026 目标也已双双下修至各 9000 万部以下;根子在于此前自年初延烧整年的存储芯片荒把元器件成本顶上了天,而低功耗 DRAM 正越来越多地被分流给 AI 服务器。压力同样砸在上游:据高盛测算,三星与海力士在韩股指数里的权重每上升 1%,就可能引发外资从韩国市场撤出约 20 亿美元(该精确口径以高盛研究为准、公开报道未见完整披露),韩股对这两家存储巨头的集中度风险已被反复提示。一边是 AI 抢产能,一边是手机厂被迫让路。

[谁要重判] 手机厂砍单和韩股回调,其实指向同一件事:AI 服务器正在把内存从消费电子手里抢走。对手机厂商,要重新规划的不是机型,而是在缺货涨价里保毛利还是保份额;对存储巨头,订单结构正从消费电子向 AI 服务器倾斜,高毛利的 HBM 把产能从普通内存上抽走,短期是利润、长期是周期。被这条供应链拴在一起的两端,现在要为同一批芯片重排优先级。

signal: 手机厂砍单和韩股回调指向同一件事——AI 服务器正把内存从消费电子手里抢走。

❯ OpenAI 联手键盘厂 Work Louder,7 月 15 日推 Codex 实体快捷键设备

[硬件预热] OpenAI 预告将于 7 月 15 日联手键盘厂商 Work Louder 推出一款 Codex 专属硬件,配文”你最爱的 Codex 快捷键将迎来升级”。据 The Verge 记者 Emma Roth 报道。这是 OpenAI 在编码智能体上罕见地把触角伸向实体外设。

[形态线索] 从预告剪影看,设备外形高度接近 Work Louder 的 Creator Micro 2 宏键盘——一块带多枚机械键、摇杆和触摸感应的紧凑宏键盘。据报道,OpenAI 已在 AI Engineer World Fair 上展出过该设备、命名为 “Codex Micro”,发言人称其是”为放大用户的 Codex 使用而设计”的键盘。两家暂未公布完整规格、定价与兼容信息;作为参照,Creator Micro 2 目前在美售价 199 美元

[谁要重判] 把 Codex 装进一块实体宏键盘,OpenAI 想验证的是一个新假设:编码智能体值不值得在屏幕之外、占用桌面上一块物理空间。对开发者,这更像锦上添花的快捷外设而非刚需;真正的看点在 7 月 15 日——OpenAI 是只想做个 Codex 周边,还是借硬件把自己嵌进开发者的物理工作台

signal: 把 Codex 装进一块宏键盘,OpenAI 赌的是编码智能体要从屏幕里走到桌面上。