OpenAI 启动 GPT-5.6 家族预览，Codex 新 UI 被扒出

❯ OpenAI 启动 GPT-5.6 家族预览，Codex 新 UI 被扒出

[预览·三档] OpenAI 已开始向一小批可信合作伙伴推送 GPT-5.6 家族预览，包含 **Sol（旗舰）、Terra（均衡）、Luna（快速廉价）**三款分档模型。同一时间，Codex 在测一个新的 effort-selector 滑块 UI，允许用户按需调节模型投入的计算深度；原有实时语音组件被完全移除，暗示正在进行架构级重做。

[扒码·拆UI] 上述信息来自 @btibor91 和 @testingcatalog 的代码与灰度版本分析。btibor91 先曝光了 Sol/Terra/Luna 的三档命名与预览范围，testingcatalog 随后从 Codex 客户端中挖出滑块 UI 和语音组件移除的界面变更。与 OpenAI 过去六个月的灰度节奏对照——先小范围预览再逐步扩容——GPT-5.6 很可能在未来 4 至 8 周进入更公开的测试阶段。

[预算锚点] 三档模型策略把「选哪款模型」从技术问题变成了采购问题。企业客户接下来要算的不再只是「GPT-5.6 比 GPT-5 强多少」，而是 Sol/Terra/Luna 三档之间的性能-成本斜率。effort-selector 滑块则进一步把推理算力消耗变成一个用户可控的杠杆——低 effort 快速出稿，高 effort 深度推理，同一底座模型按需付费。

signal: 三档分级的真正意图不是多卖三款模型，而是让客户自己把性能焦虑消化成一个可控的成本滑块。

❯ 马斯克：Grok 4.5 已内部测试，性能接近甚至超过 Opus

[内测·月更] 马斯克公开确认，Grok 4.5 已在 SpaceX 和特斯拉进入私有测试阶段。据马斯克披露，模型基于 1.5 万亿参数的 V9 基础底座，在补充训练中加入了 Cursor 编码交互数据，早期评估显示性能接近甚至超过 Anthropic 的 Opus。他同时宣布 SpaceX 此后每月将发布一款全新从头训练的模型。

[代码交互] 1.5T 参数底座相比 Grok 4 是一次大幅跳跃，说明 xAI 已从跟进节奏转入自主迭代。加入 Cursor 数据指向一个明确的产品判断：代码编辑的交互质量是下一阶段的竞争焦点——这恰恰是 Claude 系列在企业端建立口碑的阵地。月更节奏与 Anthropic 和 OpenAI 的「按需发布」模式对比强烈。

[对手换档] 如果 Grok 4.5 确实达到或超越 Opus 水平，xAI 将从第三个玩家变成 OpenAI 和 Anthropic 在企业付费市场的直接竞争者。月更承诺还会压缩模型折旧周期——上一代模型的性价比窗口从按年计算缩短到按月，采购方的预算节奏需要相应调整。

signal: 月更节奏比单款模型的性能数字更值得盯住——它会把模型采购从资本开支变成一条持续的运营账单。

❯ 特朗普政府据报接近允许 Anthropic 恢复 Fable 5 访问

[出口·本周] 据 Axios 援引知情人士报道，特朗普政府接近批准 Anthropic 恢复 Fable 5 的对外访问权限，限制最早可能在本周内解除。此前 Fable 5 与 GPT-5.6 一起被列入事实上的出口管制清单，仅限美国境内少量合作伙伴使用，欧洲和亚洲客户均无法访问。

[半年禁运] 这一轮禁运始于 2026 年初，美国政府以国家安全为由收紧了对前沿模型的管控。Anthropic 在禁运期间处境尴尬：Fable 5 已训练完成但无法大规模交付，而 企业端需求据此前市场数据反而在此期间暴增——kimmonismus 援引数据称 Anthropic 在 2025 年底至 2026 年初的企业用量增速冲到行业第一。客户用的是旧底座，等的却是 Fable 5。

[采购排期] 一旦限制解除，Anthropic 需要迅速把 Fable 5 推入 API 和企业通道。对已在 Anthropic 生态做集成的 企业采购方而言，被冻结了半年的升级路径重新激活。微妙的变量是：同期 OpenAI 的 GPT-5.6 也在预览，两个「被禁运后回归」的前沿模型几乎同时开放，横向对比会比以往更密集。

signal: 禁运解除的快慢，会直接决定 Anthropic 和 OpenAI 谁先拿到企业客户下一轮预算的签字。

❯ 算力短缺：Google 限制 Meta 使用 Gemini

[算力冻结] 据 Financial Times 报道，Google 因算力产能不足限制了 Meta 对 Gemini 模型的使用。Meta 一直将 Gemini 嵌入安全审核、客服支持、广告工具、编码和内部工作流等多个生产系统，限制直接导致相关内部项目出现延期。

[付费优先] Google 的困境在于：Meta 是大体量免费使用者，而同一条 GPU 集群还要服务 付费云客户。在算力总量短期内无法大幅增加的约束下，Google 选择优先保障付费端。此事也折射出 Gemini 模型本身正在被推入更多实际生产环境——如果只是实验性接入，Meta 不会因被限而项目延期。

[风险上移] BIS 上周刚警告 AI 基础设施存在循环融资泡沫，Google-Meta 这条新闻恰好提供了一个具体案例：即便是前两大 AI 公司之间，算力分配已经是零和博弈。对企业采购方而言，单一云厂商模型的风险溢价正在上升——一旦厂商自己产能吃紧，令牌配额可能就是下一个被砍的对象。

signal: 算力不是无限弹性资源——当巨头之间都要排队时，企业多模型备份就不再是优化，而是保险。

❯ 百度昆仑芯据报筹划赴港 IPO，目标估值 500 亿美元

[芯片IPO] 据 Qianer Liu 在 The Information 报道，百度旗下芯片子公司昆仑芯科技计划赴香港 IPO，目标估值约 500 亿美元。公司同时要求潜在投资者在 IPO 认购之外，额外采购相当于投资额 3 至 7 倍的芯片产品——这种「认购+采购」的打包方案在科技 IPO 中较为罕见。

[国产替代] 昆仑芯成立于 2018 年，专注 AI 推理和训练芯片设计，是百度在 国产 AI 芯片赛道投入最久的棋子之一。在美国对华芯片出口管制持续升级的背景下——A100/H100 禁令已延续至第三代——昆仑芯作为国产替代标的获得了额外估值溢价。此次选择赴港而非 A 股上市，市场解读为同时考量港股对芯片企业的资金效率和国际化背书。

[产能买单] 要求投资者同时采购芯片，本质上是用 IPO 解决「建厂→有客户→证明需求→再融资建厂」这个循环的信任冷启动问题。对投资人而言，除了传统的估值判断，还需要评估这些芯片能不能真的卖出去——昆仑芯的客户集中度和订单能见度将是定价关键。

signal: IPO 加捆绑采购的融资结构，折射出中国 AI 芯片创业当前最大的痛点不是设计，而是谁来为产能买单。

❯ 中国科技企业年内 A 股募资 31 亿美元，同比增 5 倍

[五倍增速] 据 Reuters 援引 LSEG 数据，中国大陆科技企业今年迄今在 A 股市场通过 IPO 募集了 31 亿美元，较去年同期增长超 5 倍。AI 和芯片公司是这波上市潮的核心驱动力，科创板（STAR Market）和创业板（ChiNext）成为主要融资通道。

[两条推力] 这一增长背后是两股力量叠加：一是监管层主动引导科技企业在境内上市，科创板和北交所都在切实加快审核节奏；二是中美紧张关系下赴美 IPO 路径实质性收窄。据 LSEG 同期数据，赴美上市的 中国科技企业数量同比大幅萎缩，A 股和港股成为仅剩的两条规模化退出通道。芯片和 AI 公司的平均募资额也显著高于传统科技行业。

[估值博弈] 一年翻五倍的募资增速说明，AI 和芯片板块在 A 股的估值锚定效应正在增强——后续排队上市的同类企业将直接以前一轮定价为参考。对二级市场而言，短期供给集中会消耗板块资金，下半年估值分化将加速出现，首批上市的公司享有先发窗口优势。

signal: 5 倍增速的背面是——窗口不可能永远这么宽，先上桌的拿估值溢价，后到的可能面临资金分流。

❯ DeepSeek 系初创 DSpark 发布投机解码框架，推理提速 85%

[投机解码] 与 DeepSeek 渊源深厚的初创公司 DSpark 发布了一套投机解码框架，据公司披露可将大模型推理速度提升高达 85%，在「Faster AI, lower costs」这一命题下直接瞄准中国 AI 产业当前最大的工程瓶颈——GPU 受限下的推理效率。

[小猜大验] 投机解码的核心原理是让一个轻量小模型先快速「猜」出后续 token，再由主模型批量验证，从而把串行的逐 token 生成变成并行批处理。这套方法此前在学术界已有验证，但 DSpark 的框架选择了高度可配置的架构，支持不同规模的主模型和草稿模型配对，通用性和可部署性更强。85% 的加幅度等于延迟和单位成本同步下降。

[软路径] 在美国对华 GPU 管制短期内看不到松动的背景下，推理端的软件效率提升正在从锦上添花变成战略必需品。对使用 DSpark 框架的 AI 应用开发商而言，同等 GPU 集群的服务容量可以直接扩约 1.5 至 2 倍，模型的投入产出比会发生跳变。下一步要看框架能否在开源社区获得足够多的适配和压力测试。

signal: 当硬件红利被封住时，推理效率就成了中国 AI 公司的新算力——DSpark 这套框架卡的点恰好是这个缺口。

❯ 孙正义质疑马斯克轨道 AI 数据中心：电力只是 7% 的成本

[7%成本] 据 Tim Higgins 在华尔街日报报道，软银创始人孙正义公开质疑马斯克推动的轨道 AI 数据中心计划，指出电力成本仅占总成本约 7%，其余绝大部分来自发射、硬件、冷却和维护。孙正义的判断是：AI 竞赛将在几年内于地面决出胜负，轨道算力缺乏经济账支撑。

[两线对撞] 马斯克此前描绘的轨道数据中心逻辑是：太空中无需支付土地、冷却和电力在地面所面临的物理和监管约束，且星舰大幅降低了发射成本。孙正义的 7% 数字试图把这个叙事拆开——如果电力在地面已经是小头，那么轨道的「电力优势」本身就不构成经济理由。两位在各自领域举足轻重的企业家就此公开站在对立面，围绕 AI 基础设施的根本方向展开了一场罕见的高层辩论。

[投资投票] 这场争论不是两个亿万富翁斗嘴，它折射出 AI 基础设施投资的两条路线：一条走极端成本优化，一条走规模化地面扩张。对正在投建数据中心的机构和能源公司来说，轨道方案如果被市场认为不成立，地面基础设施的估值会获得额外支撑。资金流向将是最终的裁判。

signal: 分歧之处不在于谁对谁错，而在于市场接下来会用投资流向给其中一条路线投票。

❯ 英特尔承诺今秋向 SpaceX、苹果交付 14A 节点测试工具包

[1.4纳米] 据 Tripp Mickle 在纽约时报报道，英特尔已承诺在今年秋季向 SpaceX 和苹果交付其最先进 14A 制程节点的测试工具包，让两家公司在做出最终生产承诺之前对工艺进行验证。14A 相当于 1.4 纳米级工艺，是英特尔代工战略的关键赌注。

[代工翻身] 英特尔当前芯片代工业务仍大幅落后于台积电和三星，14A 被视为其能否在先进制程上重新进入竞争行列的决定性节点。SpaceX 和苹果同时测试这个节点的深层含义是：两家公司都是台积电的大客户，对英特尔而言，哪怕只拿到其中一家的部分订单，这个投入了数百亿美元的代工战略就能获得首个实质性外部验证。

[双源信号] 对苹果和 SpaceX 来说，测试 14A 不等于切换供应商，但等于给台积电一个明确的信号——先进制程的单源依赖正在被主动打破。如果英特尔能将 14A 良率控制在可接受水平，明年此时可能会看到首批非台积电代工的旗舰芯片出现在产品线上，芯片制造的客户版图将开始松动。

signal: 英特尔要的不只是 14A 的技术分，而是 SpaceX 和苹果这两个名字出现在代工客户名单上。

❯ SpaceX 与 Charter 高管层密谈消费级手机业务

[手机渠道] 据 Kelcee Griffis 在 Bloomberg 报道，SpaceX 与 Charter Communications——全美第二大有线电视运营商——已在高管层面就消费级手机业务展开谈判，目标是将星链直连手机服务从 T-Mobile 的测试合作推向独立零售渠道。合作若达成，SpaceX 将从卫星宽带公司变为直接面向消费者的移动运营商。

[星链落地] SpaceX 的星链卫星直连手机服务目前正通过 T-Mobile 进行测试，覆盖短信和基础通话。与 Charter 的谈判指向的是更进一步的零售落地——利用 Charter 已有的 数千万家庭客户和遍布全美的线下渠道卖手机套餐。这比从零自建渠道要快得多，也表明 SpaceX 不想只做 T-Mobile 的信号补盲合作方，而是想做有独立品牌和定价权的全栈运营商。

[边界消融] 如果 SpaceX-Charter 合作落地，它将是卫星通信和地面电信之间边界最彻底的一次消融。传统运营商（AT&T、Verizon）面对的不再是一个信号补盲的合作方，而是一个拥有卫星、频谱、用户终端和零售渠道的完整新进入者，竞争维度从「网络覆盖」扩展到「渠道和定价权」。

signal: 星链从 B2B 网络服务跳进 C 端手机套餐这一步，会让传统运营商重新审视「卫星只是补盲」这个前提。