~/ai-daily-insights
返回 AI Daily 首页 cd ~/news
2026-06-29-星期一 · #OpenAI · #GPT5.6 · #Grok4.5 · #马斯克 · #Anthropic · #Google · #Meta · #昆仑芯 · #DSpark · #DeepSeek · #孙正义 · #SpaceX · #英特尔 · #14A · #AI芯片 · status: parsed

❯ OpenAI 启动 GPT-5.6 家族预览,Codex 新 UI 被扒出

[预览·三档] OpenAI 已开始向一小批可信合作伙伴推送 GPT-5.6 家族预览,包含 **Sol(旗舰)、Terra(均衡)、Luna(快速廉价)**三款分档模型。同一时间,Codex 在测一个新的 effort-selector 滑块 UI,允许用户按需调节模型投入的计算深度;原有实时语音组件被完全移除,暗示正在进行架构级重做。

[扒码·拆UI] 上述信息来自 @btibor91 和 @testingcatalog 的代码与灰度版本分析。btibor91 先曝光了 Sol/Terra/Luna 的三档命名与预览范围,testingcatalog 随后从 Codex 客户端中挖出滑块 UI 和语音组件移除的界面变更。与 OpenAI 过去六个月的灰度节奏对照——先小范围预览再逐步扩容——GPT-5.6 很可能在未来 4 至 8 周进入更公开的测试阶段。

[预算锚点] 三档模型策略把「选哪款模型」从技术问题变成了采购问题。企业客户接下来要算的不再只是「GPT-5.6 比 GPT-5 强多少」,而是 Sol/Terra/Luna 三档之间的性能-成本斜率。effort-selector 滑块则进一步把推理算力消耗变成一个用户可控的杠杆——低 effort 快速出稿,高 effort 深度推理,同一底座模型按需付费。

signal: 三档分级的真正意图不是多卖三款模型,而是让客户自己把性能焦虑消化成一个可控的成本滑块。

❯ 马斯克:Grok 4.5 已内部测试,性能接近甚至超过 Opus

[内测·月更] 马斯克公开确认,Grok 4.5 已在 SpaceX 和特斯拉进入私有测试阶段。据马斯克披露,模型基于 1.5 万亿参数的 V9 基础底座,在补充训练中加入了 Cursor 编码交互数据,早期评估显示性能接近甚至超过 Anthropic 的 Opus。他同时宣布 SpaceX 此后每月将发布一款全新从头训练的模型。

[代码交互] 1.5T 参数底座相比 Grok 4 是一次大幅跳跃,说明 xAI 已从跟进节奏转入自主迭代。加入 Cursor 数据指向一个明确的产品判断:代码编辑的交互质量是下一阶段的竞争焦点——这恰恰是 Claude 系列在企业端建立口碑的阵地。月更节奏与 Anthropic 和 OpenAI 的「按需发布」模式对比强烈。

[对手换档] 如果 Grok 4.5 确实达到或超越 Opus 水平,xAI 将从第三个玩家变成 OpenAI 和 Anthropic 在企业付费市场的直接竞争者。月更承诺还会压缩模型折旧周期——上一代模型的性价比窗口从按年计算缩短到按月,采购方的预算节奏需要相应调整。

signal: 月更节奏比单款模型的性能数字更值得盯住——它会把模型采购从资本开支变成一条持续的运营账单。

❯ 特朗普政府据报接近允许 Anthropic 恢复 Fable 5 访问

[出口·本周] 据 Axios 援引知情人士报道,特朗普政府接近批准 Anthropic 恢复 Fable 5 的对外访问权限,限制最早可能在本周内解除。此前 Fable 5 与 GPT-5.6 一起被列入事实上的出口管制清单,仅限美国境内少量合作伙伴使用,欧洲和亚洲客户均无法访问。

[半年禁运] 这一轮禁运始于 2026 年初,美国政府以国家安全为由收紧了对前沿模型的管控。Anthropic 在禁运期间处境尴尬:Fable 5 已训练完成但无法大规模交付,而 企业端需求据此前市场数据反而在此期间暴增——kimmonismus 援引数据称 Anthropic 在 2025 年底至 2026 年初的企业用量增速冲到行业第一。客户用的是旧底座,等的却是 Fable 5。

[采购排期] 一旦限制解除,Anthropic 需要迅速把 Fable 5 推入 API 和企业通道。对已在 Anthropic 生态做集成的 企业采购方而言,被冻结了半年的升级路径重新激活。微妙的变量是:同期 OpenAI 的 GPT-5.6 也在预览,两个「被禁运后回归」的前沿模型几乎同时开放,横向对比会比以往更密集。

signal: 禁运解除的快慢,会直接决定 Anthropic 和 OpenAI 谁先拿到企业客户下一轮预算的签字。

❯ 算力短缺:Google 限制 Meta 使用 Gemini

[算力冻结] 据 Financial Times 报道,Google 因算力产能不足限制了 Meta 对 Gemini 模型的使用。Meta 一直将 Gemini 嵌入安全审核、客服支持、广告工具、编码和内部工作流等多个生产系统,限制直接导致相关内部项目出现延期

[付费优先] Google 的困境在于:Meta 是大体量免费使用者,而同一条 GPU 集群还要服务 付费云客户。在算力总量短期内无法大幅增加的约束下,Google 选择优先保障付费端。此事也折射出 Gemini 模型本身正在被推入更多实际生产环境——如果只是实验性接入,Meta 不会因被限而项目延期。

[风险上移] BIS 上周刚警告 AI 基础设施存在循环融资泡沫,Google-Meta 这条新闻恰好提供了一个具体案例:即便是前两大 AI 公司之间,算力分配已经是零和博弈。对企业采购方而言,单一云厂商模型的风险溢价正在上升——一旦厂商自己产能吃紧,令牌配额可能就是下一个被砍的对象。

signal: 算力不是无限弹性资源——当巨头之间都要排队时,企业多模型备份就不再是优化,而是保险。

❯ 百度昆仑芯据报筹划赴港 IPO,目标估值 500 亿美元

[芯片IPO] 据 Qianer Liu 在 The Information 报道,百度旗下芯片子公司昆仑芯科技计划赴香港 IPO,目标估值约 500 亿美元。公司同时要求潜在投资者在 IPO 认购之外,额外采购相当于投资额 3 至 7 倍的芯片产品——这种「认购+采购」的打包方案在科技 IPO 中较为罕见。

[国产替代] 昆仑芯成立于 2018 年,专注 AI 推理和训练芯片设计,是百度在 国产 AI 芯片赛道投入最久的棋子之一。在美国对华芯片出口管制持续升级的背景下——A100/H100 禁令已延续至第三代——昆仑芯作为国产替代标的获得了额外估值溢价。此次选择赴港而非 A 股上市,市场解读为同时考量港股对芯片企业的资金效率和国际化背书

[产能买单] 要求投资者同时采购芯片,本质上是用 IPO 解决「建厂→有客户→证明需求→再融资建厂」这个循环的信任冷启动问题。对投资人而言,除了传统的估值判断,还需要评估这些芯片能不能真的卖出去——昆仑芯的客户集中度和订单能见度将是定价关键。

signal: IPO 加捆绑采购的融资结构,折射出中国 AI 芯片创业当前最大的痛点不是设计,而是谁来为产能买单。

❯ 中国科技企业年内 A 股募资 31 亿美元,同比增 5 倍

[五倍增速] 据 Reuters 援引 LSEG 数据,中国大陆科技企业今年迄今在 A 股市场通过 IPO 募集了 31 亿美元,较去年同期增长超 5 倍。AI 和芯片公司是这波上市潮的核心驱动力,科创板(STAR Market)和创业板(ChiNext)成为主要融资通道。

[两条推力] 这一增长背后是两股力量叠加:一是监管层主动引导科技企业在境内上市,科创板和北交所都在切实加快审核节奏;二是中美紧张关系下赴美 IPO 路径实质性收窄。据 LSEG 同期数据,赴美上市的 中国科技企业数量同比大幅萎缩,A 股和港股成为仅剩的两条规模化退出通道。芯片和 AI 公司的平均募资额也显著高于传统科技行业。

[估值博弈] 一年翻五倍的募资增速说明,AI 和芯片板块在 A 股的估值锚定效应正在增强——后续排队上市的同类企业将直接以前一轮定价为参考。对二级市场而言,短期供给集中会消耗板块资金,下半年估值分化将加速出现,首批上市的公司享有先发窗口优势。

signal: 5 倍增速的背面是——窗口不可能永远这么宽,先上桌的拿估值溢价,后到的可能面临资金分流。

❯ DeepSeek 系初创 DSpark 发布投机解码框架,推理提速 85%

[投机解码] 与 DeepSeek 渊源深厚的初创公司 DSpark 发布了一套投机解码框架,据公司披露可将大模型推理速度提升高达 85%,在「Faster AI, lower costs」这一命题下直接瞄准中国 AI 产业当前最大的工程瓶颈——GPU 受限下的推理效率。

[小猜大验] 投机解码的核心原理是让一个轻量小模型先快速「猜」出后续 token,再由主模型批量验证,从而把串行的逐 token 生成变成并行批处理。这套方法此前在学术界已有验证,但 DSpark 的框架选择了高度可配置的架构,支持不同规模的主模型和草稿模型配对,通用性和可部署性更强。85% 的加幅度等于延迟和单位成本同步下降。

[软路径] 在美国对华 GPU 管制短期内看不到松动的背景下,推理端的软件效率提升正在从锦上添花变成战略必需品。对使用 DSpark 框架的 AI 应用开发商而言,同等 GPU 集群的服务容量可以直接扩约 1.5 至 2 倍,模型的投入产出比会发生跳变。下一步要看框架能否在开源社区获得足够多的适配和压力测试。

signal: 当硬件红利被封住时,推理效率就成了中国 AI 公司的新算力——DSpark 这套框架卡的点恰好是这个缺口。

❯ 孙正义质疑马斯克轨道 AI 数据中心:电力只是 7% 的成本

[7%成本] 据 Tim Higgins 在华尔街日报报道,软银创始人孙正义公开质疑马斯克推动的轨道 AI 数据中心计划,指出电力成本仅占总成本约 7%,其余绝大部分来自发射、硬件、冷却和维护。孙正义的判断是:AI 竞赛将在几年内于地面决出胜负,轨道算力缺乏经济账支撑。

[两线对撞] 马斯克此前描绘的轨道数据中心逻辑是:太空中无需支付土地、冷却和电力在地面所面临的物理和监管约束,且星舰大幅降低了发射成本。孙正义的 7% 数字试图把这个叙事拆开——如果电力在地面已经是小头,那么轨道的「电力优势」本身就不构成经济理由。两位在各自领域举足轻重的企业家就此公开站在对立面,围绕 AI 基础设施的根本方向展开了一场罕见的高层辩论。

[投资投票] 这场争论不是两个亿万富翁斗嘴,它折射出 AI 基础设施投资的两条路线:一条走极端成本优化,一条走规模化地面扩张。对正在投建数据中心的机构和能源公司来说,轨道方案如果被市场认为不成立,地面基础设施的估值会获得额外支撑。资金流向将是最终的裁判。

signal: 分歧之处不在于谁对谁错,而在于市场接下来会用投资流向给其中一条路线投票。

❯ 英特尔承诺今秋向 SpaceX、苹果交付 14A 节点测试工具包

[1.4纳米] 据 Tripp Mickle 在纽约时报报道,英特尔已承诺在今年秋季向 SpaceX 和苹果交付其最先进 14A 制程节点的测试工具包,让两家公司在做出最终生产承诺之前对工艺进行验证。14A 相当于 1.4 纳米级工艺,是英特尔代工战略的关键赌注。

[代工翻身] 英特尔当前芯片代工业务仍大幅落后于台积电和三星,14A 被视为其能否在先进制程上重新进入竞争行列的决定性节点。SpaceX 和苹果同时测试这个节点的深层含义是:两家公司都是台积电的大客户,对英特尔而言,哪怕只拿到其中一家的部分订单,这个投入了数百亿美元的代工战略就能获得首个实质性外部验证。

[双源信号] 对苹果和 SpaceX 来说,测试 14A 不等于切换供应商,但等于给台积电一个明确的信号——先进制程的单源依赖正在被主动打破。如果英特尔能将 14A 良率控制在可接受水平,明年此时可能会看到首批非台积电代工的旗舰芯片出现在产品线上,芯片制造的客户版图将开始松动。

signal: 英特尔要的不只是 14A 的技术分,而是 SpaceX 和苹果这两个名字出现在代工客户名单上。

❯ SpaceX 与 Charter 高管层密谈消费级手机业务

[手机渠道] 据 Kelcee Griffis 在 Bloomberg 报道,SpaceX 与 Charter Communications——全美第二大有线电视运营商——已在高管层面就消费级手机业务展开谈判,目标是将星链直连手机服务从 T-Mobile 的测试合作推向独立零售渠道。合作若达成,SpaceX 将从卫星宽带公司变为直接面向消费者的移动运营商。

[星链落地] SpaceX 的星链卫星直连手机服务目前正通过 T-Mobile 进行测试,覆盖短信和基础通话。与 Charter 的谈判指向的是更进一步的零售落地——利用 Charter 已有的 数千万家庭客户和遍布全美的线下渠道卖手机套餐。这比从零自建渠道要快得多,也表明 SpaceX 不想只做 T-Mobile 的信号补盲合作方,而是想做有独立品牌和定价权的全栈运营商。

[边界消融] 如果 SpaceX-Charter 合作落地,它将是卫星通信和地面电信之间边界最彻底的一次消融。传统运营商(AT&T、Verizon)面对的不再是一个信号补盲的合作方,而是一个拥有卫星、频谱、用户终端和零售渠道的完整新进入者,竞争维度从「网络覆盖」扩展到「渠道和定价权」。

signal: 星链从 B2B 网络服务跳进 C 端手机套餐这一步,会让传统运营商重新审视「卫星只是补盲」这个前提。