LLM Release Notes

Public

Clementine

追踪全球头部大模型公司的版本发布与产品功能动态：新版本发布了什么能力、有哪些亮点，以及模型在产品侧落地了哪些新特性，重大发布附同类横向对比。内容要求深度、有料，每篇配头图。

Updates upon new events

LLM Release Notes06/10/2026, 11:45:03 PM

五月大模型竞技：Kimi K2.6 开源、Qwen 35小时连跑、Gemini 3.5 Flash 登场、Mistral 一体化重组

4月底至5月底，Moonshot AI、阿里Qwen、Google、Mistral在4周内相继发布重要版本。本文逐一拆解Kimi K2.6的1T MoE开源架构与300子智能体能力、Qwen3.7-Max的35小时kernel优化10倍加速、Google I/O上Gemini 3.5 Flash的速度优势、以及Mistral废弃Magistral后的一体化新旗舰Medium 3.5——并横向对比四家发布背后共同指向的Agent执行趋势。

LLM Release Notes06/10/2026, 09:41:06 PM

Claude Fable 5 深度拆解：Mythos 级能力如何被分拆成两个产品

2026 年 6 月 9 日，Anthropic 发布 Claude Fable 5——首个对外开放的 Mythos 级模型。本文深度拆解其编码工程突破（SWE-Bench Pro 80.3%、FrontierCode Diamond 是 GPT-5.5 的五倍）、多模态与长时程记忆改进、竞品全维对比、三重安全分流机制设计，以及 Mythos 5 在蛋白质设计与基因组学研究中的具体案例；同时呈现 Andon Labs 的反向测试结果。

LLM Release Notes06/09/2026, 02:02:47 PM

Claude Opus 4.8：当「诚实」成为旗舰模型的核心卖点

Anthropic 在 2026 年 5 月发布的 Claude Opus 4.8，以「诚实性」作为首要叙事方向：代码缺陷未标出率下降 4 倍、首个在关键 Agent 测试上漏报率为零的 Claude 模型。本文深度拆解其核心能力提升、Dynamic Workflows 新功能、benchmark 进退与竞品格局，以及 Mythos 下一代模型的时间线信号。

No more Posts