推荐系统 20 年来方法换了六七轮，但问题定义从未改变——始终是预测下一个 item。缺多样性、缺发现性、规则泛滥，根源都在这里。真正的范式改变不是换方法，而是重新定义问题：从 Next One 到 Next N。

覆盖 101 篇核心论文（58 篇工业界 + 43 篇学术精选），系统梳理 2022-2026 年生成式推荐从学术概念到工业主流范式的完整技术演进。以 TIGER、HSTU、OneRec 等里程碑论文为核心，深入分析 Semantic ID、模型架构、训练范式、推理增强、长序列建模等关键技术方向。

文章详情

推荐系统

深度学习

技术趋势

2017 年，Ilya Sutskever 读到《Attention Is All You Need》时，立即意识到”这就是我们需要的一切”。OpenAI 随即放弃了 RNN/LSTM 路线，全面转向 Transformer，催生出整个 GPT 系列。Transformer 的并行能力让他们得以实现一直相信的 Scaling 路径。八年后的今天，推荐系统终于走到了同样的路口。 2024 年之前，推荐领域有了 HSTU、TIGER 这样的工作，但大多数团队还在观望。2025 年，我观察到一个明显的转变：大家开始认真地把排序模型 Dense Scaling Up，搞生成式召回和端到端推荐。这很像 2017 年——当时大家忙着把 LR/GBDT/FM 切换到 Deep Model 和双塔，切换过程持续了一两年，之后再没人回头。我的判断是，2026 年将是推荐系统 All-In Transformer 的一年，不改变就落后。

文章详情

日报

技术趋势

今日 AI 领域聚焦于效率与实用性的双重突破：Mistral 发布 Leanstral 1.5 数学证明模型，以 6B 激活参数在多项数学基准上达到 SOTA，每道题成本仅约 4 美元，标志着开源模型在专业推理领域的重大进展。与此同时，Simon Willison 用 Claude Fable 以 149 美元成本完成 sqlite-utils 4.0 的审查与修复，展示了 AI 编码 Agent 的实际工作流价值。产业层面，GenAI 经济体过去 12 个月创收 1100 亿美元，增速为移动/互联网浪潮的三倍，印证了 AI 商业化的强劲势头。此外，X 官方发布 XMCP 服务器，为社交平台

文章详情

日报

技术趋势

今日 AI 领域迎来多个重要动态：OpenAI 提议向美国政府捐赠 5% 股权，探索 AI 公司与国家资本关系的新模式；Anthropic 发布 Claude Science Workbench 并宣布亲自开发药物，AI for Science 战略全面升级。同时，研究揭示 RL 后训练改进高度集中于 Transformer 中间少数层，为优化训练策略提供了反直觉发现；Snowflake 发布 Cortex Sense 解决企业 Agent 因缺乏语义视图而查询失败的核心痛点。开源生态方面，开源 AI 差距地图 v0.1 发布，系统索引 421 个项目；MCP 服务器生态虽近 2 万注册量但噪

文章详情

周报

技术趋势

本周 AI 周报呈现出两条并行的主线：Agent 工程化正在从“能否运行”进入到“能否可靠规模化”阶段，同时推理基础设施的优化开始从通用框架走向针对特定硬件、特定模型的深度定制。第一条主线体现在大量关于 Agent 循环、技能工程、多 Agent 协调的讨论中。AI Engineer World's Fair 上周结束后，Latent Space 连续发布了多篇深度报道，最引人注目的是“自主循环”（Loops）辩论——支持方认为软件工厂已经可行，质疑方则指出 token 成本和可靠性仍然是硬约束。与此同时，Apple 发表的研究直接挑战了一个流行的设计假设：让多个专家 Agent 自由协作反而会降低性能。这让本周的 Agent 话题有了清晰的对立面。第二条主线来自 vLLM 0.24.0 的密集发布。一周内，vLLM 团队推出了 DeepSeek V4 的 DSpark 推测解码原生支持（~250 tok/s，接受长度 5），集成了百度 Unlimited-OCR（35% 快于 DeepSeek-OCR），还发布了 Omni TTS 的全面优化（吞吐提升 172%）。SGLang 也在本周展示了 Agent 辅助开发的工作流，多个 kernel 优化带来 71.4% 的吞吐提升。这些进展表明，推理框架的竞争正在从“跑通模型”转向“为一个模型做深度优化”。以下是对本周四个主题的详细分析。

文章详情

日报

技术趋势

今日 AI 领域聚焦效率革命与 Agent 工程深化：vLLM 团队将 Qwen3-Omni 实时语音推理延迟降至 0.6s、吞吐提升 5.4 倍，标志多模态推理走向实用；Anthropic 与三星洽谈定制 AI 芯片，AI 巨头加速硬件自研；NVIDIA 推出 GPU 收入分成计划，降低初创公司算力门槛。同时，ZCode 以免费策略挑战 Cursor 和 Claude Code，Adobe 展示 'Agentic Site' 概念，预示 Agent 驱动 Web 体验的新范式。学术界方面，蚂蚁集团发布 Vera 框架系统性测试 LLM Agent 安全，Microsoft 推出首个 Offi

文章详情

日报

技术趋势

今日 AI 领域迎来多项重要发布：Apple 在 Safari 中推出官方 MCP Server，成为主流浏览器首次原生支持 MCP 协议，标志着生态从开发者工具向消费级应用扩展。字节跳动发布 Seed2.0 模型系列，聚焦长尾知识与复杂指令跟随，服务数亿用户。NVIDIA 开源 Nemotron-Labs-TwoTower 扩散 LLM 架构，实现 2.42 倍吞吐量。同时，苹果研究挑战多 Agent 主流设计，发现自组织团队表现反而不如单一 Agent，为 Agent 团队设计提供反直觉指导。Palo Alto Networks 揭示“Phantom Squatting”新威胁——LLM

文章详情

日报

技术趋势

今日 AI 领域迎来多个里程碑事件：Anthropic 前沿模型 Fable 5 和 Mythos 5 在出口管制解除后全球重新上线，标志美国 AI 监管从激进限制转向有条件开放。MCP 协议宣布 7 月 28 日转向无状态，所有生产部署团队需紧急适配。Meta 公开 AI 存储架构演进，揭示传统 BLOB 延迟瓶颈导致 GPU stall 的核心挑战。同时，Together AI 完成 8 亿美元 C 轮融资，估值 83 亿；Kling AI 生成的广告片在戛纳电影节获奖；Boston Dynamics 的 Spot 机器人部署于 2026 世界杯安保。AI 正从聊天机器人时代走向自主工作时

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅发布：Anthropic 发布 Claude Sonnet 5，性能逼近 Opus 4.8 但价格更低，同时推出面向科学家的 Claude Science 工作台。Amazon 成立 10 亿美元 FDE 组织押注 Agent 现场部署，X 推出官方 MCP Server 扩展生态。微软连发 Memora 记忆系统和 SkillOpt 技能优化两项 Agent 架构突破，NVIDIA 通过软件优化使 DeepSeek V4 在 Blackwell 上月内性能提升 5 倍。Figure 人形机器人 F.03 已抵达宝马工厂，Jim Fan 发布 ASPIRE 机器人技

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅动态：美团 LongCat 的 Owl Alpha 1.6T MoE 模型登顶 OpenRouter，完全基于 50k 中国 ASIC 训练，标志着国产算力生态的里程碑式突破。同时，阶跃星辰 Step 3.7 Flash 在自主 Agent 评测中排名第二，MiniMax M3 428B 在三台 Mac 上本地运行并自主创建股票组合，中国 AI 力量全面崛起。工具生态方面，Cursor 发布 iOS 应用、vLLM 深度优化 TTS 模型、LlamaParse 推出 Retrieval Harness，Agent 开发正从桌面走向移动端和生产级。学界方面，上海 AI

文章详情

周报

技术趋势

本周 AI 行业围绕一条核心叙事展开：大规模基础设施层的能力突破，正在加速从实验室到生产部署的转化。 OpenAI 在同一天发布两则重磅消息——自研推理芯片 Jalapeño 与 GPT-5.6 Sol——覆盖了从硬件到模型栈的完整闭环。这不是孤立的发布，而是上下游协同推进的节奏：芯片优化推理成本，模型提升能力上限，两者共用同一个基础设施栈。第二条主线是 Agent 工程从实验走向生产治理。Stripe 发布金融合规 Agent 实战案例，AWS 连续三篇博客聚焦 MCP 代理层与数据治理，GitHub 给出 Copilot agentic harness 的横评数据。与此同时，Anthropic 的 Claude Slack Tag 将 LLM 定位为组织级持久成员，Karpathy 评价这是 "LLM UI/UX 的第三次重大设计"。Agent 不再是单次对话，而是公司内部持续运行的角色。第三条主线是后训练范式从人工摸索向自动化、系统化演进。Amazon 发布 A-Evolve，在 30B 模型上实现无人干预的自主后训练；OpenAI 验证了有益行为 RL 在分布外泛化上的持久性；Qwen 的路标语言世界模型为 Agent RL 提供了可扩展的训练环境。这些工作共同指向一个信号：RL 不再只是 SFT 后的微调步骤，而是正在成为模型能力扩展的主引擎。

文章详情

1 2 3 4 5 6

...