From Next-One to Next-N:这才是推荐系统的范式改变

推荐系统 20 年来方法换了六七轮,但问题定义从未改变——始终是预测下一个 item。缺多样性、缺发现性、规则泛滥,根源都在这里。真正的范式改变不是换方法,而是重新定义问题:从 Next One 到 Next N。

生成式推荐 (Generative Recommendation) 工业界深度 Survey

覆盖 101 篇核心论文(58 篇工业界 + 43 篇学术精选),系统梳理 2022-2026 年生成式推荐从学术概念到工业主流范式的完整技术演进。以 TIGER、HSTU、OneRec 等里程碑论文为核心,深入分析 Semantic ID、模型架构、训练范式、推理增强、长序列建模等关键技术方向。

2026:推荐系统 All-In Transformer 的元年

2017 年,Ilya Sutskever 读到《Attention Is All You Need》时,立即意识到”这就是我们需要的一切”。OpenAI 随即放弃了 RNN/LSTM 路线,全面转向 Transformer,催生出整个 GPT 系列。Transformer 的并行能力让他们得以实现一直相信的 Scaling 路径。八年后的今天,推荐系统终于走到了同样的路口。 2024 年之前,推荐领域有了 HSTU、TIGER 这样的工作,但大多数团队还在观望。2025 年,我观察到一个明显的转变:大家开始认真地把排序模型 Dense Scaling Up,搞生成式召回和端到端推荐。这很像 2017 年——当时大家忙着把 LR/GBDT/FM 切换到 Deep Model 和双塔,切换过程持续了一两年,之后再没人回头。我的判断是,2026 年将是推荐系统 All-In Transformer 的一年,不改变就落后。

AI 技术日报 - 2026-05-21

今日日报跨越了博客、GitHub、论文、KOL 推文和播客五大信源,核心亮点是 Google I/O 2026 的 AI 战略发布与 Agent 基础设施的全面爆发。Google 发布了 Gemini 3.5 Flash、Omni 等多模态模型,而 Karpathy 的 `autoresearch`、火山引擎的 `OpenViking` 等项目则标志着 Agent 正从应用层渗透到研发和基础设施层。此外,OpenAI 模型首次独立攻克数学开放猜想,成为今日最受关注的里程碑事件。 精选文章:5 篇 GitHub 热门项目:5 个 播客精选:1 集 KOL 推文:30 条

AI 技术日报 - 2026-05-20

今日 AI 领域迎来重磅发布潮,以 Google I/O 2026 为核心,Gemini 3.5 系列模型、Gemini Omni 及 Managed Agents 等产品正式亮相,标志着 AI 正式进入“Agentic”时代。同时,社区围绕 Agent 生态、成本优化和工具链展开了密集讨论。本期日报精选 5 篇深度文章、5 个 GitHub 热门项目,并收录了 28 条 KOL 推文,全面覆盖从模型发布到落地实践的各个维度。

AI 技术日报 - 2026-05-19

今日 AI 日报跨越博客、GitHub 项目、论文、KOL 推文和播客五大数据源,核心亮点是 Agent 系统从评估、工程化到专用硬件的全栈成熟。IBM 与 Hugging Face 联合发布 Open Agent Leaderboard 开启通用 Agent 评估新纪元,NVIDIA 首款 Agent 专用 CPU Vera 交付头部实验室,同时社区涌现出 12-Factor Agents 等工程化原则和 Cognee 等记忆管理工具。今日共收录:精选文章 5 篇、GitHub 项目 5 个、播客 1 集、KOL 推文 31 条。

AI 技术日报 - 2026-05-18

今日日报跨越博客、GitHub 项目、KOL 推文三大数据源,核心亮点是 Agent 经济数据首次大规模披露 与 Agent 工程化实践全面爆发。Venice AI 月入 $835K、x402 协议处理 4700 万笔交易等数据标志着 Agent 从概念走向商业验证;同时,Langflow、Agent-S 等开源项目与 Oppo X-OmniClaw 等设备端方案,正将 Agent 开发门槛降至新低。 精选文章 4 篇、GitHub 项目 5 个、KOL 推文 17 条

AI周报 2026-W20

编码 Agent 的交付形态正在经历一次收敛与分化并存的阶段。一方面,OpenAI 将 Codex 推向 Windows 沙箱和移动端,Anthropic 推出官方 Skills 仓库,Garry Tan 开源 gstack——Agent 工具链从“写代码”向“管理工程团队”的方向迈了一大步。另一方,学术界则在追问:当 Agent 规模扩张到百万级别时,涌现行为的归因如何做到可计算、可证明。 与此同时,LLM 架构创新进入密集发布期。Sebastian Raschka 的综述文章系统梳理了 Gemma 4 到 DeepSeek V4 共十多篇架构论文,Nous Research 一周之内抛出两项核心技术——Token Superposition Training 和 Lighthouse Attention,分别将预训练和长上下文推理的 wall-clock 速度推高 2-3 倍和 17 倍。NVIDIA 的 Star Elastic 和 AWS 的 Priming 则从后训练和模型转换角度,提供了更经济的多模型族管理方法。 推理基础设施层面,SGLang 和 vLLM 在一周内相继合并了对 DeepSeek V4、Laguna-XS.2 等新架构的支持,KV Offload、HiSparse、MegaMoE 内核等优化密集上架。Cerebras 以 600 亿美元 IPO 收盘,Stratechery 的 Ben Thompson 则从芯片架构差异出发,预言推理算力市场将走向异构化。本周的三条主线——Agent 工具链标准化、架构创新的规模化验证、推理部署的工业化追赶——互相交织,指向同一个判断:2026 年正是从“模型试验”向“系统工程”过渡的关键季度。

AI 技术日报 - 2026-05-17

今日日报跨越博客、GitHub 项目、KOL 推文三大数据源,核心趋势是 AI 推理基础设施的爆发与 Agent 生态的加速成熟。Cerebras 以 600 亿美元 IPO 成为推理算力需求爆发的标志性事件,同时多个开源项目(CLI-Anything、CodeGraph、Dograh)正从不同维度降低 Agent 的开发与部署门槛。此外,关于 AI 投入 ROI 的质疑与递归自我改进的监管警告,也构成了今日的讨论焦点。 数据统计:精选文章 5 篇、GitHub 项目 5 个、KOL 推文 26 条

AI 技术日报 - 2026-05-16

今日日报跨越博客文章、GitHub 项目、论文和 KOL 推文,核心趋势是 AI Agent 从“能用”走向“可靠与规模化”。微软深入探讨了长时域委托任务的可靠性挑战,GitHub 分享了可访问性 Agent 的工程实践,而社区则在 Agent 自动化开发、推理基础设施和模型架构创新上取得显著进展。数据统计:精选文章 5 篇、GitHub 项目 4 个、播客 2 集、KOL 推文 16 条。

AI周报 2026-W20

W20 的叙事主线可以概括为:编码 Agent 工具链正在完成从“功能补全”到“平台级操作系统”的跃迁——OpenAI 对 Codex 的沙箱、移动端、hooks 三层能力的集中发布,叠加 Anthropic 官方技能仓库和社区《everything-claude-code》等基础设施的成熟,让编码 Agent 不再是 IDE 里的一个面板,而是一整套可远程调度、可定制、可审计的异步工作系统。与此同时,推理基础设施的竞争焦点也从“训练更大模型”转向“更高效地运行这些模型”——Nous 的 Token Superposition Training 带来 2-3x 训练加速,Perplexity 在 GB200 上优化 Qwen3 MoE 推理吞吐,SemiAnalysis 报告 SGLang 在 DeepSeek V4 上实现 4x 交互吞吐提升——这三个事件共同指向一个信号:模型能力的瓶颈正在从训练侧向 serving 侧迁移。 第二个值得关注的线索是Agent 安全与评估从“最佳实践”走向“系统化治理”。AWS 与 Cisco 联合发布的 AI Registry 试图为 MCP/A2A 代理建立统一可见性与自动化安全扫描层;Simons 的工业论文将制造领域工具调用的幻觉率从 43% 降到 0%;12 指标评估框架基于 100+ 真实部署提炼出了可复用的生产级评估体系。这三个条目分别覆盖了工具注册、领域约束、评估方法论三个维度,说明企业级 Agent 不再只是“会不会跑”的问题,而是“跑得安不安全、有没有被审计”。 第三个线索在产业经济层面:Cerebras IPO 20x 超募、Anthropic 讨论 300 亿美元融资、OpenAI 重新谈判微软协议节省 970 亿美元长期支出——这些数字背后是 AI 基础设施投入从“资本赌注”向“可量化资产”的转变。Epoch AI 报告一个 1GW AI 数据中心的总持有成本为 380 亿美元,其中服务器占比 60%,这为所有地缘政治叙事提供了一个具体的成本锚点。

AI 技术日报 - 2026-05-15

今日日报跨越博客、GitHub 项目、播客和 KOL 推文等多个数据源,核心趋势是 “Agent 工具生态趋同与规模化落地”。从 OpenAI 的 Codex 移动端发布、xAI 的 Grok Build CLI,到 Anthropic 的美中 AI 竞争白皮书和 Epoch AI 的万亿美元数据中心成本估算,行业正从单一模型能力竞争转向 Agent 工作流、基础设施和地缘战略的全面博弈。同时,医疗、学术等垂直领域的 AI 原生实践也提供了宝贵的落地经验。 精选文章 5 篇、GitHub 项目 5 个、播客 4 集、KOL 推文 21 条