生成式推荐 (Generative Recommendation) 工业界深度 Survey

覆盖 101 篇核心论文(58 篇工业界 + 43 篇学术精选),系统梳理 2022-2026 年生成式推荐从学术概念到工业主流范式的完整技术演进。以 TIGER、HSTU、OneRec 等里程碑论文为核心,深入分析 Semantic ID、模型架构、训练范式、推理增强、长序列建模等关键技术方向。

AI 技术日报 - 2026-05-21

今日日报跨越了博客、GitHub、论文、KOL 推文和播客五大信源,核心亮点是 Google I/O 2026 的 AI 战略发布与 Agent 基础设施的全面爆发。Google 发布了 Gemini 3.5 Flash、Omni 等多模态模型,而 Karpathy 的 `autoresearch`、火山引擎的 `OpenViking` 等项目则标志着 Agent 正从应用层渗透到研发和基础设施层。此外,OpenAI 模型首次独立攻克数学开放猜想,成为今日最受关注的里程碑事件。 精选文章:5 篇 GitHub 热门项目:5 个 播客精选:1 集 KOL 推文:30 条

推荐算法日报 - 2026-05-21

LLM与推荐系统的深度融合进入精细化阶段:今日多篇论文(LWGR、ABPO、RecoAtlas)不再满足于简单地将LLM作为特征提取器或排序模型,而是深入探索如何利用LLM的世界知识、处理其特有的反馈偏差(如曝光偏差、反馈模糊性),并设计专门的评估框架。这表明LLM推荐正从“能不能用”走向“如何用好”的精细化工程阶段。; 不确定性建模与鲁棒性成为核心关注点:BFT从贝叶斯视角统一Transformer的不确定性,MDCNS通过多源负采样打破自强化循环,BoR指标揭示高召回率下的随机性陷阱。这些工

AI 技术日报 - 2026-05-20

今日 AI 领域迎来重磅发布潮,以 Google I/O 2026 为核心,Gemini 3.5 系列模型、Gemini Omni 及 Managed Agents 等产品正式亮相,标志着 AI 正式进入“Agentic”时代。同时,社区围绕 Agent 生态、成本优化和工具链展开了密集讨论。本期日报精选 5 篇深度文章、5 个 GitHub 热门项目,并收录了 28 条 KOL 推文,全面覆盖从模型发布到落地实践的各个维度。

推荐算法日报 - 2026-05-20

生成式推荐与语义索引的深化应用:今日有多篇论文围绕生成式推荐(Generative Recommenders)展开,从淘宝的GrowthGR到中南大学的Ghost,均采用或分析了基于语义ID的生成式检索架构。趋势表明,业界正从传统的向量检索向更统一的、端到端的生成式范式迁移,但随之而来的流行度偏差、冷启动等问题也成为新的研究焦点。; 多目标与长期价值的精细化建模:工业界论文普遍关注如何超越短期指标(如点击率),建模长期用户价值与平台生态健康。淘宝的GrowthGR通过反事实推断量化商品长期交易价

AI 技术日报 - 2026-05-19

今日 AI 日报跨越博客、GitHub 项目、论文、KOL 推文和播客五大数据源,核心亮点是 Agent 系统从评估、工程化到专用硬件的全栈成熟。IBM 与 Hugging Face 联合发布 Open Agent Leaderboard 开启通用 Agent 评估新纪元,NVIDIA 首款 Agent 专用 CPU Vera 交付头部实验室,同时社区涌现出 12-Factor Agents 等工程化原则和 Cognee 等记忆管理工具。今日共收录:精选文章 5 篇、GitHub 项目 5 个、播客 1 集、KOL 推文 31 条。

推荐算法日报 - 2026-05-19

生成式与Agent范式崛起:今日多篇论文(GenLI、Agent4POI)挑战了传统的检索式或静态嵌入范式。GenLI通过生成式模型直接产生用户兴趣分布,将检索复杂度降至O(1);Agent4POI则利用LLM Agent在推理时动态生成POI表示,显著提升冷启动和上下文敏感场景效果。这预示着推荐系统正从“匹配”向“生成”演进。; 系统稳定性与异构加速成为工业界焦点:Apple的Fortress论文直面模型随时间不稳定的痛点,提出特征剪枝方案;华为与京东合作的Ascend-RaBitQ则聚焦于N

AI 技术日报 - 2026-05-18

今日日报跨越博客、GitHub 项目、KOL 推文三大数据源,核心亮点是 Agent 经济数据首次大规模披露 与 Agent 工程化实践全面爆发。Venice AI 月入 $835K、x402 协议处理 4700 万笔交易等数据标志着 Agent 从概念走向商业验证;同时,Langflow、Agent-S 等开源项目与 Oppo X-OmniClaw 等设备端方案,正将 Agent 开发门槛降至新低。 精选文章 4 篇、GitHub 项目 5 个、KOL 推文 17 条

推荐周报 2026-W20

本周推荐系统研究围绕三条技术主线展开:生成式推荐架构从tokenizer优化走向推理效率提升,LLM增强推荐从孤立的辅助模块演化为具备记忆与推理能力的智能体,系统工程层的量化与线程编排成为工业部署的实际瓶颈突破点。 主线 1“生成式推荐的解耦与加速”: 阿里在TmallAPP上线 CQ-SID / EG-GRPO,以类别感知语义ID和专家引导强化学习实现GMV +1.15%,生成召回贡献72.63%购买。Tencent与清华的 AsymRec 提出非对称连续-离散框架,用多专家投影替代对称量化,平均提升15.8%。美团的 DIG 将tokenizer嵌入判别式排序模型端到端训练,同时提升检索与排序。Snap的 SID-MLP 用MLP蒸馏替代Transformer解码器,加速8.74倍且精度持平。这些工作的共同指向是——生成式推荐正在从“能跑”向“跑得稳、跑得快”过渡,核心手段是解耦输入输出表示与替换密度过高的结构。 主线 2“LLM推荐向推理与记忆演进”: Microsoft Research的 PGR 引入前瞻引导检索,用Tree-of-Thought扩展查询步骤,在MemoryQuest上召回提升近3倍。美团的 RecRM-Bench 提供了100万条结构化条目覆盖指令遵循、事实一致性等四维奖励,为智能体推荐系统提供基础。SDAR(美团)用门控辅助目标稳定OPSD蒸馏,在ALFWorld、Search-QA等基准上相对GRPO提升7-10%。差异在于——PGR侧重检索前的前瞻推理,SDAR侧重训练中的稳定性,但共同挑战是LLM在推荐场景中的记忆与推理能力仍远未成熟。 主线 3“系统协同设计成为工业落地关键”: Meta的 LoKA 通过Probe-Mods-Dispatch三件套在FP8下实现训练吞吐+20%、推理加速+40%且无质量损失。Xiaohongshu的 CCD-Level Thread Orchestration 利用CCD架构的缓存特性,在ANNS服务上取得3.7x吞吐提升和30-90% P999延迟降低。Baidu的 Efficient Generative Targeting 结合量化、稀疏化和并行验证,实现1.8倍推理加速并部署于广告系统。这些工作表明——模型架构改进的边际效应递减时,硬件感知的系统优化正成为实际收益的主要来源。

AI周报 2026-W20

编码 Agent 的交付形态正在经历一次收敛与分化并存的阶段。一方面,OpenAI 将 Codex 推向 Windows 沙箱和移动端,Anthropic 推出官方 Skills 仓库,Garry Tan 开源 gstack——Agent 工具链从“写代码”向“管理工程团队”的方向迈了一大步。另一方,学术界则在追问:当 Agent 规模扩张到百万级别时,涌现行为的归因如何做到可计算、可证明。 与此同时,LLM 架构创新进入密集发布期。Sebastian Raschka 的综述文章系统梳理了 Gemma 4 到 DeepSeek V4 共十多篇架构论文,Nous Research 一周之内抛出两项核心技术——Token Superposition Training 和 Lighthouse Attention,分别将预训练和长上下文推理的 wall-clock 速度推高 2-3 倍和 17 倍。NVIDIA 的 Star Elastic 和 AWS 的 Priming 则从后训练和模型转换角度,提供了更经济的多模型族管理方法。 推理基础设施层面,SGLang 和 vLLM 在一周内相继合并了对 DeepSeek V4、Laguna-XS.2 等新架构的支持,KV Offload、HiSparse、MegaMoE 内核等优化密集上架。Cerebras 以 600 亿美元 IPO 收盘,Stratechery 的 Ben Thompson 则从芯片架构差异出发,预言推理算力市场将走向异构化。本周的三条主线——Agent 工具链标准化、架构创新的规模化验证、推理部署的工业化追赶——互相交织,指向同一个判断:2026 年正是从“模型试验”向“系统工程”过渡的关键季度。

AI 技术日报 - 2026-05-17

今日日报跨越博客、GitHub 项目、KOL 推文三大数据源,核心趋势是 AI 推理基础设施的爆发与 Agent 生态的加速成熟。Cerebras 以 600 亿美元 IPO 成为推理算力需求爆发的标志性事件,同时多个开源项目(CLI-Anything、CodeGraph、Dograh)正从不同维度降低 Agent 的开发与部署门槛。此外,关于 AI 投入 ROI 的质疑与递归自我改进的监管警告,也构成了今日的讨论焦点。 数据统计:精选文章 5 篇、GitHub 项目 5 个、KOL 推文 26 条

AI 技术日报 - 2026-05-16

今日日报跨越博客文章、GitHub 项目、论文和 KOL 推文,核心趋势是 AI Agent 从“能用”走向“可靠与规模化”。微软深入探讨了长时域委托任务的可靠性挑战,GitHub 分享了可访问性 Agent 的工程实践,而社区则在 Agent 自动化开发、推理基础设施和模型架构创新上取得显著进展。数据统计:精选文章 5 篇、GitHub 项目 4 个、播客 2 集、KOL 推文 16 条。