本周24篇论文中，4篇来自工业在线部署（Meta、Netflix、阿里巴巴、快手），覆盖召回、排序、重排、全链路生成阶段。核心技术密度的分布逻辑在变——生成式推荐从"能生成"走向"能推理"，召回从嵌入匹配转向导航式探索，排序阶段则在约束和解释之间寻找平衡。生成式推荐进入"推理+强化学习"时代： GR2、ShopX和GenPage在同一周展示了三种不同的生成式架构走向。GR2在重排阶段首次引入推理链（CoT）和RL后训练，在工业流量上R@1提升18.7%。ShopX将生成式推荐从候选生成推向"意图到物品"的端到端执行，在淘宝Agent场景下复杂请求满足率提升55-75%。GenPage走得最远——用单Transformer替代Netflix整套多阶段主页流水线，核心指标+0.24%的同时延迟降低20%。三篇的共同指向是：生成式推荐的核心壁垒已从"能否生成"转向"能否在推理质量与部署效率之间找到工业可行解"。召回从静态匹配走向动态图探索： Meta的硬负采样通过LLM聚类生成实时同簇负样本，在线召回率+8.5%、流行度偏差-12.3%。快手的IID-Nav将召回建模为自主图探索，支持间接无限深度遍历。Kuaishou的POEM利用多任务排序分数构建偏序序列，实现请求级别的实时兴趣更新。三条技术路径共享一个趋势：召回正从静态嵌入查询转向动态、上下文感知的行为建模。约束优化与可解释性重回视野： Avito的PermR在5600万搜索查询上证明了相邻交换法能在生产延迟内逼近整数规划收益。KakaoBank的ChunkGroupSHAP用分组Shapley值弥合了词级解释与密集排序器之间的粒度鸿沟。这两个工作提醒行业：在大模型热潮中，渐进式工程优化和可解释性工具仍能产出具象收益。

文章详情

推荐系统

日报

LLM 驱动的个性化与可解释性：今日多篇论文聚焦于利用 LLM 提升推荐系统的个性化和可解释性。Bi-NAS 通过 NAS 搜索最优的 LLM 提示结构，CoPersona 则利用图协同信号补全稀疏用户画像，两者都旨在解决用户历史稀疏问题，提升 LLM 在推荐场景下的鲁棒性和解释质量。; 从静态检索到动态规划：传统推荐召回阶段多采用静态打分，而 `Planning over Matrix-Factorization MDPs` 一文将其建模为马尔可夫决策过程，通过单步前瞻即可显著提升召回效果。这

文章详情

推荐系统

日报

LLM 深度赋能召回与检索：今日多篇论文将大语言模型（LLM）应用于推荐系统的召回阶段，超越了传统的语义匹配。Meta 利用 LLM 聚类生成硬负样本，Baidu 则用 LLM 构建用户画像并优化记忆检索，Amazon 则通过词汇迁移解决现代编码器在稀疏检索中的“词汇鸿沟”问题。这表明 LLM 正从特征提取向核心检索逻辑演进。; 生成式重排与推理加速成为焦点：以 Diffusion-GR2 为代表的生成式重排器，通过链式推理（CoT）提升排序精度，但其自回归解码速度是部署瓶颈。将扩散模型与知识蒸

文章详情

推荐系统

日报

生成式推荐全面渗透推荐全链路：今日多篇重磅论文（Netflix GenPage、GR2、ShopX）共同指向一个趋势：生成式推荐正从传统的候选生成阶段，向精排、重排乃至整个主页构建等全链路环节渗透。核心思路是用一个统一的Transformer/LLM模型，通过自回归或语义ID（SID）的方式，端到端地完成排序、布局生成等任务，替代传统的多阶段流水线。; 强化学习（RL）+ 推理蒸馏成为LLM落地的关键配方：GR2和GenPage都验证了RL在LLM推荐中的巨大潜力，尤其是在重排序和页面生成这类复

文章详情

推荐系统

日报

实时序列建模与多阶段信号融合：工业界（快手）开始利用精排阶段的多任务分数（CTR、观看时长）作为监督信号，构建动态偏序序列，替代传统的静态点击序列。这标志着序列建模从“被动记录”向“主动利用排序信号”的转变，能更精准地捕捉用户实时意图变化，并直接优化业务核心指标（如观看时长）。; 检索范式从“匹配”到“导航”的进化：无论是快手提出的IID-Nav（图导航）还是学术界对RAG检索瓶颈的诊断，都表明传统的静态相似度匹配（i2i）已无法满足复杂场景需求。新的趋势是将检索建模为状态化、多步的自主探索过程

文章详情

推荐系统

日报

[LLM 推荐进入"推理"深水区]：今日两篇论文（IntuRec、期刊推荐）均利用 LLM 进行偏好推理，但不再满足于简单的 prompt 匹配。IntuRec 引入认知科学中的"直觉"概念，用候选集引导 LLM 在连续隐空间进行多步推理，而非直接输出 token。这标志着 LLM 推荐正从"语义匹配"向"结构化推理"演进，工业落地需关注推理延迟与成本。; [重排/排序的可解释性与约束优化并重]：KakaoBank 的 ChunkGroupSHAP 解决了密集嵌入排序的特征粒度不匹配问题，Avi

本周 12 篇论文中，工业部署论文占据主导——8 篇来自 YouTube、TikTok、快手、腾讯、沃尔玛等一线平台，均有线上 A/B 实验指标。研究聚焦于三个相互交织的方向：生成式推荐与LLM增强、大规模检索的 GPU 加速、以及工业系统的架构与归因优化。生成式推荐从“生成物品 ID”走向“生成物理物品”：快手提出的 RaG（Kuaishou）将生成式推荐与视频生成统一，在 4 亿 DAU 平台上实现广告收入 +1.87%。YouTube 的 TokenMinds（YouTube）将 Semantic ID 从物品侧扩展到用户侧，生成离散用户 token 与稠密 embedding 双输出，覆盖全量用户流量。两条路线指向同一个判断——生成式推荐正在从离线一致性验证进入线上收益兑现阶段。用户建模从“稠密向量”向“离散语义 ID”切换加速：快手与 YouTube 几乎同时发布了基于 SID 的框架。这不仅是表征形态的变化，更意味着推荐系统与 LLM 世界的底层 token 空间开始对齐，跨场景统一（短视频/长视频、推荐/广告）的成本大幅降低。工业归因与缩放方法论走向精细化： TikTok 的归因校正框架（TikTok）将因果实验与每日生产归因对齐，将蚕食率降低约 15 个百分点。腾讯的 NOVA（Tencent）用智能体自动化架构演化，L3 任务线上 GMV 提升 +2.02%。快手的 UniFormer（Kuaishou）提出模型中心缩放框架，将建模空间显式分解为特征和任务两个维度。三者共同揭示——当模型架构趋于收敛，工程自动化和测量准确性成为工业竞争的新壁垒。

文章详情

推荐系统

日报

[Agent + LLM 驱动推荐系统自动化]：从架构演化到特征筛选，工业界正系统性地引入 LLM Agent 来替代人工专家。腾讯的 NOVA 框架展示了 Agent 如何自动化完成“论文到生产”的模型升级，PayPal 的 EMA-FS 则用增益感知的筛选策略加速 GBDT 训练。核心趋势是从“调参自动化”走向“架构决策自动化”，但验证和风险控制（如 NOVA 的验证级联）是落地的关键。; [归因与增量性：从“归因”到“归因校正”]：广告归因领域正从简单的“最后一次点击”或“多触点归因”转向

文章详情

推荐系统

日报

生成式推荐进入工业落地爆发期：今日多篇论文（TokenMinds、RaG）将生成式推荐从概念验证推向大规模工业部署。核心趋势是使用统一的Semantic ID (SID) 体系同时表示用户和物品，实现跨场景（长/短视频）的统一建模，并显著降低训练和服务成本。这标志着生成式推荐正从“召回”环节向“排序”和“内容生成”全链路渗透。; 零样本与自适应推理成为降本增效新焦点：面对海量动态物品和复杂查询，工业系统开始探索更智能的资源分配策略。IRENE通过元分类器为未见物品即时合成分类器，解决零样本检索难

文章详情

推荐系统

日报

LLM 蒸馏替代点击信号，重塑工业级召回训练范式：今日两篇来自 Walmart 的工业论文均采用 LLM 作为教师模型，生成结构化标注（相关性或意图），替代传统点击信号来训练双塔召回模型。这解决了点击信号中的位置偏差和长尾稀疏问题，并展示了显著的线上收益，标志着工业界正从“数据驱动”向“模型生成数据驱动”的范式转变。; 图基础模型（GFM）评估趋于理性，PFN 范式或成新方向：学术界对 GFM 的评估揭示了其并非普遍优于传统 GNN。只有基于 Prior-data Fitted Networks

本周推荐系统研究集中在三个方向：大规模图检索的全生命周期协同设计、基于Transformer的序列建模在多平台落地、以及多任务排序架构从DNN向Transformer native的迁移。Meta、Airbnb、Alibaba、Shopee、NetEase Cloud Music等公司各自发布了线上部署工作，提供具体的AB指标。主线1（大规模图系统的端到端设计）： Meta的RankGraph-2（Meta）将图构建、表示学习、在线服务三个阶段耦合优化，在百亿节点图上计算成本降低83%、召回率是GAT+Deep Graph Infomax的3.8倍、线上CTR+0.96%、CVR+2.75%。同方向，HighLevel的ScoreGate（HighLevel）用双分数统计融合控制RAG检索数量，生产环境减少34.8% token、召回率97.77-99.34%。主线2（生成式推荐从理论走向生产）： Airbnb的JourneyFormer（Airbnb）在搜索排序中部署基于Transformer的序列模型，处理长且稀疏的用户行为；阿里巴巴的OneBar（Alibaba）用端到端生成式框架做视频电商查询推荐，GMV提升21.67%。两篇共同指向——生成式推荐需要在实际约束（冷启动、延迟、标签稀疏）下做工程折中，而非单纯追求离线指标。主线3（多任务排序的Transformer-native范式）： Shopee的OneRank（Shopee）消除编码器-预测器分离，在Transformer内部做任务私有通道和梯度分离，线上CTR+1.2%、CVR+0.8%。网易云音乐的PIANO（NetEase Cloud Music）用可学习[CLS] token实现列表级多目标重排，CTR+0.62%、CVR+4.45%。两者都说明：将多目标推理内化到Transformer堆中比外挂MLP更有效。

文章详情

推荐系统

日报

[大模型适配与效率优化]：今日多篇论文聚焦于如何将大模型（LLM/MLLM）高效应用于推荐与检索系统。核心思路包括将传统信号压缩为“软Token”以适配Transformer架构（Token Factory），以及通过磁盘存储+稀疏过滤（Stellar）或语义缓存校准（Closing the Calibration Gap）来降低推理和检索阶段的内存与计算开销。这表明工业界正从“能否用大模型”转向“如何低成本、高效率地用大模型”。; [多模态检索的冷启动与细粒度问题]：多模态检索是今日另一热点，

文章详情

1 2 3 4 5 6

...