推荐算法日报 - 2026-02-13
2026-2-13
| 2026-2-13
字数 3444阅读时长 9 分钟
type
status
date
slug
summary
tags
category
icon
password
priority

Section 1: 📊 Trend Analysis

  • 🔥 工业界主导的生成式推荐落地加速:今日多篇论文展示了生成式推荐(Generative-Rec)范式在工业场景的快速实践。LinkedIn、高德、腾讯等公司均采用Decoder-only Transformer架构,通过自回归方式统一建模用户行为序列,并针对线上延迟、训练稳定性等工程挑战提出了具体优化方案(如CADET的自门控注意力、IntTravel的多任务生成、Rec2PM的偏好记忆),标志着生成式推荐正从学术探索走向大规模工业应用。
  • 💡 长序列建模的系统性解法成为焦点:超长用户行为序列建模的价值已成为共识,但工业落地面临“延迟墙”瓶颈。今日论文从不同角度提供了系统性解法:小红书(LASER)通过“存储(SeqVault)+算法(STA)”的全栈优化,在保证效果的同时大幅降低I/O与计算开销;腾讯(Rec2PM)则利用偏好记忆压缩和并行化训练策略,为生成式推荐中的长序列问题提供了轻量级方案。核心思路均是从工程与算法协同设计出发,寻求效果与效率的平衡。
  • 📈 效率优化与结构化扩展成为精排核心议题:在模型效果趋同的背景下,如何高效地扩展模型能力成为工业界精排阶段的新焦点。B站(MLCC)提出的“压缩-交叉-扩展”范式及通道扩展策略,在参数量和计算量大幅降低(最高26倍)的同时保持甚至提升效果,为在严格资源约束下进行模型扩展提供了新路径。这反映了工业界从追求“更大模型”向追求“更优ROI模型”的务实转变。

Section 2: 📋 今日速览

今日速览
小红书 提出LASER长序列建模全栈方案,线上ADVV+2.36%
LinkedIn 发布CADET生成式广告CTR模型,线上CTR+11.04%
B站 提出高效特征交互架构MLCC,线上ADVV提升32%
中科大 为生成式推荐引入不确定性感知优化框架UGR
阿里巴巴高德 开源多任务旅行推荐数据集IntTravel,线上CTR+1.09%
腾讯&清华 提出Rec2PM长序列生成式推荐框架,大幅降低延迟
快手 开源最大规模电商搜索全链路数据集KuaiSearch
法国图卢兹大学 利用归因信号指导LLM改写查询,提升神经检索效果
华中科技大学 提出EpicCBR框架,解决冷启动捆绑推荐问题
UC Merced 系统评测向量数据库过滤搜索性能,提供工程选型指南

Section 3: 📰 Daily Digest

1. LASER: An Efficient Target-Aware Segmented Attention Framework for End-to-End Long Sequence Modeling

🔗 原文: https://arxiv.org/abs/2602.11562v1
🏷️ 来源: 🏭 工业界 | Xiaohongshu
⭐ 评分: ⭐⭐⭐⭐⭐ (5/5)
🎯 推荐理由: 小红书工业级长序列建模方案,系统与算法协同优化,线上收益显著,极具参考价值。
📝 摘要: 为突破长序列建模在工业落地中的“延迟墙”(I/O与计算双重瓶颈),小红书提出了LASER全栈优化框架。该系统层面创新性地设计了SeqVault统一存储服务,通过DRAM-SSD混合索引将检索延迟降低50%;算法层面则提出分段目标注意力(STA)机制,对长序列进行基于兴趣稀疏性的压缩与降噪,再通过轻量级全局注意力(GSTA)建模跨段依赖。该方案在服务于超1亿DAU的广告系统中,取得了ADVV提升2.36%、收入提升2.08%的显著线上收益,是系统与算法协同设计的典范。

2. CADET: Context-Conditioned Ads CTR Prediction With a Decoder-Only Transformer

🔗 原文: https://arxiv.org/abs/2602.11410v1
🏷️ 来源: 🏭 工业界 | LinkedIn
⭐ 评分: ⭐⭐⭐⭐⭐ (5/5)
🎯 推荐理由: LinkedIn工业级生成式推荐实践,线上CTR提升11.04%,方法创新且工程细节详实。
📝 摘要: 本文提出CADET,一个用于广告CTR预测的端到端Decoder-only Transformer模型。其核心创新在于上下文条件解码架构,通过多塔预测头显式建模广告位置等后打分信号,解决了CTR预测与排序的循环依赖问题。模型还集成了自门控注意力、时间戳RoPE、会话掩码等稳定训练与解决训练-服务偏差的机制。通过详尽的工程优化(如数据打包、序列分块、自定义FlashAttention内核),模型实现了高效训练与推理。线上A/B测试相比生产基线取得了11.04%的CTR提升,已部署于LinkedIn广告主流量。

3. Compress, Cross and Scale: Multi-Level Compression Cross Networks for Efficient Scaling in Recommender Systems

🔗 原文: https://arxiv.org/abs/2602.12041v1
🏷️ 来源: 🏭 工业界 | Bilibili
⭐ 评分: ⭐⭐⭐⭐ (4/5)
🎯 推荐理由: B站提出高效特征交互架构MLCC,线上ADVV提升32%,参数效率提升26倍,工业落地价值显著。
📝 摘要: 针对精排阶段高效建模高阶特征交互的挑战,B站提出了MLCC及其多通道扩展MC-MLCC架构。该架构遵循“压缩-交叉-扩展”范式,通过全局压缩、参数化交叉和局部压缩,在显著降低参数量和计算量(最高达26倍)的同时,保持了强大的交互建模能力。研究深入分析了模型扩展路径,指出通过增加通道数进行“通道扩展”比传统的“嵌入膨胀”具有更高的参数效率(ROI)。该方案已在B站广告平台上线,带来ADVV累计32%的提升。

4. Uncertainty-aware Generative Recommendation

🔗 原文: https://arxiv.org/abs/2602.11719v1
🏷️ 来源: 🎓 学术界 | USTC
⭐ 评分: ⭐⭐⭐⭐ (4/5)
🎯 推荐理由: 为生成式推荐范式引入系统性的不确定性建模框架,提升训练稳定性和模型风险感知能力。
📝 摘要: 本文针对生成式推荐中偏好优化方法存在的“不确定性盲视”问题,提出了不确定性感知生成式推荐(UGR)框架。UGR通过不确定性加权奖励、难度感知优化和显式置信度对齐三个协同机制,将模型的内在生成置信度作为关键信号指导训练。该方法不仅提升了推荐性能,更从根本上稳定了训练过程,防止了标准方法中常见的性能退化,并赋予模型显式的置信度表达能力,为风险感知应用奠定了基础。

5. IntTravel: A Real-World Dataset and Generative Framework for Integrated Multi-Task Travel Recommendation

🔗 原文: https://arxiv.org/abs/2602.11664v1
🏷️ 来源: 🏭 工业界 | Alibaba, AMAP
⭐ 评分: ⭐⭐⭐⭐ (4/5)
🎯 推荐理由: 高德发布首个大规模多任务旅行推荐数据集及配套生成式模型,线上CTR+1.09%。
📝 摘要: 本文开源了首个大规模、覆盖“何时出发、如何出行、去哪、途经何地”多任务的一体化旅行推荐数据集IntTravel(含41亿交互)。基于此,提出了一个端到端的Decoder-only生成式多任务推荐框架,通过任务引导信息保持(TIP)、任务特定选择性门控(TSG)和任务感知场景因子分解(TSF)三个模块,有效平衡了任务协作与特异性。该框架在IntTravel及非旅行基准上均达到SOTA,并已在高德地图上线,带来CTR 1.09%的提升。

6. Recurrent Preference Memory for Efficient Long-Sequence Generative Recommendation

🔗 原文: https://arxiv.org/abs/2602.11605v1
🏷️ 来源: 🤝 产学合作 | Tencent, Tsinghua
⭐ 评分: ⭐⭐⭐⭐ (4/5)
🎯 推荐理由: 提出高效的长序列生成式推荐框架,通过偏好记忆压缩和并行化训练,平衡了效果与效率。
📝 摘要: 为解决生成式推荐中长序列建模的计算与噪声问题,本文提出Rec2PM框架。它将长用户历史压缩为紧凑的偏好记忆(Preference Memory)令牌,并创新性地采用自参考教师强制策略,实现了记忆的完全并行化训练,同时支持推理时的迭代更新。该方法以极低的存储开销(约1KB/用户)显著降低了推理延迟,且分析表明偏好记忆起到了信息瓶颈的降噪作用,能有效捕捉鲁棒的长期兴趣。

7. KuaiSearch: A Large-Scale E-Commerce Search Dataset for Recall, Ranking, and Relevance

🔗 原文: https://arxiv.org/abs/2602.11518v1
🏷️ 来源: 🤝 产学合作 | Kuaishou, USTC
⭐ 评分: ⭐⭐⭐⭐ (4/5)
🎯 推荐理由: 快手开源的最大规模、覆盖搜索全链路的真实电商搜索数据集,为LLM与电商搜索研究提供关键基础设施。
📝 摘要: 本文构建并开源了当前最大规模的电商搜索数据集KuaiSearch。该数据集基于快手平台真实交互,保留了原始查询和商品文本,覆盖冷启动用户和长尾商品,并系统性地提供了召回、排序、相关性判断三个搜索关键阶段的数据。这为研究真实、复杂的电商搜索问题,特别是LLM在该领域的应用,提供了高质量、全链路的基础设施。论文还提供了多阶段基准实验,验证了数据集的有效性。

8. Improving Neural Retrieval with Attribution-Guided Query Rewriting

🔗 原文: https://arxiv.org/abs/2602.11841v1
🏷️ 来源: 🎓 学术界 | Université Toulouse Capitole, UT2J
⭐ 评分: ⭐⭐⭐ (3/5)
🎯 推荐理由: 利用检索器归因信号指导LLM改写查询,提升神经检索效果,方法新颖但非推荐核心问题。
📝 摘要: 针对神经检索器对模糊查询敏感的问题,本文提出一种归因引导的查询改写方法。该方法计算检索器对查询中每个token的梯度归因分数,并将此作为软指导输入LLM,引导其澄清弱贡献或误导性token,同时保留用户意图。在BEIR基准上的实验表明,该方法能稳定提升检索效果,尤其对隐含或模糊的信息需求提升更大。这是一种检索器感知、模型无关的轻量级优化技术。

9. EpicCBR: Item-Relation-Enhanced Dual-Scenario Contrastive Learning for Cold-Start Bundle Recommendation

🔗 原文: https://arxiv.org/abs/2602.11680v1
🏷️ 来源: 🎓 学术界 | Huazhong University of Science and Technology
⭐ 评分: ⭐⭐⭐ (3/5)
🎯 推荐理由: 针对冷启动捆绑推荐,提出基于物品关系挖掘和双场景对比学习的新框架,离线实验效果显著。
📝 摘要: 本文聚焦于冷启动捆绑推荐问题,提出EpicCBR框架。该框架通过精细化挖掘用户-物品和捆绑包-物品图中的物品关系(如跨域互补关系)来增强用户画像,并利用流行度感知方法表征新捆绑包。为了同时优化冷启动和热启动场景,框架引入了多视图对比学习,包括双场景对比损失来对齐不同场景的信息。在三个公开数据集上的离线实验显示,其在冷启动场景下的Recall@20指标大幅超越SOTA方法。

10. Filtered Approximate Nearest Neighbor Search in Vector Databases: System Design and Performance Analysis

🔗 原文: https://arxiv.org/abs/2602.11443v1
🏷️ 来源: 🎓 学术界 | UCM
⭐ 评分: ⭐⭐⭐ (3/5)
🎯 推荐理由: 对向量数据库过滤搜索的系统级评测,工程选型参考价值高,但非推荐算法创新。
📝 摘要: 本文对FAISS、Milvus、pgvector等主流向量数据库在过滤式近似最近邻搜索(FANNS)任务上的性能进行了系统评测。研究引入了新的关系数据集MoReVec和全局-局部选择率(GLS)量化指标,并扩展了ANN-Benchmarks框架。实验得出关键工程洞察:Milvus通过混合执行策略实现了更稳定的召回;pgvector的查询优化器在过滤场景下易选次优计划;在低选择率(严格过滤)下,IVFFlat索引可能优于HNSW。这些结论为召回系统的基础设施选型与调优提供了实用指南。
  • 推荐系统
  • 日报
  • AI 技术日报 - 2026-01-10推荐算法日报 - 2026-02-12
    Loading...