5 | Page | Recsys Frontier

今日 AI 领域聚焦于智能体（Agent）的架构设计与落地原则。Google DeepMind 发布 57 页 ASI 路线图，首次正式定义超级人工智能，并指出硅基智能的固有优势。LlamaIndex CEO 提出 Agent 应使用类似 Google Docs 的双向可编辑文档格式，推动人机协作范式演进。HERE 则提出 LLM 空间推理不应近似计算，应完全卸载给专用执行层，为 Agent 与物理世界交互提供了关键设计原则。此外，一篇系统讲解 Triton 矩阵乘实现的教程，为 LLM 推理优化提供了从入门到实战的优质资源。

文章详情

周报

技术趋势

2026-W25 最清晰的叙事线是：开源模型前沿从追赶变为并跑，甚至在某些维度反超闭源。GLM-5.2、DeepSeek-V4、Nemotron 3 Ultra、Ling-2.6 四款模型在本周密集发布，参数规模从 284B 到 1.6T，上下文全部支持 1M token，且均以开源形式提供。社区评测和独立分析表明，这些模型在知识工作、编码、科学推理等任务上已不逊于 GPT-5.5 和 Opus 4.8——甚至更便宜。第二条主线是 Agent 基础设施从零散工具转向平台化。Amazon Bedrock AgentCore Harness 正式 GA，两个 API 调用即可部署生产级 Agent；Cursor 推出 Git 替代品 Origin 专为 Agent 工作负载设计。与此同时，Agent 评估方法正在经历从聚合排行榜到预测有效性的范式转换——IBM 论文直接质疑静态榜单向部署场景迁移的有效性。第三条主线是推理效率的微观创新加速。Pine AI 提出可编辑/可组合的 KV 缓存范式，将 p90 TTFT 降低 53-398x；LMSYS 用 SGLang-JAX 在 TPU 上优化 1T 参数 MoE 模型，prefill 减少 53%；Jeff Dean 发布 TPU 从 v2 到 Ironwood 的演进论文，30 倍能效提升。硬件与算法两端的协同正在使 1M token 推理变得经济可行。此外，监管博弈在本周剧烈升温——Anthropic 限制 Fable 模型的使用条款，美国商务部随后对 Fable 和 Mythos 实施出口许可要求，Andrew Ng 称此举将加速 AI 主权运动。医疗领域也有多项产品级进展，从罕见病诊断到全身体超声 CT。

本周推荐系统研究集中在三个方向：大规模图检索的全生命周期协同设计、基于Transformer的序列建模在多平台落地、以及多任务排序架构从DNN向Transformer native的迁移。Meta、Airbnb、Alibaba、Shopee、NetEase Cloud Music等公司各自发布了线上部署工作，提供具体的AB指标。主线1（大规模图系统的端到端设计）： Meta的RankGraph-2（Meta）将图构建、表示学习、在线服务三个阶段耦合优化，在百亿节点图上计算成本降低83%、召回率是GAT+Deep Graph Infomax的3.8倍、线上CTR+0.96%、CVR+2.75%。同方向，HighLevel的ScoreGate（HighLevel）用双分数统计融合控制RAG检索数量，生产环境减少34.8% token、召回率97.77-99.34%。主线2（生成式推荐从理论走向生产）： Airbnb的JourneyFormer（Airbnb）在搜索排序中部署基于Transformer的序列模型，处理长且稀疏的用户行为；阿里巴巴的OneBar（Alibaba）用端到端生成式框架做视频电商查询推荐，GMV提升21.67%。两篇共同指向——生成式推荐需要在实际约束（冷启动、延迟、标签稀疏）下做工程折中，而非单纯追求离线指标。主线3（多任务排序的Transformer-native范式）： Shopee的OneRank（Shopee）消除编码器-预测器分离，在Transformer内部做任务私有通道和梯度分离，线上CTR+1.2%、CVR+0.8%。网易云音乐的PIANO（NetEase Cloud Music）用可学习[CLS] token实现列表级多目标重排，CTR+0.62%、CVR+4.45%。两者都说明：将多目标推理内化到Transformer堆中比外挂MLP更有效。

文章详情

推荐系统

日报

[大模型适配与效率优化]：今日多篇论文聚焦于如何将大模型（LLM/MLLM）高效应用于推荐与检索系统。核心思路包括将传统信号压缩为“软Token”以适配Transformer架构（Token Factory），以及通过磁盘存储+稀疏过滤（Stellar）或语义缓存校准（Closing the Calibration Gap）来降低推理和检索阶段的内存与计算开销。这表明工业界正从“能否用大模型”转向“如何低成本、高效率地用大模型”。; [多模态检索的冷启动与细粒度问题]：多模态检索是今日另一热点，

文章详情

日报

技术趋势

今日 AI 领域迎来多个关键节点：DeepSeek 开源 1.6T 参数的 V4 系列模型，在百万 token 上下文中实现 3.7 倍 FLOPs 降低，多项基准超越 GPT-5.4 和 Claude Opus 4.6。同时，Subquadratic 公司声称突破 Transformer 注意力 O(n²) 瓶颈，获 MIT Tech Review 深度报道，但模型尚未公开引发业界观望。GLM-5.2 获 Jeremy Howard 等社区领袖认可，成为首个在日常使用中接近前沿水平的开源模型。此外，GitHub 分享了内部数据分析 Agent Qubot 的完整构建经验，CMU 的 TheA

文章详情

推荐系统

日报

全链路协同设计成为工业界新范式：Meta 的 RankGraph-2 和 Airbnb 的 JourneyFormer 都展示了从数据构建、模型训练到在线服务的端到端协同优化思路。RankGraph-2 更是明确提出图构建、训练、服务三阶段生命周期协同设计，通过各阶段需求相互约束来提升整体效率，这标志着工业界推荐系统正从单点优化走向全链路系统级优化。; 多语言/跨域检索成为热点，工业界与学术界共同发力：今日有多篇论文聚焦多语言或跨域场景。Baidu 的 Querit-Reranker 通过标签无

文章详情

日报

技术趋势

今日 AI 领域迎来多个里程碑事件：Anthropic 的 Claude Opus 4.7 自主操控机器人速度比人类快 20 倍，标志着 LLM 在物理世界自主性的质变；高通拟 80-100 亿美元收购 Tenstorrent，押注 RISC-V 路线挑战 NVIDIA 推理霸权；Transformer 论文作者之一 Noam Shazeer 加入 OpenAI，Sam Altman 称自 OpenAI 创立之初就希望与其合作。同时，Agent 基础设施全面走向生产级——Amazon Bedrock AgentCore Harness GA、Perplexity 推出 Brain 系统、Kim

文章详情

推荐系统

日报

大模型驱动的推荐系统范式升级：今日多篇论文聚焦于将大型语言模型（LLM）深度融入推荐系统，不再局限于特征工程，而是直接利用LLM进行用户行为序列建模、跨域知识迁移和冷启动物品理解。这表明业界正从“LLM辅助推荐”向“LLM原生推荐”演进，核心挑战在于如何平衡模型容量与推理效率。; 多模态与长序列建模的工程化突破：针对短视频、直播等富媒体场景，业界开始探索更高效的多模态特征融合与用户长期行为序列建模方案。例如，通过解耦注意力机制或记忆网络，在可控的计算成本下，将用户数月的交互历史纳入模型，以捕捉动

文章详情

日报

技术趋势

今日 AI 领域迎来多项重磅动态：Transformer 论文作者之一 Noam Shazeer 离开 Google 加入 OpenAI，标志人才争夺战升级；NVIDIA 与 Inclusion AI 分别开源 550B 和 1T 参数级 Agent 模型，混合架构与推理效率成为焦点；AWS 与 Hugging Face 同日发布 Agent 上下文基础设施（Context 服务与 ARD 协议），Agent 生态从“工具调用”迈向“运行时动态发现”。同时，CMU 挑战 Bitter Lesson 提出 V-pretraining，OpenAI 发布 AI 化学家将药物产率提升 57%，Nat

文章详情

日报

技术趋势

今日 AI 领域迎来历史性并购：SpaceX 以 600 亿美元全股票收购 Cursor，同日 Cursor 发布 Git 替代品 Origin，标志着 AI 编码工具从辅助角色跃升为关键基础设施。模型竞赛白热化：智谱 GLM-5.2 开源 744B 模型登顶智能指数，NVIDIA Nemotron 3 Ultra 以 6 倍推理吞吐引领 Agent 推理，Inclusion AI 发布万亿参数 Ling/Ring 2.6。Agent 安全与效率成焦点：AWS 发布按需安全检测 API，Pine AI 提出可编辑 KV 缓存新范式，Figma 分享 MCP 内部实战案例。

文章详情

日报

技术趋势

今日 AI 领域迎来历史性并购：SpaceX 以 600 亿美元全股票收购 Cursor，成为 2026 年最大创业公司并购案，同日 Cursor 推出 Origin 挑战 GitHub。微软据传正探索用 DeepSeek 替代 OpenAI/Anthropic 以控制 Copilot Cowork 成本，而智谱 GLM-5.2 以 51 分登顶 AI 智能指数，开源 MIT 许可。产业层面，AI 公司 CEO 首次受邀参加 G7 峰会午餐会，标志 AI 正式进入地缘政治核心议程。

文章详情

推荐系统

日报

生成式推荐与多任务架构的深度融合：今日多篇论文（OneRank、OneBar、HoloRec）不约而同地将生成式或Transformer-native架构引入推荐核心环节，从精排到召回，试图用统一的生成式框架替代传统的多阶段级联设计，解决目标碎片化和信息瓶颈问题。; 挖掘被忽视的信号源：负行为与合成先验：工业界正积极从“数据”本身寻找增量。一方面，Beyond Positive Signals 论文系统性地将用户隐式负行为（跳过、低参与度）纳入序列建模，以极低成本带来显著AUC提升；另一方面，S

文章详情

...

3 4 5 6 7

...