日报

技术趋势

今日 AI 领域聚焦于效率与实用性的双重突破：Mistral 发布 Leanstral 1.5 数学证明模型，以 6B 激活参数在多项数学基准上达到 SOTA，每道题成本仅约 4 美元，标志着开源模型在专业推理领域的重大进展。与此同时，Simon Willison 用 Claude Fable 以 149 美元成本完成 sqlite-utils 4.0 的审查与修复，展示了 AI 编码 Agent 的实际工作流价值。产业层面，GenAI 经济体过去 12 个月创收 1100 亿美元，增速为移动/互联网浪潮的三倍，印证了 AI 商业化的强劲势头。此外，X 官方发布 XMCP 服务器，为社交平台

文章详情

日报

技术趋势

今日 AI 领域迎来多个重要动态：OpenAI 提议向美国政府捐赠 5% 股权，探索 AI 公司与国家资本关系的新模式；Anthropic 发布 Claude Science Workbench 并宣布亲自开发药物，AI for Science 战略全面升级。同时，研究揭示 RL 后训练改进高度集中于 Transformer 中间少数层，为优化训练策略提供了反直觉发现；Snowflake 发布 Cortex Sense 解决企业 Agent 因缺乏语义视图而查询失败的核心痛点。开源生态方面，开源 AI 差距地图 v0.1 发布，系统索引 421 个项目；MCP 服务器生态虽近 2 万注册量但噪

文章详情

推荐系统

日报

LLM 驱动的个性化与可解释性：今日多篇论文聚焦于利用 LLM 提升推荐系统的个性化和可解释性。Bi-NAS 通过 NAS 搜索最优的 LLM 提示结构，CoPersona 则利用图协同信号补全稀疏用户画像，两者都旨在解决用户历史稀疏问题，提升 LLM 在推荐场景下的鲁棒性和解释质量。; 从静态检索到动态规划：传统推荐召回阶段多采用静态打分，而 `Planning over Matrix-Factorization MDPs` 一文将其建模为马尔可夫决策过程，通过单步前瞻即可显著提升召回效果。这

文章详情

日报

技术趋势

今日 AI 领域聚焦效率革命与 Agent 工程深化：vLLM 团队将 Qwen3-Omni 实时语音推理延迟降至 0.6s、吞吐提升 5.4 倍，标志多模态推理走向实用；Anthropic 与三星洽谈定制 AI 芯片，AI 巨头加速硬件自研；NVIDIA 推出 GPU 收入分成计划，降低初创公司算力门槛。同时，ZCode 以免费策略挑战 Cursor 和 Claude Code，Adobe 展示 'Agentic Site' 概念，预示 Agent 驱动 Web 体验的新范式。学术界方面，蚂蚁集团发布 Vera 框架系统性测试 LLM Agent 安全，Microsoft 推出首个 Offi

文章详情

推荐系统

日报

LLM 深度赋能召回与检索：今日多篇论文将大语言模型（LLM）应用于推荐系统的召回阶段，超越了传统的语义匹配。Meta 利用 LLM 聚类生成硬负样本，Baidu 则用 LLM 构建用户画像并优化记忆检索，Amazon 则通过词汇迁移解决现代编码器在稀疏检索中的“词汇鸿沟”问题。这表明 LLM 正从特征提取向核心检索逻辑演进。; 生成式重排与推理加速成为焦点：以 Diffusion-GR2 为代表的生成式重排器，通过链式推理（CoT）提升排序精度，但其自回归解码速度是部署瓶颈。将扩散模型与知识蒸

文章详情

日报

技术趋势

今日 AI 领域迎来多项重要发布：Apple 在 Safari 中推出官方 MCP Server，成为主流浏览器首次原生支持 MCP 协议，标志着生态从开发者工具向消费级应用扩展。字节跳动发布 Seed2.0 模型系列，聚焦长尾知识与复杂指令跟随，服务数亿用户。NVIDIA 开源 Nemotron-Labs-TwoTower 扩散 LLM 架构，实现 2.42 倍吞吐量。同时，苹果研究挑战多 Agent 主流设计，发现自组织团队表现反而不如单一 Agent，为 Agent 团队设计提供反直觉指导。Palo Alto Networks 揭示“Phantom Squatting”新威胁——LLM

文章详情

推荐系统

日报

生成式推荐全面渗透推荐全链路：今日多篇重磅论文（Netflix GenPage、GR2、ShopX）共同指向一个趋势：生成式推荐正从传统的候选生成阶段，向精排、重排乃至整个主页构建等全链路环节渗透。核心思路是用一个统一的Transformer/LLM模型，通过自回归或语义ID（SID）的方式，端到端地完成排序、布局生成等任务，替代传统的多阶段流水线。; 强化学习（RL）+ 推理蒸馏成为LLM落地的关键配方：GR2和GenPage都验证了RL在LLM推荐中的巨大潜力，尤其是在重排序和页面生成这类复

文章详情

日报

技术趋势

今日 AI 领域迎来多个里程碑事件：Anthropic 前沿模型 Fable 5 和 Mythos 5 在出口管制解除后全球重新上线，标志美国 AI 监管从激进限制转向有条件开放。MCP 协议宣布 7 月 28 日转向无状态，所有生产部署团队需紧急适配。Meta 公开 AI 存储架构演进，揭示传统 BLOB 延迟瓶颈导致 GPU stall 的核心挑战。同时，Together AI 完成 8 亿美元 C 轮融资，估值 83 亿；Kling AI 生成的广告片在戛纳电影节获奖；Boston Dynamics 的 Spot 机器人部署于 2026 世界杯安保。AI 正从聊天机器人时代走向自主工作时

文章详情

推荐系统

日报

实时序列建模与多阶段信号融合：工业界（快手）开始利用精排阶段的多任务分数（CTR、观看时长）作为监督信号，构建动态偏序序列，替代传统的静态点击序列。这标志着序列建模从“被动记录”向“主动利用排序信号”的转变，能更精准地捕捉用户实时意图变化，并直接优化业务核心指标（如观看时长）。; 检索范式从“匹配”到“导航”的进化：无论是快手提出的IID-Nav（图导航）还是学术界对RAG检索瓶颈的诊断，都表明传统的静态相似度匹配（i2i）已无法满足复杂场景需求。新的趋势是将检索建模为状态化、多步的自主探索过程

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅发布：Anthropic 发布 Claude Sonnet 5，性能逼近 Opus 4.8 但价格更低，同时推出面向科学家的 Claude Science 工作台。Amazon 成立 10 亿美元 FDE 组织押注 Agent 现场部署，X 推出官方 MCP Server 扩展生态。微软连发 Memora 记忆系统和 SkillOpt 技能优化两项 Agent 架构突破，NVIDIA 通过软件优化使 DeepSeek V4 在 Blackwell 上月内性能提升 5 倍。Figure 人形机器人 F.03 已抵达宝马工厂，Jim Fan 发布 ASPIRE 机器人技

文章详情

推荐系统

日报

[LLM 推荐进入"推理"深水区]：今日两篇论文（IntuRec、期刊推荐）均利用 LLM 进行偏好推理，但不再满足于简单的 prompt 匹配。IntuRec 引入认知科学中的"直觉"概念，用候选集引导 LLM 在连续隐空间进行多步推理，而非直接输出 token。这标志着 LLM 推荐正从"语义匹配"向"结构化推理"演进，工业落地需关注推理延迟与成本。; [重排/排序的可解释性与约束优化并重]：KakaoBank 的 ChunkGroupSHAP 解决了密集嵌入排序的特征粒度不匹配问题，Avi

文章详情

日报

技术趋势

今日 AI 领域迎来多个重磅动态：美团 LongCat 的 Owl Alpha 1.6T MoE 模型登顶 OpenRouter，完全基于 50k 中国 ASIC 训练，标志着国产算力生态的里程碑式突破。同时，阶跃星辰 Step 3.7 Flash 在自主 Agent 评测中排名第二，MiniMax M3 428B 在三台 Mac 上本地运行并自主创建股票组合，中国 AI 力量全面崛起。工具生态方面，Cursor 发布 iOS 应用、vLLM 深度优化 TTS 模型、LlamaParse 推出 Retrieval Harness，Agent 开发正从桌面走向移动端和生产级。学界方面，上海 AI

文章详情

1 2 3 4 5 6

...