按发生时间倒序排列,最新在前。共 54 条匹配。按重要性筛选用下方「影响」chip。
What 81,000 people want from AI - Large-scale qualitative study
Anthropic 发布 8.1 万人参与的 AI 用户研究,是最大规模多语言定性调研,揭示用户对 AI 的真实态度。
Measuring progress toward AGI: A cognitive framework
DeepMind 发布 AGI 评估认知框架并举办 Kaggle 基准测试黑客马拉松,体现其在 AI 评估标准上的话语权争夺。
Claude is a space to think - Ad-free commitment
Anthropic 承诺 Claude 永不加广告,通过订阅模式而非广告变现,强化用户信任定位。
Project Genie: Experimenting with infinite, interactive worlds
Project Genie 作为世界模型产品向付费用户开放,展示 Google 在多模态/世界模型方向的产品化进展。
DeepSeek-V3.2 Upgrade
DeepSeek-V3.2 发布,统一 chat 和 reasoner 两条模型线到 V3.2 架构下。
DeepSeek-V3.1-Terminus: Fixes for Language Mixing and Agent Optimization
V3.1 的小版本升级,重点修复语言混用问题并强化 Coding Agent 和搜索 Agent,显示 DeepSeek 在 Agent 场景的持续投入。
DeepSeek-R1-0528: Enhanced Reasoning, JSON Output, and Function Calling
R1 推理模型首次获得 Function Calling 和 JSON 输出能力,推理 benchmark 全面提升,使推理模型可在 Agent 场景中直接使用。
DeepSeek-V3-0324: Enhanced Reasoning, Front-End Dev, and Function Calling
V3-0324 在推理 benchmark 上全面提升,修复了此前 V3 版本的 Function Calling 问题,中文写作对齐 R1 风格。
DeepSeek V2.5: Merger of Chat and Coder Models
DeepSeek 将 Chat 和 Coder 两条模型线合并为统一的 V2.5,简化产品线同时保持 API 兼容,是模型统合战略的早期信号。
Context Caching on Disk Technology
DeepSeek 推出基于硬盘的上下文缓存技术,通过降低缓存存储成本实现大幅降价,是推理成本优化的创新方案。