按发生时间倒序排列,最新在前。共 3 条匹配。按重要性筛选用下方「影响」chip。
Prompt shields 新增 Spotlighting 功能,通过标记文档信任级别防御间接注入攻击。
Project Glasswing: An initial update
Project Glasswing 首次进展更新,目前了解的信息有限。
Widening the conversation on frontier AI
Anthropic 推动前沿 AI 公共对话,属安全治理层面的倡议。