📢 转载信息
原文链接:https://openai.com/index/introducing-lockdown-mode-and-elevated-risk-labels-in-chatgpt
原文作者:OpenAI
2026年2月13日
随着 AI 系统承担更复杂的任务,尤其是涉及网络与关联应用程序的任务,安全风险也随之改变。
一项新兴风险变得尤为关键:提示注入。在此类攻击中,第三方会试图误导对话式 AI 系统,诱使其执行恶意指令或泄露敏感信息。
今天,我们推出了两项全新保护措施,旨在帮助用户和组织抵御提示注入攻击,同时提升风险可见性与管控力度:
- 锁定模式是 ChatGPT 的一项高级可选安全设置,专为高风险用户设计。
- 在 ChatGPT、ChatGPT Atlas、Codex 中,为可能带来额外风险的功能统一标注“风险升高”
这些新增功能基于我们在模型、产品、系统层面的现有防护体系而打造。涵盖沙盒隔离、基于 URL 的数据外泄防护、监控与执行,以及基于角色访问、审计日志等企业级管控功能。
助力组织为面临最高网络攻击风险的员工提供防护
锁定模式是一项可选的高级安全设置,专为少数高度重视安全的用户设计,例如知名组织的高管或安全团队,这类用户需要更强的防护抵御高级威胁。对大多数用户而言,该功能不是必需的。锁定模式严格限制 ChatGPT 与外部系统的交互方式,降低提示注入引发的数据外泄风险。
锁定模式以确定性的方式禁用 ChatGPT 中的某些工具和功能,以防范攻击者通过提示注入等攻击,从用户对话或关联应用程序中窃取敏感数据。
例如,在锁定模式模式下,网页浏览仅限于缓存内容,因此不会有任何实时网络请求流出 OpenAI 的受控网络。该限制旨在避免敏感数据通过网页浏览泄露给攻击者。若无法为数据安全提供可靠的确定性保障,部分功能将被完全禁用。
锁定模式是一项全新的确定性安全设置,通过严格限制 ChatGPT 与特定外部系统的交互方式,避免数据被无意间共享给第三方。
ChatGPT Business 套餐已提供企业级数据安全保障。锁定模式在现有防护基础上进一步升级,适用于 ChatGPT Enterprise、ChatGPT Edu、ChatGPT for Healthcare、ChatGPT for Teachers。管理员可在工作空间设置(在新窗口中打开)中创建新角色(在新窗口中打开),启用该功能。启用后,锁定模式会在现有管理员设置的基础上叠加额外限制。
前往帮助中心(在新窗口中打开)了解锁定模式的更多详情。
由于部分核心工作流程依赖应用程序,工作空间管理员可保留更精细的管控权限。管理员可以精准设定锁定模式下,用户可以使用的应用程序及应用程序内的具体操作。此外,合规 API 日志平台(在新窗口中打开)独立于锁定模式,可详细展示应用使用情况、共享数据与关联来源,协助管理员实施监督。
我们计划在未来几个月内面向个人用户推出锁定模式。
帮助用户明智地选择风险应对方案
AI 产品在连接到你的应用程序和网络时会更加实用,为此我们已投入大量资源保障关联数据的安全。与此同时,部分网络相关功能引入了新的风险,而行业现有安全防护措施尚未完全解决此类风险。有些用户可能愿意承担此类风险。我们认为让用户有权自主决定是否使用、如何使用相关功能是非常重要的,尤其是在处理私人数据时。
我们的策略是为可能带来额外风险的功能提供产品内指引。为了让指引更清晰统一,我们正在对少量现有功能的标注方式进行标准化设计。这些功能将在 ChatGPT、ChatGPT Atlas、Codex 中统一标注“风险升高”,确保你在任意产品中获得一致指引。
例如,在编程助手 Codex 中,开发人员可授予 Codex 网络访问权限,以便其执行查阅文档等网页操作。相关设置界面会标注“风险升高”,并清晰说明功能变更、可能引发的风险,以及何时适合授予该访问权限。
Codex 设置界面截图,用户可在此配置 Codex 的网络访问权限。
下一步发展
我们正在持续投入以升级安全防护措施,重点应对全新、新兴且不断加剧的风险。随着我们加强这些功能的安全防护措施,一旦确认安全优化已充分缓解通用场景下的风险,便会移除“风险升高”标签。我们也会持续更新带有该标签的功能,以便向你精准传达风险信息。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区