目 录CONTENT

文章目录

锁定模式正式上线,在 ChatGPT 中统一使用“风险升高”标签

Administrator
2026-02-27 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://openai.com/index/introducing-lockdown-mode-and-elevated-risk-labels-in-chatgpt

原文作者:OpenAI


2026年2月13日

随着 AI 系统承担更复杂的任务,尤其是涉及网络与关联应用程序的任务,安全风险也随之改变。

一项新兴风险变得尤为关键:提示注入。在此类攻击中,第三方会试图误导对话式 AI 系统,诱使其执行恶意指令或泄露敏感信息。

今天,我们推出了两项全新保护措施,旨在帮助用户和组织抵御提示注入攻击,同时提升风险可见性与管控力度:

  • 锁定模式是 ChatGPT 的一项高级可选安全设置,专为高风险用户设计。
  • 在 ChatGPT、ChatGPT Atlas、Codex 中,为可能带来额外风险的功能统一标注“风险升高”

这些新增功能基于我们在模型、产品、系统层面的现有防护体系而打造。涵盖沙盒隔离、基于 URL 的数据外泄防护、监控与执行,以及基于角色访问、审计日志等企业级管控功能。

助力组织为面临最高网络攻击风险的员工提供防护

锁定模式是一项可选的高级安全设置,专为少数高度重视安全的用户设计,例如知名组织的高管或安全团队,这类用户需要更强的防护抵御高级威胁。对大多数用户而言,该功能不是必需的。锁定模式严格限制 ChatGPT 与外部系统的交互方式,降低提示注入引发的数据外泄风险。

锁定模式以确定性的方式禁用 ChatGPT 中的某些工具和功能,以防范攻击者通过提示注入等攻击,从用户对话或关联应用程序中窃取敏感数据。

例如,在锁定模式模式下,网页浏览仅限于缓存内容,因此不会有任何实时网络请求流出 OpenAI 的受控网络。该限制旨在避免敏感数据通过网页浏览泄露给攻击者。若无法为数据安全提供可靠的确定性保障,部分功能将被完全禁用。

标题为“锁定模式”的示意图,显示 ChatGPT 处于安全边界内,可连接私有网页缓存、下载文件、通过 Canvas 访问网页、浏览公共网页。外部“攻击者”与公共网页位于安全边界外,封锁的入口点表明锁定模式下访问权限受限。

锁定模式是一项全新的确定性安全设置,通过严格限制 ChatGPT 与特定外部系统的交互方式,避免数据被无意间共享给第三方。

ChatGPT Business 套餐已提供企业级数据安全保障。锁定模式在现有防护基础上进一步升级,适用于 ChatGPT Enterprise、ChatGPT Edu、ChatGPT for Healthcare、ChatGPT for Teachers。管理员可在工作空间设置⁠(在新窗口中打开)中创建新角色⁠(在新窗口中打开),启用该功能。启用后,锁定模式会在现有管理员设置的基础上叠加额外限制。

前往帮助中心⁠(在新窗口中打开)了解锁定模式的更多详情。

由于部分核心工作流程依赖应用程序,工作空间管理员可保留更精细的管控权限。管理员可以精准设定锁定模式下,用户可以使用的应用程序及应用程序内的具体操作。此外,合规 API 日志平台⁠(在新窗口中打开)独立于锁定模式,可详细展示应用使用情况、共享数据与关联来源,协助管理员实施监督。

我们计划在未来几个月内面向个人用户推出锁定模式。

帮助用户明智地选择风险应对方案

AI 产品在连接到你的应用程序和网络时会更加实用,为此我们已投入大量资源保障关联数据的安全。与此同时,部分网络相关功能引入了新的风险,而行业现有安全防护措施尚未完全解决此类风险。有些用户可能愿意承担此类风险。我们认为让用户有权自主决定是否使用、如何使用相关功能是非常重要的,尤其是在处理私人数据时。

我们的策略是为可能带来额外风险的功能提供产品内指引。为了让指引更清晰统一,我们正在对少量现有功能的标注方式进行标准化设计。这些功能将在 ChatGPT、ChatGPT Atlas、Codex 中统一标注“风险升高”,确保你在任意产品中获得一致指引。

例如,在编程助手 Codex 中,开发人员可授予 Codex 网络访问权限,以便其执行查阅文档等网页操作。相关设置界面会标注“风险升高”,并清晰说明功能变更、可能引发的风险,以及何时适合授予该访问权限。

Codex 设置界面截图,用户可在此配置 Codex 的网络访问权限。

Codex 设置界面截图,用户可在此配置 Codex 的网络访问权限。

下一步发展

我们正在持续投入以升级安全防护措施,重点应对全新、新兴且不断加剧的风险。随着我们加强这些功能的安全防护措施,一旦确认安全优化已充分缓解通用场景下的风险,便会移除“风险升高”标签。我们也会持续更新带有该标签的功能,以便向你精准传达风险信息。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区