锁定模式正式上线，在 ChatGPT 中统一使用“风险升高”标签-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://openai.com/index/introducing-lockdown-mode-and-elevated-risk-labels-in-chatgpt

原文作者：OpenAI

2026年2月13日

随着 AI 系统承担更复杂的任务，尤其是涉及网络与关联应用程序的任务，安全风险也随之改变。

一项新兴风险变得尤为关键：提示注入⁠。在此类攻击中，第三方会试图误导对话式 AI 系统，诱使其执行恶意指令或泄露敏感信息。

今天，我们推出了两项全新保护措施，旨在帮助用户和组织抵御提示注入攻击，同时提升风险可见性与管控力度：

锁定模式是 ChatGPT 的一项高级可选安全设置，专为高风险用户设计。
在 ChatGPT、ChatGPT Atlas、Codex 中，为可能带来额外风险的功能统一标注“风险升高”

这些新增功能基于我们在模型、产品、系统层面的现有防护体系而打造。涵盖沙盒隔离、基于 URL 的数据外泄防护⁠、监控与执行，以及基于角色访问、审计日志等企业级管控⁠功能。

助力组织为面临最高网络攻击风险的员工提供防护

锁定模式是一项可选的高级安全设置，专为少数高度重视安全的用户设计，例如知名组织的高管或安全团队，这类用户需要更强的防护抵御高级威胁。对大多数用户而言，该功能不是必需的。锁定模式严格限制 ChatGPT 与外部系统的交互方式，降低提示注入引发的数据外泄风险。

锁定模式以确定性的方式禁用 ChatGPT 中的某些工具和功能，以防范攻击者通过提示注入等攻击，从用户对话或关联应用程序中窃取敏感数据。

例如，在锁定模式模式下，网页浏览仅限于缓存内容，因此不会有任何实时网络请求流出 OpenAI 的受控网络。该限制旨在避免敏感数据通过网页浏览泄露给攻击者。若无法为数据安全提供可靠的确定性保障，部分功能将被完全禁用。

标题为“锁定模式”的示意图，显示 ChatGPT 处于安全边界内，可连接私有网页缓存、下载文件、通过 Canvas 访问网页、浏览公共网页。外部“攻击者”与公共网页位于安全边界外，封锁的入口点表明锁定模式下访问权限受限。

锁定模式是一项全新的确定性安全设置，通过严格限制 ChatGPT 与特定外部系统的交互方式，避免数据被无意间共享给第三方。

ChatGPT Business 套餐已提供企业级数据安全保障⁠。锁定模式在现有防护基础上进一步升级，适用于 ChatGPT Enterprise、ChatGPT Edu、ChatGPT for Healthcare、ChatGPT for Teachers。管理员可在工作空间设置⁠（在新窗口中打开）中创建新角色⁠（在新窗口中打开），启用该功能。启用后，锁定模式会在现有管理员设置的基础上叠加额外限制。

前往帮助中心⁠（在新窗口中打开）了解锁定模式的更多详情。

由于部分核心工作流程依赖应用程序，工作空间管理员可保留更精细的管控权限。管理员可以精准设定锁定模式下，用户可以使用的应用程序及应用程序内的具体操作。此外，合规 API 日志平台⁠（在新窗口中打开）独立于锁定模式，可详细展示应用使用情况、共享数据与关联来源，协助管理员实施监督。

我们计划在未来几个月内面向个人用户推出锁定模式。

帮助用户明智地选择风险应对方案

AI 产品在连接到你的应用程序和网络时会更加实用，为此我们已投入大量资源保障关联数据的安全⁠。与此同时，部分网络相关功能引入了新的风险，而行业现有安全防护措施尚未完全解决此类风险。有些用户可能愿意承担此类风险。我们认为让用户有权自主决定是否使用、如何使用相关功能是非常重要的，尤其是在处理私人数据时。

我们的策略是为可能带来额外风险的功能提供产品内指引。为了让指引更清晰统一，我们正在对少量现有功能的标注方式进行标准化设计。这些功能将在 ChatGPT、ChatGPT Atlas、Codex 中统一标注“风险升高”，确保你在任意产品中获得一致指引。

例如，在编程助手 Codex 中，开发人员可授予 Codex 网络访问权限，以便其执行查阅文档等网页操作。相关设置界面会标注“风险升高”，并清晰说明功能变更、可能引发的风险，以及何时适合授予该访问权限。

Codex 设置界面截图，用户可在此配置 Codex 的网络访问权限。

下一步发展

我们正在持续投入以升级安全防护措施，重点应对全新、新兴且不断加剧的风险。随着我们加强这些功能的安全防护措施，一旦确认安全优化已充分缓解通用场景下的风险，便会移除“风险升高”标签。我们也会持续更新带有该标签的功能，以便向你精准传达风险信息。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

锁定模式正式上线，在 ChatGPT 中统一使用“风险升高”标签

助力组织为面临最高网络攻击风险的员工提供防护

帮助用户明智地选择风险应对方案

下一步发展

评论区