安全性-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

行动起来，活在当下

累计撰写 7387 篇文章
累计创建 3268 个标签
累计收到 0 条评论

目录CONTENT

以下是安全性相关的文章

2026-05-24
关于近期AI委派任务与长周期可靠性研究的补充说明微软研究院就“大模型委派任务可能损坏文档”的研究引发的讨论做出回应。本文阐述了该基准测试的初衷，强调长周期AI委派任务的可靠性仍是重要挑战，并指出生产环境可通过验证机制有效缓解模型潜在的语义退化问题。
- 2026-05-24
- 1
- 0
- 0
- AI基础/开发
- AI新闻/评测
2026-05-24
在 OpenAI 内部安全运行 Codex 深入解析 OpenAI 如何通过沙箱机制、网络控制、身份认证及智能体原生遥测技术，在保障开发效率的同时，确保编程智能体 Codex 在企业级环境下的安全合规运行。
- 2026-05-24
- 1
- 0
- 0
- AI基础/开发
- AI行业应用
2026-05-24
构建安全有效的沙箱：为 Windows 上的 Codex 提供支持本文深入探讨了 OpenAI 工程团队如何为 Windows 开发安全的 Codex 沙箱环境。通过分析 AppContainer、Windows Sandbox 等现有工具的局限性，作者分享了如何通过自定义特权隔离、写入限制令牌以及防火墙规则，构建出一个既能保障安全又不干扰开发者工作流的强大沙箱系统。
- 2026-05-24
- 2
- 0
- 0
- AI基础/开发
- AI行业应用
2026-04-10
OpenAI力挺新法案：旨在豁免AI公司在“重大灾难”中的法律责任 OpenAI近日在伊利诺伊州表态支持一项极具争议的法案，该法案旨在豁免前沿AI开发商在模型引发重大人员伤亡或巨额财产损失时的法律责任。这一动作标志着OpenAI立法策略的重大转变，引发了行业专家对AI安全监管与问责机制的激烈讨论。
- 2026-04-10
- 0
- 0
- 0
- AI新闻/评测
- AI行业应用
2026-04-10
佛罗里达州检察长计划就 ChatGPT 在大规模枪击事件中的潜在作用展开调查佛罗里达州检察长宣布，将针对 ChatGPT 在佛罗里达州立大学枪击案中可能扮演的角色展开调查。受害者家属指控该 AI 辅助策划了袭击，这一事件再次引发了公众对于“AI 精神错乱”及模型安全性问题的严峻担忧。
- 2026-04-10
- 0
- 0
- 0
- AI新闻/评测
- AI行业应用
2026-04-09
深入解析 OpenAI 的模型规范制定方法随着AI系统能力日益增强，如何界定其预设行为至关重要。本文深度解析OpenAI的“模型规范（Model Spec）”框架，阐述其如何通过指令层级、红线原则及公共透明度，确保AI行为既符合人类利益，又具备可理解性与可治理性。
- 2026-04-09
- 0
- 0
- 0
- AI基础/开发
- AI新闻/评测
2026-04-09
OpenAI 安全性风险赏金计划正式上线 OpenAI 正式启动安全性风险赏金计划，旨在识别 AI 产品中的滥用与安全隐患。该计划不仅补充了原有的安全漏洞赏金，更聚焦于智能体风险、模型专有信息泄露及平台完整性，诚邀全球安全研究人员参与，共同构建更安全的 AI 生态。
- 2026-04-09
- 0
- 0
- 0
- AI新闻/评测
- AI基础/开发
2026-04-08
科学家编造了一种假疾病，AI却告诉人们它是真的如果你的眼睛干涩发痒，向AI询问病因时它是否诊断你患上了“bixonimania”？本文深度揭秘AI如何被虚构的学术论文误导，产生严重幻觉，并探讨大型语言模型在处理医疗信息时存在的致命风险与数据安全性问题。
- 2026-04-08
- 1
- 0
- 0
- AI新闻/评测
- AI行业应用
2026-04-07
BlueCodeAgent：一种由自动化红队测试支持的编程AI蓝队智能体微软研究团队推出了BlueCodeAgent，这是一种创新的蓝队智能体。通过引入自动化红队测试机制，该工具旨在提升代码生成类AI的安全性，通过动态监测与评估，显著增强了编程辅助系统的防御能力与可靠性。
- 2026-04-07
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2026-04-07
BlueCodeAgent：通过自动化红队测试赋能代码生成AI的蓝队智能体本文介绍了微软研究团队开发的BlueCodeAgent。这是一种创新的蓝队智能体，利用自动化红队测试技术，显著提升了代码生成AI的安全性与鲁棒性。通过这一机制，BlueCodeAgent能够主动识别并防御代码生成中的漏洞，为AI编程开发提供了更可靠的安全保障。
- 2026-04-07
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2026-04-07
BlueCodeAgent：一种通过自动化红队测试赋能代码生成AI的蓝队智能体微软最新发布BlueCodeAgent，这是一种创新的蓝队智能体。它通过自动化的红队测试机制，有效提升了代码生成AI模型的安全防御能力。本文深度解析了该技术如何通过动态红队交互，为AI驱动的软件开发构建更加坚固的防御屏障。
- 2026-04-07
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2026-04-07
派早报：OpenAI 发布 AI 时代政策建议、工信部提示 iOS 安全风险等本期早报速览：OpenAI 发布《智能时代的产业政策》探讨 AI 治理；工信部发出 iOS 安全漏洞风险提示；LinkedIn 被指控扫描用户扩展程序；国家网信办拟规管数字虚拟人；十部门印发人工智能伦理审查办法；Anthropic 与谷歌达成大规模 TPU 算力合作。
- 2026-04-07
- 0
- 0
- 0
- AI新闻/评测
- AI行业应用
2026-04-07
OpenAI Foundation 最新动态：投入十亿美元深耕生命科学与AI安全 OpenAI Foundation 正式启动资源投入，计划在未来一年内斥资至少10亿美元，聚焦生命科学、AI风险应对、经济机遇及社区建设，推动通用人工智能造福全人类。
- 2026-04-07
- 1
- 0
- 0
- AI新闻/评测
- AI行业应用
2026-04-07
BlueCodeAgent：利用自动化红队测试赋能代码生成AI的蓝队智能体本文介绍了BlueCodeAgent，这是一种创新的蓝队智能体。通过引入自动化红队测试机制，该工具显著提升了代码生成AI的安全性与稳健性，为开发者提供了更可靠的AI编程辅助方案，是AI安全领域的重要进展。
- 2026-04-07
- 0
- 0
- 0
2026-04-07
OpenAI 宣布推出安全奖学金计划 (OpenAI Safety Fellowship) OpenAI 正式启动“安全奖学金计划”，旨在支持外部研究人员与工程师，针对先进 AI 系统的安全与对齐问题开展深度研究。该项目涵盖安全评估、伦理、稳健性等领域，入选者将获得 OpenAI 导师指导、计算资源及津贴支持。
- 2026-04-07
- 0
- 0
- 0
- AI新闻/评测
- AI基础/开发
2026-04-06
BlueCodeAgent：利用自动化红队测试赋能代码生成AI的蓝队智能体微软研究团队推出BlueCodeAgent，这是一款创新的蓝队智能体，通过自动化红队测试技术，显著增强了代码生成AI的安全性与鲁棒性。本文深入探讨了其工作原理及在软件开发安全领域的前沿应用。
- 2026-04-06
- 0
- 0
- 0
2026-04-06
BlueCodeAgent：通过自动化红队测试赋能代码生成AI的蓝队智能体微软研究团队推出了BlueCodeAgent，这是一款利用自动化红队测试技术提升代码生成AI安全性的蓝队智能体。本文深入探讨了该系统如何通过主动防御机制，显著增强代码生成模型的安全性与可靠性，为构建更可信的AI开发环境提供了前沿解决方案。
- 2026-04-06
- 1
- 0
- 0
- AI基础/开发
- AI工具应用
2026-04-06
提升前沿大语言模型的指令层级结构：OpenAI 发布 IH-Challenge 数据集 OpenAI 正式发布 IH-Challenge 数据集，旨在强化大语言模型的指令层级（Instruction Hierarchy）理解能力。通过训练模型正确处理冲突指令，这一方案有效提升了 AI 的安全性、抗提示注入稳健性，并成功解决了过度拒答等常见的训练难题，为构建更可控的智能体奠定基础。
- 2026-04-06
- 1
- 0
- 0
- AI新闻/评测
- AI基础/开发
2026-04-06
BlueCodeAgent：通过自动化红队测试赋能代码生成AI的蓝队智能体微软最新发布BlueCodeAgent，这是一款专为代码生成AI设计的蓝队智能体。通过自动化红队测试技术，该智能体能够有效提升代码生成的安全性与可靠性，为开发者提供更稳健的AI编程支持。
- 2026-04-06
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2026-04-06
BlueCodeAgent：一种由自动化红队测试驱动的编程AI蓝队智能体本文介绍了微软研究团队开发的BlueCodeAgent。该智能体利用自动化红队测试技术，旨在为编程AI提供更强的防御与安全能力，有效识别并修复代码生成模型中的潜在漏洞，是提升编程AI安全性的一项重要进展。
- 2026-04-06
- 0
- 0
- 0
- AI基础/开发
- AI工具应用

1
2
3