首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
6777
篇文章
累计创建
3170
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
安全性
相关的文章
2026-03-28
最新的AI纪录片提出了疑问:我们到底该有多害怕?
这部名为《AI纪录片:或者我是如何成为一名“末日乐观主义者”的》的新作,试图在极化的AI叙事中寻找中间地带,却因对硅谷大佬们过于宽容而引发争议。文章深度剖析了该片在记录行业精英与探讨生存危机之间的摇摆。
2026-03-28
0
0
0
AI新闻/评测
2026-03-27
如何防御提示词注入攻击?详解 StruQ 与 SecAlign 两种微调防御方案
提示词注入是大型语言模型应用面临的首要威胁。本文深入解析了提示词注入的成因,并介绍伯克利大学提出的StruQ与SecAlign两种创新微调防御方案,通过结构化指令和偏好优化,有效提升LLM应对恶意攻击的鲁棒性。
2026-03-27
0
0
0
AI基础/开发
AI新闻/评测
2026-03-26
深度解析:OpenAI 如何构建与迭代“模型规范”(Model Spec)
本文深入探讨了OpenAI“模型规范”(Model Spec)的背后逻辑与核心机制。作为一套定义AI行为的正式框架,Model Spec旨在通过透明的规则和公众反馈,引导大模型在安全性、公平性与合规性上不断进化,实现从“技术驱动”到“价值对齐”的转变。
2026-03-26
0
0
0
AI新闻/评测
AI基础/开发
2026-03-26
OpenAI 正式推出人工智能安全漏洞赏金计划
OpenAI 近日宣布推出全新的“安全漏洞赏金计划”,旨在招募全球安全研究人员,通过识别 AI 产品中的滥用行为与安全风险,共同构建更稳健的 AI 生态系统。本文详细介绍了该计划的参与范畴及重点审查领域。
2026-03-26
0
0
0
AI新闻/评测
AI基础/开发
2026-03-26
Reddit宣布新举措:要求可疑自动化账户进行人工验证
面对网站上泛滥的机器人程序,Reddit近日宣布将引入人工验证机制。系统将识别并标记自动化服务账户,若账户表现出异常活动,则需进行身份验证。此举旨在打击误导性信息和滥用行为,同时承诺在维护平台透明度的同时,最大程度保护用户匿名性。
2026-03-26
0
0
0
AI新闻/评测
AI行业应用
2026-03-25
Anthropic 为 Claude Code 提供了更多控制权,但仍对其进行约束
Anthropic 推出了 Claude Code 的新“自动模式”,该模式使用 AI 安全措施在执行之前审查每个操作。此功能旨在平衡速度与控制,它会自动执行安全操作,同时阻止潜在的风险行为,从而减少对人工监督的需求。
2026-03-25
0
0
0
AI基础/开发
AI工具应用
AI新闻/评测
2026-03-25
优化 AI 智能体设计:提升对“提示注入”的免疫力
本文深入探讨了AI智能体面临的“提示注入”攻击,并提出了基于社会工程学防御的创新解决方案。文章详细分析了攻击手段的演变,从简单的指令覆盖到复杂的社会工程学操纵,并阐述了如何通过限制智能体权限、引入确认机制等方法,构建更安全、更具弹性的AI系统。这为AI安全领域提供了新的防御思路和实践指导。
2026-03-25
0
0
0
AI新闻/评测
AI基础/开发
2026-03-24
安全地使用 Sora 进行创作
本文详细介绍了OpenAI的Sora 2模型和Sora App在安全性方面的构建和保障措施。从内容来源的辨识、真人肖像的生成、用户肖像的许可使用,到对青少年用户的特殊保护、有害内容的过滤以及音频生成安全,OpenAI力求在提供强大视频生成能力的同时,确保用户安全和内容合规。
2026-03-24
0
0
0
AI新闻/评测
AI创意设计