首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
6777
篇文章
累计创建
3170
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
LLMs
相关的文章
2026-03-24
指令层级挑战:增强大型语言模型的安全性和鲁棒性
OpenAI发布IH-Challenge数据集,旨在通过强化指令层级训练,提升大型语言模型(LLMs)在多渠道指令冲突场景下的安全可控性和对抗“提示注入”的能力。该方法能有效泛化,显著增强模型在现实世界中的安全性。
2026-03-24
0
0
0
AI基础/开发
AI行业应用
2026-03-24
2026 年最值得关注的 10 个 LLM 更新 X(推特)账号
2026-03-24
0
0
0
AI基础/开发
AI新闻/评测
AI工具应用
2026-03-21
通过丰富背景故事集生成语言模型的虚拟人格
本文介绍了Anthology方法,通过生成和利用包含丰富个体价值观和经验的自然主义背景故事,来引导大型语言模型(LLMs)生成具有代表性、一致性且多样化的虚拟人格。该方法能够更精确地模拟个体,有望革新用户研究和社会科学领域。
2026-03-21
0
0
0
AI基础/开发
AI行业应用
AI新闻/评测
2026-03-20
推理模型难以掌控思维链,但这反而是好事
本文深入探讨了当前AI推理模型在控制其“思维链”(Chain of Thought, CoT)方面的能力。研究发现,即便是最先进的模型,也很难在被告知正在被监测的情况下,有意地模糊或重塑其推理过程。这一“弱点”反而为AI安全提供了一道意想不到的保障,使得基于CoT的监测技术更加可靠,对AI系统的安全部署至关重要。
2026-03-20
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2026-03-19
AI 行业的“裁判”:从博士研究项目到估值 17 亿美元的 Arena
AI 模型竞争激烈,谁是最佳?Arena(前身为 LM Arena)已成为前沿 LLM 的公开排行榜,影响着资金、发布和公关。这个曾是加州大学伯克利分校博士研究项目的初创公司,在短短七个月内估值飙升至 17 亿美元。本文探讨了 Arena 如何在竞争对手也是投资者的背景下,建立一个中立的基准测试平台。
2026-03-19
0
0
0
AI新闻/评测
AI行业应用
2026-03-18
减少生产环境中 LLM 幻觉的 7 种方法
2026-03-18
1
0
0
AI基础/开发
AI工具应用
2026-03-18
请给AI起个好名字
本文探讨了“AI”这一英文缩写在中国社会中的广泛使用,并分析了其作为专有名词在规范性和文化亲和力方面的不足。文章呼吁为AI起一个更符合中文习惯、更具形象化和亲和力的中文名称,并建议通过征名活动激发公众的参与和创造力。
2026-03-18
0
0
0
AI新闻/评测
AI基础/开发
2026-03-17
大英百科全书和韦氏词典起诉OpenAI,指控其“大规模版权侵犯”
大英百科全书(Encyclopedia Britannica)及其子公司韦氏词典(Merriam-Webster)已对OpenAI提起诉讼,指控其未经许可抓取并使用近10万篇受版权保护的文章来训练其大型语言模型(LLM)。原告认为OpenAI不仅侵犯了版权,还通过虚假归因内容损害了出版商的声誉,并直接与出版商的内容竞争。
2026-03-17
0
0
0
AI新闻/评测
AI行业应用
2026-03-17
AWS 推出由 llm-d 驱动的分布式推理功能
本文介绍了 AWS 推出的由 llm-d 驱动的分布式推理功能,旨在提升大型语言模型(LLM)的推理性能、GPU 利用率和成本效益。通过分离预填充(prefill)和解码(decode)阶段,并利用 NIXL 和 EFA 等技术,实现了高效的多节点推理。
2026-03-17
0
0
0
AI基础/开发
AI行业应用
AI工具应用
2026-03-15
今夜,大模型从世界消散
本文以轻小说《今夜,即使这份恋情从世界消散》为引,深入剖析了当前大型语言模型(LLM)“无状态”的本质,以及“上下文窗口”和“KV Cache”等技术如何构建出AI拥有记忆的假象。同时,文章探讨了Prompt Injection等安全问题,并展望了AI记忆的痕迹与未来。
2026-03-15
0
0
0
AI基础/开发
AI新闻/评测
2026-03-15
SPEX与ProxySPEX:大规模识别AI模型中的关键交互作用
本文介绍了SPEX和ProxySPEX框架,旨在解决理解复杂AI模型(尤其是大型语言模型LLMs)行为时面临的“规模上的复杂性”这一关键挑战。通过将解释性研究从特征归因、数据归因和机制解释等多个角度进行统一,SPEX和ProxySPEX能够以极少的消融(ablation)操作,大规模识别模型行为中真正起作用的关键交互作用,并已成功应用于特征归因、数据归因和模型组件归因等领域。
2026-03-15
1
0
0
AI基础/开发
AI工具应用
2026-03-14
P-EAGLE:vLLM 中使用并行推测性解码实现更快的 LLM 推理
本文介绍了 P-EAGLE,一种创新的 LLM 推理技术,它通过并行推测性解码解决了 EAGLE 方法的瓶颈。P-EAGLE 可以在一次前向传播中生成所有草稿 token,相比原生 EAGLE-3 在实际工作负载上实现了高达 1.69 倍的速度提升。该技术已集成到 vLLM 中,并提供了预训练模型,方便用户立即使用。
2026-03-14
0
0
0
AI基础/开发
AI工具应用
2026-03-13
防御提示注入攻击:StruQ 和 SecAlign 方法
随着大语言模型(LLMs)的飞速发展,其集成应用也日益增多,但安全性问题随之凸显。提示注入攻击已成为OWASP列出的LLM集成应用首要威胁。本文提出StruQ和SecAlign两种微调防御方法,旨在有效且经济地解决这一问题。
2026-03-13
0
0
0
AI基础/开发
AI相关教程
2026-03-13
LLM 嵌入能否提升时间序列预测性能?一项实际的特征工程方法
2026-03-13
0
0
0
AI基础/开发
AI工具应用
2026-03-11
使用LLM嵌入构建简单的语义搜索引擎
2026-03-11
1
0
0
AI基础/开发
AI工具应用
2026-03-10
LLM 工程师必备的 10 个 Python 库
2026-03-10
1
0
0
AI基础/开发
AI工具应用
2026-03-10
语言模型是商品吗?
2026-03-10
2
0
0
AI基础/开发
AI行业应用
2026-03-10
使用托管在 SageMaker AI 端点上的 LLM 为 Strands Agent 构建自定义模型提供程序
本文深入探讨了如何为使用自定义服务框架(如SGLang, vLLM)托管在Amazon SageMaker AI端点上的大型语言模型(LLMs)构建自定义模型提供程序。主要解决的是模型响应格式与Strands Agent期望的Bedrock Messages API格式不兼容的问题。通过扩展SageMakerAIModel并实现自定义解析器,可以无缝集成各种模型,确保Strands Agent的兼容性。
2026-03-10
0
0
0
AI工具应用
AI基础/开发
AI新闻/评测