LLMs-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

行动起来，活在当下

累计撰写 7387 篇文章
累计创建 3268 个标签
累计收到 0 条评论

目录CONTENT

以下是 LLMs 相关的文章

2026-03-24
指令层级挑战：增强大型语言模型的安全性和鲁棒性 OpenAI发布IH-Challenge数据集，旨在通过强化指令层级训练，提升大型语言模型（LLMs）在多渠道指令冲突场景下的安全可控性和对抗“提示注入”的能力。该方法能有效泛化，显著增强模型在现实世界中的安全性。
- 2026-03-24
- 0
- 0
- 0
- AI基础/开发
- AI行业应用
2026-03-24
2026 年最值得关注的 10 个 LLM 更新 X（推特）账号
- 2026-03-24
- 0
- 0
- 0
2026-03-21
通过丰富背景故事集生成语言模型的虚拟人格本文介绍了Anthology方法，通过生成和利用包含丰富个体价值观和经验的自然主义背景故事，来引导大型语言模型（LLMs）生成具有代表性、一致性且多样化的虚拟人格。该方法能够更精确地模拟个体，有望革新用户研究和社会科学领域。
- 2026-03-21
- 0
- 0
- 0
2026-03-20
推理模型难以掌控思维链，但这反而是好事本文深入探讨了当前AI推理模型在控制其“思维链”（Chain of Thought, CoT）方面的能力。研究发现，即便是最先进的模型，也很难在被告知正在被监测的情况下，有意地模糊或重塑其推理过程。这一“弱点”反而为AI安全提供了一道意想不到的保障，使得基于CoT的监测技术更加可靠，对AI系统的安全部署至关重要。
- 2026-03-20
- 0
- 0
- 0
2026-03-19
AI 行业的“裁判”：从博士研究项目到估值 17 亿美元的 Arena AI 模型竞争激烈，谁是最佳？Arena（前身为 LM Arena）已成为前沿 LLM 的公开排行榜，影响着资金、发布和公关。这个曾是加州大学伯克利分校博士研究项目的初创公司，在短短七个月内估值飙升至 17 亿美元。本文探讨了 Arena 如何在竞争对手也是投资者的背景下，建立一个中立的基准测试平台。
- 2026-03-19
- 1
- 0
- 0
- AI新闻/评测
- AI行业应用
2026-03-18
减少生产环境中 LLM 幻觉的 7 种方法
- 2026-03-18
- 3
- 0
- 0
- AI基础/开发
- AI工具应用
2026-03-18
请给AI起个好名字本文探讨了“AI”这一英文缩写在中国社会中的广泛使用，并分析了其作为专有名词在规范性和文化亲和力方面的不足。文章呼吁为AI起一个更符合中文习惯、更具形象化和亲和力的中文名称，并建议通过征名活动激发公众的参与和创造力。
- 2026-03-18
- 0
- 0
- 0
- AI新闻/评测
- AI基础/开发
2026-03-17
大英百科全书和韦氏词典起诉OpenAI，指控其“大规模版权侵犯” 大英百科全书（Encyclopedia Britannica）及其子公司韦氏词典（Merriam-Webster）已对OpenAI提起诉讼，指控其未经许可抓取并使用近10万篇受版权保护的文章来训练其大型语言模型（LLM）。原告认为OpenAI不仅侵犯了版权，还通过虚假归因内容损害了出版商的声誉，并直接与出版商的内容竞争。
- 2026-03-17
- 0
- 0
- 0
- AI新闻/评测
- AI行业应用
2026-03-17
AWS 推出由 llm-d 驱动的分布式推理功能本文介绍了 AWS 推出的由 llm-d 驱动的分布式推理功能，旨在提升大型语言模型（LLM）的推理性能、GPU 利用率和成本效益。通过分离预填充（prefill）和解码（decode）阶段，并利用 NIXL 和 EFA 等技术，实现了高效的多节点推理。
- 2026-03-17
- 0
- 0
- 0
2026-03-15
今夜，大模型从世界消散本文以轻小说《今夜，即使这份恋情从世界消散》为引，深入剖析了当前大型语言模型（LLM）“无状态”的本质，以及“上下文窗口”和“KV Cache”等技术如何构建出AI拥有记忆的假象。同时，文章探讨了Prompt Injection等安全问题，并展望了AI记忆的痕迹与未来。
- 2026-03-15
- 1
- 0
- 0
- AI基础/开发
- AI新闻/评测
2026-03-15
SPEX与ProxySPEX：大规模识别AI模型中的关键交互作用本文介绍了SPEX和ProxySPEX框架，旨在解决理解复杂AI模型（尤其是大型语言模型LLMs）行为时面临的“规模上的复杂性”这一关键挑战。通过将解释性研究从特征归因、数据归因和机制解释等多个角度进行统一，SPEX和ProxySPEX能够以极少的消融（ablation）操作，大规模识别模型行为中真正起作用的关键交互作用，并已成功应用于特征归因、数据归因和模型组件归因等领域。
- 2026-03-15
- 1
- 0
- 0
- AI基础/开发
- AI工具应用
2026-03-14
P-EAGLE：vLLM 中使用并行推测性解码实现更快的 LLM 推理本文介绍了 P-EAGLE，一种创新的 LLM 推理技术，它通过并行推测性解码解决了 EAGLE 方法的瓶颈。P-EAGLE 可以在一次前向传播中生成所有草稿 token，相比原生 EAGLE-3 在实际工作负载上实现了高达 1.69 倍的速度提升。该技术已集成到 vLLM 中，并提供了预训练模型，方便用户立即使用。
- 2026-03-14
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2026-03-13
防御提示注入攻击：StruQ 和 SecAlign 方法随着大语言模型（LLMs）的飞速发展，其集成应用也日益增多，但安全性问题随之凸显。提示注入攻击已成为OWASP列出的LLM集成应用首要威胁。本文提出StruQ和SecAlign两种微调防御方法，旨在有效且经济地解决这一问题。
- 2026-03-13
- 0
- 0
- 0
- AI基础/开发
- AI相关教程
2026-03-13
LLM 嵌入能否提升时间序列预测性能？一项实际的特征工程方法
- 2026-03-13
- 1
- 0
- 0
- AI基础/开发
- AI工具应用
2026-03-11
使用LLM嵌入构建简单的语义搜索引擎
- 2026-03-11
- 2
- 0
- 0
- AI基础/开发
- AI工具应用
2026-03-10
LLM 工程师必备的 10 个 Python 库
- 2026-03-10
- 1
- 0
- 0
- AI基础/开发
- AI工具应用
2026-03-10
语言模型是商品吗？
- 2026-03-10
- 3
- 0
- 0
- AI基础/开发
- AI行业应用
2026-03-10
使用托管在 SageMaker AI 端点上的 LLM 为 Strands Agent 构建自定义模型提供程序本文深入探讨了如何为使用自定义服务框架（如SGLang, vLLM）托管在Amazon SageMaker AI端点上的大型语言模型（LLMs）构建自定义模型提供程序。主要解决的是模型响应格式与Strands Agent期望的Bedrock Messages API格式不兼容的问题。通过扩展SageMakerAIModel并实现自定义解析器，可以无缝集成各种模型，确保Strands Agent的兼容性。
- 2026-03-10
- 0
- 0
- 0