首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
5205
篇文章
累计创建
1860
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
LLM
相关的文章
2026-01-29
Modelence 获 300 万美元种子轮融资,致力于简化“氛围式编码”技术栈
随着人工智能普及软件工程,新一代用户涌现,渴望构建自己的应用。然而,部署、安全和DevOps等传统难题依然存在。Y Combinator 初创公司 Modelence 宣布获得 300 万美元种子轮融资,旨在通过提供类似一体化的框架,解决这些“氛围式编码”(Vibe Coding)技术栈中服务间连接的复杂性,整合认证、数据库、托管和LLM可观测性工具。
2026-01-29
0
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2026-01-28
Risotto 融资 1000 万美元种子轮,利用 AI 让票务系统更易用
帮助台自动化领域正面临 AI 带来的颠覆。初创公司 Risotto 宣布完成 1000 万美元种子轮融资,旨在利用 AI 自动化处理帮助台工单。他们通过构建专门的基础设施和提示库,已成功帮助 Gusto 自动化了 60% 的支持工单,预示着未来工作台操作将更多地依赖 LLM。
2026-01-28
1
0
0
AI新闻/评测
AI工具应用
AI行业应用
2026-01-16
BotSync完成A轮延期融资,新加坡SGInnovate领投
专注于将大型语言模型(LLM)与特定领域知识相结合的BotSync,近期完成了其A轮融资的延期(Extension)轮。本轮融资由新加坡的风险投资机构<em>SGInnovate</em>领投,并获得了新老投资者的共同支持。BotSync的核心技术在于其<em>“领域知识层”</em>,它能够帮助企业在AI应用中有效整合私有或专业数据,解决通用LLM在处理垂直行业信息时的准确性与深度不足问题。此轮融资将主要用于技术研发、市场拓展以及加速AI在企业级应用的落地,特别是针对金融、法律和医疗等高...
2026-01-16
0
0
0
AI新闻/评测
AI行业应用
2026-01-09
StrongREJECT:评估大型语言模型越狱方法的更可靠基准
研究人员发现,许多已发表的大型语言模型(LLM)越狱(Jailbreak)方法的成功率被夸大了。为了解决评估中的可靠性问题,本文提出了StrongREJECT基准。该基准包含一套高质量的禁止提示词集和先进的自动评估器,能够更准确、更稳健地评估越狱方法的有效性,并揭示了“意愿-能力权衡”现象。
2026-01-09
1
0
0
AI新闻/评测
AI基础/开发
2026-01-09
学习人工智能最受欢迎的10个GitHub仓库
本指南精选了当前最受欢迎且实用的10个GitHub仓库,旨在为人工智能学习者提供清晰的学习路径。这些资源全面覆盖了从基础数学和机器学习原理,到前沿的大语言模型(LLM)、生成式AI应用、智能体系统构建,以及实际的生产系统部署。通过微软的初学者课程、从零开始构建LLM的实战项目,以及专注于RAG和多智能体架构的资源,学习者可以系统地掌握构建可靠AI应用所需的端到端技能,避免学习过程中的迷茫,加速实践转化。
2026-01-09
1
0
0
AI基础/开发
AI工具应用
2026-01-07
为什么AI预测如此困难
作者深入探讨了在当前技术快速迭代的背景下,对人工智能未来发展进行准确预测的难度。他指出了三个核心的不确定性因素:大型语言模型(LLM)的持续进步、公众对AI日益增长的不满,以及监管机构混乱的反应。尽管如此,我们仍在努力预测2026年的AI趋势。
2026-01-07
0
0
0
AI新闻/评测
2025-12-26
使用 BentoML 的 LLM-Optimizer 在 Amazon SageMaker AI 上优化 LLM 推理
本文深入探讨了如何在 Amazon SageMaker AI 上使用 BentoML 的 LLM-Optimizer 工具,系统性地优化大型语言模型(LLM)的推理性能。通过自动化基准测试和参数调优,我们展示了如何摆脱繁琐的手动试错,快速找到满足延迟和吞吐量目标的最优配置,并将其无缝部署到生产环境,以实现显著的成本和性能提升。
2025-12-26
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-26
使用 BentoML 的 LLM-Optimizer 在 Amazon SageMaker AI 上优化 LLM 推理
本文深入探讨了在 Amazon SageMaker AI 上使用 BentoML 的 LLM-Optimizer 来系统化优化大型语言模型(LLM)推理性能的方法。通过自动化基准测试和参数调优,您可以告别繁琐的手动试错,快速找到满足延迟和吞吐量服务水平协议(SLA)的最佳配置,从而显著提升自托管模型的效率和成本效益。
2025-12-26
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-25
使用 BentoML 的 LLM-Optimizer 优化 Amazon SageMaker AI 上的 LLM 推理
本文深入探讨了如何在 Amazon SageMaker AI 上利用 BentoML 的 LLM-Optimizer 工具,系统性地优化大型语言模型(LLM)的推理性能。面对自托管模型的成本和复杂性,LLM-Optimizer 提供了自动化的参数基准测试和搜索流程,以平衡吞吐量和延迟。通过 Qwen-3-4B 模型的实际部署案例,文章展示了如何找到最优的张量并行、批处理大小和并发限制配置,实现比基线高出 2.7 倍的吞吐量提升,确保生产环境下的服务水平目标。
2025-12-25
1
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-18
加州大学圣地亚哥分校实验室使用 NVIDIA DGX B200 系统推进生成式AI研究
加州大学圣地亚哥分校的Hao AI Lab团队获得了强大的NVIDIA DGX B200系统,用于加速其在大型语言模型(LLM)推理方面的关键研究。该实验室的研究成果,如DistServe,已经影响了包括NVIDIA Dynamo在内的现有LLM平台。DGX B200正助力FastVideo和Lmgame等项目,并探索低延迟LLM服务的新前沿。
2025-12-18
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2025-12-16
针对提示注入的有效防御方法:StruQ和SecAlign
提示注入已成为LLM应用面临的首要威胁。本文介绍了两种无需额外计算成本的微调防御方法:StruQ和SecAlign。它们能将多种优化无关攻击的成功率降至接近0%,同时SecAlign使优化攻击的成功率降低了4倍以上,有效提升了LLM系统的安全性。
2025-12-16
0
0
0
AI新闻/评测
AI基础/开发
2025-12-16
首次,人工智能模型分析语言的能力达到人类专家的水平
研究人员首次测试了大型语言模型(LLM)在语言学分析方面的能力,其中OpenAI的o1模型表现出色,展现出与人类语言学研究生相当的“元语言”能力。这一突破挑战了AI仅能模仿语言而无法深入分析的传统观点,特别是在处理递归、歧义和虚构语言的音系规则方面。
2025-12-16
0
0
0
AI新闻/评测
AI基础/开发
2025-12-14
华尔街、硅谷放心了:调查显示 90% 企业计划 2026 年增加 AI 投入
一项针对企业首席信息官(CIO)的最新调查明确显示,企业对人工智能(AI)的投资热情不减。加拿大皇家银行资本市场(RBC)的调研结果表明,高达90%的受访公司计划在2026年增加对AI的投入。更值得关注的是,90%的技术高管表示正在为生成式AI和大型语言模型(LLM)项目设立专项预算,标志着AI支出正从替代性成本向增量型投资转变。目前,已有60%的AI项目进入生产阶段,显示出企业正加速将AI技术落地,以实现成本降低和收入增长的双重目标。
2025-12-14
1
0
0
AI新闻/评测
AI行业应用
2025-12-10
Amazon SageMaker HyperPod 的托管分层 KV 缓存和智能路由
本文介绍了 Amazon SageMaker HyperPod 中新增的托管分层 KV 缓存和智能路由功能,旨在解决大型语言模型(LLM)推理中因上下文长度增加导致的延迟和成本问题。这些新功能通过优化 KV 缓存管理和请求路由,可将 TTFT 降低高达 40%,并将吞吐量提升高达 24%,显著降低推理成本。
2025-12-10
0
0
0
AI行业应用
AI工具应用
2025-12-09
顶级5款开源大语言模型(LLM)评估平台
2025-12-09
0
0
0
AI基础/开发
AI工具应用
2025-12-08
StrongREJECT:重新评估LLM越狱方法的基准测试
本文揭示了现有LLM越狱评估方法中存在的可靠性问题,特别是对低质量提示和自动化评估器的依赖。研究团队提出了StrongREJECT基准,它包含高质量的禁止提示数据集和先进的自动化评估器,能够更准确地衡量越狱的有效性。结果显示,许多声称成功的越狱方法实际上效果不佳,且越狱行为可能以牺牲模型能力为代价(意愿-能力权衡)。
2025-12-08
0
0
0
AI新闻/评测
AI基础/开发
2025-12-06
利用虚拟人格进行LLM评估:一种新的方法
伯克利BAIR团队提出了一种新颖的LLM评估方法:利用“虚拟人格”(Virtual Personas)进行交互式评估。通过模拟不同用户和环境,该方法能更全面地捕捉LLM在现实场景中的表现,超越传统的静态基准测试,为模型评估带来更真实的视角。
2025-12-06
0
0
0
AI新闻/评测
AI基础/开发
2025-12-06
您可以在本地运行的五大精选小型AI编程模型
2025-12-06
2
0
0
AI基础/开发
AI工具应用
2025-12-05
AI聊天机器人可以说服选民改变主意
研究表明,与大型语言模型(LLM)的对话确实可以影响人们对政治候选人和政策问题的态度。了解AI聊天机器人的说服特征及其对民主的潜在风险至关重要。值得警惕的是,AI聊天机器人的事实准确性并非总是可靠,尤其是在支持右翼立场时。
2025-12-05
0
0
0
AI新闻/评测
AI行业应用
2025-11-27
Amazon SageMaker HyperPod 现支持托管分层 KV 缓存和智能路由
为应对长文档和多轮对话带来的LLM推理性能挑战,AWS推出Amazon SageMaker HyperPod的托管分层KV缓存和智能路由功能。这些新特性通过优化注意力缓存管理和请求分发,能将首个Token时间(TTFT)最多降低40%,吞吐量提升,并将成本降低高达25%,显著提升了生产级LLM部署的效率和经济性。
2025-11-27
0
0
0
AI工具应用
AI基础/开发
AI行业应用
1
2
3