LLM-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

行动起来，活在当下

累计撰写 7387 篇文章
累计创建 3268 个标签
累计收到 0 条评论

目录CONTENT

以下是 LLM 相关的文章

2026-02-27
CorpGen：为真实工作场景推进AI智能体微软研究院发布了CorpGen，这是一个开创性的框架，旨在通过将大型语言模型（LLM）与真实世界的系统和工具集成，将AI智能体从研究概念转变为企业级的实际生产力工具。CorpGen通过整合多模态输入和先进的工具调用能力，为构建可靠、高效的AI代理铺平了道路。
- 2026-02-27
- 2
- 0
- 0
2026-02-17
LLM 嵌入 vs TF-IDF vs 词袋模型：Scikit-learn 中哪个效果更好？
- 2026-02-17
- 1
- 0
- 0
- AI基础/开发
- AI工具应用
2026-02-10
使用 Scikit-Learn 和 LLM 嵌入进行文档聚类
- 2026-02-10
- 2
- 0
- 0
- AI基础/开发
- AI工具应用
2026-01-29
Modelence 获 300 万美元种子轮融资，致力于简化“氛围式编码”技术栈随着人工智能普及软件工程，新一代用户涌现，渴望构建自己的应用。然而，部署、安全和DevOps等传统难题依然存在。Y Combinator 初创公司 Modelence 宣布获得 300 万美元种子轮融资，旨在通过提供类似一体化的框架，解决这些“氛围式编码”（Vibe Coding）技术栈中服务间连接的复杂性，整合认证、数据库、托管和LLM可观测性工具。
- 2026-01-29
- 3
- 0
- 0
2026-01-28
Risotto 融资 1000 万美元种子轮，利用 AI 让票务系统更易用帮助台自动化领域正面临 AI 带来的颠覆。初创公司 Risotto 宣布完成 1000 万美元种子轮融资，旨在利用 AI 自动化处理帮助台工单。他们通过构建专门的基础设施和提示库，已成功帮助 Gusto 自动化了 60% 的支持工单，预示着未来工作台操作将更多地依赖 LLM。
- 2026-01-28
- 2
- 0
- 0
2026-01-16
BotSync完成A轮延期融资，新加坡SGInnovate领投专注于将大型语言模型（LLM）与特定领域知识相结合的BotSync，近期完成了其A轮融资的延期（Extension）轮。本轮融资由新加坡的风险投资机构<em>SGInnovate</em>领投，并获得了新老投资者的共同支持。BotSync的核心技术在于其<em>“领域知识层”</em>，它能够帮助企业在AI应用中有效整合私有或专业数据，解决通用LLM在处理垂直行业信息时的准确性与深度不足问题。此轮融资将主要用于技术研发、市场拓展以及加速AI在企业级应用的落地，特别是针对金融、法律和医疗等高...
- 2026-01-16
- 0
- 0
- 0
- AI新闻/评测
- AI行业应用
2026-01-09
StrongREJECT：评估大型语言模型越狱方法的更可靠基准研究人员发现，许多已发表的大型语言模型（LLM）越狱（Jailbreak）方法的成功率被夸大了。为了解决评估中的可靠性问题，本文提出了StrongREJECT基准。该基准包含一套高质量的禁止提示词集和先进的自动评估器，能够更准确、更稳健地评估越狱方法的有效性，并揭示了“意愿-能力权衡”现象。
- 2026-01-09
- 2
- 0
- 0
- AI新闻/评测
- AI基础/开发
2026-01-09
学习人工智能最受欢迎的10个GitHub仓库本指南精选了当前最受欢迎且实用的10个GitHub仓库，旨在为人工智能学习者提供清晰的学习路径。这些资源全面覆盖了从基础数学和机器学习原理，到前沿的大语言模型（LLM）、生成式AI应用、智能体系统构建，以及实际的生产系统部署。通过微软的初学者课程、从零开始构建LLM的实战项目，以及专注于RAG和多智能体架构的资源，学习者可以系统地掌握构建可靠AI应用所需的端到端技能，避免学习过程中的迷茫，加速实践转化。
- 2026-01-09
- 2
- 0
- 0
- AI基础/开发
- AI工具应用
2026-01-07
为什么AI预测如此困难作者深入探讨了在当前技术快速迭代的背景下，对人工智能未来发展进行准确预测的难度。他指出了三个核心的不确定性因素：大型语言模型（LLM）的持续进步、公众对AI日益增长的不满，以及监管机构混乱的反应。尽管如此，我们仍在努力预测2026年的AI趋势。
- 2026-01-07
- 0
- 0
- 0
- AI新闻/评测
2025-12-26
使用 BentoML 的 LLM-Optimizer 在 Amazon SageMaker AI 上优化 LLM 推理本文深入探讨了如何在 Amazon SageMaker AI 上使用 BentoML 的 LLM-Optimizer 工具，系统性地优化大型语言模型（LLM）的推理性能。通过自动化基准测试和参数调优，我们展示了如何摆脱繁琐的手动试错，快速找到满足延迟和吞吐量目标的最优配置，并将其无缝部署到生产环境，以实现显著的成本和性能提升。
- 2025-12-26
- 0
- 0
- 0
2025-12-26
使用 BentoML 的 LLM-Optimizer 在 Amazon SageMaker AI 上优化 LLM 推理本文深入探讨了在 Amazon SageMaker AI 上使用 BentoML 的 LLM-Optimizer 来系统化优化大型语言模型（LLM）推理性能的方法。通过自动化基准测试和参数调优，您可以告别繁琐的手动试错，快速找到满足延迟和吞吐量服务水平协议（SLA）的最佳配置，从而显著提升自托管模型的效率和成本效益。
- 2025-12-26
- 1
- 0
- 0
2025-12-25
使用 BentoML 的 LLM-Optimizer 优化 Amazon SageMaker AI 上的 LLM 推理本文深入探讨了如何在 Amazon SageMaker AI 上利用 BentoML 的 LLM-Optimizer 工具，系统性地优化大型语言模型（LLM）的推理性能。面对自托管模型的成本和复杂性，LLM-Optimizer 提供了自动化的参数基准测试和搜索流程，以平衡吞吐量和延迟。通过 Qwen-3-4B 模型的实际部署案例，文章展示了如何找到最优的张量并行、批处理大小和并发限制配置，实现比基线高出 2.7 倍的吞吐量提升，确保生产环境下的服务水平目标。
- 2025-12-25
- 1
- 0
- 0
2025-12-18
加州大学圣地亚哥分校实验室使用 NVIDIA DGX B200 系统推进生成式AI研究加州大学圣地亚哥分校的Hao AI Lab团队获得了强大的NVIDIA DGX B200系统，用于加速其在大型语言模型（LLM）推理方面的关键研究。该实验室的研究成果，如DistServe，已经影响了包括NVIDIA Dynamo在内的现有LLM平台。DGX B200正助力FastVideo和Lmgame等项目，并探索低延迟LLM服务的新前沿。
- 2025-12-18
- 0
- 0
- 0
2025-12-16
针对提示注入的有效防御方法：StruQ和SecAlign 提示注入已成为LLM应用面临的首要威胁。本文介绍了两种无需额外计算成本的微调防御方法：StruQ和SecAlign。它们能将多种优化无关攻击的成功率降至接近0%，同时SecAlign使优化攻击的成功率降低了4倍以上，有效提升了LLM系统的安全性。
- 2025-12-16
- 0
- 0
- 0
- AI新闻/评测
- AI基础/开发
2025-12-16
首次，人工智能模型分析语言的能力达到人类专家的水平研究人员首次测试了大型语言模型（LLM）在语言学分析方面的能力，其中OpenAI的o1模型表现出色，展现出与人类语言学研究生相当的“元语言”能力。这一突破挑战了AI仅能模仿语言而无法深入分析的传统观点，特别是在处理递归、歧义和虚构语言的音系规则方面。
- 2025-12-16
- 0
- 0
- 0
- AI新闻/评测
- AI基础/开发
2025-12-14
华尔街、硅谷放心了：调查显示 90% 企业计划 2026 年增加 AI 投入一项针对企业首席信息官（CIO）的最新调查明确显示，企业对人工智能（AI）的投资热情不减。加拿大皇家银行资本市场（RBC）的调研结果表明，高达90%的受访公司计划在2026年增加对AI的投入。更值得关注的是，90%的技术高管表示正在为生成式AI和大型语言模型（LLM）项目设立专项预算，标志着AI支出正从替代性成本向增量型投资转变。目前，已有60%的AI项目进入生产阶段，显示出企业正加速将AI技术落地，以实现成本降低和收入增长的双重目标。
- 2025-12-14
- 2
- 0
- 0
- AI新闻/评测
- AI行业应用
2025-12-10
Amazon SageMaker HyperPod 的托管分层 KV 缓存和智能路由本文介绍了 Amazon SageMaker HyperPod 中新增的托管分层 KV 缓存和智能路由功能，旨在解决大型语言模型（LLM）推理中因上下文长度增加导致的延迟和成本问题。这些新功能通过优化 KV 缓存管理和请求路由，可将 TTFT 降低高达 40%，并将吞吐量提升高达 24%，显著降低推理成本。
- 2025-12-10
- 0
- 0
- 0
- AI行业应用
- AI工具应用
2025-12-09
顶级5款开源大语言模型（LLM）评估平台
- 2025-12-09
- 1
- 0
- 0
- AI基础/开发
- AI工具应用
2025-12-08
StrongREJECT：重新评估LLM越狱方法的基准测试本文揭示了现有LLM越狱评估方法中存在的可靠性问题，特别是对低质量提示和自动化评估器的依赖。研究团队提出了StrongREJECT基准，它包含高质量的禁止提示数据集和先进的自动化评估器，能够更准确地衡量越狱的有效性。结果显示，许多声称成功的越狱方法实际上效果不佳，且越狱行为可能以牺牲模型能力为代价（意愿-能力权衡）。
- 2025-12-08
- 0
- 0
- 0
- AI新闻/评测
- AI基础/开发
2025-12-06
利用虚拟人格进行LLM评估：一种新的方法伯克利BAIR团队提出了一种新颖的LLM评估方法：利用“虚拟人格”（Virtual Personas）进行交互式评估。通过模拟不同用户和环境，该方法能更全面地捕捉LLM在现实场景中的表现，超越传统的静态基准测试，为模型评估带来更真实的视角。
- 2025-12-06
- 1
- 0
- 0
- AI新闻/评测
- AI基础/开发

1
2
3