模型-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

行动起来，活在当下

累计撰写 7387 篇文章
累计创建 3268 个标签
累计收到 0 条评论

目录CONTENT

以下是模型相关的文章

2026-02-24
小型语言模型导论：2026年终极指南
- 2026-02-24
- 3
- 0
- 0
- AI基础/开发
- AI工具应用
2026-02-24
OptiMind：一个具备优化专业知识的小型语言模型微软研究院推出OptiMind，一个精简而强大的小型语言模型，专注于优化问题。OptiMind展示了如何通过结构化的训练方法，使小模型在优化任务上媲美甚至超越大型模型，为资源受限环境下的复杂决策提供了新的解决方案。
- 2026-02-24
- 0
- 0
- 0
2026-02-19
印度AI实验室Sarvam发布新一代大模型，大力押注开源AI的可行性印度AI初创公司Sarvam于周二发布了新一代大型语言模型，旨在通过更小、更高效的开源AI模型，从大型竞争对手那里抢占市场份额。这些模型专注于支持印度本土语言的实时应用，并得到了印度政府“IndiaAI Mission”的支持，标志着印度在发展本土AI能力方面迈出了重要一步。
- 2026-02-19
- 2
- 0
- 0
- AI新闻/评测
- AI基础/开发
2026-02-18
中国开源AI的下一步发展自2025年初DeepSeek发布R1模型以来，中国AI在开源领域迅速崛起，性能媲美西方前沿模型，但成本更低。本文深入探讨了中国开源模型如何通过发布权重、社区贡献和催生专业化变体，正在改变全球AI创新的格局和标准制定权。
- 2026-02-18
- 3
- 0
- 0
2026-01-29
初创公司Arcee AI从零开始构建了4000亿参数的开源LLM，旨在超越Meta的Llama 尽管业界普遍认为AI模型市场的赢家已定，但30人团队的Arcee AI挑战了这一观点。他们发布了参数高达4000亿的开源基础模型Trinity，并声称其性能可与Meta的Llama 4 Maverick相媲美。Arcee的优势在于采用永久开放的Apache许可证，旨在为开发者和学术界提供一个真正开放的前沿替代方案。
- 2026-01-29
- 1
- 0
- 0
- AI新闻/评测
- AI基础/开发
2026-01-24
解密 Codex Agent 循环：深入探索软件智能体的核心逻辑本文深入解析了OpenAI Codex CLI的核心机制——“智能体循环”（agent loop），这是编排用户、模型和工具之间交互的关键逻辑。文章详细介绍了从用户输入到模型推理、工具调用，再到上下文管理的全过程，并揭示了Codex如何构建初始提示词（prompt）以及与Responses API的交互细节，为理解高级AI软件代理提供了宝贵见解。
- 2026-01-24
- 1
- 0
- 0
- AI基础/开发
- AI工具应用
2026-01-24
表格机器学习任务中使用的10种嵌入方法
- 2026-01-24
- 3
- 0
- 0
- AI基础/开发
- AI工具应用
2026-01-24
AI 智能体的数学逻辑算不通一篇研究论文从数学上论证了AI智能体注定会失败，声称它们无法处理复杂任务。然而，AI行业对此持不同意见，认为通过构建外围防护栏或使用数学验证方法可以克服幻觉问题。本文探讨了智能体AI的数学局限性与行业前景之间的紧张关系。
- 2026-01-24
- 0
- 0
- 0
- AI新闻/评测
- AI基础/开发
2026-01-22
2026 年时间序列工具包：用于自主预测的 5 个基础模型
- 2026-01-22
- 0
- 0
- 0
2026-01-21
GPT-5.2-Codex 正式发布：赋能复杂软件工程与网络安全防御 OpenAI 正式发布了迄今最前沿的智能体编码模型 GPT-5.2-Codex。该模型基于 GPT-5.2 深度优化，显著增强了长程任务执行、代码重构迁移能力，并在 Windows 环境下表现更优。更重要的是，它在网络安全领域实现了重大突破，为防御性安全工作提供了强大工具，但同时也引发了对双重用途风险的审慎管理。
- 2026-01-21
- 5
- 0
- 0
2026-01-16
OptiMind：一个具备优化专业知识的小型语言模型微软研究院发布了OptiMind，这是一个专为优化问题设计的小型语言模型（SLM）。OptiMind旨在通过集成优化专家的知识，高效解决复杂的组合优化问题，展示了在模型规模受限的情况下实现强大性能的潜力。
- 2026-01-16
- 1
- 0
- 0
- AI基础/开发
- AI工具应用
2026-01-09
StrongREJECT：评估大型语言模型越狱方法的更可靠基准研究人员发现，许多已发表的大型语言模型（LLM）越狱（Jailbreak）方法的成功率被夸大了。为了解决评估中的可靠性问题，本文提出了StrongREJECT基准。该基准包含一套高质量的禁止提示词集和先进的自动评估器，能够更准确、更稳健地评估越狱方法的有效性，并揭示了“意愿-能力权衡”现象。
- 2026-01-09
- 2
- 0
- 0
- AI新闻/评测
- AI基础/开发
2026-01-08
智谱港交所敲钟上市，首席科学家唐杰要求公司全面回归基础模型研究全球大模型企业智谱今日在香港联交所主板成功挂牌上市，发行价定为每股 116.20 港元，市值一举突破 528 亿港元。此次上市标志着智谱在人工智能领域的又一里程碑。首席科学家唐杰在内部信中宣布，智谱将很快推出新一代模型 GLM-5，并强调公司未来将全面回归基础模型研究。三大技术方向将聚焦于模型架构设计、更通用的强化学习范式以及持续学习与进化探索，旨在驱动核心能力提升，并设立 X-Lab 部门探索颠覆性创新，最终回归 AGI 主线。
- 2026-01-08
- 0
- 0
- 0
- AI新闻/评测
- AI基础/开发
2026-01-07
语言模型微调的温和介绍
- 2026-01-07
- 1
- 0
- 0
- AI基础/开发
- AI工具应用
2026-01-03
2026年：AI将从炒作转向务实如果说2025年是AI进行“氛围检验”的一年，那么2026年将是技术走向实用的关键一年。业界焦点正从构建超大语言模型转向更困难的AI落地工作，包括部署小型模型、将智能嵌入物理设备以及无缝集成到人类工作流程中。专家预测，AI将告别纯粹的规模扩展，进入研究新架构、注重定向部署和真正增强人类工作的时代。
- 2026-01-03
- 7
- 0
- 0
- AI新闻/评测
- AI行业应用
2026-01-01
DeepSeek 发布开年新论文：提出全新 mHC 架构，梁文锋现身作者名单 DeepSeek 团队发布了题为《流形约束超连接（mHC）》的开年新论文，旨在解决传统超连接（HC）在大规模模型训练中出现的稳定性差和内存开销大的问题。mHC 架构通过将 HC 的残差连接空间投影到特定流形上，成功恢复了恒等映射属性，并确保了训练效率。论文显示 mHC 在大规模训练中表现出卓越的可扩展性和性能改进，DeepSeek 创始人兼 CEO 梁文锋也位列作者之一，预示着 AI 基础模型架构设计进入一个更实用、更深入的研究方向。
- 2026-01-01
- 2
- 0
- 0
- AI基础/开发
- AI新闻/评测
2025-12-30
超越短期记忆：AI智能体需要的三种长期记忆类型
- 2025-12-30
- 1
- 0
- 0
- AI基础/开发
- AI工具应用
2025-12-27
使用数据并行在多GPU上训练模型
- 2025-12-27
- 1
- 0
- 0
- AI基础/开发
- AI工具应用
2025-12-25
评估语言模型的困惑度
- 2025-12-25
- 1
- 0
- 0
- AI基础/开发
- AI工具应用
2025-12-23
树莓派适用的7款微型AI模型
- 2025-12-23
- 4
- 0
- 0
- AI基础/开发
- AI工具应用