首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
5208
篇文章
累计创建
1860
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
模型
相关的文章
2026-01-29
初创公司Arcee AI从零开始构建了4000亿参数的开源LLM,旨在超越Meta的Llama
尽管业界普遍认为AI模型市场的赢家已定,但30人团队的Arcee AI挑战了这一观点。他们发布了参数高达4000亿的开源基础模型Trinity,并声称其性能可与Meta的Llama 4 Maverick相媲美。Arcee的优势在于采用永久开放的Apache许可证,旨在为开发者和学术界提供一个真正开放的前沿替代方案。
2026-01-29
0
0
0
AI新闻/评测
AI基础/开发
2026-01-24
解密 Codex Agent 循环:深入探索软件智能体的核心逻辑
本文深入解析了OpenAI Codex CLI的核心机制——“智能体循环”(agent loop),这是编排用户、模型和工具之间交互的关键逻辑。文章详细介绍了从用户输入到模型推理、工具调用,再到上下文管理的全过程,并揭示了Codex如何构建初始提示词(prompt)以及与Responses API的交互细节,为理解高级AI软件代理提供了宝贵见解。
2026-01-24
0
0
0
AI基础/开发
AI工具应用
2026-01-24
表格机器学习任务中使用的10种嵌入方法
2026-01-24
1
0
0
AI基础/开发
AI工具应用
2026-01-24
AI 智能体的数学逻辑算不通
一篇研究论文从数学上论证了AI智能体注定会失败,声称它们无法处理复杂任务。然而,AI行业对此持不同意见,认为通过构建外围防护栏或使用数学验证方法可以克服幻觉问题。本文探讨了智能体AI的数学局限性与行业前景之间的紧张关系。
2026-01-24
0
0
0
AI新闻/评测
AI基础/开发
2026-01-22
2026 年时间序列工具包:用于自主预测的 5 个基础模型
2026-01-22
0
0
0
AI基础/开发
AI工具应用
AI行业应用
2026-01-21
GPT-5.2-Codex 正式发布:赋能复杂软件工程与网络安全防御
OpenAI 正式发布了迄今最前沿的智能体编码模型 GPT-5.2-Codex。该模型基于 GPT-5.2 深度优化,显著增强了长程任务执行、代码重构迁移能力,并在 Windows 环境下表现更优。更重要的是,它在网络安全领域实现了重大突破,为防御性安全工作提供了强大工具,但同时也引发了对双重用途风险的审慎管理。
2026-01-21
1
0
0
AI新闻/评测
AI工具应用
AI行业应用
2026-01-16
OptiMind:一个具备优化专业知识的小型语言模型
微软研究院发布了OptiMind,这是一个专为优化问题设计的小型语言模型(SLM)。OptiMind旨在通过集成优化专家的知识,高效解决复杂的组合优化问题,展示了在模型规模受限的情况下实现强大性能的潜力。
2026-01-16
0
0
0
AI基础/开发
AI工具应用
2026-01-09
StrongREJECT:评估大型语言模型越狱方法的更可靠基准
研究人员发现,许多已发表的大型语言模型(LLM)越狱(Jailbreak)方法的成功率被夸大了。为了解决评估中的可靠性问题,本文提出了StrongREJECT基准。该基准包含一套高质量的禁止提示词集和先进的自动评估器,能够更准确、更稳健地评估越狱方法的有效性,并揭示了“意愿-能力权衡”现象。
2026-01-09
1
0
0
AI新闻/评测
AI基础/开发
2026-01-08
智谱港交所敲钟上市,首席科学家唐杰要求公司全面回归基础模型研究
全球大模型企业智谱今日在香港联交所主板成功挂牌上市,发行价定为每股 116.20 港元,市值一举突破 528 亿港元。此次上市标志着智谱在人工智能领域的又一里程碑。首席科学家唐杰在内部信中宣布,智谱将很快推出新一代模型 GLM-5,并强调公司未来将全面回归基础模型研究。三大技术方向将聚焦于模型架构设计、更通用的强化学习范式以及持续学习与进化探索,旨在驱动核心能力提升,并设立 X-Lab 部门探索颠覆性创新,最终回归 AGI 主线。
2026-01-08
0
0
0
AI新闻/评测
AI基础/开发
2026-01-07
语言模型微调的温和介绍
2026-01-07
0
0
0
AI基础/开发
AI工具应用
2026-01-03
2026年:AI将从炒作转向务实
如果说2025年是AI进行“氛围检验”的一年,那么2026年将是技术走向实用的关键一年。业界焦点正从构建超大语言模型转向更困难的AI落地工作,包括部署小型模型、将智能嵌入物理设备以及无缝集成到人类工作流程中。专家预测,AI将告别纯粹的规模扩展,进入研究新架构、注重定向部署和真正增强人类工作的时代。
2026-01-03
0
0
0
AI新闻/评测
AI行业应用
2026-01-01
DeepSeek 发布开年新论文:提出全新 mHC 架构,梁文锋现身作者名单
DeepSeek 团队发布了题为《流形约束超连接(mHC)》的开年新论文,旨在解决传统超连接(HC)在大规模模型训练中出现的稳定性差和内存开销大的问题。mHC 架构通过将 HC 的残差连接空间投影到特定流形上,成功恢复了恒等映射属性,并确保了训练效率。论文显示 mHC 在大规模训练中表现出卓越的可扩展性和性能改进,DeepSeek 创始人兼 CEO 梁文锋也位列作者之一,预示着 AI 基础模型架构设计进入一个更实用、更深入的研究方向。
2026-01-01
2
0
0
AI基础/开发
AI新闻/评测
2025-12-30
超越短期记忆:AI智能体需要的三种长期记忆类型
2025-12-30
0
0
0
AI基础/开发
AI工具应用
2025-12-27
使用数据并行在多GPU上训练模型
2025-12-27
0
0
0
AI基础/开发
AI工具应用
2025-12-25
评估语言模型的困惑度
2025-12-25
0
0
0
AI基础/开发
AI工具应用
2025-12-23
树莓派适用的7款微型AI模型
2025-12-23
3
0
0
AI基础/开发
AI工具应用