首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
5221
篇文章
累计创建
1869
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
AI大模型评测
相关的文章
2025-10-17
Anthropic重磅发布Claude Haiku 4.5:性能追平五个月前的旗舰模型,成本仅为其三分之一
Anthropic最新推出的Claude Haiku 4.5小型语言模型展现出惊人潜力,其性能已与五个月前旗舰模型Claude Sonnet 4相当,但成本仅为其三分之一,速度提升超过两倍。该模型在SWE-bench编程测试中得分73.3%,与Sonnet 4不相上下,这标志着AI模型在效率和能力之间取得了重大平衡。对于需要实时、低延迟任务(如聊天助手和代码辅助)的用户而言,Haiku 4.5的性价比极高,同时Anthropic也强调其在多模型工作流中与更强大的Sonnet 4.5协同工作...
2025-10-17
2
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-10-17
告别“要效果还是要成本”的纠结:火山引擎豆包大模型1.6重磅升级,实现成本效益双赢
面对AI应用中普遍存在的深度思考延迟高、Token消耗剧增的成本痛点,火山引擎在最新发布会上推出重磅升级方案。豆包大模型1.6原生支持四档思考长度调节,允许用户根据任务复杂度灵活切换,例如低档模式能将Token消耗骤降77.5%,同时保持效果不变。此外,新推出的豆包1.6 lite模型在成本腰斩的同时,性能超越前代旗舰。更具突破性的是,智能模型路由功能的引入,可自动为不同任务匹配最优模型,实现成本与效果的智能平衡,标志着AI应用正迈向更高效、更经济的“千瓦时”时代。
2025-10-17
1
0
0
AI基础/开发
AI工具应用
AI新闻/评测
2025-10-17
深度学习模型:我们离真正理解世界还有多远?
人工智能领域正在经历飞速发展,尤其是深度学习模型,它们在特定任务上展现出惊人能力。然而,一个核心争议仍然存在:这些模型是否真正理解了它们处理的信息,还是仅仅在进行复杂的模式匹配?研究人员强调,当前的大模型虽然能生成流畅文本和精确预测,但在常识推理、因果关系理解和灵活泛化能力上仍存在显著局限性。要实现通用人工智能(AGI),我们必须超越表层统计关联,构建出具备深层世界模型的系统,这将是未来AI研究的关键挑战。
2025-10-17
3
0
0
AI基础/开发
AI新闻/评测
2025-10-17
Anthropic 发布 Claude Haiku 4.5:性能媲美 GPT-5,速度翻倍,价格更香!
Anthropic 正式推出了 Claude Haiku 4.5,这款轻量级模型在性能、速度和成本方面实现了惊人平衡。Haiku 4.5 在 SWE-bench 测试中取得了 73% 的高分,性能直逼 Claude Sonnet 4 甚至 OpenAI 的 GPT-5。其核心亮点在于速度是前代的两倍多,但价格更低,为实时交互和低延迟任务提供了极具竞争力的解决方案。尽管在复杂数学运算上仍有不足,但它已成为 Anthropic 系列中最安全的模型,预示着 AI 开发者将在成本效益和性能之间获得...
2025-10-17
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-10-17
重磅!AI“黑客”首次成功入侵并控制了大型语言模型
研究人员首次实现了对大型语言模型(LLM)的直接“越狱”式攻击,成功绕过了模型的安全防护措施。这次被称为“多跳攻击”的突破,意味着黑客可以诱导AI执行本应拒绝的敏感或有害操作,例如生成恶意代码或欺诈信息。该研究证明了即使是最先进的AI系统也存在未知的安全漏洞,对全球AI安全治理构成了严峻挑战。未来需要开发更强大的防御机制,以应对这种新型、高度隐蔽的AI攻击。
2025-10-17
1
0
0
AI基础/开发
AI新闻/评测
2025-10-17
重磅升级!豆包发布四款创新大模型:支持情感理解、音调风格调节,还能精准朗读复杂公式
火山引擎在武汉站活动中推出了豆包大模型1.6升级版及全新发布的1.6 lite、语音合成2.0、声音复刻2.0模型。其中,豆包1.6原生支持四档思考长度,优化了效率与成本。轻量级的1.6 lite模型在多项测试中超越了1.5 Pro,综合成本降低超53%。更引人注目的是,新的语音模型具备深度语义理解能力,能精准控制语速、情绪和音调风格,尤其在小学至高中公式朗读准确率高达90%,标志着AI语音技术在情感表达和专业内容处理上迈出重要一步。
2025-10-17
2
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-10-17
Anthropic 发布 Claude Haiku 4.5:速度翻倍、价格更低,性能直追 GPT-5 和 Sonnet 4
Anthropic 重磅推出 Claude Haiku 4.5,这款“小杯”模型在性能上实现了巨大飞跃。Haiku 4.5 在 SWE-bench 编码测试中达到了 73% 的惊人成绩,与 Claude Sonnet 4 及 OpenAI 的 GPT-5 处于同一水平。该模型不仅速度比前代提升两倍多,价格也更具竞争力,成为 Anthropic 目前最安全的模型。对于追求高性价比的开发者和企业而言,Haiku 4.5 提供了接近顶配的智能与更低的运营成本,标志着轻量级AI模型的性能新标杆。
2025-10-17
2
0
0
AI基础/开发
AI新闻/评测
AI工具应用
2025-10-17
告别“选A还是选B”的困境:火山引擎豆包大模型升级,实现效果与成本的终极平衡
面对AI深度思考带来的高延迟和Token成本飙升难题,火山引擎在FORCE LINK AI创新巡展上发布了豆包大模型1.6系列重磅升级,旨在打破效果与成本的二元对立。核心亮点包括首个原生支持四档思考长度调节的模型,允许用户在不同场景下灵活平衡性能与开销,低档模式下可大幅削减成本。此外,全新推出的智能模型路由方案,能根据任务自动选择最优模型,实现成本最高下降超70%,标志着AI应用进入了更精细化、高性价比的Token管理时代。
2025-10-17
1
0
0
AI基础/开发
AI工具应用
AI新闻/评测
2025-10-16
火山引擎豆包语音模型重磅升级:实现“发疯文学”精准复刻,让AI学会“懂人”
火山引擎发布了重磅升级的豆包语音大模型,包括豆包语音合成模型2.0和声音复刻模型2.0。新模型实现了对复杂情感和语气(如“发疯文学”)的精准理解与表达,并引入了“默认模式”、“语音指令”和“上下文引入”三大关键功能,使AI语音从单纯的“像人”进化到“懂人”。此外,新模型在复杂公式朗读准确率上达到90%,远超业界平均水平,标志着AI语音在语义理解和情感表达方面迈出了坚实的一步,极大地提升了多模态交互的真实感。
2025-10-16
1
0
0
AI基础/开发
AI工具应用
AI创意设计
2025-10-16
性能比肩GPT-5,速度翻倍,价格更低!Anthropic 发布轻量级王牌模型 Claude Haiku 4.5
Anthropic 重磅推出 Claude Haiku 4.5,这款轻量级模型在性能、速度和成本上实现了惊人平衡。Haiku 4.5 在 SWE-bench 编码测试中取得了 73% 的高分,性能直追 Claude Sonnet 4 甚至 GPT-5。它不仅速度是前代的两倍多,价格仅为 Sonnet 4.5 的三分之一,使其成为实时交互和低延迟任务的理想选择。虽然在数学计算方面略有不足,但其出色的安全性和对齐性使其成为 Anthropic 当前最安全可靠的模型,为开发者提供了高性价比的 A...
2025-10-16
16
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-10-16
生成式AI巨头Anthropic发布Claude 3.5 Sonnet:性能超越GPT-4o和Gemini
AI巨头Anthropic刚刚发布了其最新的主力模型Claude 3.5 Sonnet,并在多项基准测试中超越了OpenAI的GPT-4o和谷歌的Gemini 1.5 Pro。这款新模型在代码生成、推理能力和多模态处理方面展现出显著提升,标志着AI竞争进入新的白热化阶段。
2025-10-16
3
0
0
AI新闻/评测
AI工具应用
2025-10-16
Anthropic 性价比之王:Haiku 4.5 重磅发布,以三分之一价格实现 Sonnet 4 级编程能力
Anthropic 宣布推出新型小型 AI 模型 Claude Haiku 4.5,旨在为实时、低延迟任务提供卓越的性价比。Haiku 4.5 在成本上仅为 Sonnet 4 的三分之一,而编程能力却能与其媲美,并在速度上快了两倍。该模型在 SWE-bench 权威测试中得分 73.3%,接近 GPT-5 表现。此外,Anthropic 还设计了创新的多模型协同工作流,利用 Haiku 4.5 执行分解后的子任务,极大地提升了复杂任务处理的效率和成本效益,预示着新一代 AI 代理应用的巨大潜力。
2025-10-16
2
0
0
AI基础/开发
AI工具应用
AI新闻/评测
2025-10-16
Anthropic 发布 Claude Haiku 4.5:更便宜、更快,首次支持推理能力
📢 转载信息 原文链接:https://simonwillison.net/2025/Oct/15/claude-haiku-45/#atom-everything 原文作者:Simon Willison Anthropic 推出 Claude Haiku 4.5:速度与成本的优化升级 Anthr
2025-10-16
3
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2025-10-16
Anthropic发布全新轻量级模型Haiku 4.5:性能比肩Sonnet 4,成本降低三分之二,速度提升两倍以上
📢 转载信息 原文链接:https://techcrunch.com/2025/10/15/anthropic-launches-new-version-of-scaled-down-haiku-model/ 原文作者:Russell Brandom Anthropic重磅推出Claude Hai
2025-10-16
3
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2025-10-15
谷歌Gemini 3.0 Pro惊艳亮相:仅凭文本描述,成功复刻可交互的macOS/Windows/Linux桌面环境
谷歌新发布的Gemini 3.0 Pro在代码生成和UI构建方面展现了惊人能力。通过简单的文本提示词,该模型能一次性生成一个功能完备、可交互的网页版macOS操作系统,并在浏览器中流畅运行,甚至包含彩蛋特效。与Claude 4.5 Sonnet在同类任务上的表现形成鲜明对比,凸显了Gemini在编程和复杂界面生成方面的领先优势。尽管专家指出这仍是“仿真”而非底层实现,但其自动化构建复杂应用界面的能力,预示着AI在前端开发和操作系统设计领域可能引发颠覆性变革。
2025-10-15
4
0
0
AI基础/开发
AI工具应用
AI新闻/评测
2025-10-15
惊人发现!仅需约250份恶意文档,即可攻破任何体量的人工智能模型
Anthropic、英国AI安全研究院与艾伦·图灵研究所的最新联合研究揭示了AI模型训练数据安全领域的一个重大安全漏洞。研究团队发现,与传统认知相反,AI模型规模的增大并不能有效稀释数据投毒带来的风险。仅需大约250份精心构造的恶意文档,攻击者就能够在参数量从6亿到130亿不等的所有测试模型中成功植入难以察觉的“后门”。这一发现对当前AI安全策略提出了严峻挑战,强调了防御机制建设的紧迫性。
2025-10-15
3
0
0
AI基础/开发
AI新闻/评测
2025-10-15
麻省理工学院团队推出创新方法,精准测试AI文本分类器的可靠性
📢 转载信息 原文链接:https://news.mit.edu/2025/new-way-test-how-well-ai-systems-classify-text-0813 原文作者:David Chandler | MIT Laboratory for Information and De
2025-10-15
2
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-10-15
大语言模型能否真正理解真实世界?研究发现:目前看来,它们还差得远
📢 转载信息 原文链接:https://news.mit.edu/2025/can-large-language-models-figure-out-real-world-0825 原文作者:David Chandler | Laboratory for Information and Decis
2025-10-15
1
0
0
AI基础/开发
AI新闻/评测
2025-10-15
如何构建AI缩放定律,以实现高效LLM训练和预算最大化
📢 转载信息 原文链接:https://news.mit.edu/2025/how-build-ai-scaling-laws-efficient-llm-training-budget-maximization-0916 原文作者:Lauren Hinkel | MIT-IBM Watson A
2025-10-15
1
0
0
AI基础/开发
AI工具应用
AI行业应用
2025-10-15
AI偏见降低30%:OpenAI宣布GPT-5成为迄今最中立模型
OpenAI近日发布重磅研究报告,揭示了其最新模型GPT-5在处理政治敏感内容时的显著进步。研究数据显示,GPT-5 Instant和GPT-5 Thinking版本的政治偏见相较于GPT-4o等前代模型降低了30%,特别是在应对争议性话题时表现出更强的中立性。这一成果得益于内部“模型行为”团队建立的科学评估框架,通过500个独特的提示词压力测试,确保AI在推理和语调上更加平衡,为构建更可靠、公正的人工智能系统奠定了重要基础。
2025-10-15
1
0
0
AI基础/开发
AI新闻/评测
1
...
12
13
14
15
16