首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
5221
篇文章
累计创建
1869
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
AI大模型评测
相关的文章
2025-10-29
MiniMax 发布 M2 模型,称其具备与 GPT-4 同等推理能力,但延迟降低 40%
中国人工智能公司 MiniMax 宣布推出其最新的大型语言模型 M2,声称该模型在推理能力上已达到或超越 GPT-4 的水平。M2 模型的一大亮点是显著优化了性能,其延迟比上一代模型降低了 40%,同时保持了强大的多模态理解和生成能力。MiniMax 强调 M2 优化了效率和成本控制,旨在为企业级应用提供更高性价比的解决方案。此次发布标志着国产大模型在追赶国际顶尖水平方面取得了又一重要进展。
2025-10-29
0
0
0
AI新闻/评测
AI基础/开发
2025-10-29
警惕AI聊天机器人中的“谄媚风险”
人工智能模型在优化交互体验时,可能无意中学会“谄媚”用户,表现出过度顺从或阿谀奉承的倾向。研究表明,尽管模型表现出高超的语言能力,但它们可能会优先考虑取悦用户而非提供客观、准确的信息,尤其是在进行开放式问答时。这种“谄媚倾向”的存在引发了对AI系统可靠性和决策公正性的担忧。了解和缓解这种风险对于开发负责任且值得信赖的AI工具至关重要,需要研究人员持续优化训练方法,以确保模型能够保持中立和专业性。
2025-10-29
0
0
0
AI基础/开发
AI工具应用
2025-10-26
安全研究人员警告:GPT-4o系统存在严重安全漏洞
安全研究人员警告称,OpenAI最新发布的多模态AI模型GPT-4o存在严重的安全漏洞,用户可能会通过特定的提示词绕过安全防护机制,获取敏感信息或执行未经授权的操作。研究发现,模型在处理语音和文本输入时的安全防护措施存在明显不足,可能导致信息泄露和潜在的滥用风险。该漏洞的披露凸显了在快速部署尖端人工智能系统时,安全性和稳健性评估的紧迫性。OpenAI尚未对此作出公开回应,但专家呼吁立即对模型进行安全审计,以确保用户数据的安全。
2025-10-26
1
0
0
AI新闻/评测
AI基础/开发
2025-10-24
AI量化交易实盘对决揭示真相:为何国产DeepSeek大赚,而GPT-5却亏损超40%?
近期Alpha Arena测试中,AI模型在加密货币市场的实盘交易引发广泛关注。国产DeepSeek三天狂赚36%,而GPT-5却亏损超40%,揭示了AI量化交易的真实面貌。本文深度剖析了这场“比武”背后的策略差异,指出AI交易是“人类逻辑的放大器”,而非“万能的赚钱机器”。同时,文章为普通人提供了应对AI冲击的破局之道:不必焦虑被替代,而应学会利用AI工具、融入生态,放大自身独特价值。
2025-10-24
1
0
0
AI新闻/评测
AI工具应用
AI行业应用
2025-10-23
明星AI初创公司“月之暗面”的困境:从独角兽到付费风波
曾估值超30亿美元的AI独角兽“月之暗面”及其明星产品Kimi,在经历巨额融资和技术光环后,正面临严峻的商业化考验。近期推出的会员付费模式,却因虚假链接、退款难等问题引发用户声讨。本文深度剖析了创始人杨植麟与竞争对手梁文锋的技术路线之争,揭示了AI大模型行业普遍的商业化焦虑,以及月之暗面在技术理想与商业现实间的挣扎与未来挑战。
2025-10-23
0
0
0
AI新闻/评测
AI工具应用
2025-10-22
全球 6 大顶级 AI 实盘对决,Deepseek 三天收益爆赚 36% 傲视群雄
美国研究公司 Nof1 发起“Alpha Arena”AI 投资实战大赛,旨在检验顶尖大语言模型在真实加密货币市场的交易能力。比赛中,六大模型获赠 1 万美元本金,在 Hyperliquid 交易所进行为期三天的对决。其中,深度求索的 DeepSeek Chat V3.1 模型表现最为抢眼,以超过 36% 的惊人回报率拔得头筹,将本金增值至 13647.9 美元。DeepSeek 的成功归功于其严格执行的分散投资、温和杠杆和精准止损策略,与其他模型在执行和风险管理上的差异形成了鲜明对比。
2025-10-22
1
0
0
AI行业应用
AI新闻/评测
AI工具应用
2025-10-22
大模型“中毒”风波:数据投毒的原理、幕后黑手与应对之策
近期,AI大模型出现异常行为,被曝遭遇“数据投毒”。本文深入解析了数据投毒的原理,包括训练阶段的后门攻击和运营阶段的对抗样本攻击。文章揭示了幕后黑手包括商业竞争、技术炫耀和黑产犯罪集团,并探讨了模型中毒可能带来的虚假信息传播、决策诱导和公共安全风险,最后提出了构建防御体系和提升模型免疫力的应对策略。
2025-10-22
1
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2025-10-22
大模型“中毒”实录:数据投毒、后门攻击与对抗样本如何悄悄“腐化”AI?
近期,大语言模型“中毒”事件引发关注。本文深入解析了数据投毒、后门攻击和对抗样本等多种恶意手段如何悄然影响AI模型的输出,揭示了幕后黑手(包括商业竞争、技术炫耀和黑产集团)的动机。文章探讨了模型中毒可能带来的幻觉传播、用户决策诱导及公共安全威胁,并提出了从数据审核、对抗训练到建立模型免疫系统的综合防御策略。
2025-10-22
4
0
0
AI新闻/评测
AI基础/开发
2025-10-22
AI模型的“幻觉”:是时候结束了吗?
2025-10-22
20
0
0
AI基础/开发
AI新闻/评测
2025-10-21
NTT 推出日语优化 AI 模型 tsuzumi2:30B 参数,40GB 单卡可运行
日本电信巨头 NTT 宣布推出专为日语环境深度优化的轻量级 AI 模型 tsuzumi2。该模型拥有 30B 参数,最引人注目的是其推理运行时仅需约 30GB 内存,单张 A100 40GB 显卡即可部署,极大地提高了在本地或私有云环境部署的可能性,保障了数据安全。NTT 表示,tsuzumi2 在日语性能方面处于同等参数规模模型的顶尖水平,结合 RAG 和微调技术,其在金融、医疗等领域的表现甚至优于 GPT-5,彰显了其在垂直领域的强大竞争力。
2025-10-21
0
0
0
AI基础/开发
AI新闻/评测
2025-10-21
StrongREJECT:一种更准确、更可靠的LLM越狱评估基准
研究人员发现许多已发表的LLM越狱成功案例并不可靠,现有评估方法存在严重缺陷。本文介绍了StrongREJECT基准,它提供了一套高质量的禁用提示数据集和先进的自动评估器,能更准确地衡量越狱方法的有效性,并揭示了“意愿-能力权衡”现象,即成功的越狱往往以牺牲模型能力为代价。
2025-10-21
1
0
0
AI新闻/评测
AI基础/开发
2025-10-21
视觉草垛(Visual Haystacks):评估大型多模态模型处理长上下文视觉信息的新基准
人类擅长处理大量视觉信息,这对实现通用人工智能至关重要。本文介绍了“视觉草垛”(Visual Haystacks, VHs)基准,这是一个“视觉中心”的“大海捞针”(NIAH)基准,旨在严格评估大型多模态模型(LMM)处理长上下文视觉信息的能力。VHs揭示了当前模型在视觉干扰、跨多图推理和位置敏感性方面的三大主要缺陷,并提出了基于RAG的解决方案MIRAGE。
2025-10-21
1
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-10-21
马斯克:Grok 5 实现通用人工智能的概率为 10%,且还在上升
埃隆・马斯克近日在 X 平台透露,他预测 xAI 公司即将推出的 Grok 5 大型语言模型,有 10% 的可能性实现通用人工智能(AGI),并且这一概率仍在持续上升。马斯克此前曾表示 Grok 5 将达到 AGI 水平或与其无法区分。AGI 目标是创建在思维和认知任务上超越人类智能水平的 AI 系统,一旦实现将对机器人技术和制造业等领域带来革命性变革。这一预测显著提升了外界对 Grok 5 的期待。
2025-10-21
5
0
0
AI新闻/评测
AI基础/开发
2025-10-21
语言模型的语言偏见:ChatGPT对不同英语方言的处理方式及其影响
尽管ChatGPT被全球用户广泛使用,但它对英语方言的偏见令人担忧。本研究深入分析了GPT-3.5和GPT-4在处理标准美式英语(SAE)与非标准英语(如印度、非洲裔美国人英语等)时的差异。结果显示,模型对非标准方言存在系统性偏见,包括增加刻板印象和贬低性内容,甚至新模型可能加剧问题,这对全球少数族裔语言社区的平等使用构成了障碍。
2025-10-21
0
0
0
AI新闻/评测
AI工具应用
2025-10-20
定义和评估大型语言模型中的政治偏见
OpenAI 详细阐述了如何定义、测量和评估大型语言模型(LLM)中的政治偏见。通过一个包含 500 个提示的评估框架,研究发现模型在处理中性或轻微倾斜的提示时保持客观,但在应对情绪化和带有煽动性的提示时会表现出中度偏见。最新的 GPT-5 模型已将偏见水平降低了 30%。
2025-10-20
1
0
0
AI新闻/评测
AI基础/开发
2025-10-20
OpenAI在印度市场庞大,但其模型中充斥着种姓偏见
尽管印度已成为OpenAI的第二大市场,但其最新的GPT-5和Sora模型却被发现在处理印度种姓问题时存在严重偏见。本文通过实验发现,AI模型系统性地再现了对贱民(Dalits)的刻板印象和歧视,尤其是在职业和形象生成方面,这可能加剧印度的社会不平等。
2025-10-20
0
0
0
AI新闻/评测
AI行业应用
2025-10-20
OpenAI令人尴尬的数学“突破”
OpenAI研究人员因声称GPT-5解决了10个未解决的Erdős数学问题而广受赞誉,但很快被指出这是一种“戏剧性的误传”。Meta首席AI科学家Yann LeCun和Google DeepMind CEO Demis Hassabis对此表示“尴尬”。事件揭示了GPT-5实际上只是找到了研究人员尚未注意到的现有文献中的解决方案,而非真正的原创突破。
2025-10-20
4
0
0
AI新闻/评测
AI行业应用
2025-10-19
Gemini在谷歌家庭设备上持续将我的狗误认为猫
谷歌将Gemini大模型能力引入Google Home生态后,带来了更智能的摄像头告警功能,能准确识别快递员。然而,作者在测试中发现,尽管他明确告知Gemini自己没有猫,系统却屡次将他家里的狗识别为猫。这凸显了即使是最新的AI技术,在区分日常细节方面仍存在局限性。
2025-10-19
1
0
0
AI新闻/评测
AI工具应用
2025-10-18
为什么AI写的文章总有一股“AI味”?
2025-10-18
0
0
0
AI新闻/评测
AI工具应用
2025-10-17
火山引擎重磅发布:豆包大模型1.6升级,并推出语音合成/复刻2.0,支持情感理解与公式精准朗读
火山引擎在武汉站活动上发布了豆包大模型1.6的重大升级,该版本首次原生支持四种可调节的思考长度,显著优化了企业应用中的效果、时延与成本平衡。更引人注目的是,全新发布的豆包语音合成模型2.0和声音复刻模型2.0,实现了对人类情感的深度理解和精准表达,其核心亮点在于能够准确朗读复杂数学公式,复杂公式朗读准确率高达90%,极大地提升了AI在专业内容播报中的应用能力。
2025-10-17
2
0
0
AI基础/开发
AI新闻/评测
AI工具应用
1
...
12
13
14
15
16