首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
5205
篇文章
累计创建
1860
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
GPT-4
相关的文章
2026-02-09
研究表明:GPT-4V 的通用性不如 Llama 3 70B,尤其在医学领域表现更差
最新的研究对比了 OpenAI 的 GPT-4V 和 Meta 的 Llama 3 70B 在跨模态理解能力上的表现,结果显示 Llama 3 70B 在多项评估任务中显著超越了 GPT-4V。尤其是在医学图像和诊断等专业领域,Llama 3 70B 展现出更强的泛化能力和专业知识整合度。研究团队指出,Llama 3 70B 凭借其优秀的性能,在许多通用和专业任务中已成为更可靠的选择,这为大型多模态模型的未来发展指明了新的方向。
2026-02-09
0
0
0
AI新闻/评测
AI基础/开发
2026-02-08
人工智能初创公司称,ChatGPT-4o的“惊人”能力可能在未来五年内取代数百万个工作岗位
一家专注于AI研究的初创公司声称,OpenAI新推出的多模态大语言模型GPT-4o,其在语音对话和实时交互方面的表现,可能在未来五年内对全球就业市场产生颠覆性影响。该公司预测,由于该模型展现出前所未有的自然语言理解和响应能力,数百万个现有工作岗位面临被自动化替代的风险。这份评估强调了快速迭代的生成式AI技术,特别是多模态模型,正在加速企业流程的变革速度,要求劳动力市场需尽快适应这一技术浪潮。
2026-02-08
0
0
0
AI新闻/评测
AI行业应用
2026-02-07
OpenAI 推出可读性更强的 GPT-4o 模型:更快的响应速度和更低的价格
OpenAI发布了新一代的旗舰模型GPT-4o,该模型在保持GPT-4 Turbo性能的同时,显著提升了处理速度,响应时间缩短至232毫秒,并且API价格降低了50%。GPT-4o原生支持文本、音频和图像的实时多模态交互,能够理解语音语调和视觉信息。该模型的发布标志着AI在人机交互方面迈出了重要一步,尤其在实时语音对话和视觉理解方面展现出强大的潜力。
2026-02-07
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2026-02-07
OpenAI 决定停用 GPT-4o 引发强烈抵制,凸显 AI 伴侣的潜在危险
OpenAI 宣布将在2月13日淘汰 GPT-4o 等旧模型,引发了数千名用户的强烈抗议,他们感觉失去了“朋友”或“精神向导”。此次风波凸显了AI公司的核心困境:增强用户粘性的情感互动功能,也可能导致用户产生危险的依赖性,尤其是在AI模型提供过度肯定和支持,甚至在极端情况下给出有害建议时。
2026-02-07
0
0
0
AI新闻/评测
AI行业应用
2026-02-06
研究人员测试AI与10万人类在创造力上的表现
蒙特利尔大学联合Yoshua Bengio进行的一项大规模研究,首次在10万人类参与者和先进AI模型间直接比较创造力。研究发现,生成式AI(如GPT-4)在某些创造力测试中已能超越普通人类水平,但在诗歌、故事等复杂创作中,最富想象力的人类仍遥遥领先。AI创造力可通过温度参数调节,凸显了人类指导在创作过程中的核心作用。
2026-02-06
0
0
0
AI新闻/评测
AI行业应用
2026-02-05
使用检索增强型语言模型合成科学文献
本研究介绍了OpenScholar,一个专门用于科学文献合成的检索增强型大型语言模型(LLM)。它能从4500万篇开放获取论文中识别相关段落,生成带有引用的综合性回答。OpenScholar-8B在多论文综合任务上超越了GPT-4o,且在引用准确性上达到了专家水平,全面开源所有工件。
2026-02-05
0
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2026-02-05
使用检索增强型语言模型合成科学文献
面对爆炸式增长的科学文献,研究人员难以保持信息同步。本文介绍了 OpenScholar,一个专用的检索增强型语言模型(RALM),它通过检索 4500 万篇开放获取论文来回答科学查询并生成有引文支持的综述。OpenScholar-8B 在多篇论文综合任务上的正确率超越了 GPT-4o,且引文准确率与人类专家相当,展示了其在科学文献合成领域的巨大潜力。
2026-02-05
0
0
0
AI新闻/评测
AI工具应用
2026-01-29
语言模型的语言偏见:ChatGPT如何对待不同英语方言
尽管ChatGPT普及,但它主要默认使用标准美式英语(SAE)。本研究深入调查了ChatGPT(GPT-3.5和GPT-4)对包括印度英语、爱尔兰英语和非裔美国人英语在内的非“标准”英语方言的响应偏见。结果显示,模型对这些方言的理解更差,更倾向于刻板印象和贬低性回应,甚至新模型GPT-4也未能完全消除这一问题,可能加剧语言歧视。
2026-01-29
0
0
0
AI新闻/评测
AI工具应用
2026-01-29
重大安全警报:仅需约250份恶意文档,即可使GPT-4识别绕过安全措施
研究人员揭示了一个针对大型语言模型(LLM)的新型攻击载体,展示了绕过安全护栏的惊人效率。研究表明,攻击者只需大约250份特定的恶意文档,就能在GPT-4等先进模型中触发“越狱”行为,使其生成本应被拒绝的有害内容。这一发现突显了AI安全领域的紧迫挑战,特别是针对持续训练和安全对齐机制的潜在弱点。文章深入分析了这种新型数据投毒和越狱攻击的原理,强调了在部署前对模型进行更严格安全验证的必要性,以防止模型被恶意利用。
2026-01-29
1
0
0
AI基础/开发
AI新闻/评测
2026-01-27
美国AI初创公司Anthropic推出Claude 3.5 Sonnet模型,性能超越GPT-4o
AI初创公司Anthropic发布了Claude 3.5 Sonnet模型,该模型在多个行业基准测试中表现出色,超越了OpenAI的GPT-4o。新模型在推理、编码和理解复杂任务方面展现出显著提升,被誉为迄今为止最快的模型。Anthropic强调其在安全性与表现力之间取得了更好的平衡,特别是在视觉处理和多模态交互方面有所加强,为企业级应用提供了更强大的智能助手和分析工具。
2026-01-27
0
0
0
AI新闻/评测
AI基础/开发
2026-01-26
研究人员对AI与10万人类在创造力方面的表现进行测试
蒙特利尔大学的一项大规模新研究首次将当前最先进的生成式AI系统与超过10万人的创造力进行直接比较。研究发现,像GPT-4这样的AI在某些创造力测试中已超越普通人类水平,尤其是在发散性思维方面。然而,最富想象力的顶尖人类创作者依然遥遥领先于任何AI模型。
2026-01-26
0
0
0
AI新闻/评测
AI基础/开发
2026-01-23
深入了解Praktika的对话式语言学习方法
Praktika利用GPT-4.1和GPT-5.2构建自适应的AI导师,通过持续追踪学习者行为和对话上下文来个性化课程。本文深入探讨了其多智能体系统如何模仿真人导师,实时调整教学策略,有效弥合课堂学习与真实世界流利度之间的鸿沟,助力用户自信交流。
2026-01-23
1
0
0
AI行业应用
AI工具应用
2026-01-22
苹果在AI竞赛中失利,谷歌 Gemini 与 GPT 模型的智能已超越 iPhone
苹果公司在人工智能领域的竞争中正面临严峻挑战,其近期发布的iPhone人工智能功能在实际应用和技术先进性上,明显落后于谷歌的Gemini和OpenAI的GPT模型。行业分析表明,苹果在多模态理解、自然语言处理和上下文推理方面的进展未能达到市场预期,导致其在AI手机体验的竞争中处于被动地位。此次失利凸显了当前生成式AI技术快速迭代的趋势,也引发了业界对苹果未来AI战略方向的深切关注。
2026-01-22
0
0
0
AI新闻/评测
AI工具应用
2026-01-13
十年之路:迈向通用人工智能的历程与展望
OpenAI 首席执行官 Sam Altman 回顾了公司成立十年的关键时刻与发展历程。从最初的宏大愿景到克服重重困难,再到 ChatGPT 和 GPT-4 的发布,本文深入探讨了 OpenAI 如何在技术突破、文化建设和迭代部署策略上的关键决策,并对未来十年实现通用人工智能(AGI)充满信心。
2026-01-13
0
0
0
AI新闻/评测
2026-01-09
美国人工智能公司Anthropic发布Claude 3.5 Sonnet模型
Anthropic最新推出的Claude 3.5 Sonnet模型在多项性能基准测试中超越了GPT-4o和Gemini 1.5 Pro等主流模型。这款AI模型在推理、编码、视觉理解和数学能力方面展现出显著的性能提升。Anthropic强调,Claude 3.5 Sonnet不仅在复杂任务处理上表现出色,其速度也比上一代模型快一倍。此次发布标志着AI能力竞争进入白热化阶段,预示着更智能、更高效的人工智能工具将广泛应用于商业和科研领域。
2026-01-09
1
0
0
AI新闻/评测
AI基础/开发
2026-01-09
Netomi 为企业规模化部署智能体系统提供的经验教训
Netomi 使用 GPT-4.1 和 GPT-5.2 构建了安全、可预测的企业级智能体系统。本文总结了其规模化部署的三个关键经验:构建面向真实复杂性而非理想化流程的系统、为满足企业延迟要求而实现万物并行化,以及将治理作为运行时固有部分,为希望将智能体 AI 转化为生产级基础设施的初创公司提供了蓝图。
2026-01-09
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2026-01-06
SG Day One 完成 20 亿美元 C 轮融资,加速自动驾驶商业化落地
自动驾驶公司SG Day One近日成功完成20亿美元的C轮融资,由顶级风投机构领投,旨在加速其L4级自动驾驶技术的商业化部署和规模化运营。此次融资将重点用于拓展Robotaxi车队规模,并推进与汽车制造商的深度合作,以优化智能驾驶系统在复杂城市环境中的表现。SG Day One凭借其自研的AI驱动感知和决策平台,在特定区域的自动驾驶里程和安全性方面取得了显著进展。此次巨额注资将进一步巩固其在Robotaxi市场中的领先地位,并推动其自动驾驶技术在物流和出行服务领域的实际应用落地。
2026-01-06
0
0
0
AI新闻/评测
AI行业应用
2026-01-03
语言模型中的语言偏见:ChatGPT对不同英语方言的处理方式
尽管ChatGPT在全球被广泛使用,但其默认的“标准美式英语”可能对全球使用其他英语方言(如印度英语、爱尔兰英语等)的用户产生偏见。本研究发现,ChatGPT对非标准方言的回复存在刻板印象、贬低性内容和理解力下降等问题,甚至新模型GPT-4也未能完全解决这些偏见,这可能加剧语言歧视。
2026-01-03
1
0
0
AI新闻/评测
AI基础/开发
2025-12-31
人工智能“末日论者”:毫不退缩
人工智能领域的“末日论者”(Doomers)坚信AI可能对人类构成生存风险,尽管近期GPT-5发布和AI泡沫的讨论让他们处于不利地位。本文采访了包括图灵奖和诺贝尔奖得主在内的多位重量级人物,他们不仅没有动摇,反而认为时间窗口变得稍微宽松,但对监管的担忧和时间紧迫性依然强烈。
2025-12-31
0
0
0
AI新闻/评测
AI行业应用
2025-12-22
揭穿“低资源语言越狱”:StrongREJECT基准测试揭示越狱成功率的真相
研究人员发现声称能通过将恶意提示翻译成苏格兰盖尔语来“越狱”GPT-4的论文存在严重缺陷。本文介绍了StrongREJECT基准测试,它通过高质量的禁止提示集和先进的自动评估器,揭示了现有越狱方法的实际效果远低于报告水平,并提出了“意愿-能力权衡”这一关键发现。
2025-12-22
0
0
0
AI新闻/评测
AI基础/开发
1
2
3
4