首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
5216
篇文章
累计创建
1867
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
多模态
相关的文章
2026-02-10
PLAID:通过学习蛋白质折叠模型的潜在空间生成蛋白质
为庆祝2024年诺贝尔化学奖授予AlphaFold2,本文介绍了PLAID模型,这是一个多模态生成模型,能同时生成蛋白质的一维序列和三维结构。PLAID通过学习蛋白质折叠模型的潜在空间进行训练,能够接受“功能和生物体提示”,并能利用比结构数据库大2-4个数量级的序列数据库进行训练,解决了全原子生成和生物体特异性控制等关键挑战。
2026-02-10
0
0
0
AI新闻/评测
AI基础/开发
2026-02-10
UniR-G:使用多模态强化学习扩展医学成像报告生成
本文介绍了UniR-G,一种利用多模态强化学习技术革新医学成像报告生成的新方法。UniR-G旨在通过结合视觉和文本信息,实现更精确、更全面的报告生成,显著提升医疗诊断效率。
2026-02-10
0
0
0
AI新闻/评测
AI工具应用
AI行业应用
2026-02-09
研究表明:GPT-4V 的通用性不如 Llama 3 70B,尤其在医学领域表现更差
最新的研究对比了 OpenAI 的 GPT-4V 和 Meta 的 Llama 3 70B 在跨模态理解能力上的表现,结果显示 Llama 3 70B 在多项评估任务中显著超越了 GPT-4V。尤其是在医学图像和诊断等专业领域,Llama 3 70B 展现出更强的泛化能力和专业知识整合度。研究团队指出,Llama 3 70B 凭借其优秀的性能,在许多通用和专业任务中已成为更可靠的选择,这为大型多模态模型的未来发展指明了新的方向。
2026-02-09
0
0
0
AI新闻/评测
AI基础/开发
2026-02-07
OpenAI 推出可读性更强的 GPT-4o 模型:更快的响应速度和更低的价格
OpenAI发布了新一代的旗舰模型GPT-4o,该模型在保持GPT-4 Turbo性能的同时,显著提升了处理速度,响应时间缩短至232毫秒,并且API价格降低了50%。GPT-4o原生支持文本、音频和图像的实时多模态交互,能够理解语音语调和视觉信息。该模型的发布标志着AI在人机交互方面迈出了重要一步,尤其在实时语音对话和视觉理解方面展现出强大的潜力。
2026-02-07
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2026-02-03
GigaTime:利用多模态AI生成的虚拟人群扩展肿瘤微环境建模
微软研究院发布了GigaTime项目,旨在通过多模态AI生成大规模虚拟肿瘤微环境(TME)人群,从而扩展肿瘤模拟的规模和保真度。该技术利用AI模型生成具有复杂生物学特征的虚拟患者,加速了肿瘤学研究和个性化治疗方案的开发。
2026-02-03
0
0
0
AI新闻/评测
AI行业应用
2026-01-31
用于AI智能体的多模态强化学习与智能体验证器
本文介绍了多模态强化学习与智能体验证器(Agentic Verifier)的创新结合,旨在提升AI智能体的可靠性和安全性。通过引入验证机制,研究人员显著提高了智能体在复杂、多模态环境中的决策准确性和一致性,为构建更健壮的AI系统提供了新思路。
2026-01-31
2
0
0
AI基础/开发
AI工具应用
2026-01-31
MMCTAgent:实现对大规模视频和图像集的模态推理
微软研究院发布了MMCTAgent,这是一个创新的框架,旨在实现对大规模视频和图像集的模态推理。该模型通过集成视觉、听觉和文档信息,使AI代理能够进行更复杂和深层次的分析与决策,极大地提升了多模态理解能力。
2026-01-31
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2026-01-30
印度正在向谷歌传授教育领域AI如何实现规模化
随着AI技术在全球课堂中加速普及,谷歌发现其关于技术规模化的最深刻经验正来自于印度的学校。印度已成为谷歌教育AI的试验场,面对日益激烈的竞争,谷歌正根据印度庞大且复杂的教育系统,调整其AI部署策略,侧重于多模态学习和赋能教师。
2026-01-30
1
0
0
AI新闻/评测
AI行业应用
AI相关教程
2026-01-28
UniRG:使用多模态强化学习扩展医学成像报告生成
微软研究院发布了UniRG模型,它利用多模态强化学习(RL)技术,显著提升了医学影像报告生成的效率和准确性。该研究解决了现有模型在处理复杂、长尾病例时的不足,为临床决策支持系统带来了新的突破。
2026-01-28
1
0
0
AI新闻/评测
AI行业应用
AI工具应用
2026-01-28
多模态人工智能指南:视觉、语音、文本及超越
2026-01-28
2
0
0
AI基础/开发
AI工具应用
AI行业应用
2026-01-27
美国AI初创公司Anthropic推出Claude 3.5 Sonnet模型,性能超越GPT-4o
AI初创公司Anthropic发布了Claude 3.5 Sonnet模型,该模型在多个行业基准测试中表现出色,超越了OpenAI的GPT-4o。新模型在推理、编码和理解复杂任务方面展现出显著提升,被誉为迄今为止最快的模型。Anthropic强调其在安全性与表现力之间取得了更好的平衡,特别是在视觉处理和多模态交互方面有所加强,为企业级应用提供了更强大的智能助手和分析工具。
2026-01-27
0
0
0
AI新闻/评测
AI基础/开发
2026-01-22
扩展肿瘤微环境建模:使用多模态AI生成的虚拟人群
微软研究院推出了GigaTime方法,利用多模态AI生成海量虚拟个体来模拟肿瘤微环境(TME)。这一突破将TME建模的计算瓶颈从数周缩短到数小时,实现了前所未有的规模和分辨率,极大地加速了对肿瘤异质性和治疗反应的研究,为精准肿瘤学的未来发展奠定了基础。
2026-01-22
0
0
0
AI新闻/评测
AI行业应用
AI基础/开发
2026-01-09
AI治理全球化、具身智能化:中央广播电视总台发布2026年人工智能十大趋势
中央广播电视总台联合多家机构发布了2026年人工智能十大趋势,描绘了未来AI发展的关键方向。报告指出,AI治理将趋向全球化合作,同时智能算力规模化和AI应用主流化将成为核心驱动力。特别强调了AI智能体在企业级业务中的规模化部署,以及多模态技术的实用化进展。此外,具身智能化的融合趋势预示着机器人与现实世界的深度交互将加速,为制造业、仓储和家庭服务等领域带来变革性产品。
2026-01-09
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2026-01-09
GigaTime:使用多模态AI生成的虚拟人群扩展肿瘤微环境建模
微软研究院发布创新方法GigaTime,利用多模态AI生成的虚拟人群,实现了肿瘤微环境(TME)模型的空前规模扩展。该技术整合多源数据,生成数百万个逼真TME模型,显著提高了模型泛化能力,加速了罕见病例研究和新疗法筛选,为精准肿瘤学带来革命性突破。
2026-01-09
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2026-01-07
SGE AI 搜索引擎升级:生成式搜索体验全面改进,支持多模态和定制化
谷歌搜索正在进行重大升级,推出SGE(Search Generative Experience)的全面改进版本,旨在提供更直观、更智能的生成式搜索体验。新版本大幅提升了多模态信息的整合能力,用户可以直接在搜索结果中看到图像、视频和文本的综合摘要。此外,SGE引入了“个性化定制”功能,允许用户根据特定偏好和使用场景调整搜索结果的生成方式,提高信息获取的效率和相关性。这些更新标志着谷歌在AI驱动的搜索领域迈出了关键一步,预示着未来搜索引擎将更加注重用户意图的深度理解和结果的个性化呈现。
2026-01-07
0
0
0
AI新闻/评测
AI工具应用
2026-01-06
MMCTAgent:赋能跨大型视频和图像集合的多模态推理
本文介绍了MMCTAgent,一个创新的多模态代理系统,它能够高效地处理和推理跨越海量视频和图像集合。该系统利用了先进的推理能力,旨在解决复杂的多模态数据分析任务,为AI在信息检索和理解方面提供了新的解决方案。
2026-01-06
1
0
0
AI新闻/评测
AI工具应用
2025-12-30
谷歌宣布重大模型更新:Gemini 1.5 Pro性能提升显著
谷歌正式发布了其最新的AI模型Gemini 1.5 Pro,该版本在性能上实现了显著提升,尤其在多模态处理和长上下文理解方面取得了突破性进展。新模型能够处理高达100万个Token,极大地扩展了AI处理复杂信息的能力范围。此次更新不仅优化了推理速度和效率,还加强了模型在代码生成、复杂推理和多模态输入整合方面的表现,为开发者和企业用户带来了更强大的工具支持。
2025-12-30
0
0
0
AI基础/开发
AI新闻/评测
AI工具应用
2025-12-23
使用 Amazon Bedrock 构建用于预测性维护中根本原因诊断的多模态生成式 AI 助手
本文详细介绍了如何利用 Amazon Bedrock 构建一个多模态生成式 AI 助手,该助手专为预测性维护场景设计,能够对设备故障进行根本原因诊断。通过结合文本、图像等多种数据源,AI 助手能更准确地分析问题,加速故障排除,提升工业运维效率。
2025-12-23
0
0
0
AI新闻/评测
AI行业应用
AI工具应用
2025-12-20
Known利用语音AI帮助你进行更多线下约会
初创公司Known的联合创始人Celeste Amadon和Asher Allen,通过一个使用AI预订餐厅的应用,发现了利用语音AI增强用户互动的潜力。他们开发了一个语音驱动的AI入职系统,极大地提升了用户愿意进行线下约会的比例,并在测试中实现了80%的成功率。该公司已获得970万美元融资,旨在解决“孤独流行病”,鼓励用户摆脱滑动模式,进行更真实的面对面交流。
2025-12-20
0
0
0
AI新闻/评测
AI工具应用
2025-12-10
Rivian 正在开发自研人工智能助手
据 TechCrunch 获悉,Rivian 近两年一直在秘密开发自己的人工智能助手,此举独立于其与大众汽车价值数十亿美元的技术合资企业。该助手旨在深度集成所有车辆控制,采用混合软件堆栈,结合了边缘 AI 和云 AI,以实现灵活定制和增强客户信任。
2025-12-10
0
0
0
AI新闻/评测
AI工具应用
AI基础/开发
1
2