首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
5216
篇文章
累计创建
1867
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
Amazon SageMaker
相关的文章
2026-02-10
使用 Hugging Face 和 Amazon SageMaker AI 扩展 LLM 微调能力
企业正越来越多地将通用大语言模型(LLM)转向基于私有数据进行专业化微调。本文深入探讨了如何利用 Hugging Face 与 Amazon SageMaker AI 的紧密集成,克服扩展 LLM 微调的技术和运营挑战。通过集成了 LoRA 和 FSDP 等先进技术,企业能够简化模型定制流程,加速实现领域特定 LLM 的价值,同时保持对数据的完全控制。
2026-02-10
0
0
0
AI基础/开发
AI工具应用
AI行业应用
2026-02-07
使用 HyperPod CLI 和 SDK 管理 Amazon SageMaker HyperPod 集群
本文详细介绍了如何利用 Amazon SageMaker HyperPod 的命令行界面(CLI)和软件开发工具包(SDK)来简化大规模 AI 模型训练的基础设施管理。我们将通过实践示例,演示如何使用 `hyp` 命令创建、监控、修改和删除 HyperPod 集群,帮助数据科学家和机器学习从业者专注于模型开发,而非底层系统的复杂性。
2026-02-07
0
0
0
AI新闻/评测
AI工具应用
2026-02-07
使用基于Amazon Nova规则的大型语言模型裁判对生成式AI模型进行评估(第2部分)
本文深入探讨了Amazon SageMaker AI中基于Amazon Nova规则的大型语言模型(LLM)裁判功能。这种新方法能根据具体提示自动生成定制化的评估标准(规则),取代了过去通用的静态规则。我们将详细介绍其工作原理、训练方法、关键指标以及如何进行校准,并分享使用SageMaker训练作业评估和比较不同LLM输出的Notebook代码。
2026-02-07
0
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2026-01-31
使用 Amazon SageMaker AI 上的 Amazon Nova LLM-as-a-Judge 评估生成式 AI 模型
评估大型语言模型(LLM)的性能超越了传统的统计指标。本文介绍了如何在 Amazon SageMaker AI 上使用 Amazon Nova LLM-as-a-Judge 功能,这是一个强大的、经过严格验证的 LLM 评估方法。Nova LLM-as-a-Judge 能够提供公正的、与人类偏好高度一致的成对比较,帮助用户在几分钟内部署工作流程,并做出数据驱动的模型改进决策。
2026-01-31
0
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2026-01-31
使用 Amazon Nova LLM-as-a-Judge 在 Amazon SageMaker AI 上评估生成式 AI 模型
评估生成式AI模型的性能不能仅依赖统计指标。本文介绍了Amazon Nova LLM-as-a-Judge的综合方法,该功能在Amazon SageMaker AI上运行,能利用LLM的推理能力对其他模型进行灵活、大规模的评估。Nova LLM-as-a-Judge经过严格验证,在关键指标上表现出色,并能紧密反映人类偏好,是实现可靠、生产级LLM评估的新标准。
2026-01-31
1
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2026-01-31
使用基于Amazon S3模板的Amazon SageMaker AI项目简化ModelOps
本文介绍了Amazon SageMaker AI Projects中推出的基于Amazon S3的新模板功能,它极大地简化了ModelOps工作流的设置与管理。通过S3模板,管理员可以利用S3的版本控制和生命周期策略,以更低的开销为数据科学家团队提供安全、版本化的自动化项目模板,显著降低了MLOps的复杂性。
2026-01-31
2
0
0
AI行业应用
AI工具应用
AI基础/开发
2026-01-13
Omada Health 如何通过在 Amazon SageMaker AI 上微调 Llama 模型来扩展患者护理
Omada Health 携手 AWS 和 Meta,在 Amazon SageMaker AI 上使用 Llama 模型开发了 OmadaSpark AI 助手,专注于个性化营养教育。通过 QLoRA 微调 Llama 3.1 8B 模型,Omada 实现了实时、循证的患者支持,同时确保了 HIPAA 合规性,显著提升了患者参与度和护理效率。
2026-01-13
1
0
0
AI行业应用
AI工具应用
AI基础/开发
2026-01-10
基于 Amazon SageMaker AI 构建 TrueLook 的人工智能驱动建筑安全系统架构
本文深入探讨了TrueLook如何利用Amazon SageMaker AI构建和部署其人工智能驱动的建筑安全监控系统。通过结合计算机视觉和MLOps最佳实践,TrueLook实现了对个人防护设备(PPE)的自动化检测,显著提升了工地的安全合规性与效率。了解其三阶段模型微调流程与SageMaker Pipelines的强大能力。
2026-01-10
0
0
0
AI新闻/评测
AI工具应用
AI行业应用
2026-01-10
使用Amazon SageMaker AI上的AWQ和GPTQ进行训练后权重和激活的量化,加速LLM推理
本文深入探讨了如何在Amazon SageMaker上利用AWQ和GPTQ技术加速大型语言模型(LLM)的推理过程。通过后训练权重和激活量化,我们展示了如何显著降低延迟和提高吞吐量,优化LLM的部署成本和性能。
2026-01-10
0
0
0
AI基础/开发
AI工具应用
2025-12-26
使用 BentoML 的 LLM-Optimizer 在 Amazon SageMaker AI 上优化 LLM 推理
本文深入探讨了在 Amazon SageMaker AI 上使用 BentoML 的 LLM-Optimizer 来系统化优化大型语言模型(LLM)推理性能的方法。通过自动化基准测试和参数调优,您可以告别繁琐的手动试错,快速找到满足延迟和吞吐量服务水平协议(SLA)的最佳配置,从而显著提升自托管模型的效率和成本效益。
2025-12-26
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-23
在 Amazon SageMaker AI 上部署 Mistral AI 的 VoxLlama 模型
本文详细介绍了如何利用 Amazon SageMaker 快速部署 Mistral AI 推出的先进多模态模型 VoxLlama。我们将探讨使用 SageMaker 托管服务部署高性能大语言模型的步骤,为开发者和企业提供了一个高效、可扩展的解决方案,以在云端运行和集成最前沿的 AI 技术。
2025-12-23
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-12-20
面向Amazon SageMaker Studio推出SOCI索引:为AI/ML工作负载提供更快的容器启动时间
AWS重磅推出Amazon SageMaker Studio的新功能:SOCI(Seekable Open Container Initiative)索引。该功能通过实现容器镜像的延迟加载,显著缩短了AI/ML工作负载的容器启动时间,将等待时间从几分钟缩短到几秒钟。本文详细介绍了SOCI的工作原理、先决条件、创建索引的步骤以及基准测试结果,旨在帮助数据科学家和ML工程师减少环境初始化等待,提高开发效率。
2025-12-20
0
0
0
AI工具应用
AI基础/开发
2025-12-18
使用 Amazon SageMaker AI 跟踪和管理 AI 开发中使用的资产
构建定制基础模型需要协调数据、计算、模型架构、评估器和部署等多个资产。本文深入探讨了 Amazon SageMaker AI 如何通过自动跟踪和管理数据集版本、自定义评估器以及端到端血缘关系,简化生成式 AI 开发的复杂性,确保模型的可追溯性和可复现性。
2025-12-18
0
0
0
AI基础/开发
AI工具应用
AI行业应用
2025-12-18
使用 Snowflake 集成在 Amazon SageMaker 上通过 MLflow 跟踪机器学习实验
本文介绍了如何将 Amazon SageMaker 托管的 MLflow 与 Snowflake 集成,以实现在数据环境中进行机器学习实验跟踪。通过 Snowpark 库,您可以在 Snowflake 中进行数据处理和特征工程,并利用 SageMaker MLflow 作为中央存储库来记录和监控实验元数据、参数、模型和结果,从而实现更安全、更高效的 MLOps 工作流。
2025-12-18
1
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2025-12-17
塔塔电力CoE如何利用Amazon SageMaker AI和Amazon Bedrock构建可扩展的AI驱动太阳能电池板检测解决方案
本文深入探讨了塔塔电力(Tata Power)如何与Oneture Technologies合作,利用AWS服务(包括Amazon SageMaker AI和Amazon Bedrock)构建了一个革命性的AI驱动太阳能电池板安装检测系统。该方案解决了传统手动检测耗时长、可扩展性差和质量不一致的痛点,实现了超过90%的准确率和80%的复检率下降,加速了清洁能源的推广。
2025-12-17
0
0
0
AI新闻/评测
AI工具应用
AI行业应用
2025-12-16
使用 SageMaker HyperPod 弹性训练实现基础模型训练的自适应基础设施
本文介绍了 Amazon SageMaker HyperPod 新增的弹性训练功能,它允许机器学习(ML)工作负载根据资源可用性自动伸缩。通过动态调整资源,弹性训练可最大化 GPU 利用率,降低成本,并加速模型开发,同时保持训练质量并最大限度地减少手动干预。我们将深入探讨其工作原理、配置步骤以及性能表现。
2025-12-16
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-16
Amazon SageMaker HyperPod 的无检查点训练:面向更快速故障恢复的生产规模训练
随着基础模型训练的规模不断扩大,传统的基于检查点的恢复方法已成为效率瓶颈。本文介绍了 Amazon SageMaker HyperPod 上的无检查点训练,这是一种范式转变,通过实现对等状态恢复,显著减少了对传统检查点的依赖。生产规模验证结果显示,恢复时间减少了 80%–93%,在数千个 AI 加速器集群上可实现高达 95% 的训练有效吞吐量(Goodput)。
2025-12-16
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-12-12
扩展MLflow以支持企业级AI:SageMaker AI中MLflow的新特性
AWS发布了Amazon SageMaker AI中的新MLflow功能,引入了无服务器能力,可动态管理基础设施的预置、扩展和运维。这项更新无需管理员配置,即可实现实验跟踪、可观测性和模型性能评估的自动化,并支持跨账户共享和与SageMaker Pipelines的集成,显著简化了企业级ML和生成式AI工作负载的管理。
2025-12-12
0
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2025-12-10
Amazon SageMaker HyperPod 的托管分层 KV 缓存和智能路由
本文介绍了 Amazon SageMaker HyperPod 中新增的托管分层 KV 缓存和智能路由功能,旨在解决大型语言模型(LLM)推理中因上下文长度增加导致的延迟和成本问题。这些新功能通过优化 KV 缓存管理和请求路由,可将 TTFT 降低高达 40%,并将吞吐量提升高达 24%,显著降低推理成本。
2025-12-10
0
0
0
AI行业应用
AI工具应用
2025-12-04
AWS re:Invent 2025:企业级AI代理和模型定制成最大亮点
AWS re:Invent 2025 大会聚焦企业级AI,重点推出了增强AI代理功能,使其能独立工作数日。首席执行官Matt Garman强调AI代理是释放AI真正价值的关键。此外,AWS还发布了简化定制LLM的工具,如SageMaker的无服务器模型定制和Bedrock的强化微调功能,并展示了Trainium3芯片和企业级AI工厂解决方案。
2025-12-04
0
0
0
AI新闻/评测
AI行业应用
AI基础/开发
1
2