首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
5208
篇文章
累计创建
1860
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
部署运维
相关的文章
2026-02-10
使用 Hugging Face 和 Amazon SageMaker AI 扩展 LLM 微调能力
企业正越来越多地将通用大语言模型(LLM)转向基于私有数据进行专业化微调。本文深入探讨了如何利用 Hugging Face 与 Amazon SageMaker AI 的紧密集成,克服扩展 LLM 微调的技术和运营挑战。通过集成了 LoRA 和 FSDP 等先进技术,企业能够简化模型定制流程,加速实现领域特定 LLM 的价值,同时保持对数据的完全控制。
2026-02-10
0
0
0
AI基础/开发
AI工具应用
AI行业应用
2026-02-07
翻译后的中文标题
...转载信息... ... ... ... 🚀 想要体验更好更全面的AI调用? ...
2026-02-07
0
0
0
AI新闻/评测
2026-02-05
解锁 Codex 架构:我们如何构建应用服务器
本文深入解析了OpenAI Codex应用服务器(App Server)的构建和架构。作为连接所有Codex体验的关键桥梁,该服务器采用JSON-RPC API,实现了Codex核心逻辑的跨平台复用。我们将探讨其设计演变、核心组件、对话原语(Item、Turn、Thread)以及如何与IDE、Web运行时等不同客户端集成,为开发者提供超级充电工作流的宝贵经验。
2026-02-05
0
0
0
AI工具应用
AI基础/开发
2026-02-05
将 PostgreSQL 扩展至支持 8 亿 ChatGPT 用户
OpenAI 分享了如何通过严谨的工程实践和深度优化,将 PostgreSQL 扩展到支持每秒数百万次查询,服务全球 8 亿 ChatGPT 用户。本文揭示了如何利用单个主实例和近 50 个只读副本应对海量流量,并详细阐述了针对读密集型负载的关键优化策略,包括负载卸载、查询优化、缓解单点故障和连接池管理等,展示了其在极端规模下的强大潜力。
2026-02-05
0
0
0
AI新闻/评测
AI基础/开发
2026-02-04
人工智能机器人已成为网络流量的重要来源
根据TollBit和Akamai的新数据,人工智能(AI)机器人已经占据了显著的网络流量份额,并且其行为日益复杂。这场与网站防御之间的“军备竞赛”正在重塑互联网的未来格局,特别是对于依赖人类流量的出版商而言,机器对机器的内容交换正成为新的商业模式。
2026-02-04
0
0
0
AI新闻/评测
AI行业应用
AI基础/开发
2026-01-31
思科与 OpenAI 携手利用 AI 智能体重新定义企业工程
思科(Cisco)正与 OpenAI 深度合作,将 Codex 模型集成到其复杂、大规模的企业工程工作流中。本文重点介绍了 Codex 如何超越传统工具,成为企业级的 AI 工程伙伴,在代码仓库分析、缺陷修复和框架迁移等关键任务中显著提升效率,展示了 AI 原生开发在真实生产环境中的巨大潜力。
2026-01-31
0
0
0
AI新闻/评测
AI行业应用
AI工具应用
2026-01-31
机器学习从业者使用FastAPI进行模型部署的实践指南
本指南为机器学习从业者提供了使用Python的FastAPI框架部署机器学习模型的实用路线图。FastAPI以其高性能、现代化的特性和自动化的API文档生成功能,成为构建生产级AI服务的首选工具之一。文章详细介绍了如何设置API、处理数据预处理和模型推理的流程,帮助从业者高效地将训练好的模型封装为可靠的Web服务。掌握这些步骤,能够显著加快AI模型从实验到实际生产环境的转化速度,确保模型在可控、可扩展的环境中提供服务。
2026-01-31
0
0
0
AI基础/开发
AI工具应用
2026-01-30
如何使用 Hugging Face Spaces 免费托管您的作品集
2026-01-30
0
0
0
AI工具应用
AI基础/开发
2026-01-30
在生产环境中部署具身AI之前的7个重要考虑因素
2026-01-30
0
0
0
AI基础/开发
AI工具应用
2026-01-21
5 个替代 Google Colab 运行长时间任务的方案
2026-01-21
0
0
0
AI基础/开发
AI工具应用
2026-01-21
AI能编写Python代码,但维护工作仍是你的职责
人工智能工具能快速生成可运行的Python代码,但这些代码往往难以维护。文章深入探讨了在使用Claude Code、GitHub Copilot等工具时,AI倾向于优化“即时可用性”而非长期可读性和可维护性的问题。为解决这一差距,文章提供了六大核心策略,包括:避免从零开始(设置基础结构)、利用Python类型系统(如Pydantic和mypy)设置护栏、创建明确的“AGENTS.md”指南文件、编写引用现有模式的提示词、在实施前规划,以及系统化验证AI输出。通过这些方法,开发者可以确保AI...
2026-01-21
0
0
0
AI基础/开发
AI工具应用
2026-01-17
使用强化学习训练扩散模型
本文介绍了伯克利AI研究团队利用强化学习(RL)控制100辆自动驾驶汽车(AV)部署到高峰时段的高速公路上,旨在平滑交通拥堵并降低所有人的燃料消耗。研究重点是解决“走走停停”波浪现象,并通过与数据驱动的模拟器交互,训练出能够最大化能源效率、保持吞吐量并安全运行的控制器。实验成功展示了少量智能控制车辆对改善整体交通流和燃油效率的显著作用。
2026-01-17
1
0
0
AI基础/开发
AI行业应用
2026-01-17
五大开源AI模型API提供商对比
2026-01-17
0
0
0
AI基础/开发
AI工具应用
AI行业应用
2026-01-17
使用 GitHub Actions 在 Amazon Bedrock AgentCore 上部署 AI 智能体
本文详细介绍了如何利用 GitHub Actions 工作流,安全、可扩展地将 AI 智能体部署到 Amazon Bedrock AgentCore Runtime。通过采用 OIDC 身份验证和最小权限控制等最佳实践,我们构建了一个全自动化的 CI/CD 流程,实现了代理的无缝部署、持续安全扫描和代码质量检查,极大简化了企业级 AI 智能体的运维复杂性。
2026-01-17
1
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2026-01-10
使用Amazon SageMaker AI上的AWQ和GPTQ进行训练后权重和激活的量化,加速LLM推理
本文深入探讨了如何在Amazon SageMaker上利用AWQ和GPTQ技术加速大型语言模型(LLM)的推理过程。通过后训练权重和激活量化,我们展示了如何显著降低延迟和提高吞吐量,优化LLM的部署成本和性能。
2026-01-10
0
0
0
AI基础/开发
AI工具应用
2025-12-27
使用数据并行在多GPU上训练模型
2025-12-27
0
0
0
AI基础/开发
AI工具应用
2025-12-27
初学者必看的5个有趣Docker项目
想要通过实践掌握Docker技能的初学者,可以从五个有趣且实用的项目中入手。这些项目涵盖了使用Docker托管静态网站、构建多容器应用(如Flask后端与Redis数据库)、共享数据库、实现Jenkins自动化持续集成,以及搭建Prometheus和Grafana进行日志和性能监控。通过亲手操作,您将不仅理解Docker的核心概念,还能掌握部署、管理和观测容器化应用的关键技能,有效避免“在我机器上可以运行”的问题,从而简化开发和部署流程。
2025-12-27
0
0
0
AI基础/开发
AI工具应用
2025-12-26
使用 BentoML 的 LLM-Optimizer 在 Amazon SageMaker AI 上优化 LLM 推理
本文深入探讨了在 Amazon SageMaker AI 上使用 BentoML 的 LLM-Optimizer 来系统化优化大型语言模型(LLM)推理性能的方法。通过自动化基准测试和参数调优,您可以告别繁琐的手动试错,快速找到满足延迟和吞吐量服务水平协议(SLA)的最佳配置,从而显著提升自托管模型的效率和成本效益。
2025-12-26
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-25
使用 BentoML 的 LLM-Optimizer 优化 Amazon SageMaker AI 上的 LLM 推理
本文深入探讨了如何在 Amazon SageMaker AI 上利用 BentoML 的 LLM-Optimizer 工具,系统性地优化大型语言模型(LLM)的推理性能。面对自托管模型的成本和复杂性,LLM-Optimizer 提供了自动化的参数基准测试和搜索流程,以平衡吞吐量和延迟。通过 Qwen-3-4B 模型的实际部署案例,文章展示了如何找到最优的张量并行、批处理大小和并发限制配置,实现比基线高出 2.7 倍的吞吐量提升,确保生产环境下的服务水平目标。
2025-12-25
1
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-25
Agent Lightning:无需重写代码即可为 AI 智能体添加强化学习
本文介绍了 Agent Lightning,一种创新性的方法,允许开发者在不修改现有 AI 智能体代码的情况下,为其注入强化学习能力。这项技术通过添加可学习的控制器来优化智能体行为,显著提升了其性能和决策能力,为构建更强大的智能体开辟了新的途径。
2025-12-25
0
0
0
AI基础/开发
AI工具应用
1
2
3
4
5