产品发布AI工具派快讯

部署对象

描述模型部署任务对象的属性和结构。

作者:help.aliyun.com浏览:5,383发布日期:2026-06-08 18:19喜欢:2,157
产品发布5383 浏览2157 喜欢
部署对象
\n

描述模型部署任务对象的属性和结构。

\n
\n\n
当前模型部署 API 仅在北京 Region 开放。如您使用其他 Region,请通过该 Region 的百炼控制台完成模型部署操作。
\n\n

以下为部署任务的响应对象字段定义。通过创建部署接口创建,可通过查询部署详情列举部署接口获取。

\n

响应参数

\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n
\n

参数

\n
\n

类型

\n
\n

说明

\n
\n

request_id

\n
\n

String

\n
\n

本次请求的ID。

\n
\n

output

\n
\n

Object

\n
\n

本次部署任务的详细信息。

\n
\n

deployed_model

\n
\n

String

\n
\n

新模型的唯一标识。在发起模型调用请求时需要在SDK参数传入。

\n
\n

gmt_create

\n
\n

String

\n
\n

创建部署任务的时间。

\n
\n

gmt_modified

\n
\n

String

\n
\n

修改部署任务的时间。

\n
\n

status

\n
\n

String

\n
\n

部署任务的状态。

\n
    \n
  • \n

    PENDING:正在创建部署任务。

    \n
  • \n
  • \n

    UPDATING:正在更新部署任务。

    \n
  • \n
  • \n

    RUNNING:部署任务正在运行,此时已部署的模型可以正常处理请求。

    \n
  • \n
  • \n

    STOPPED:部署任务已经停止,此时的部署任务不会被计费。

    \n
  • \n
  • \n

    DELETING:正在删除部署任务。

    \n
  • \n
  • \n

    FAILED:部署任务创建或更新失败。

    \n
  • \n
\n
\n

model_name

\n
\n

String

\n
\n

部署任务使用的模型名称。

\n
\n

base_model

\n
\n

String

\n
\n

部署任务使用的模型对应的基础模型ID。

\n
\n

base_capacity

\n
\n

Number

\n
\n

基础模型运行所需的最小资源单元数量。

\n
\n

capacity

\n
\n

Number

\n
\n

部署任务使用的资源单元数量。

\n
\n

ready_capacity

\n
\n

Number

\n
\n

已就绪并可立即处理请求的资源单元数量。受限于资源初始化速度或硬件状态。

\n
\n

workspace_id

\n
\n

String

\n
\n

部署任务所属的业务空间ID。

\n
\n

charge_type

\n
\n

String

\n
\n

部署任务的扣费方法。

\n
post_paid:后付费。
\n
\n

creator

\n
\n

String

\n
\n

该部署任务创建人UID。

\n
\n

modifier

\n
\n

String

\n
\n

对该部署任务进行最后一次操作的账号UID。

\n
\n

plan

\n
\n

String

\n
\n

部署任务的计费模式。(部分模式不显示该参数)

\n
\n

模型单元部署方式响应

\n
\n

model_unit_spec

\n
\n

String

\n
\n

模型单元规格。

\n
\n

enable_thinking

\n
\n

Boolean

\n
\n

是否开启思考模式,部分模型支持。

\n
\n

max_context_length

\n
\n

Number

\n
\n

最大上下文长度限制。

\n
\n

rpm_limit

\n
\n

String

\n
\n

Requests per minute,每分钟请求数。

\n
\n

tpm_limit

\n
\n

Number

\n
\n

Token per minute,每分钟 Token 使用量。

\n
\n

仅预置吞吐量(ptu)部署方式响应

\n
\n

ptu_capacity

\n
\n

Object

\n
\n

当设置\"plan\": \"ptu\"时,该参数才生效。

\n

样例:\"ptu_capacity\": { \"input_tpm\": 10000, \"output_tpm\": 1000 }

\n
\n

ptu_capacity.input_tpm

\n
\n

Number

\n
\n

所有模型支持,input token pre-minute,部署的模型每分钟支持的最大输入 Token 量。

\n
\n

ptu_capacity.output_tpm

\n
\n

Number

\n
\n

所有模型支持,output token pre-minute,部署的模型每分钟支持的最大输出 Token 量。

\n
\n

ptu_capacity.thinking_output_tpm

\n
\n

Number

\n
\n

部分模型支持,thinking output token pre-minute,部署的模型每分钟支持的预置思考最大输出 Token 量。

\n
\n
\n

文章来源: https://help.aliyun.com/zh/model-studio/model-deployment-api

来源与声明

本站快讯内容主要用于行业资讯整理与信息聚合,部分内容来源于公开网络与第三方平台,仅供学习、参考与行业交流使用。

如相关内容涉及版权、署名或权益问题,请通过站点联系邮箱与我们联系,我们会在核实后尽快处理。

关联工具

文中相关方向,可以先从这些工具开始试

Hostinger 是一款围绕 代码生成与开发辅助、AI 联网搜索 展开的 Agent与工作流 工具,公开页面更强调它在 代码开发与自动化工作流、日常 AI 问答与资料整理 这类任务里的实际用途。从页面信息来看,中文使用场景与中文内容支持会更清晰一些。

Entry Point AI – 大型语言模型的微调平台 可以先理解为一款面向 代码开发与自动化工作流 的 模型平台与API 工具,当前公开信息主要围绕 AI 对话问答、代码生成与开发辅助 这些能力展开。如果你主要在中文环境里工作,可优先确认中文输入、输出和界面是否符合预期。

豆包大模型平台 可以先理解为一款面向 日常 AI 工具使用、信息整理与内容处理 的 模型平台与API 工具,当前公开信息主要围绕 智能问答与内容生成、任务辅助与信息整理 这些能力展开。如果你主要在中文环境里工作,可优先确认中文输入、输出和界面是否符合预期。

小马算力 是一款围绕 智能问答与内容生成、任务辅助与信息整理 展开的 模型平台与API 工具,公开页面更强调它在 日常 AI 工具使用、信息整理与内容处理 这类任务里的实际用途。从页面信息来看,中文使用场景与中文内容支持会更清晰一些。

Runway - AI视频生成平台 是一款围绕 AI 视频生成与剪辑、AI 对话问答 展开的 模型平台与API 工具,公开页面更强调它在 日常 AI 问答与资料整理、图片创作与视觉内容生成 这类任务里的实际用途。从页面信息来看,中文使用场景与中文内容支持会更清晰一些。

硅基流动SiliconFlow 是一款围绕 AI 对话问答、文件上传理解 展开的 模型平台与API 工具,公开页面更强调它在 图片创作与视觉内容生成、办公文档、PPT、表格处理 这类任务里的实际用途。从页面信息来看,中文使用场景与中文内容支持会更清晰一些。

相关推荐

继续看同主题内容

文章评论

阅读后的真实反馈

支持继续回复展开讨论,审核通过后会展示在页面中。

访
写下你的看法当前身份:访客
0 条评论
全部评论0 条
暂时还没有评论,欢迎来留下第一条看法。