Skip to content

API 文档

火速AI 提供完全兼容 OpenAI 格式的 RESTful API,支持聊天补全、文本嵌入、图片生成等多种能力。如果您已经熟悉 OpenAI API,可以零成本迁移到火速AI。

Base URL

https://api.huosu.com/v1

所有 API 请求均使用 HTTPS 协议,不支持 HTTP 明文传输。

认证方式

火速AI 使用 Bearer Token 认证。在每个请求的 HTTP Header 中携带您的 API Key:

http
Authorization: Bearer YOUR_API_KEY

API Key 可在 火速AI 控制台 的「API 密钥」页面创建和管理。

支持的 API 端点

聊天补全 (Chat Completions)

POST /v1/chat/completions

最核心的对话接口,支持多轮对话、流式输出、函数调用、JSON Mode 等功能。

请求示例:

json
{
  "model": "gpt-4o",
  "messages": [
    {"role": "system", "content": "你是一个有用的助手。"},
    {"role": "user", "content": "请解释什么是大语言模型。"}
  ],
  "temperature": 0.7,
  "max_tokens": 2048,
  "stream": false
}

响应示例:

json
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1710000000,
  "model": "gpt-4o",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "大语言模型(Large Language Model,LLM)是一种基于深度学习的人工智能模型..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 25,
    "completion_tokens": 150,
    "total_tokens": 175
  }
}

关键参数说明:

参数类型必填说明
modelstring模型标识符,如 gpt-4oclaude-sonnet-4-20250514deepseek-chat
messagesarray对话消息数组,包含 rolecontent
temperaturenumber采样温度,0-2 之间,默认 1。值越低输出越确定
max_tokensinteger最大生成 Token 数
streamboolean是否启用流式输出,默认 false
top_pnumber核采样参数,0-1 之间
toolsarray函数调用工具定义
response_formatobject响应格式控制,如 {"type": "json_object"}

文本嵌入 (Embeddings)

POST /v1/embeddings

将文本转换为向量表示,用于语义搜索、文本相似度计算、RAG 等场景。

请求示例:

json
{
  "model": "text-embedding-3-small",
  "input": "火速AI是一个智能模型聚合平台",
  "encoding_format": "float"
}

响应示例:

json
{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "index": 0,
      "embedding": [0.0023064255, -0.009327292, ...]
    }
  ],
  "model": "text-embedding-3-small",
  "usage": {
    "prompt_tokens": 12,
    "total_tokens": 12
  }
}

图片生成 (Image Generations)

POST /v1/images/generations

基于文本描述生成图片,支持 DALL-E 等图片生成模型。

请求示例:

json
{
  "model": "dall-e-3",
  "prompt": "一只可爱的橙色猫咪坐在电脑前写代码",
  "n": 1,
  "size": "1024x1024",
  "quality": "standard"
}

补全 (Completions)

POST /v1/completions

传统文本补全接口,适用于代码补全等场景。

模型列表 (Models)

GET /v1/models

获取当前可用的模型列表。

响应示例:

json
{
  "object": "list",
  "data": [
    {
      "id": "gpt-4o",
      "object": "model",
      "created": 1710000000,
      "owned_by": "openai"
    },
    {
      "id": "claude-sonnet-4-20250514",
      "object": "model",
      "created": 1710000000,
      "owned_by": "anthropic"
    }
  ]
}

音频转写 (Audio Transcriptions)

POST /v1/audio/transcriptions

将音频文件转换为文本,支持 Whisper 模型。

音频翻译 (Audio Translations)

POST /v1/audio/translations

将音频文件翻译为英文文本。

内容审核 (Moderations)

POST /v1/moderations

检测文本内容是否包含不当信息。

流式输出 (Streaming)

对于聊天补全接口,可以通过设置 stream: true 启用流式输出,获得更好的用户体验。流式响应使用 Server-Sent Events (SSE) 格式:

data: {"id":"chatcmpl-abc","object":"chat.completion.chunk","choices":[{"delta":{"content":"你"},"index":0}]}

data: {"id":"chatcmpl-abc","object":"chat.completion.chunk","choices":[{"delta":{"content":"好"},"index":0}]}

data: [DONE]

错误码说明

当 API 请求出错时,会返回相应的 HTTP 状态码和错误信息:

HTTP 状态码错误类型说明
400invalid_request_error请求参数错误,请检查请求体格式和参数值
401authentication_errorAPI Key 无效或已过期,请检查认证信息
403permission_error没有权限访问请求的资源或模型
404not_found_error请求的端点或模型不存在
429rate_limit_error请求频率超限,请稍后重试或联系客服提升限额
500server_error服务器内部错误,请稍后重试
502upstream_error上游模型服务异常,请稍后重试或切换其他模型
503service_unavailable服务暂时不可用,通常因为维护或过载

错误响应格式:

json
{
  "error": {
    "message": "Incorrect API key provided: sk-xxxx. You can find your API key at https://huosu.com",
    "type": "authentication_error",
    "code": "invalid_api_key"
  }
}

请求限制

限制项默认值说明
请求频率60 RPM每分钟最大请求数,可申请提升
并发数10同时进行的请求数量
单次最大 Token取决于模型不同模型支持的最大上下文长度不同
请求体大小10 MB单次请求的最大 Payload 大小

如需更高的请求限制,请联系客服或在控制台提交工单。

智能模型聚合平台