来自 Apache APISIX 原创团队

让 AI 成为业务优势
而不是成本中心

AISIX 是面向 LLM 与 AI 智能体的开源 AI 网关。用一个兼容 OpenAI 的 API 连接所有模型，让团队在几天内交付 AI 功能，并把真正产生价值的能力稳定扩展到生产环境。

Apache-2.0 开源核心 · 100+ 模型服务商 · Rust 构建 · 文档 · 查看定价

python

from openai import OpenAI
client = OpenAI(
    base_url="https://your-aisix-gateway/v1",  # 指向 AISIX
    api_key="AISIX_API_KEY",
)
# 原有 OpenAI 代码无需改写
resp = client.chat.completions.create(
    model="gpt-4o",  # 也可以是 Claude、Gemini、DeepSeek 等 100+ 模型
    messages=[{"role": "user", "content": "Hello"}],
)

亚毫秒

代理开销

100+

LLM 服务商

100%

兼容 OpenAI

Apache-2.0

开源核心

不要让 AI 基础设施，
拖慢产品节奏

第一次调用模型很简单。第 50 个服务、第 10 个模型，以及第一次面向客户的线上故障，才是真正的复杂度。AI 网关把这些复杂度收束到统一入口，让团队继续专注交付。

直连模型服务商

每个团队都在重复建设基础能力

不同服务商使用不同 SDK，每次接入都像一个新项目
没有统一限流，一个异常循环就可能影响所有业务
费用在账单生成前难以及时发现和治理
模型密钥散落在各个服务和团队中
缺少安全护栏和审计记录，AI 功能难以放心开放给客户

使用 AISIX

用一个平台更快交付 AI 功能

一个兼容 OpenAI 的 API，接入一次，后续无需反复改写
组织级限流与预算，扩展 AI 流量时避免意外成本
每次调用都有记录，清楚看见请求、延迟、错误和费用
密钥集中加密管理，降低凭证泄露和运维风险
安全护栏、重试和故障转移，让 AI 能力更稳地进入生产环境

切换模型，不需要切换代码

把现有 OpenAI SDK 指向 AISIX，就可以访问主流模型服务商。无需为每个服务商维护独立 SDK，也不用被单一模型平台绑定。

兼容 OpenAI 的聊天、流式响应（SSE）、Embedding、Rerank、音频和图像接口，同时支持兼容 Anthropic 的 /v1/messages。
虚拟模型与路由模型 可以把一个模型名称映射到不同服务商和区域。
云厂商模型服务 支持 AWS Bedrock、Azure OpenAI、GCP Vertex AI，也可以接入模型服务商的直接 API。

一个接口，连接多种模型服务

OpenAIAnthropicGoogle GeminiDeepSeek AWS BedrockAzure OpenAIVertex AIMistral GroqCohereQwenTogetherFireworks 还有 100+ 服务商

在一个控制台，
管理完整 AI 网关

跨环境查看请求量、延迟、错误、费用和模型健康状态，无需从零搭建监控面板。

AISIX Cloud 控制台概览，展示请求量、p50 和 p99 延迟、错误率、今日成本、24 小时请求与成本图表以及实例健康状态。

AI 上生产所需的关键能力，
都在一个平台里

从第一个原型到生产级流量，AISIX 内置模型路由、限流、安全、可观测性和成本治理能力。

发布和切换模型，无需改写应用代码。 将任意模型别名映射到 OpenAI、Anthropic、Bedrock、Vertex、Groq 等服务商，并结合加权负载均衡、自动故障转移、健康检查、语义路由和成本优先路由。

AISIX 模型管理页面，将 gpt-4o、claude-3-7-sonnet、bedrock-claude-prod、gemini-flash 等模型别名映射到上游服务商和 API 地址。

让 AI 流量稳定扩展到生产规模。 支持滑动窗口请求限流（RPM / RPD）、令牌限流（TPM / TPD）和并发上限，可按密钥、团队或服务商账号设置，并通过 Redis 在多副本间同步。

更有信心地把 AI 能力开放给客户。 在输入前和输出后执行检查，包括关键词与正则拦截、PII 脱敏（Presidio）、Prompt 注入检测与内容审核（Lakera、OpenAI Moderation、Llama-Guard），以及按密钥控制模型访问权限。

AISIX 安全护栏页面，展示竞品词拦截、PII 脱敏和 Prompt 注入防护策略，可按密钥或模型生效。

把预算投入到真正有效的 AI 能力上。 跨环境、密钥和成员查看当月费用，支持按密钥和组织设置预算，在 75%、90%、100% 阈值触发告警，并按模型跟踪成本和设置硬性上限。

AISIX 用量与费用页面，展示组织月度预算、当月请求数、成本最高模型，以及按环境和成员拆分的费用。

真正的网关基础设施，而不是脚本语言转发代理

很多 AI 网关只是应用热路径上的一层脚本代理。AISIX 是为 AI 流量重新构建的网关基础设施。

Rust 构建

亚毫秒级代理开销，没有垃圾回收停顿；无状态数据面可以随流量水平扩展。

Apache-2.0 开源

可以用单个二进制文件自托管完整网关，免费使用，避免锁定；也可以选择托管版 AISIX Cloud。

来自 Apache APISIX 团队

API7.ai 是 Apache APISIX 的创造者，积累多年生产级网关工程经验，并将这些经验带到 LLM 与 AI 智能体场景。

VPC

云上托管或部署到自己的 VPC

几分钟即可使用托管云服务，也可以把控制面和数据面全部部署在企业自己的基础设施中。

面向规模化场景准备

SOC 2 Type IIISO 27001GDPRHIPAASSO（SAML / OIDC）审计日志

交付真正推动业务增长的 AI 能力

兼容 OpenAI。把现有 SDK 指向 AISIX，即可开始接入与治理多模型流量。免费开始，无需信用卡。

免费开始在 GitHub 查看

微信咨询

获取方案

让 AI 成为业务优势而不是成本中心

不要让 AI 基础设施，拖慢产品节奏