来自 Apache APISIX 原创团队

让 AI 成为业务优势
而不是成本中心

AISIX 是面向 LLM 与 AI 智能体的开源 AI 网关。用一个兼容 OpenAI 的 API 连接所有模型,让团队在几天内交付 AI 功能,并把真正产生价值的能力稳定扩展到生产环境。

python
from openai import OpenAI
client = OpenAI(
    base_url="https://your-aisix-gateway/v1",  # 指向 AISIX
    api_key="AISIX_API_KEY",
)
# 原有 OpenAI 代码无需改写
resp = client.chat.completions.create(
    model="gpt-4o",  # 也可以是 Claude、Gemini、DeepSeek 等 100+ 模型
    messages=[{"role": "user", "content": "Hello"}],
)
亚毫秒
代理开销
100+
LLM 服务商
100%
兼容 OpenAI
Apache-2.0
开源核心

不要让 AI 基础设施,
拖慢产品节奏

第一次调用模型很简单。第 50 个服务、第 10 个模型,以及第一次面向客户的线上故障,才是真正的复杂度。AI 网关把这些复杂度收束到统一入口,让团队继续专注交付。

直连模型服务商

每个团队都在重复建设基础能力

  • 不同服务商使用不同 SDK,每次接入都像一个新项目
  • 没有统一限流,一个异常循环就可能影响所有业务
  • 费用在账单生成前难以及时发现和治理
  • 模型密钥散落在各个服务和团队中
  • 缺少安全护栏和审计记录,AI 功能难以放心开放给客户
使用 AISIX

用一个平台更快交付 AI 功能

  • 一个兼容 OpenAI 的 API,接入一次,后续无需反复改写
  • 组织级限流与预算,扩展 AI 流量时避免意外成本
  • 每次调用都有记录,清楚看见请求、延迟、错误和费用
  • 密钥集中加密管理,降低凭证泄露和运维风险
  • 安全护栏、重试和故障转移,让 AI 能力更稳地进入生产环境

切换模型,不需要切换代码

把现有 OpenAI SDK 指向 AISIX,就可以访问主流模型服务商。无需为每个服务商维护独立 SDK,也不用被单一模型平台绑定。

  • 兼容 OpenAI 的聊天、流式响应(SSE)、Embedding、Rerank、音频和图像接口,同时支持兼容 Anthropic 的 /v1/messages
  • 虚拟模型与路由模型 可以把一个模型名称映射到不同服务商和区域。
  • 云厂商模型服务 支持 AWS Bedrock、Azure OpenAI、GCP Vertex AI,也可以接入模型服务商的直接 API。
一个接口,连接多种模型服务
OpenAIAnthropicGoogle GeminiDeepSeek AWS BedrockAzure OpenAIVertex AIMistral GroqCohereQwenTogetherFireworks 还有 100+ 服务商

在一个控制台,
管理完整 AI 网关

跨环境查看请求量、延迟、错误、费用和模型健康状态,无需从零搭建监控面板。

AISIX Cloud 控制台概览,展示请求量、p50 和 p99 延迟、错误率、今日成本、24 小时请求与成本图表以及实例健康状态。

AI 上生产所需的关键能力,
都在一个平台里

从第一个原型到生产级流量,AISIX 内置模型路由、限流、安全、可观测性和成本治理能力。

发布和切换模型,无需改写应用代码。 将任意模型别名映射到 OpenAI、Anthropic、Bedrock、Vertex、Groq 等服务商,并结合加权负载均衡、自动故障转移、健康检查、语义路由和成本优先路由。

AISIX 模型管理页面,将 gpt-4o、claude-3-7-sonnet、bedrock-claude-prod、gemini-flash 等模型别名映射到上游服务商和 API 地址。

让 AI 流量稳定扩展到生产规模。 支持滑动窗口请求限流(RPM / RPD)、令牌限流(TPM / TPD)和并发上限,可按密钥、团队或服务商账号设置,并通过 Redis 在多副本间同步。

AISIX 限流页面,展示按密钥、团队和服务商账号配置每分钟请求数与令牌预算。

更有信心地把 AI 能力开放给客户。 在输入前和输出后执行检查,包括关键词与正则拦截、PII 脱敏(Presidio)、Prompt 注入检测与内容审核(Lakera、OpenAI Moderation、Llama-Guard),以及按密钥控制模型访问权限。

AISIX 安全护栏页面,展示竞品词拦截、PII 脱敏和 Prompt 注入防护策略,可按密钥或模型生效。

把预算投入到真正有效的 AI 能力上。 跨环境、密钥和成员查看当月费用,支持按密钥和组织设置预算,在 75%、90%、100% 阈值触发告警,并按模型跟踪成本和设置硬性上限。

AISIX 用量与费用页面,展示组织月度预算、当月请求数、成本最高模型,以及按环境和成员拆分的费用。

真正的网关基础设施,而不是脚本语言转发代理

很多 AI 网关只是应用热路径上的一层脚本代理。AISIX 是为 AI 流量重新构建的网关基础设施。

Rs

Rust 构建

亚毫秒级代理开销,没有垃圾回收停顿;无状态数据面可以随流量水平扩展。

OS

Apache-2.0 开源

可以用单个二进制文件自托管完整网关,免费使用,避免锁定;也可以选择托管版 AISIX Cloud。

A6

来自 Apache APISIX 团队

API7.ai 是 Apache APISIX 的创造者,积累多年生产级网关工程经验,并将这些经验带到 LLM 与 AI 智能体场景。

VPC

云上托管或部署到自己的 VPC

几分钟即可使用托管云服务,也可以把控制面和数据面全部部署在企业自己的基础设施中。

面向规模化场景准备
SOC 2 Type IIISO 27001GDPRHIPAASSO(SAML / OIDC)审计日志

交付真正推动业务增长的 AI 能力

兼容 OpenAI。把现有 SDK 指向 AISIX,即可开始接入与治理多模型流量。免费开始,无需信用卡。

微信咨询

获取方案