Apache APISIX 原创团队打造

从免费开始，在 AI 流量增长时平滑扩展

先免费交付第一个 AI 功能，随着流量增长再升级到托管服务或企业版。AISIX AI 网关提供开源核心、统一模型入口、成本治理、安全审计和企业级部署能力。

免费开始

查看文档

查看开源项目

亚毫秒级

代理额外开销

100+

可接入模型服务商

OpenAI

兼容接口

Apache-2.0

开源核心

AI 网关定价

随 AI 流量增长而扩展的价格方案

从免费验证开始，生产阶段升级到托管服务；如需更高配额、安全合规或私有化部署，可进入企业版。

开发者版

适合快速验证第一个 AI 功能，免费使用托管服务。

/ 月

每月 10 万次可记录请求

超过 10 万次后流量继续转发，超出部分不再计入日志和分析。

直连模型服务商，兼容 OpenAI 接口

1 个环境、1 个数据面、1 名成员

请求日志保留 3 天

密钥轮换与社交账号登录

社区支持

最受欢迎

团队版

适合把 AI 功能带入生产环境，并开始治理成本与稳定性。

$149

/ 月

每月 100 万次可记录请求

超出后按每 100 万次 100 美元计费，持续超过 500 万次建议升级企业版。

开始使用

包含开发者版全部能力

模型路由、负载均衡、重试与故障转移

预算、限流和提示词 / 响应安全治理

基于角色的权限、团队管理与响应缓存

25 名成员、3 个环境、3 个数据面

日志保留 30 天，标准服务等级

企业版

适合在组织范围内规模化落地 AI 应用，并满足安全、合规和支持要求。

定制

每月 1000 万次以上可记录请求

配额、超额费用、部署方式和服务等级均可按企业需求定制。

包含团队版全部能力

支持 AWS Bedrock、Azure OpenAI、GCP Vertex AI

组织管理、单点登录和审计日志

自定义安全治理钩子与语义缓存

SOC 2 Type II、ISO 27001、GDPR、HIPAA

私有化 / VPC 部署与专属支持

开源项目或已融资初创企业？可以申请免费团队版，完整团队能力免费开放，最终以用量限制和审核结果为准。

希望自托管？AISIX 采用 Apache-2.0 许可证开源，您可以免费自行部署完整网关。

查看 GitHub

什么是可记录请求？

凡是经过网关路由并写入日志的调用都会计入，包括错误响应。一次流式响应按一次请求计算。

免费版不会阻断流量

开发者版超过 10 万次后，流量仍会继续转发，只是超出部分不进入日志和分析，避免验证阶段被意外中断。

超额成本可预期

团队版超过 100 万次后，按每 100 万次 100 美元追加计费，生产流量不会因为额度触顶而中断。

已上架 AWS Marketplace

可通过现有 AWS 账号完成采购并统一账单管理，也可用于符合条件的 AWS 承诺消费计划。

在 AWS Marketplace 查看

构建、发布和规模化 AI 应用所需的完整能力

横向比较不同方案在多模型管理、路由可靠性、限流、成本控制、安全治理、可观测性和部署合规上的差异。

横向滑动查看完整对比

功能	开发者版 $0	团队版 $149 / 月	企业版定制
用量与配额
每月可记录请求	10 万次	100 万次	1000 万次+
成员数	1	25	不限
环境数量	1	3	不限
数据面数量	1	3	不限
日志保留	3 天	30 天	定制
指标保留	30 天	90 天	定制
月度超额策略	不记录超出部分	$100 / 100 万次	定制
AI 网关核心能力
统一 OpenAI 兼容接口
对话补全与流式响应
Anthropic 兼容接口
向量、重排、音频与图像生成接口
模型透传与调试台
虚拟模型与路由模型	-
多模型组合与评估	-
模型服务商
OpenAI、Anthropic、Gemini、DeepSeek
20+ 常用模型服务商
通过 OpenAI 兼容接口接入 100+ 服务商
AWS Bedrock、Azure OpenAI、GCP Vertex AI	-	-
路由与可靠性
加权负载均衡	-
自动重试	-
错误或 429 时故障转移	-
上游健康检查	-
语义路由	-	-
成本优先路由	-	-
限流与成本控制
请求级限流	-
令牌级限流	-
并发限制	-
按团队 / 成员配置限流	-
按密钥、组织、环境、服务商设置预算	-
预算预警与按模型成本分析	-
缓存与安全治理
精确匹配响应缓存	-
内存与 Redis 缓存后端	-
缓存节省成本统计	-
语义缓存	-	-
关键词 / 正则安全治理	-
云安全护栏、敏感信息脱敏与内容审核	-	-
自定义安全治理钩子	-	-
可观测性与组织管理
请求访问日志
用量与成本分析看板	基础版
Prometheus 指标与 OpenTelemetry 链路导出	-
告警	-
数据湖 / 对象存储导出	-	-
密钥管理、轮换与模型白名单
个人访问令牌
基于角色的权限与团队管理	-
组织管理、单点登录和审计日志	-	-
部署、合规与支持
托管服务
模型服务商密钥静态加密
自托管 / 本地部署选项	-	-
私有化 / VPC 部署	-	-
SOC 2 Type II、ISO 27001、GDPR、HIPAA	-	-
数据隔离与企业合规协议	-	-
支持方式	社区支持	标准支持	专属支持
服务等级	-	标准	定制

企业级安全

当 AI 应用进入规模化阶段，安全、合规和组织治理同步就绪

在企业自己的云环境或 VPC 中运行 AISIX AI 网关，统一执行组织级策略，满足审计与合规要求，并获得专属团队支持与服务等级保障。

SOC 2 Type IIISO 27001GDPRHIPAA

单点登录

支持 SAML / OIDC

私有化 / VPC

运行在企业自己的云环境

组织管理

跨团队统一策略

审计日志

变更行为可追踪

数据隔离

密钥加密与隔离管理

专属支持

上线辅导与服务等级保障

常见问题

AISIX AI 网关会对令牌或模型调用加价吗？

不会。您使用自己的模型服务商密钥，并直接向 OpenAI、Anthropic 等模型服务商支付费用。AISIX AI 网关只按产品方案收费，不对模型令牌加价。

AISIX AI 网关和大模型转发代理有什么区别？

常见转发代理通常代持模型账号并转售模型访问能力，企业需要接受第三方的共享限流、数据路径和加价方式。AISIX AI 网关是企业自己的网关入口，连接企业自己的模型服务商密钥，并提供路由、故障转移、限流、预算、安全治理和可观测性。

哪些请求会计入每月配额？

经过网关路由并被记录的调用会计入配额，包括错误响应。一次流式响应按一次请求计算。

达到配额上限后会发生什么？

开发者版超过 10 万次后，流量继续转发，超出部分不再记录。团队版超过 100 万次后，会按每额外 100 万次 100 美元追加计费，流量不会因此中断。

可以自托管 AISIX 吗？

可以。AISIX 采用 Apache-2.0 许可证开源，企业可以自行部署开源核心。托管版本在此基础上提供控制面、看板、预算、权限和服务等级等企业能力，企业版也支持部署到自己的云环境或 VPC。

支持哪些模型服务商？

可通过统一的 OpenAI 兼容接口接入 100+ 模型服务商，包括 OpenAI、Anthropic、Gemini、DeepSeek、Groq、Mistral、Cohere、通义千问等。AWS Bedrock、Azure OpenAI、GCP Vertex AI 等云上模型服务商适用于企业版。

单点登录、审计日志和合规如何支持？

组织管理、SAML / OIDC 单点登录、审计日志以及 SOC 2 Type II、ISO 27001、GDPR、HIPAA 等合规能力属于企业版范围，可结合部署方式和合规要求进一步评估。

模型密钥和数据如何保护？

托管服务中，模型服务商密钥会静态加密，并仅在请求时解密使用；不同环境的数据面使用独立的密钥空间。自托管模式下，数据和密钥均保留在企业自己的基础设施中。

AI 网关会增加多少延迟？

AISIX 数据面采用原生 Rust 代理，目标是将代理开销控制在亚毫秒级。相较于大模型推理耗时，网关额外开销通常很低，具体仍建议结合真实流量压测确认。

用可治理的方式交付 AI 应用

通过统一的 OpenAI 兼容接口接入模型服务商，先免费开始，再根据流量、成本、安全和合规要求逐步扩展。