Apache APISIX 原创团队打造

从免费开始,在 AI 流量增长时平滑扩展

先免费交付第一个 AI 功能,随着流量增长再升级到托管服务或企业版。AISIX AI 网关提供开源核心、统一模型入口、成本治理、安全审计和企业级部署能力。

免费开始
查看文档

|

查看开源项目

亚毫秒级

代理额外开销

100+

可接入模型服务商

OpenAI

兼容接口

Apache-2.0

开源核心

AI 网关定价

随 AI 流量增长而扩展的价格方案

从免费验证开始,生产阶段升级到托管服务;如需更高配额、安全合规或私有化部署,可进入企业版。

开发者版

适合快速验证第一个 AI 功能,免费使用托管服务。

$0

/ 月

每月 10 万次可记录请求

超过 10 万次后流量继续转发,超出部分不再计入日志和分析。

直连模型服务商,兼容 OpenAI 接口

1 个环境、1 个数据面、1 名成员

请求日志保留 3 天

密钥轮换与社交账号登录

社区支持

最受欢迎

团队版

适合把 AI 功能带入生产环境,并开始治理成本与稳定性。

$149

/ 月

每月 100 万次可记录请求

超出后按每 100 万次 100 美元计费,持续超过 500 万次建议升级企业版。

开始使用

包含开发者版全部能力

模型路由、负载均衡、重试与故障转移

预算、限流和提示词 / 响应安全治理

基于角色的权限、团队管理与响应缓存

25 名成员、3 个环境、3 个数据面

日志保留 30 天,标准服务等级

企业版

适合在组织范围内规模化落地 AI 应用,并满足安全、合规和支持要求。

定制

每月 1000 万次以上可记录请求

配额、超额费用、部署方式和服务等级均可按企业需求定制。

包含团队版全部能力

支持 AWS Bedrock、Azure OpenAI、GCP Vertex AI

组织管理、单点登录和审计日志

自定义安全治理钩子与语义缓存

SOC 2 Type II、ISO 27001、GDPR、HIPAA

私有化 / VPC 部署与专属支持

开源项目或已融资初创企业?可以申请免费团队版,完整团队能力免费开放,最终以用量限制和审核结果为准。

希望自托管?AISIX 采用 Apache-2.0 许可证开源,您可以免费自行部署完整网关。

查看 GitHub

什么是可记录请求?

凡是经过网关路由并写入日志的调用都会计入,包括错误响应。一次流式响应按一次请求计算。

免费版不会阻断流量

开发者版超过 10 万次后,流量仍会继续转发,只是超出部分不进入日志和分析,避免验证阶段被意外中断。

超额成本可预期

团队版超过 100 万次后,按每 100 万次 100 美元追加计费,生产流量不会因为额度触顶而中断。

已上架 AWS Marketplace

可通过现有 AWS 账号完成采购并统一账单管理,也可用于符合条件的 AWS 承诺消费计划。

在 AWS Marketplace 查看

构建、发布和规模化 AI 应用所需的完整能力

横向比较不同方案在多模型管理、路由可靠性、限流、成本控制、安全治理、可观测性和部署合规上的差异。

横向滑动查看完整对比

功能开发者版

$0

团队版

$149 / 月

企业版

定制

用量与配额
每月可记录请求

10 万次

100 万次

1000 万次+

成员数

1

25

不限

环境数量

1

3

不限

数据面数量

1

3

不限

日志保留

3 天

30 天

定制

指标保留

30 天

90 天

定制

月度超额策略

不记录超出部分

$100 / 100 万次

定制

AI 网关核心能力
统一 OpenAI 兼容接口
对话补全与流式响应
Anthropic 兼容接口
向量、重排、音频与图像生成接口
模型透传与调试台
虚拟模型与路由模型

-

多模型组合与评估

-

模型服务商
OpenAI、Anthropic、Gemini、DeepSeek
20+ 常用模型服务商
通过 OpenAI 兼容接口接入 100+ 服务商
AWS Bedrock、Azure OpenAI、GCP Vertex AI

-

-

路由与可靠性
加权负载均衡

-

自动重试

-

错误或 429 时故障转移

-

上游健康检查

-

语义路由

-

-

成本优先路由

-

-

限流与成本控制
请求级限流

-

令牌级限流

-

并发限制

-

按团队 / 成员配置限流

-

按密钥、组织、环境、服务商设置预算

-

预算预警与按模型成本分析

-

缓存与安全治理
精确匹配响应缓存

-

内存与 Redis 缓存后端

-

缓存节省成本统计

-

语义缓存

-

-

关键词 / 正则安全治理

-

云安全护栏、敏感信息脱敏与内容审核

-

-

自定义安全治理钩子

-

-

可观测性与组织管理
请求访问日志
用量与成本分析看板

基础版

Prometheus 指标与 OpenTelemetry 链路导出

-

告警

-

数据湖 / 对象存储导出

-

-

密钥管理、轮换与模型白名单
个人访问令牌
基于角色的权限与团队管理

-

组织管理、单点登录和审计日志

-

-

部署、合规与支持
托管服务
模型服务商密钥静态加密
自托管 / 本地部署选项

-

-

私有化 / VPC 部署

-

-

SOC 2 Type II、ISO 27001、GDPR、HIPAA

-

-

数据隔离与企业合规协议

-

-

支持方式

社区支持

标准支持

专属支持

服务等级

-

标准

定制

企业级安全

当 AI 应用进入规模化阶段,安全、合规和组织治理同步就绪

在企业自己的云环境或 VPC 中运行 AISIX AI 网关,统一执行组织级策略,满足审计与合规要求,并获得专属团队支持与服务等级保障。

SOC 2 Type IIISO 27001GDPRHIPAA

单点登录

支持 SAML / OIDC

私有化 / VPC

运行在企业自己的云环境

组织管理

跨团队统一策略

审计日志

变更行为可追踪

数据隔离

密钥加密与隔离管理

专属支持

上线辅导与服务等级保障

常见问题

AISIX AI 网关会对令牌或模型调用加价吗?

+

不会。您使用自己的模型服务商密钥,并直接向 OpenAI、Anthropic 等模型服务商支付费用。AISIX AI 网关只按产品方案收费,不对模型令牌加价。

AISIX AI 网关和大模型转发代理有什么区别?

+

常见转发代理通常代持模型账号并转售模型访问能力,企业需要接受第三方的共享限流、数据路径和加价方式。AISIX AI 网关是企业自己的网关入口,连接企业自己的模型服务商密钥,并提供路由、故障转移、限流、预算、安全治理和可观测性。

哪些请求会计入每月配额?

+

经过网关路由并被记录的调用会计入配额,包括错误响应。一次流式响应按一次请求计算。

达到配额上限后会发生什么?

+

开发者版超过 10 万次后,流量继续转发,超出部分不再记录。团队版超过 100 万次后,会按每额外 100 万次 100 美元追加计费,流量不会因此中断。

可以自托管 AISIX 吗?

+

可以。AISIX 采用 Apache-2.0 许可证开源,企业可以自行部署开源核心。托管版本在此基础上提供控制面、看板、预算、权限和服务等级等企业能力,企业版也支持部署到自己的云环境或 VPC。

支持哪些模型服务商?

+

可通过统一的 OpenAI 兼容接口接入 100+ 模型服务商,包括 OpenAI、Anthropic、Gemini、DeepSeek、Groq、Mistral、Cohere、通义千问等。AWS Bedrock、Azure OpenAI、GCP Vertex AI 等云上模型服务商适用于企业版。

单点登录、审计日志和合规如何支持?

+

组织管理、SAML / OIDC 单点登录、审计日志以及 SOC 2 Type II、ISO 27001、GDPR、HIPAA 等合规能力属于企业版范围,可结合部署方式和合规要求进一步评估。

模型密钥和数据如何保护?

+

托管服务中,模型服务商密钥会静态加密,并仅在请求时解密使用;不同环境的数据面使用独立的密钥空间。自托管模式下,数据和密钥均保留在企业自己的基础设施中。

AI 网关会增加多少延迟?

+

AISIX 数据面采用原生 Rust 代理,目标是将代理开销控制在亚毫秒级。相较于大模型推理耗时,网关额外开销通常很低,具体仍建议结合真实流量压测确认。

用可治理的方式交付 AI 应用

通过统一的 OpenAI 兼容接口接入模型服务商,先免费开始,再根据流量、成本、安全和合规要求逐步扩展。

免费开始

微信咨询

获取方案