亚毫秒级
代理额外开销
100+
可接入模型服务商
OpenAI
兼容接口
Apache-2.0
开源核心
AI 网关定价
从免费验证开始,生产阶段升级到托管服务;如需更高配额、安全合规或私有化部署,可进入企业版。
适合快速验证第一个 AI 功能,免费使用托管服务。
$0
/ 月
每月 10 万次可记录请求
超过 10 万次后流量继续转发,超出部分不再计入日志和分析。
直连模型服务商,兼容 OpenAI 接口
1 个环境、1 个数据面、1 名成员
请求日志保留 3 天
密钥轮换与社交账号登录
社区支持
适合把 AI 功能带入生产环境,并开始治理成本与稳定性。
$149
/ 月
每月 100 万次可记录请求
超出后按每 100 万次 100 美元计费,持续超过 500 万次建议升级企业版。
开始使用包含开发者版全部能力
模型路由、负载均衡、重试与故障转移
预算、限流和提示词 / 响应安全治理
基于角色的权限、团队管理与响应缓存
25 名成员、3 个环境、3 个数据面
日志保留 30 天,标准服务等级
适合在组织范围内规模化落地 AI 应用,并满足安全、合规和支持要求。
定制
每月 1000 万次以上可记录请求
配额、超额费用、部署方式和服务等级均可按企业需求定制。
包含团队版全部能力
支持 AWS Bedrock、Azure OpenAI、GCP Vertex AI
组织管理、单点登录和审计日志
自定义安全治理钩子与语义缓存
SOC 2 Type II、ISO 27001、GDPR、HIPAA
私有化 / VPC 部署与专属支持
开源项目或已融资初创企业?可以申请免费团队版,完整团队能力免费开放,最终以用量限制和审核结果为准。
希望自托管?AISIX 采用 Apache-2.0 许可证开源,您可以免费自行部署完整网关。
查看 GitHub凡是经过网关路由并写入日志的调用都会计入,包括错误响应。一次流式响应按一次请求计算。
开发者版超过 10 万次后,流量仍会继续转发,只是超出部分不进入日志和分析,避免验证阶段被意外中断。
团队版超过 100 万次后,按每 100 万次 100 美元追加计费,生产流量不会因为额度触顶而中断。
已上架 AWS Marketplace
可通过现有 AWS 账号完成采购并统一账单管理,也可用于符合条件的 AWS 承诺消费计划。
横向比较不同方案在多模型管理、路由可靠性、限流、成本控制、安全治理、可观测性和部署合规上的差异。
横向滑动查看完整对比
| 功能 | 开发者版 $0 | 团队版 $149 / 月 | 企业版 定制 |
|---|---|---|---|
| 用量与配额 | |||
| 每月可记录请求 | 10 万次 | 100 万次 | 1000 万次+ |
| 成员数 | 1 | 25 | 不限 |
| 环境数量 | 1 | 3 | 不限 |
| 数据面数量 | 1 | 3 | 不限 |
| 日志保留 | 3 天 | 30 天 | 定制 |
| 指标保留 | 30 天 | 90 天 | 定制 |
| 月度超额策略 | 不记录超出部分 | $100 / 100 万次 | 定制 |
| AI 网关核心能力 | |||
| 统一 OpenAI 兼容接口 | |||
| 对话补全与流式响应 | |||
| Anthropic 兼容接口 | |||
| 向量、重排、音频与图像生成接口 | |||
| 模型透传与调试台 | |||
| 虚拟模型与路由模型 | - | ||
| 多模型组合与评估 | - | ||
| 模型服务商 | |||
| OpenAI、Anthropic、Gemini、DeepSeek | |||
| 20+ 常用模型服务商 | |||
| 通过 OpenAI 兼容接口接入 100+ 服务商 | |||
| AWS Bedrock、Azure OpenAI、GCP Vertex AI | - | - | |
| 路由与可靠性 | |||
| 加权负载均衡 | - | ||
| 自动重试 | - | ||
| 错误或 429 时故障转移 | - | ||
| 上游健康检查 | - | ||
| 语义路由 | - | - | |
| 成本优先路由 | - | - | |
| 限流与成本控制 | |||
| 请求级限流 | - | ||
| 令牌级限流 | - | ||
| 并发限制 | - | ||
| 按团队 / 成员配置限流 | - | ||
| 按密钥、组织、环境、服务商设置预算 | - | ||
| 预算预警与按模型成本分析 | - | ||
| 缓存与安全治理 | |||
| 精确匹配响应缓存 | - | ||
| 内存与 Redis 缓存后端 | - | ||
| 缓存节省成本统计 | - | ||
| 语义缓存 | - | - | |
| 关键词 / 正则安全治理 | - | ||
| 云安全护栏、敏感信息脱敏与内容审核 | - | - | |
| 自定义安全治理钩子 | - | - | |
| 可观测性与组织管理 | |||
| 请求访问日志 | |||
| 用量与成本分析看板 | 基础版 | ||
| Prometheus 指标与 OpenTelemetry 链路导出 | - | ||
| 告警 | - | ||
| 数据湖 / 对象存储导出 | - | - | |
| 密钥管理、轮换与模型白名单 | |||
| 个人访问令牌 | |||
| 基于角色的权限与团队管理 | - | ||
| 组织管理、单点登录和审计日志 | - | - | |
| 部署、合规与支持 | |||
| 托管服务 | |||
| 模型服务商密钥静态加密 | |||
| 自托管 / 本地部署选项 | - | - | |
| 私有化 / VPC 部署 | - | - | |
| SOC 2 Type II、ISO 27001、GDPR、HIPAA | - | - | |
| 数据隔离与企业合规协议 | - | - | |
| 支持方式 | 社区支持 | 标准支持 | 专属支持 |
| 服务等级 | - | 标准 | 定制 |
企业级安全
在企业自己的云环境或 VPC 中运行 AISIX AI 网关,统一执行组织级策略,满足审计与合规要求,并获得专属团队支持与服务等级保障。
单点登录
支持 SAML / OIDC
私有化 / VPC
运行在企业自己的云环境
组织管理
跨团队统一策略
审计日志
变更行为可追踪
数据隔离
密钥加密与隔离管理
专属支持
上线辅导与服务等级保障
AISIX AI 网关会对令牌或模型调用加价吗?
+
不会。您使用自己的模型服务商密钥,并直接向 OpenAI、Anthropic 等模型服务商支付费用。AISIX AI 网关只按产品方案收费,不对模型令牌加价。
AISIX AI 网关和大模型转发代理有什么区别?
+
常见转发代理通常代持模型账号并转售模型访问能力,企业需要接受第三方的共享限流、数据路径和加价方式。AISIX AI 网关是企业自己的网关入口,连接企业自己的模型服务商密钥,并提供路由、故障转移、限流、预算、安全治理和可观测性。
哪些请求会计入每月配额?
+
经过网关路由并被记录的调用会计入配额,包括错误响应。一次流式响应按一次请求计算。
达到配额上限后会发生什么?
+
开发者版超过 10 万次后,流量继续转发,超出部分不再记录。团队版超过 100 万次后,会按每额外 100 万次 100 美元追加计费,流量不会因此中断。
可以自托管 AISIX 吗?
+
可以。AISIX 采用 Apache-2.0 许可证开源,企业可以自行部署开源核心。托管版本在此基础上提供控制面、看板、预算、权限和服务等级等企业能力,企业版也支持部署到自己的云环境或 VPC。
支持哪些模型服务商?
+
可通过统一的 OpenAI 兼容接口接入 100+ 模型服务商,包括 OpenAI、Anthropic、Gemini、DeepSeek、Groq、Mistral、Cohere、通义千问等。AWS Bedrock、Azure OpenAI、GCP Vertex AI 等云上模型服务商适用于企业版。
单点登录、审计日志和合规如何支持?
+
组织管理、SAML / OIDC 单点登录、审计日志以及 SOC 2 Type II、ISO 27001、GDPR、HIPAA 等合规能力属于企业版范围,可结合部署方式和合规要求进一步评估。
模型密钥和数据如何保护?
+
托管服务中,模型服务商密钥会静态加密,并仅在请求时解密使用;不同环境的数据面使用独立的密钥空间。自托管模式下,数据和密钥均保留在企业自己的基础设施中。
AI 网关会增加多少延迟?
+
AISIX 数据面采用原生 Rust 代理,目标是将代理开销控制在亚毫秒级。相较于大模型推理耗时,网关额外开销通常很低,具体仍建议结合真实流量压测确认。
微信咨询
获取方案