API 网关 APISIX 在谷歌云 T2A 和 T2D 的性能测试

更新时间 7/22/2021

背景

2022 年 7 月 13 日 Google Cloud 发布了第一个基于 Arm® 架构的 Tau T2A 的 VM 系列预览版。T2A VM 由基于 Ampere® Altra® Arm 的处理器提供支持,谷歌宣称其拥有极具吸引力的价格和卓越的单线程性能。

值得注意的是,Ampere® Altra® Arm 是一款云原生处理器,基于 Ampere® Altra® Arm 处理器的 Tau T2A 虚拟机也因此能以高效的方式运行横向扩展的云原生应用程序。

那么具体实际体验和性能如何呢?我们以一个云原生的 API 网关为例,带大家一起看看 Google Cloud Tau T2A 虚拟机的表现。这里,我们选择了 Apache APISIX 在 Google Cloud Tau T2A 服务器环境上进行安装测试。

Apache APISIX 是一个云原生、高性能、可扩展的 API 网关。基于 NGNIX + LuaJIT 和 etcd,APISIX 与传统 API 网关相比,具有动态路由和插件热加载特性,特别适合云原生架构下的 API 管理。

network error/APISIX Architecture.png

前期准备

首先需要在 Google Cloud 上启动一个 T2A 实例,操作系统选择 Ubuntu 20.04。

network error/Google Cloud T2A.png

然后安装 Docker,方便后续使用容器化的方式来安装部署 Apache APISIX。

1sudo apt-get update && sudo apt-get install docker.io

部署 Apache APISIX

Apache APISIX 使用 etcd 作为配置中心,所以这里需要先启动一个 etcd 实例。

1sudo docker run -d --name etcd \
2    -p 2379:2379 \
3    -e ETCD_UNSUPPORTED_ARCH=arm64 \
4    -e ETCD_LISTEN_CLIENT_URLS=http://0.0.0.0:2379 \
5    -e ETCD_ADVERTISE_CLIENT_URLS=http://0.0.0.0:2379 \
6    rancher/coreos-etcd:v3.4.16-arm64

启动 Apache APISIX 实例:

1sudo docker run --net=host -d apache/apisix:2.14.1-alpine

注册路由。

1curl "http://127.0.0.1:9080/apisix/admin/routes/1" \
2-H "X-API-KEY: edd1c9f034335f136f87ad84b625c8f1" -X PUT -d '
3{  
4    "uri": "/anything/*",
5    "upstream": {
6        "type": "roundrobin",
7        "nodes": {
8              "httpbin.org:80": 1
9        }
10    }
11}'

访问测试。

1curl -i http://127.0.0.1:9080/anything/das
1HTTP/1.1 200 OK
2.....

Google Cloud T2D vs Google Cloud T2A

从上述操作来看,Apache APISIX 在 Google Cloud Tau T2A 上的安装和兼容性测试都能顺利完成。那么 Google Cloud T2A 的实际性能到底如何呢?接下来我们将使用 Apache APISIX 分别在 Google Cloud T2A 和 Google Cloud T2D 上做性能测试对比,来看看其实际表现。

Google Cloud T2D 是 Google Cloud Tau 系列的另一款机型,是基于 AMD x86 架构的,所以上述 etcd 安装步骤略有不同:

1sudo docker run -d --name etcd \
2    -p 2379:2379 \
3    -e ETCD_LISTEN_CLIENT_URLS=http://0.0.0.0:2379 \
4    -e ALLOW_NONE_AUTHENTICATION=yes \
5    -e ETCD_ADVERTISE_CLIENT_URLS=http://0.0.0.0:2379 \
6    bitnami/etcd:3.4.16

为简单起见,本次测试 APISIX 中只启用了一个 Worker,以下性能测试数据均在单核 CPU 上运行。

场景一:单上游

该场景下将使用单个上游(不包含任何插件),主要测试 APISIX 在纯代理回源模式下的性能表现。在本地环境中进行测试:

1# apisix: 1 worker + 1 upstream + no plugin
2
3# 注册路由
4curl http://127.0.0.1:9080/apisix/admin/routes/1 \
5-H 'X-API-KEY: edd1c9f034335f136f87ad84b625c8f1' -X PUT -d '
6{
7    "uri": "/hello",
8    "plugins": {
9    },
10    "upstream": {
11        "type": "roundrobin",
12        "nodes": {
13            "127.0.0.1:1980":1
14        }
15    }
16}'

场景 2:单个上游 + 两个插件

该场景下将使用单个上游与两个插件进行,主要测试 APISIX 在开启 limit-countprometheus 两个核心性能消耗插件时的表现。

1# apisix: 1 worker + 1 upstream + 2 plugins (limit-count + prometheus)
2
3# 注册路由
4curl http://127.0.0.1:9080/apisix/admin/routes/1 \
5-H 'X-API-KEY: edd1c9f034335f136f87ad84b625c8f1' -X PUT -d '
6{
7    "uri": "/hello",
8    "plugins": {
9        "limit-count": {
10            "count": 2000000000000,
11            "time_window": 60,
12            "rejected_code": 503,
13            "key": "remote_addr"
14        },
15        "prometheus": {}
16    },
17    "upstream": {
18        "type": "roundrobin",
19        "nodes": {
20            "127.0.0.1:1980":1
21        }
22    }
23}'

数据比较

上述两个场景中,分别从请求 QPS(每秒查询数) 和延迟时间两个层面进行了相关的测试对比。结果如下:

  • QPS 比较

network error/QPS comparison.png

  • 请求延迟比较

network error/Latency comparison.png

network error/data comparison.png

从以上数据也可以看出,在 API Gateway 等网络 IO 密集计算场景下,T2A 相比同系列的 T2D 虚拟机,在性能上仍然有差距。不过另一个好消息是,在同等配置情况下,T2A 的价格要比 T2D 便宜 10% 左右。在实际机器选型时,用户可以根据自己的业务体量来灵活决策。

总结

本文主要使用 Apache APISIX 对比 Google Cloud T2A 和 Google Cloud T2D 的性能。可以看出,在 API 网关等网络 IO 密集计算场景中,Google Cloud T2A 相比 T2D,表现虽然不是那么亮眼,但是作为 Google Cloud 在 ARM 架构下的第一次尝试,相信其会在 ARM 架构的虚拟机上持续发力,也期待它的后续迭代表现。