近期有機會來比較一下 AWS 和 GCP 的一些差別，也看了一些文章(~~練英文QQ~~)。 GCP 和 AWS 都有 auto scaling 的功能，當我們在某些時候，需要比較多的資源處理事情時，可以自動增加機器來維持高 reliability。那這部分 GCP 和 AWS 有甚麼區別呢 ?

簡介

Cloud compute 通常被視為一種 ethereal resource ，即可以自由啟動並關閉，然後按秒計費。概念上資源看起來是無限的，這也是與 on-prem 相比的優勢和賣點之一。 可以根據 loading 進行 scale，且不需要的時候可以移除。

但實際上資源並不是無限的。 Cloud 還是一個在真實世界的機房，故機房內的 CPU 和 GPU 還是有其上限數量。因此 當我們需要spin up VM 時，還是可能會有 resource availability issues。還是可能在需要時，機器不夠用…

Benchmarking Harness

在 gcp 和 aws 上配置需要的 GPU 資源，然後在一天中的隨機時間啟動 GPU，更進一步設計一天中有不同時段 loading 來模擬真實世界狀況。

在兩週的時間裡，大約啟動了了 3,000 個 T4 GPU。

The results are pretty staggering !! AWS 很平均的約 11.4 秒生成一個新的 GPU。但 GCP 平均卻要 42.6 秒…

進一步考慮一下兩家 cloud vendors 的差異:

先不考慮那些超時200秒的部分(下次再討論)，看起來 GCP 無法快速的創建 VM。故:

ethereal[ɪˋθɪrɪəl] : 注意念法

adj. 如空氣般輕的；飄逸的；精緻的；縹緲的；天上的；非人間的

launch[lɔ:ntʃ] : 注意念法，不要念成午餐

spin up

軟體工程師的範圍，以上常當作開機

on-prem: 注意念法 premises[ˋprɛmɪsɪz] :

軟體工程師的範圍，以上常當作 cloud 的反義字，概念上是 local

excess[ɛkˋsɛs]: 注意念法，不要念成 exist

n.超越

adj.過量的

benchmarking harness:

n. 基準測試框架

staggering[ˋstægərɪŋ]:

adj.搖晃欲倒的；驚人的