Cloud Storage簡介
Cloud Storage (GCS) 為Google新一代Object Storage,以Google Datacenter的規模,提供GCP的開發者使用。是為具備高性能、全球網際網路存取規模之固定的BLOB(Binary Large Object)儲存裝置... GCS並非檔案系統(可從 Cloud Storage Fuse 之類的第三方工具,以類似檔案系統的方式進行存取),提供使用者以Google Web Console介面或是SDK以及RESTful API的方式存取。
GCS提供簡單的管理作業介面,提供使用者無需花費心力去管理容量,且資料無論是在使用中或閒置中一律維持加密的狀態等優點,讓GCS資料存放具備高可用性與高安全性等特色。
Cloud Storage的Class種類
依據不同使用者的需求,GCS提供四種不同類別(Class)的儲存方案,主要差異在儲存的複製份數與區域,以及價格上的差異。
Multi Region: 為具有地理性備援能力的儲存裝置層級,可用性與效能為最高等級。適合為跨區域的使用者提供低延遲、高QPS的服務。
Regional: 在指定的一個區域內的可用性與效能為最高等級。適用於特定區域中的運算、分析、機器學習等工作負載。
Nearline: 適用於資料的存取頻率為 1 個月不到 1 次的用途,為高速、低成本、高耐用性的儲存裝置。
Codeline: 適用於資料的存取頻率為 1 年不到 1 次的用途,為高速、低成本、高耐用性的儲存裝置。
關於儲存服務的價格,可以參考:https://cloud.google.com/storage/pricing
Cloud Storage的各項功能
Cloud Storage本身以分散式儲存的方式將上傳的物件進行切割(sharding)與複製(replicate),然後儲存到多個儲存體,在Google安全性保護下,儲存的檔案本身在傳輸過程會有SSL加密與Oauth2的認證保護,資料進入Google資料中心後,儲存到磁碟也會有AES的加密保護,讓資料的傳輸、儲存都更有保障。除此之外,GCS也提供許多其他的加值功能...
用戶端工具 - gsutil
GCS提供用戶端工具gsutl,預設提供於gcloud工具安裝後即可執行... gsutil使用方式與linux指令類似,下面為幾個常用的gsutil指令...
建立bucket:
複製檔案到bucket
複製檔案到local
刪除GCS檔案
更多gsutil用法,可以參考:https://cloud.google.com/storage/docs/gsutil/commands/acl
針對物件與Bucket可以設定專屬的ACL
針對每個Bucket與物件均可以設定所屬的ACL(Access Control List),設定同意哪些對象可以讀寫、唯獨或分享您的資源。權限的授權可以是Google Account, Gsuite Account, Gsuite Domain, Google Group與Service Account等。
簡單的授權動作可以在Web Console上操作,也可以透過gsutil指令來執行...
Dump某個bucket內某個物件的ACL到acl.txt檔案:
將設定好的權限檔案設定到某個bucket內的某個文件:
Regional儲存
GCS提供建立Bucket的時候,指定Bucket所屬的Region或Zone,透過這些指定,可以讓您的資料鎖定在所指定的地區,以符合一些特定服務的規範。如果需要進一步管理資料所在地區,可以透過限定地區的方式提供資料儲存的Bucket。反之,如果希望資料以多Region的方式備份,則可以選用Multi Region的方案,讓GCS Bucket預設以跨Region的高可用性提供服務。
物件生命週期 / Object Lifecycle
GCS提供Bucket階段設定物件生命週期,讓物件可以透過設定生命週期參數後,在指定的時間到達時進行指定的動作(目前物件動作可以為刪除或是更換物件的Class)。
例如:以下acl.json檔案指定對象在365天之後,進行刪除動作。
將這個設定檔,使用lifecycle的指令設定到指定的Bucket中
設定無誤後,可以透過lifecycle get的方式查詢。
更進一步資訊可參考:https://cloud.google.com/storage/docs/lifecycle
物件版本功能 / Object Versioning
GCS提供一般的物件存放之外,也提供物件以附加版本號碼的方式存放,讓相同名稱的物件可以在存放在相同的Bucket中,需要時候,可以附加版號來取用該版本的物件內容。
首先啟用Bucket的版本功能...
然後模擬使用不同的內容但相同檔案名稱去存放到GCS上...
關於存放檔案的版本內容部分,我們可以使用gsutil ls -a來檢視物件的版號
然後透過gsutil cat加上物件版號,即可取到該版本的內容...
Transfer Service / Online Import
Google提供想要將資料上傳到GCS的用戶,可以透過Transfer Service,也就是Online Import的方式來傳輸檔案,您可以至Web Console的Storage頁面,透過Wizard的設定來將檔案傳輸到GCS上。
目前Transfer Service支援:
Google Cloud Storage bucket
AWS S3 bucket
Object URLs
想要更了解Transfer Service,可以參考:https://cloud.google.com/storage/transfer/create-manage-transfer-console
Offline Import
除了Online Import的方式外,Google也提供需要在第一時間上傳大量資料的用戶,直接將硬碟打包後郵寄至Google指定的服務提供商,然後由Google協助將資料上傳的方式。Offline Import適合有需要將大量資料上傳到Google的用戶,且上傳的頻寬不足或考慮上傳時間過久的用戶。
Object Change Notification
為了提供開發者可以監控Bucket中物件的動態,GCS提供Object Change Notification來觸動使用者設定的Webhook,讓Bucket中有任何物件上傳或異動都可以直接反映到用戶的系統。類似的功能可以應用在終端用戶上傳照片檔案後,系統需要抓取檔案來進行格式的特別轉檔或設定的情境,使用者只要準備好Webhook接收GCS的資訊,然後針對上傳的檔案來進行操作。
Website Bucket
GCS的另一項好用的功能 - Website Bucket,是可以透過GCS的儲存能力來作為使用者存放靜態網頁檔案的地方,然後透過DNS CNAME的對應後,即可將GCS當作靜態網頁伺服器使用。Website Bucket的提供可以免除使用者想要提供像官方網站或是產品網站的靜態網頁,卻又希望可以不用架設Web Server的用戶,也可以順便省下主機的成本。
想更近一步了解Website Bucket的建置,可以參考下面章節:設定Website Bucket
Load Balancer & CDN Bucket
除了使用Website Bucket來當作靜態網頁使用之外,GCS也提供使用Load Balancer的掛載方式,讓GCS作為Load Balancer的Backend,並掛載Frontend IP來轉導使用者的需求到背後的Backend Bucket。透過Load Balancer掛載GCS Bucket的另一個好處,是可以透過Load Balancer的CDN功能提供Bucket內物件在存取的過程當中可以透過CDN來進行Cache,讓存取可以透過CDN更加快速。
想更進一步了解Load Balancer與CDN Bucket,可以參考下面章節:透過HTTP(S) Load Balancer幫GCS加上CDN
Last updated