Tất cả những gì bạn cần biết về Cloud Storage

Tháng Tám 30, 2021
Nga Pham

Cloud Storage là một kho lưu trữ đối tượng toàn cầu, an toàn và có thể mở rộng, được sử dụng để lưu dữ liệu bất biến như hình ảnh, văn bản, video và các định dạng tệp khác. Bạn có thể thêm dữ liệu vào hoặc truy xuất dữ liệu từ Cloud Storage thường xuyên nếu ứng dụng của bạn cần. Các đối tượng được lưu trữ có số định danh ID, siêu dữ liệu, các thuộc tính và dữ liệu thực tế. Siêu dữ liệu có thể bao gồm tất cả mọi thứ, từ phân loại bảo mật của tập tin, các ứng dụng có thể truy cập nó và những thông tin tương tự khác. ID, siêu dữ liệu và các thuộc tính khiến việc lưu trữ đối tượng trở thành lựa chọn lưu trữ hấp dẫn, phù hợp cho nhiều ứng dụng khác nhau, từ máy chủ web cho đến phân tích dữ liệu.

Các lớp lưu trữ

Bạn lưu trữ các đối tượng trong các bucket được liên kết với một dự án, và các dự án lại được nhóm lại theo tổ chức. Google Cloud Storage cung cấp bốn lớp lưu trữ dựa trên ngân sách, tính khả dụng và tần suất truy cập.

  • Bucket chuẩn: dành cho hiệu suất cao, nhu cầu truy cập thường xuyên và có tính sẵn sàng cao nhất
    – Đơn vùng hoặc vùng kép (Regional or dual-regional): dành cho dữ liệu được truy cập thường xuyên hoặc nhu cầu thông lượng cao
    – Đa vùng (Multi-region) để phát hành nội dung trên toàn cầu
  • Lưu trữ Nearline dành cho dữ liệu được truy cập ít hơn một lần mỗi tháng
  • Lưu trữ Coldline dành cho dữ liệu được truy cập gần như ít hơn một lần mỗi quý
  • Lưu trữ Archive dành cho dữ liệu mà bạn muốn cất đi trong nhiều năm (được truy cập ít hơn một lần mỗi năm)

Việc sử dụng bộ nhớ tiêu chuẩn sẽ tốn kém hơn một chút vì nó được thiết kế cho dữ liệu tồn tại trong thời gian ngắn và (hoặc) được truy cập thường xuyên. Lưu trữ Nearline, Coldline và Archive đòi hỏi chi phí lưu trữ hàng tháng thấp hơn đối với dữ liệu tồn tại lâu và ít được truy cập thường xuyên hơn.

Lựa chọn cách lưu trữ phù hợp với nhu cầu của bạn

Cloud Sotrage cho phép bạn lưu trữ dữ liệu của mình ở ba loại vị trí:

  • Regional (đơn vùng): tất cả dữ liệu của bạn được lưu trữ trong một khu vực duy nhất. Lưu trữ đơn vùng thường đòi hỏi mức giá lưu trữ hàng tháng thấp nhất và phù hợp với nhiều trường hợp sử dụng, bao gồm cả phân tích hiệu suất cao – công việc đòi hỏi vị trí máy tính và bộ nhớ của bạn phải thuộc cùng một khu vực.
  • Multi-region (Đa vùng): Tất cả dữ liệu của bạn được lưu trữ trên một lục địa nhưng bạn sẽ không thể nhìn thấy vị trí cụ thể mà dữ liệu được lưu trữ. Cách lưu trữ này có tính khả dụng cao hơn lưu trữ đơn vùng vì dữ liệu của bạn có thể phân phát từ nhiều vùng. Lưu trữ đa vùng đòi hỏi chi phí cao hơn một chút so với đơn vùng, nhưng nó là lựa chọn tuyệt vời để phân phát nội dung trên Internet.
  • Dual-regions (Vùng kép): Tất cả dữ liệu của bạn được lưu trữ tại hai khu vực cụ thể. Lưu trữ vùng kép cung cấp khả năng sẵn sàng cao và bảo vệ bạn khỏi các lỗi khu vực, đồng thời cung cấp các đặc tính hiệu suất cao của lưu trữ đơn vùng. Các khối lượng công việc quan trọng của doanh nghiệp thường được triển khai tốt nhất trên các vùng kép. Lưu trữ vùng kép cũng có thể là một lựa chọn tuyệt vời cho một hồ dữ liệu để phát trực tuyến, hay để tải lên hàng loạt dữ liệu cho các dự án lớn và dự án máy học.

Dù bạn lựa chọn vị trí nào, tất cả các lớp lưu trữ đều sẵn sàng để bạn có thể tối ưu hóa chi phí của mình theo thời gian. Bạn hoàn toàn có thể lưu trữ dữ liệu nóng nhất của mình với Standard và chuyển dữ liệu xuống các lớp lạnh hơn khi nó trở nên cũ và ít được truy cập thường xuyên hơn.

Làm thế nào để sử dụng Cloud Storage

Với Quản lý Vòng đời Đối tượng (Object Lifecycle Management), bạn có thể tự động chuyển đổi dữ liệu của mình sang các lớp chi phí thấp hơn khi chúng đạt đến một độ tuổi nhất định, hoặc khi các quy tắc vòng đời khác mà bạn thiết lập được áp dụng. Cloud Storage cũng cung cấp tính năng lập phiên bản đối tượng tự động (automatic object versioning), vì vậy bạn có thể khôi phục các phiên bản cũ hơn của đối tượng – công việc đặc biệt hữu ích để bảo vệ dữ liệu khỏi việc vô tình bị xóa.

Bạn có thể tải các đối tượng lên bucket và tải xuống các đối tượng đó từ bảng điều khiển (console) hoặc sử dụng lệnh gsutil, Storage Transfer Service, Transfer Appliance hoặc truyền trực tiếp. Khi dữ liệu đã được lưu trữ, bạn có thể dễ dàng truy cập nó với một lệnh gọi API cho tất cả các lớp lưu trữ.

Để có cái nhìn sâu hơn về các tối ưu hóa vị trí và chi phí cho bucket của mình, bạn có thể xem thêm bài viết Tối ưu hóa chi phí lưu trữ đối tượng trên Google Cloud.

Bảo mật

Mặc định, 100% dữ liệu trong Cloud Storage được tự động mã hóa ở trạng thái nghỉ và trong khi truyền mà không cần khách hàng phải cấu hình. Tuy nhiên, bạn có thể cấp quyền cho các thành viên và nhóm cụ thể hoặc đặt các đối tượng ở chế độ công khai hoàn toàn cho các trường hợp sử dụng nhanh như website.

Nếu bạn muốn kiểm soát một cách trực tiếp hơn công việc mã hóa, Google cung cấp hai tùy chọn bổ sung có sẵn cho bạn, ngoài mã hóa tích hợp sẵn.

  • Bạn có thể sử dụng khóa mã hóa do khách hàng quản lý (customer-managed encryption keys – CMEK) thông qua Dịch vụ quản lý khóa đám mây của Google (Google Cloud Key Management Service – KMS). Bạn có thể xác định các điều khiển truy cập cho các khóa, thiết lập các chính sách xoay vòng và thu thập thông tin đăng nhập bổ sung vào các hoạt động mã hóa/ giải mã. Trong cả trường hợp sử dụng mặc định và do khách hàng quản lý, Goolge vẫn là cơ sở đáng tin cậy cho các hoạt động mã hóa/ giải mã dữ liệu.
  • Bạn cũng có thể sử dụng khóa mã hóa do khách hàng cung cấp (customer-supplied encryption keys – CSEK). Khi đó, Google không còn là cơ sở tin cậy nữa. Việc sử dụng CSEK đi kèm với một số rủi ro mất dữ liệu, vì Google không thể giúp bạn giải mã dữ liệu nếu bạn đánh mất khóa mã khóa. Tuy nhiên, bạn không nhất thiết phải lựa chọn một tùy chọn quản lý khóa duy nhất mà có thể kết hợp chúng với nhau. Bạn có thể sử dụng mã hóa mặc định cho hầu hết khối lượng công việc của mình và thêm các kiểm soát bổ sung cho một số ứng dụng nhất định.

Kết luận

Dù bạn cần lưu trữ dữ liệu để tuân thủ quy định, khôi phục lại sau thảm họa, phân tích hay chỉ đơn giản là cung cấp dữ liệu cho website, Cloud Storage đều có sẵn những lựa chọn dành cho bạn. Để hiểu thêm về cách Cloud Storage hoạt động, bạn có thể xem tiếp loạt video về Cloud Storage Bytes tại đây.

Theo Google Cloud Blog