Danh sách những câu hỏi phổ biến nhất và ý nghĩa của một số thuật ngữ, khái niệm thường gặp trong điện toán đám mây để giúp bạn làm quen và có một cái nhìn tổng quan về chúng. Nếu bạn muốn tìm hiểu kỹ hơn về những khái niệm này, hãy truy cập trang web của Google Cloud tại đây.
Container là gì?
Vùng chứa (container) là các gói phần mềm chứa tất cả các yếu tố cần thiết để thực thi phần mềm trong bất kỳ môi trường nào. Theo cách này, vùng chứa ảo hóa hệ điều hàng và có thể thực thi ở khắp mọi nơi, từ trung tâm dữ liệu riêng tư cho đến đám mây công cộng, hoặc thậm chí là ngay trên máy tính cá nhân của nhà phát triển. Giải pháp ảo hóa (containerization) cho phép các nhóm phát triển di chuyển nhanh chóng, triển khai phần mềm hiệu quả và hoạt động ở quy mô lớn chưa từng có.
Điểm khác biệt giữa Container và VM?
Có thể bạn đã quen thuộc với máy ảo (Virtual Machine – VM), một hệ điều hành khách như Linux hoặc Windows chạy trên hệ điều hành chủ và có quyền truy cập vào phần cứng bên dưới. Các vùng chứa thường được so sánh với máy ảo. Giống như máy ảo, vùng chứa cho phép bạn đóng gói ứng dụng của mình cùng các thư viện và các thành phần phụ thuộc khác để từ đó cung cấp một môi trường riêng biệt để thực thi các dịch vụ phần mềm của bạn. Tuy nhiên, sự tương đồng kết thúc ngay tại đây, bởi vì các vùng chứa cung cấp một đơn vị nhẹ hơn rất nhiều và mang lại nhiều lợi ích hơn cho các nhà phát triển và các nhóm IT Ops. Các vùng chứa nhẹ hơn nhiều so với máy ảo, chúng thực hiện ảo hóa ở cấp hệ điều hành, trong khi máy ảo ảo hóa ở cấp phần cứng, chia sẻ nhân hệ điều hành và sử dụng một phần bộ nhớ cần thiết.
Kubernetes là gì?
Với sự phổ biến ngày càng gia tăng của các vùng chứa, Kubernetes – phần mềm quản lý tập trung vào vùng chứa, đã trở thành tiêu chuẩn trên thực tế để triển khai và vận hành các ứng dụng vùng chứa. Kubernetes được được xây dựng dựa trên kinh nghiệm 15 năm vận hành các khối lượng công việc vùng chứa của Google, cùng với những đóng góp đầy giá trị từ cộng đồng mã nguồn mở và được phát hành lần đầu tiên vào năm 2014. Lấy cảm hứng từ hệ thống quản lý cụm nội bộ của Google – Borg, Kubernetes khiến cho mọi thứ liên quan đến việc triển khai và quản lý ứng dụng của bạn trở nên dễ dàng hơn. Với hệ thống điều phối vùng chứa tự động, Kubernetes cải thiện độ tin cậy, tiết kiệm thời gian và tài nguyên được phân bổ cho các hoạt động hằng ngày.
Kiến trúc microservices là gì?
Kiếm trúc microservices (hay còn được gọi là microservices) đề cập đến một phong cách kiến trúc để phát triển các ứng dụng. Microservices cho phép một ứng dụng lớn được chia tách thành các phần độc lập nhỏ hơn, mỗi phần có phạm vi trách nhiệm riêng. Để phục vụ một yêu cầu của người dùng, một ứng dụng được xây dựng theo kiến trúc microservices có thể gọi nhiều dịch vụ nhỏ nội bộ để tạo ra phản hồi của nó. Vùng chứa là một ví dụ của kiến trúc này, vì chúng cho phép bạn tập trung vào việc phát triển các dịch vụ mà không cần lo lắng về các thành phần phụ thuộc. Các ứng dụng gốc đám mây hiện đại thường được xây dựng dưới dạng microservices và sử dụng vùng chứa.
Hybrid cloud là gì?
Đám mây lai (hybrid cloud) là một đám mây trong đó các ứng dụng được thực thi nhờ sự kết hợp của các môi trường khác nhau. Các phương pháp tiếp cận đám mây kết hợp đang ngày càng trở nên phổ biến. Nhiều tổ chức đã đầu tư mạnh tay vào cơ sở hạ tầng tại chỗ trong những thập kỷ qua, kết quả là họ chỉ phụ thuộc vào đám mây công cộng. Ví dụ phổ biến nhất của đám mây lai chính là kết hợp môi trường điện toán riêng tư – chẳng hạn như một trung tâm dữ liệu tại chỗ, và môi trường điện toán đám mây công cộng như Google Cloud.
ETL là gì?
ETL là viết tắt của Extract – trích xuất, Transform – chuyển đổi và Load – tải. Đây là một cách thức truyền thống được chấp nhận để các tổ chức kết hợp dữ liệu từ nhiều hệ thống thành một cơ sở dữ liệu, kho dữ liệu hay một hồ dữ liệu duy nhất. ETL có thể được sử dụng để lưu trữ dữ liệu kế thừa, nhưng công dụng điển hình của nó ngày nay là để tổng hợp dữ liệu nhằm phân tích và đưa ra các quyết định kinh doanh. Các tổ chức đã sử dụng ETL trong nhiều thập kỷ qua, nhưng có một điểm mới mẻ là cả nguồn dữ liệu, cũng như cơ sở dữ liệu đều đang được chuyển sang đám mây. Hơn nữa, chúng ta có thể thấy sự xuất hiện của các đường ống ETL trực tuyến (streaming ETL pipelines) xử lý dữ liệu trong thời gian thực được hợp nhất cùng các đường ống tuần tự (batch pipelines). Một số doanh nghiệp thực hiện các tác vụ trong thời gian thực bằng cách tái lấp đầy các đường ống tuần tự hoặc tái xử lý các đường ống hỗn hợp.
Hồ dữ liệu là gì?
Một hồ dữ liệu (data lake) là một kho lưu trữ tập trung được thiết kế để lưu trữ, xử lý và bảo mật một lượng lớn dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc. Nó có thể lưu trữ dữ liệu ở định dạng gốc và xử lý mọi loại dữ liệu khác nhau ở bất cứ kích thước nào.
Kho dữ liệu là gì?
Các công ty hoạt động dựa trên dữ liệu cần đến những giải pháp mạnh mẽ để quản lý và phân tích khối lượng lớn dữ liệu trong tổ chức của họ. Các hệ thống này phải có khả năng mở rộng, đáng tin cậy và đủ an toàn, đồng thời đủ linh hoạt để hỗ trợ nhiều loại dữ liệu và trường hợp sử dụng khác nhau. Các yêu cầu này nằm ngoài khả năng của tất cả các cơ sở dữ liệu truyền thống. Đây là lúc kho dữ liệu (data warehouse) xuất hiện. Kho dữ liệu là một hệ thống doanh nghiệp được sử dụng để phân tích và báo cáo dữ liệu có cấu trúc và bán cấu trúc từ nhiều nguồn, chẳng hạn như giao dịch tại điểm bán, tự động hóa tiếp thị, quản lý quan hệ khách hàng, v.v. Kho dữ liệu phù hợp cho những yêu cầu phân tích đột xuất, báo cáo tùy chỉnh và có thể lưu trữ cả dữ liệu hiện tại và lịch sử dữ liệu ở mọi nơi. Được thiết kế để cung cấp tầm nhìn xa về dữ liệu theo thời gian, kho dữ liệu đã trở thành một phần thiết yếu của trí tuệ kinh doanh.
Phân tích trực tuyến là gì?
Phân tích trực tuyến (streaming analytics) là xử lý và phân tích các bản ghi dữ liệu liên tục thay vì theo lô. Nhìn chung, phân tích trực tuyến rất hữu ích trong trường hợp các nguồn dữ liệu được gửi tới ở kích thước nhỏ (thường tính bằng kilobyte) trên một luồng liên tục khi dữ liệu được tạo ra.
Máy học là gì?
Các doanh nghiệp ngày nay đang bị tấn công bởi dữ liệu. Để thúc đẩy các quyết định kinh doanh tốt hơn, họ phải hiểu rõ dữ liệu. Tuy nhiên, các công cụ truyền thống ngày càng gặp khó khăn trong việc phân tích dữ liệu với khối lượng khổng lồ và sự phức tạp ngày càng lớn. Việc xây dựng, thử nghiệm, lặp đi lặp lại và triển khai các mô hình phân tích để xác định các mẫu và thông tin chi tiết về dữ liệu tiêu tốn rất nhiều thời gian của nhân viên. Hơn nữa, sau khi được triển khai, các mô hình này cũng phải được theo dõi và điều chỉnh liên tục khi tình hình thị trường hoặc bản thân dữ liệu thay đổi. Lúc này, máy học (Machine learning – ML) chính là giải pháp. Máy học cho phép các doanh nghiệp kích hoạt dữ liệu để dạy hệ thống các giải quyết vấn đề bằng các thuật toán, và cách để trở nên thông minh hơn theo thời gian.
Xử lý ngôn ngữ tự nhiên là gì?
Xử lý ngôn ngữ tự nhiên (Natural language processing – NLP) là công việc sử dụng máy học để tìm ra cấu trúc và ý nghĩa của văn bản. Với các ứng dụng xử lý ngôn ngữ tự nhiên, các tổ chức có thể phân tích văn bản và trích xuất thông tin về con người, địa điểm hoặc sự kiện để hiểu rõ hơn về cảm xúc trên mạng xã hội hay các cuộc trò chuyện của khách hàng.
Hãy truy cập vào trang tài nguyên của Google Cloud tại đây nếu bạn muốn tìm hiểu sâu hơn về các khái niệm này, cũng như nhiều thuật ngữ chuyên sâu hơn về điện toán đám mây.