Khi một mô hình máy học đưa ra các dự đoán kém, lý do gây ra điều đó có thể bao gồm một loạt các vấn đề. Đó có thể là kết quả của các lỗi điển hình trong bất cứ chương trình nào, nhưng cũng có thể là hậu quả của những vấn đề cụ thể trong máy học. Có lẽ sự sai lệch và bất thường trong dữ liệu đã khiến hiệu suất của mô hình giảm dần theo thời gian, hoặc nguyên nhân cũng có thể là sự không nhất quán về định dạng dữ liệu giữa giao diện gốc của mô hình và API phân phối. Nếu các mô hình không được giám sát, chúng có thể thất bại một cách âm thầm.

Khi một mô hình được nhúng vào một ứng dụng, các vấn đề như trên có thể dẫn đến trải nghiệm người dùng kém; còn nếu mô hình là một phần của quy trình nội bộ, các vấn đề kể trên có thể tác động tiêu cực đến việc đưa ra quyết định kinh doanh.

Quá trình phát triển phần mềm bao gồm rất nhiều quy trình và công cụ để đảm bảo chất lượng phần mềm, để đảm bảo rằng phần mềm đang hoạt động trong môi trường sản xuất đúng như dự kiến. Các quy trình này gồm có kiểm thử, xác minh, ghi nhật ký và giám sát. Trong hệ thống máy học, các tác vụ xây dựng, triển khai và vận hành hệ thống tạo ra những thách thức bổ sung, đòi hỏi các quy trình và công cụ bổ sung. Các hệ thống máy học không chỉ đặc biệt phụ thuộc vào dữ liệu vì chúng cần đưa ra các quyết định dựa trên dữ liệu, mà còn vì chúng là những hệ thống huấn luyện kép. Tính hai mặt này có thể tạo ra sự sai lệch trong quá trình phục vụ huấn luyện. Các hệ thống máy học cũng dễ dàng gặp sự cố trong các hệ thống tự động đưa ra quyết định.

Điều này có nghĩa là bạn cần các phương pháp kiểm tra và giám sát đối với các mô hình và hệ thống máy học khác với các hệ thống phần mềm khác – trong tất cả các quá trình phát triển, triển khai và sản xuất.

Dựa trên những kinh nghiệm làm việc cùng khách hàng, Google đã tạo ra một bộ sưu tập toàn diện các nguyên tắc cho từng quy trình trong vòng đời MLOps. Các nguyên tắc này bao gồm cách đánh giá, đảm bảo và kiểm soát chất lượng các giải pháp máy học của bạn, được xuất bản một cách đầy đủ và hoàn chỉnh trên trang web của Google Cloud.

Dưới đây là bản tóm tắt về những nội dung được đề cập trong bản nguyên tắc để giúp bạn nhanh chóng hình dung về những gì bạn có thể học được.

  • Model development (Phát triển mô hình): Những hướng dẫn về việc xây dựng một mô hình máy học hiệu quả cho tác vụ đang thực hiện bằng cách áp dụng tiền xử lý dữ liệu có liên quan, đánh giá mô hình, cũng như các kỹ thuật kiểm tra và gỡ lỗi mô hình.
  • Training pipeline deployment (Triển khai đường ống huấn luyện): Những hướng dẫn về các cách triển khai một quy trình CI/CD tự động hóa các kiểm tra đơn vị (unit test) cho các chức năng của mô hình và các kiểm tra tích hợp cho các thành phần của đường ống huấn luyện. Các nguyên tắc này giúp bạn áp dụng chiến lược phân phối lũy tiến một cách phù hợp để triển khai quy trình đào tạo.
  • Continuous training (Huấn luyện liên tục): Các nguyên tắc này cung cấp các khuyến nghị để bạn có thể mở rộng quy trình huấn luyện tự động với các bước xác thực dữ liệu đầu vào mới cho huấn luyện và xác thực mô hình đầu ra được tạo ra sau khi huấn luyện. Hướng dẫn cũng đề xuất các cách để theo dõi siêu dữ liệu và các thành phần được tạo ra trong quá trình huấn luyện.
  • Model deployment (Triển khai mô hình): Các hướng dẫn đề cập đến cách triển khai một quy trình CI/CD tự động hóa quá trình xác nhận tính tương thích của mô hình và các phụ thuộc của nó đối với cơ sở hạ tầng triển khai. Các đề xuất này cũng bao gồm cách kiểm tra dịch vụ mô hình đã triển khai và cách áp dụng các chiến lược phân phối tiến bộ và thử nghiệm trực tuyến để đưa ra các quyết định về hiệu quả mô hình.
  • Model serving (Cung cấp mô hình): Các hướng dẫn về các cách để giám sát mô hình triển khai trong suốt thời gian phục vụ dự đoán của nó để giám sát sự suy giảm hiệu suất (performance degradation) và trôi dạt tập dữ liệu (dataset drift).
  • Model governance (Quản trị mô hình): Những hướng dẫn liên quan đến việc thiết lập các tiêu chuẩn chất lượng của mô hình. Chúng cũng bao gồm các kỹ thuật thực hiện các thủ tục và quy trình làm việc nhằm xem xét và phê duyệt các mô hình để triển khai sản xuất, cũng như quản lý mô hình đã triển khai trong sản xuất.

Theo Google Cloud Blog

Menu