Biên dịch các tài liệu kinh doanh sang hơn 100 thứ tiếng với Google Translation API Advanced

Tháng Chín 11, 2021
Nga Pham

Dịch thuật là công việc vô cùng quan trọng đối với nhiều nhà phát triển và nhà cung cấp dịch vụ bản địa hóa, cho dù bạn cần phát hành một tài liệu, một phần mềm, tài liệu đào tạo hay một trang web bằng nhiều ngôn ngữ. Ngày này, các nội dung được chia sẻ bằng nhiều thứ tiếng và qua nhiều định dạng khác nhau, do đó việc dịch thuật ở quy mô lớn, tích hợp tính năng nhận diện ký tự quang học (Optical Character Recognition – OCR) và hiệu chỉnh thuật ngữ chuyên ngành là rất cần thiết để đáp ứng nhu cầu này. Giờ đây, các nhà phát triển có thể sử dụng công nghệ máy học để dịch văn bản nhanh và hiệu quả hơn bao giờ hết với sản phẩm dịch thuật hàng đầu của Google Cloud.

Dịch vụ dịch thuật tài liệu của Google Cloud có thể đáp ứng công việc chuyển ngữ tài liệu qua hơn 100 thứ tiếng, đồng thời giữ nguyên định dạng gốc của tài liệu, hỗ trợ nhiều định dạng phổ biến như Docx, PPTx, XLSx và PDF.

Một trong những công ty đang sử dụng dịch vụ này là Welocalize. Họ sử dụng Translation API Advanced (API Dịch thuật Nâng cao) để dịch hàng trăm triệu từ mỗi năm, đồng thời áp dụng dịch máy trong các kịch bản làm việc với nhiều khách hàng trong các lĩnh vực rộng rãi như truyền thông, giáo dục trực tuyến và bản địa hóa.

“API Dịch thuật của Google hỗ trợ chúng tôi chuyển ngữ chính xác các thuật ngữ trong nhiều lĩnh vực, đặc biệt là đối với những khách hàng có kho dữ liệu ít ỏi, giúp chúng tôi cung cấp cho khách hàng những bản dịch có độ chính xác cao cho những tài liệu họ ủy thác. Các mô hình được huấn luyện sẵn của API Dịch thuật hỗ trợ chúng tôi trong việc giảm độ trễ dịch thuật, nhờ đó có thể cung cấp bản dịch cho người dùng cuối ngay trong thời gian thực, chỉ sau vài giây.”

Olga Beregovaya, Phó chủ tịch Dịch vụ Ngôn ngữ Welocalize

Nhận bản dịch trực tuyến chỉ sau vài giây

Các doanh nghiệp truyền thống có thể sử dụng dịch vụ dịch thuật hàng loạt để đáp ứng nhu cầu của mình, song một số công ty yêu cầu bản dịch ngay lập tức trong thời gian thực. Một trong những điểm khác biệt lớn nhất trong tính năng dịch văn bản của Translation API Advanced chính là khả năng dịch thuật trực tuyến trong thời gian thực với việc áp dụng xử lý đồng bộ trên một tài liệu duy nhất. Ví dụ, nếu bạn đang cần dịch một tài liệu kinh doanh như tài liệu nhân sự, sự linh hoạt của dịch trực tuyến ưu tiên trả kết quả bản dịch cho các khách hàng có tệp nhỏ hơn và mong muốn có kết quả nhanh hơn. Bạn có thể dễ dàng tích hợp các API của Google qua REST hoặc gRPC trong các ứng dụng di động hoặc trình duyệt, với quyền truy cập tức thì vào hơn 100 cặp ngôn ngữ và chuyển ngữ nội dung sang các thứ tiếng được hỗ trợ. Hình ảnh bên dưới minh họa quy trình dịch một tài liệu bằng Translation API Advanced.

Các bước dịch một tài liệu của API Dịch thuật

Sử dụng AutoML Translation để xây dựng các mô hình dịch thuật tùy chỉnh

Thay vì sử dụng mô hình do Google quản lý, bạn cũng có thể sử dụng các mô hình AutoML Translation của riêng mình để chuyển ngữ tài liệu. Tính năng Dịch tài liệu mới có thể dịch các tài liệu kinh doanh nhanh chóng và dễ dàng với các mô hình dịch SOTA của Google Cloud, đồng thời được kết hợp với các tính năng của Translation API Advanced để dễ dàng kiểm soát bản dịch tùy chỉnh thông quan bảng thuật ngữ hoặc các mô hình bạn đã huấn luyện trên AutoML. Tính năng bảng thuật ngữ của Translation API lưu trữ tên của các thương hiệu trong nội dung đã dịch. Bạn cần xác định tên và từ vựng trong ngôn ngữ nguồn và ngôn ngữ đích, sau đó lưu tập tin bảng thuật ngữ vào dự án dịch của mình. Sau khi lưu, các từ và cụm từ đó sẽ tự động được áp dụng trong bản dịch mới của bạn trong tương lai.

Các bước dịch một tài liệu kết hợp với bảng thuật ngữ của API Dịch thuật

Những dịch vụ dịch thuật Google cung cấp bao gồm Translation API (cơ bản và nâng cao) dành cho những người muốn sử dụng các mô hình được huấn luyện sẵn cho các trường hợp sử dụng phổ biến như ứng dụng trò chuyện, mạng xã hội và game, cùng với AutoML Translation hỗ trợ các doanh nghiệp xây dựng các mô hình dịch thuật tùy chỉnh chất lượng cao và sẵn sàng được sử dụng trong môi trường sản xuất mà không cần viết một dòng mã nguồn nào.

Đây chỉ là ví dụ mới nhất về cách mà Google đang tiếp tục thúc đẩy sự đổi mới do AI hỗ trợ trong việc trích xuất dữ liệu có cấu trúc từ các nguồn không có cấu trúc. Với Document AI, Google đã áp dụng công nghệ này vào một số quy trình làm việc dựa trên tài liệu lớn nhất trên thế giới thông qua việc trích xuất và phân loại dữ liệu. Giờ đây, với tính năng hỗ trợ tài liệu của Translation API Advanced, Google cung cấp các giải pháp xử lý tài liệu để bạn có thể dịch các tài liệu kinh doanh của mình trên quy mô lớn.

Thêm nhiều tài nguyên về Cloud Translation

Bạn có thể tìm hiểu thêm về cách dịch vụ Dịch thuật Đám mây của Google trên trang web, hoặc xem những nhận xét kỹ thuật về cách sử dụng tính năng này trong tài liệu hướng dẫn của họ.

Theo Google Cloud Blog