Ngày cập nhật mới nhất: 21/06/2023

Dịch máy là một phần không thể thiếu của ngành dịch thuật và bản địa hóa ngày nay khi các công ty tiếp tục cố gắng mở rộng quy mô, tự động hóa và hợp lý hóa sản lượng bản dịch. Nhưng chính xác thì dịch máy là gì và nó hoạt động như thế nào? Làm thế nào chúng ta có thể kiểm soát chất lượng bản dịch và những người dịch tham gia vào quá trình nào?

Dịch Máy Hoạt Động Như Thế Nào?

Dịch máy, nói một cách đơn giản là việc sử dụng phần mềm để dịch – từ văn bản hoặc giọng nói – từ ngôn ngữ này sang ngôn ngữ khác. Bằng cách sử dụng các thuật toán, mẫu và mô hình ngôn ngữ lấy từ cơ sở dữ liệu lớn của các bản dịch hiện có, nó có thể đề xuất bản dịch cho các chuyên gia ngôn ngữ hoặc trong một số trường hợp, tự động dịch số lượng lớn văn bản mà không cần sự tham gia của con người. Đối với ngữ cảnh, các yếu tố phần mềm nằm trong danh mục chủ đề (ví dụ: y tế, pháp lý, khoa học), những nguồn thông tin trên mạng và bảng chú giải thuật ngữ.

Có nhiều kiểu dịch máy khác nhau với các mức độ phức tạp khác nhau. Bạn có thể đã đọc bản dịch có sự hỗ trợ của máy tính, bản dịch có sự hỗ trợ của con người và bản dịch tương tác. Chúng không giống như dịch máy, mỗi công cụ đều có các đặc điểm và bộ công cụ riêng biệt.

>>> Đề xuất xem: 10 Công Cụ Dịch Thuật Tốt Nhất Cho Dịch Giả

Các Loại Dịch Máy

Con người đã bắt đầu nghiên cứu công nghệ dịch máy kể từ những năm 1940, với mỗi công nghệ mới sẽ cải tiến quy trình tăng dần theo thời gian. Và trong thời gian qua, các công nghệ mới nổi như trí tuệ nhân tạo và học chuyên sâu cũng đã được tích hợp rất nhiều vào hoạt động bên trong của nó.

Có ba loại dịch máy: dịch máy thống kê (SMT), dịch máy dựa trên quy tắc và dịch máy nơ-ron.

Dịch máy dựa trên quy tắc (RbMT)

Phần mềm dịch máy đầu tiên được sử dụng rộng rãi và vẫn được sử dụng cho đến ngày nay,. Là một hệ thống dựa trên quy tắc – nhờ vào một số lượng gần như vô hạn các thuật toán dựa trên ngữ pháp, cú pháp và cụm từ của ngôn ngữ.

Dịch máy thống kê (SMT)

Dịch máy thống kê là một phương pháp được phát triển mạnh mẽ trong thập kỷ qua, mặc dù nó được lên ý tưởng lần đầu tiên vào năm 1949. SMT sử dụng các mô hình ngôn ngữ thống kê với các tham số dựa trên các nguồn ngôn ngữ được tạo thành từ các bộ văn bản lớn, có cấu trúc. Mặc dù nó sử dụng hiệu quả các nguồn nhân lực và dữ liệu, các bản dịch thường hời hợt, giống như các bản dịch không trôi chảy sử dụng Google Dịch. Nó cũng không hoạt động tốt với các cặp ngôn ngữ có cú pháp khác nhau. Các nhà ngôn ngữ học cần phải giúp ra sức hỗ trợ.

Dịch máy nơ-ron (NMT)

Dịch máy nơ-ron được ra mắt lần đầu tiên vào năm 2016. NMT sử dụng mạng nơ-ron nhân tạo để dự đoán trình tự của các từ và liên tục cải thiện bản dịch bằng cách học hỏi từ nhiều nguồn, cơ sở dữ liệu, bảng chú giải thuật ngữ và các đề xuất dịch đã được người dịch phê duyệt. Phần mềm NMT thường chạy trên các đơn vị đồ họa của CPU để đáp ứng sức mạnh xử lý khổng lồ mà nó cần để hoạt động.

Nhiều công ty dịch vụ dịch thuật sử dụng NMT vì họ đã nhận ra rằng nó làm tăng năng suất dịch thuật và cắt giảm chi phí, đây là một lợi thế bán hàng B2B độc nhất. Các tổ chức sử dụng nó như Microsoft (bao gồm Skype, Bing, v.v.), Systran, Reverso và IBM.

Dịch máy hỗn hợp

Bản dịch máy hỗn hợp có nghĩa là hai trong số các loại được đề cập ở trên được sử dụng cùng một lúc. Các công ty sử dụng phương pháp này như một cách an toàn để cung cấp độ chính xác và đảm bảo quyền kiểm soát, thay vì dựa vào một giải pháp. Prompt, Systran và Omniscien Technologies là một số công ty sử dụng nó.

Có những ưu và nhược điểm cho từng loại máy dịch. RbMT tốt hơn về tính nhất quán và chất lượng có thể dự đoán được so với SMT, trong khi RbMT thể hiện sự trôi chảy nhiều hơn và có khả năng nắm bắt các quy tắc ngoại lệ. Tuy nhiên, giải pháp được tìm kiếm nhiều nhất hiện nay là phần mềm nơ-ron.

.>>> Bài viết đề xuất: So sánh dịch máy và công cụ dịch thuật

Hệ Thống Dịch Máy

Có ba loại hệ thống dịch máy có thể áp dụng cho bất kỳ công nghệ dịch máy nào:

Generic MT là hệ thống MT cơ bản nhất cung cấp các bản dịch tức thì với ít hoặc không cần tùy chỉnh, chẳng hạn như Google Dịch, Bing, Reverso và Yandex. MT có thể tùy chỉnh sử dụng nền tảng của Generic MT, nhưng cho phép người dùng điều chỉnh thuật ngữ dựa trên ngữ cảnh, danh mục, phong cách, đối tượng mục tiêu, v.v.

Hệ thống thích ứng MT là hệ thống thường được sử dụng nhất trong các công cụ CAT. Nó cung cấp các đề xuất dịch trực tiếp cho các chuyên gia ngôn ngữ và học hỏi từ các lựa chọn được thực hiện theo thời gian để cải thiện những gì được đề xuất.

Adaptive MT hoạt động cùng với bộ nhớ dịch và đã được chứng minh là một trong những công cụ hữu ích nhất cho người dịch, vì nó tăng tốc đáng kể công việc và đầu ra.

Công Nghệ, Công Cụ Và Dịch Vụ Dịch Máy

Dịch máy có tính khả dụng rộng rãi, chẳng hạn như trên đám mây, trên nền tảng, trên máy chủ hoặc thông qua tích hợp phần mềm với việc sử dụng API.

Ví dụ: các dịch vụ dịch thuật của Google, Microsoft và Amazon bán API đám mây, trong khi các nhà phát triển khác như Systran và Prompt cung cấp MT có thể tùy chỉnh thông qua máy chủ hoặc sản phẩm máy tính để bàn. Tuy nhiên, các dịch giả chuyên nghiệp chủ yếu sử dụng MT ngay trong các công cụ CAT mà họ cần cho công việc của mình, như Trados, MemoQ, v.v.

Người dùng cũng có thể khai thác các tùy chọn dịch máy mã nguồn mở và độc lập. Chúng cho phép bất kỳ ai có hiểu biết về kỹ thuật xây dựng công cụ dịch máy của riêng họ. Để sử dụng bất kỳ bộ công cụ mã nguồn mở nào, bạn cần trang bị một bộ sưu tập lớn các văn bản song song bằng hai ngôn ngữ.

Chất Lượng Dịch Máy

Phần mềm dịch máy, mặc dù rất hữu ích trong việc cải thiện năng suất của người dịch cũng như dịch khối lượng lớn văn bản, nhưng cũng phải tuân thủ các tiêu chuẩn chất lượng cao. Đây là lý do tại sao các chuyên gia ngôn ngữ được giao nhiệm vụ chỉnh sửa hậu kỳ của MT để đảm bảo kết quả là bản dịch tự nhiên phù hợp với ngữ cảnh, có cảm giác trò chuyện của con người và được bản địa hóa chính xác cho khán giả mục tiêu.

Chất lượng bản dịch cũng được đảm bảo về mặt kỹ thuật hơn. Các kỹ sư tính toán được giao nhiệm vụ xem xét các động cơ MT với các thử nghiệm và thử nghiệm A / B trên cơ sở liên tục. Một số bài kiểm tra, chẳng hạn như bài kiểm tra tự động BLEU (Đánh giá song ngữ), ROUGE, NIST và METEOR kiểm tra tỉ mỉ sự giống nhau giữa bản dịch của máy và người của cùng một văn bản.

>>> Đề xuất xem: 5 Ứng Dụng Phiên Dịch Hàng Đầu Qua Điện Thoại

Một mối quan tâm khác bên cạnh chất lượng là bảo mật. Do nhiều nền tảng dịch máy được chia sẻ nên các bản dịch không phải lúc nào cũng được giữ bí mật. Nhiều công ty ngăn chặn điều này bằng cách thiết lập một công cụ dịch máy tại chỗ chạy bên trong mạng công ty không cho phép quyền truy cập bên ngoài. Mặt khác, các giải pháp đám mây sử dụng mã hóa dữ liệu. Đó là lý do tại sao các công ty nên tránh các tùy chọn mở cho công chúng, đó là những cánh cổng dễ dàng cho tin tặc.

Lợi Ích Của Dịch Máy

Dịch máy được thực hiện mà không có sự can thiệp của con người, phù hợp nhất cho văn bản tương đối đơn giản. Theo truyền thống, nó đã được triển khai cho nội dung do người dùng tạo ra như đánh giá, diễn đàn và đấu giá. 

Tùy thuộc vào mong đợi về chất lượng, loại nội dung và mục đích của bạn, dịch máy có thể thực hiện một công việc tốt trong việc dịch các tài liệu kinh doanh chung, đơn giản sang một số ngôn ngữ. Sự gia tăng của dịch máy cho phép nhiều công ty được hưởng những lợi ích tương tự như những lợi ích do bộ nhớ dịch tạo ra, bao gồm:

  • Khả năng đưa nội dung ra thị trường nhanh hơn.
  • Tính nhất quán của thuật ngữ.
  • Năng suất cao hơn của người dịch.
  • Chi phí dịch thuật thấp hơn.

Điều quan trọng cần lưu ý là người dịch dành ít thời gian hơn cho một số công việc nhất định. Do đó, họ có thể thoải mái để làm việc cho nhiều dự án hơn.

Công nghệ dịch máy là một lĩnh vực liên ngành thú vị kết hợp công nghệ, ngôn ngữ học và bản địa hóa mới nhất. Nhu cầu ngày càng tăng về bản địa hóa nội dung sẽ tiếp tục thúc đẩy những tiến bộ công nghệ trong MT với tốc độ ngày càng nhanh. Các chuyên gia ngôn ngữ phải tìm ra những cách hiệu quả để kiểm soát chất lượng và sự tiếp xúc của con người đối với các bản dịch máy.

Chia Sẻ Kinh Nghiệm Dịch Thuật

5/5 - (1 vote)