Trợ lý giọng nói điều khiển AI đang trở nên ngày càng phát triển. Các chuyên gia ước tính, vào cuối năm 2020 sẽ có 21,4 triệu loa thông minh hoạt động chỉ riêng ở Mỹ. Và nhu cầu dự kiến sẽ tăng trong những năm tới.

Trợ lý giọng nói được hỗ trợ bởi AI đang trở thành một phần trong cuộc sống hàng ngày của chúng ta cũng như thay đổi nền kinh tế. Chẳng hạn, việc dựa vào các thiết bị này để khiến cho các tìm kiếm trên Google trở nên phổ biến đến mức các doanh nghiệp bắt đầu phân bổ tài nguyên cho trợ lý giọng nói và xử lý ngôn ngữ tự nhiên đang trở nên tinh tế đến mức một số doanh nghiệp đang dựa vào chúng đối với các phần quan trọng của quy trình marketing và bán hàng.

Note: Dịch Thuật Tài Liệu Kinh Doanh Thương Mại Điện Tử

Vào tháng 8 năm 2018, Google Assistant đã bắt đầu hỗ trợ sử dụng song ngữ. Trước đây, một người dùng đa ngôn ngữ không thể chuyển đổi giữa các ngôn ngữ khi giao tiếp với sự trợ giúp của chúng. Do đó, người dùng phải điều hướng đến các cài đặt của thiết bị và chuyển ngôn ngữ.

Hiện tại bạn có có thể thiết lập Google Assistant để có thể hiểu hai ngôn ngữ một cách dễ dàng. Hơn nữa đội ngũ Google AI đang làm việc hướng tới một sản phẩm mà thành thạo ba ngôn ngữ cùng một lúc. Tuy nhiên để hiểu cách một thiết bị như Google Assistant trở thành đa ngôn ngữ, chúng ta cần hiểu cách máy xử lý ngôn ngữ.

Đằng sau mỗi trợ lý giọng nói, đó là công nghệ phức tạp và thú vị. Các công ty đằng sau các thiết bị này phải dạy chúng vừa sản xuất vừa nhận ra lời nói như nói, nghe, hiểu và đưa ra những phản hồi có liên quan. Nỗ lực này trở nên đặc biệt phức tạp khi chúng ta xem xét người dùng nói tiếng nước ngoài hoặc đa ngôn ngữ.

Trong bài viết này, chúng ta sẽ khám phá cách các trợ lý được đào tạo để giao tiếp với chúng ta bằng ngôn ngữ của mình và các dịch vụ lồng tiếng đóng vai trò gì trong việc tạo ra một sản phẩm đa ngôn ngữ đầy đủ chức năng.

Xử Lý Dữ Liệu Ngôn Ngữ Khó Hơn Bạn Nghĩ

Note: Bằng Cấp Dịch Thuật Có Thật Sự Là Cần Thiết

Xử lý ngôn ngữ tự nhiên là một chủ đề trong trí tuệ nhân tạo nhằm phát triển phần cứng và phần mềm có thể xử lý dữ liệu ngôn ngữ. Dạy máy tính nói là công việc khá phức tạp. Trong khi bất kỳ máy tính cá nhân nào trong năm 2008 có thể xử lý lượng dữ liệu có cấu trúc lớn, máy tính ít được trang bị để xử lý dữ liệu phi cấu trúc. Hơn nữa, thông tin ngôn ngữ là dữ liệu phi cấu trúc. Bản chất của ngôn ngữ cùng tính tự phát, sắc thái ngữ cảnh và khía cạnh thẩm mỹ mang đến sự phức tạp hoàn toàn mới.

Khi chúng ta dạy máy tính xử lý ngôn ngữ, chúng ta đang đối mặt với ba khó khăn lớn: Ngôn ngữ của con người chúng ta đối với cách thức hoạt động của máy tính, bản chất ngôn ngữ của chúng ta là sắc thái và phụ thuộc vào các biến số vô tận, và sự hiểu biết ngày càng tăng nhưng vẫn rất hạn chế về cách bộ não của chúng ta hoạt động liên quan đến ngôn ngữ.

Cách Thức Hoạt Động Của Trợ Lý AI

Hãy hỏi Siri rằng thời tiết ngày mai sẽ như thế nào. Điện thoại của bạn sẽ thu âm thanh và chuyển đổi nó thành văn bản, vì vậy nó có thể được xử lý. Sau đó, thông qua phần mềm xử lý ngôn ngữ tự nhiên, điện thoại của bạn sẽ cố gắng giải mã nghĩa của từ.

Nếu lệnh của bạn được cấu trúc như một câu hỏi, phần mềm sẽ xác định các dấu hiệu ngữ nghĩa cho thấy bạn đã hỏi một câu hỏi. “thời tiết” và “ngày mai” sẽ gửi tới phần mềm về nội dung của câu hỏi. Sau đó, nó sẽ tiến hành nghiên cứu thay mặt bạn và truyền đạt kết quả bằng cách biến chúng thành âm thanh.

Hãy tập trung vào hai phần của quy trình này: Đầu vào ban đầu và đầu ra. Làm thế nào để Siri hiểu những gì chúng ta nói và làm thế nào để Siri giao tiếp với chúng ta bằng chính ngôn ngữ của chúng ta?

Note: 12 Bài Học Từ Hội Nghị Hello World Đầy Sâu Sắc

Các Lệnh Đa Ngôn Ngữ: Dấu Và Âm Vị

Vào năm 2011, khi Siri được phát hành lần đầu tiên, nó đã phải đối mặt với nhiều phản ứng dữ dội. Một số coi toàn bộ trải nghiệm là không được như dự kiến. Những người khác phàn nàn cụ thể về việc trợ lý không thể hiểu được giọng của họ. Đó là do sự thiếu đa dạng trong tài liệu được sử dụng để huấn luyện các mạng lưới thần kinh mà Siri dựa vào.

Phần mềm NLP cơ bản đã học được cách giải quyết với ngôn ngữ thông qua âm thanh và nhập văn bản. Nếu chúng ta chỉ sử dụng các mẫu lời nói từ người địa phương, với giọng nói nhất định (hoặc tính trung lập giọng có chủ đích), phần mềm sẽ không hiểu được các mẫu giọng nói hiếm hơn hoặc giọng khu vực. Đó là lý do tại sao một số công ty trong lĩnh vực này bắt đầu tìm kiếm các dịch vụ lồng tiếng, dịch vụ dịch thuật chuyên nghiệp có thể cung cấp các mẫu lệnh đa dạng.

Note: Dịch Thuật Công Chứng Tiếng Anh Giá Rẻ

Tuy nhiên các “nghệ sĩ lồng tiếng” không chỉ liên quan đến cung cấp dữ liệu để huấn luyện mạng lưới thần kinh. Họ cũng cung cấp các công cụ như âm vị để nói chuyện. Âm vị là ngôn ngữ đơn vị nhỏ nhất có thể của âm thanh. Chúng ta nói bằng cách kết hợp âm vị. Như Marco Tabini từ MacWorld đã giải thích vào năm 2013:

Khi được yêu cầu chuyển đổi một câu thành lời nói, công cụ tổng hợp trước tiên sẽ tìm kiếm một đầu vào được xác định trước trong cơ sở dữ liệu của nó. Nếu không tìm thấy, thì nó sẽ cố gắng hiểu ý nghĩa của bản chất ngôn ngữ đầu vào, để gán ngữ điệu phù hợp cho tất cả các từ. Tiếp theo, nó sẽ chia thành các tổ hợp âm vị và tìm kiếm âm thanh ứng viên phù hợp nhất trong cơ sở dữ liệu. Các “nghệ sĩ lồng tiếng” là những tác nhân chính trong lĩnh vực xử lý ngôn ngữ tự nhiên, cung cấp tài liệu để tinh chỉnh sự hiểu biết của phần mềm về ngôn ngữ của chúng ta và đưa ra tiếng nói cho các trợ lý AI.

Bạn đang xem bài viết Tầm Quan Trọng Của AI Trong Dịch Thuật. Mong rằng bạn viết đã giúp bạn có thêm những kiến thức bổ ích. Nếu bạn có nhu cầu vềdịch thuật vui lòng liên hệ với Idichthuat để nhận được sự hỗ trợ tốt nhất.

Blog Chia Sẻ

VietnameseEnglish