Ngày cập nhật mới nhất: 30/10/2024

Hội nghị Hello World: 12 bài học từ một sự kiện đầy tính sâu sắc

Hội nghị Hello World mà PhraseApp tổ chức tại Hamburg, Đức, vừa kết thúc. Sau 7 giờ thuyết trình kích thích sự tư duy, chúng tôi cảm thấy mình đã học được rất nhiều.

Đại diện của Xing, Deliveroo, AWS, Jimdo, Auto1, Beluga, Lengoo, Wieners&Wieners, Đại học Hamburg, Đại học Dublin, Otovo, Glossa, và PhraseApp đã có mặt và cung cấp những hiểu biết vô cùng quý giá về quy trình bản địa hóa có ý nghĩa gì đối với họ và cách thức họ thực hiện nó.

Các cuộc thảo luận bao gồm các trường hợp sử dụng, các câu chuyện về sự thành công, lời khuyên kinh doanh, thực tiễn tốt nhất, nghiên cứu chuyên sâu, những thách thức trong tương lai và nhiều hơn nữa. Hãy đọc để tìm hiểu những bài học quý giá nhất mà chúng tôi đã mang về nhà của mình!

Bản địa là một tiêu chuẩn mới

Davide Gallo đến từ AWS đã chia sẻ với chúng tôi về hình thức bản địa hóa tại Amazon. Ông đã tham khảo trong những thứ khác về nghiên cứu Can’t Read Won’t Buy của CSA. Ông cũng nói với chúng tôi rằng 51% mọi người thích diễn đạt nội dung bằng ngôn ngữ của họ ngay cả khi họ nói tiếng Anh!

Vậy thì bây giờ bạn bản địa hóa hiệu quả nội dung của mình như thế nào khi ấn phẩm quảng cáo của bạn bao gồm hàng tỷ sản phẩm với hàng ngàn trong số đó được thêm vào trong từng phút?

Amazon là một trong những ví dụ tốt nhất về lý do tại sao Dịch tự động bằng nơron (NMT) đôi khi là cách khả thi nhất để bản địa hóa nội dung.

Davide nhấn mạnh lợi thế đáng kể của NMT về tốc độ và chi phí, và cho chúng tôi thấy đầu ra của Amazon Dịch nghe có vẻ tự nhiên hơn nhiều so với đầu ra của các giải pháp dịch tự động mở khác. Chúng tôi không biết phần mềm của họ thực sự đứng trong top 5% trên thị trường Dịch tự động!

NMT không phù hợp với mọi loại văn bản 

Về chất lượng và độ chính xác, Davide đã giải thích rằng mặc dù không hoàn hảo nhưng đầu ra của họ có thể tốt hơn tới 85% so với bản dịch của con người. Mới nghe qua thì bạn sẽ nghi ngờ về tỷ lệ này, tuy nhiên điều đó là sự thật.

Davide cũng đã bày tỏ rằng các công ty chỉ nên dựa vào Dịch tự động cho nội dung không cần sự chính xác 100%. Do đó, tốt nhất là chúng ta nên để lại các văn bản tiếp thị và thông tin nhạy cảm trong tay một biên dịch viên.

Sau cùng, chúng tôi đã học được rằng NMT hữu ích cho một loạt các hoạt động ngoài bản địa hoá các mô tả sản phẩm trên nền tảng Amazon. Điều đó chứng tỏ sự hữu ích cho các công việc khác như phân tích phương tiện truyền thông, khám phá điện tử, kiểm duyệt nội dung, tìm hiểu các vấn đề của khách hàng tại các trung tâm liên hệ, chuyển đổi văn bản bằng giọng nói, v.v. 

NMT hoạt động tốt cần nhiều dữ liệu

Hội nghị Hello World cũng bao gồm những hiểu biết nghiên cứu từ các giáo sư đại học và tiến sĩ. Nhà nghiên cứu sau tiến sĩ Meriem Beloucif đã thực hiện nghiên cứu về Dịch tự động từ góc độ ngôn ngữ có ít tài nguyên đã làm chúng tôi bất ngờ. Cô ấy đã đề xuất rằng yếu tố chính để bản dịch trở nên hữu ích nằm trong ngữ nghĩa, đó là giữ ý nghĩa khi diễn đạt lại thông điệp trong ngôn ngữ đích.

Bạn có biết rằng hệ thống dịch tự động nơron và dịch thuật thống kê có thể được đào tạo? Bởi vậy, bạn sẽ cần phải cung cấp cho họ rất nhiều dữ liệu cho sự kết hợp ngôn ngữ cụ thể và lĩnh vực được nhắc đến? Jonathan Wuermeling từ Lengoo cũng đã đề xuất rằng đầu vào dữ liệu tối thiểu phải nằm trong khoảng từ 200k đến 400k từ.

Bạn hãy thử tưởng tượng một thách thức khi đào tạo hệ thống cho các ngôn ngữ có ít tài nguyên như tiếng Hausa, tiếng Uzbek, tiếng Tigrinya, tiếng Oromo, v.v. Bạn cải thiện và đánh giá đầu ra của dịch tự động như thế nào khi bạn không có đủ dữ liệu?

Meriem Beloucif đã đề xuất mô hình đầu tiên thành công xen ngữ nghĩa thay vì phương pháp BLEU khi đào tạo các hệ thống dịch tự động và cô ấy đã cho thấy nếu khuynh hướng xen ngữ nghĩa vào ngôn ngữ đích (tiếng Anh), thì chất lượng dịch thuật được cải thiện đáng kể.

Sau cùng, theo cách nói của Beloucif, điều mà tất cả chúng ta muốn nhận được từ một bản dịch là ai đã làm gì với ai, cho ai, khi nào, ở đâu, tại sao và như thế nào?

Lỗi trong NMT khó phát hiện hơn trong SMT

Giáo sư Joss Moorkens đến từ Đại học Dublin đã mang một nghiên cứu rất toàn diện về NMT đến Hội nghị Hello World. Chúng tôi đã phân tích các cách khác nhau để sử dụng NTM và so sánh các kết quả đầu ra của Dịch tự động thống kê so với Dịch tự động nơron.

Chúng tôi cũng đã xem xét thời gian các biên tập viên dành ra để chỉnh sửa từng loại đầu ra. Hơn nữa, chúng tôi đã tìm ra một phát hiện kỳ lạ. Đó là các lỗi trong NTM khó phát hiện hơn so với SMT vì đầu ra trước đây cho thấy sự chính xác và sự lưu loát cao hơn và ít lỗi về trật tự từ và hình thái hơn.

NMT là lựa chọn tốt nhất cho nội dung dễ bị sai hỏng

Một bài học quý giá khác từ Hội nghị Hello World là “thời hạn sử dụng” của một văn bản nhất định có thể quyết định sự lựa chọn giữa con người dịch so với NMT. Chẳng hạn như hãy nghĩ đến một đánh giá trên TripAdvisor và về một tiêu đề trang đích của một trang web.

Vậy thì cái nào sẽ dễ “hư hỏng” hơn? Cái nào chất lượng cao mà quan trọng hơn? NMT chính là một giải pháp khả thi cho nội dung tạm thời như một lời đánh giá. Bởi độ chính xác không quan trọng đối với loại văn bản đó như giữ nguyên ý chính của thông điệp văn bản nguồn.

Tuy nhiên, sử dụng cùng một cách tiếp cận cho nội dung tiếp thị có thể là một ý tưởng rất tệ! Vì vậy, sử dụng NMT cho nội dung quảng cáo của bạn không phải là một quyết định thông minh.

Lường trước sự khác nhau giữa những nhu cầu về bản địa hoá ngôn ngữ

Tilman Büttner từ Xing đã nói về những sai lầm mà các giám đốc sản phẩm nên tránh. Chúng tôi thực sự đã hồi tưởng lại thuở Xing còn là OpenBC! Ông đã đưa ra kết luận quan trọng sau khi phân tích những quyết định tồi tệ mà công ty đã đưa ra lúc đó. Chúng tôi rất yêu thích quyết định này: “Bạn cần phải nghĩ xa ngoài vùng kiểm soát”, tuy nhiên nhiều thương hiệu thất bại ở đó.

Tuy nhiên, bài học quan trọng nhất từ Tilman là việc phát triển một sản phẩm có tiềm năng tiếp cận thị trường quốc tế đòi hỏi tính dự đoán. Bản địa hóa cần được tích hợp vào dòng thời gian phát triển sản phẩm hoặc tính năng ngay từ đầu. Điều này sẽ giúp bạn ngăn chặn các sản phẩm được dịch được một nửa và đánh giá thấp nhu cầu của khách hàng về trải nghiệm người dùng. 

+ Note: Dịch Hồ Sơ Thầu

Mọi người trong hội nghị Hello World đồng ý rằng bản địa hóa ngôn ngữ đã vượt xa ngành dịch thuật

Như nhiều diễn giả Tilman Büttner, Anne-Sophie Delafosse (Deliveroo), Antonella Zagaria (Auto1) và Eike-Marie Eiting (Jimdo) đã chỉ ra, bản địa hóa phải lưu ý nhiều hơn so với văn bản. Các khía cạnh như màu sắc, luồng chuyển hướng, vị trí của các nút CTA trong số nhiều thứ khác cần phải lưu ý đến khi bản địa hóa. Đặc biệt là khi lựa chọn tên sản phẩm! Chúng tôi đã cười nói vui vẻ khi Antonella chỉ cho chúng tôi một ví dụ sau:

Ở nhiều quốc gia nói tiếng Tây Ban Nha, “pajero” được dịch là người bất tài! Hãy tưởng tượng rằng Mitsubishi đã lãng phí bao nhiêu tiền khi đổi thương hiệu sản phẩm và họ có thể tránh được nó với một số nghiên cứu ban đầu.

Điều này cũng nhắc nhở chúng tôi về việc Honda không thay đổi tên của Fitta vào năm 2001 khi phát hành chiếc xe ở Thụy Điển. Trong tiếng Thụy Điển, “fitta” là một cách nói thô tục khi đề cập đến bộ phận sinh dục của người phụ nữ. Do đó, bản địa hóa ngay từ đầu dòng thời gian phát triển sản phẩm là một điều cần thiết.

Tập trung hóa những nhu cầu về bản địa hóa ngôn ngữ trong công ty

Eike-Marie Eiting, Anne-Sophie Delafosse và Antonella Zagaria đem lại cho chúng tôi rất nhiều điều đáng suy nghĩ. Hai người đầu tiên là những nhà quản lý bản địa hóa ngôn ngữ tại Jimdo và Deliveroo, và Antonella là Giám đốc sản phẩm tại Auto1.

Cả ba người trong số họ cho chúng tôi thấy rằng bản địa hóa ngôn ngữ có thể trở thành một thách thức. Các doanh nghiệp thường bỏ bê bản địa hóa ngôn ngữ hoặc xử lý nó theo cách phi tập trung, đó đã gây nên một sự hỗn loạn. Ai đã nghe câu nói điển hình “người X trong bộ phận X sử dụng được hai thứ tiếng, họ có thể dịch cái này được không?”

Tập trung hóa tất cả sự nỗ lực cho bản địa hóa ngôn ngữ là chìa khóa để thu hút thị trường nước ngoài và sau đó tạo ra nhiều doanh thu hơn. Hãy xem xét các hoạt động của Auto1 tại 30 quốc gia châu Âu và 25 ngôn ngữ: đó là không tập trung hóa sẽ là một thảm họa! Một thách thức chung cho Eike-Marie và Anne-Sophie là các yêu cầu dịch thuật đến từ khắp nơi.

Họ đã có rất nhiều việc để làm khi họ bắt đầu ở vai trò hiện tại của họ! Tuy nhiên, vai trò của họ đã không tồn tại cách đây một năm. Ngoài ra, cả ba diễn giả đều đồng ý rằng việc tập trung hóa tạo ra những dữ liệu đáng tin cậy. Bạn có thể phân tích khoản chi của công ty cho dịch thuật và ROI là bao nhiêu.

Những nhà quản lý bản địa hóa ngôn ngữ là những vị anh hùng

Công việc đầy ấn tượng của nhà quản lý bản địa hóa ngôn ngữ bao gồm việc tạo và duy trì các hướng dẫn về phong cách, thuật ngữ, bộ nhớ dịch trong số các tài nguyên khác. Chúng cũng đóng vai trò trung gian giữa các nhóm người cần bản địa hóa và các nhà ngôn ngữ học cung cấp nó.

Khi ai đó cần một bản dịch, họ sẽ điền vào một yêu cầu và gửi nó cho nhà quản lý bản địa hóa ngôn ngữ. Tại thời điểm đó, người này sẽ giao nhiệm vụ cho một nhà ngôn ngữ học hoặc một nhóm các nhà ngôn ngữ học, và sau đó sẽ giao nó cho bất cứ ai gửi yêu cầu.

Những lợi ích của việc tập trung bản địa hóa ngôn ngữ là dịch thuật đạt được nhiều tiến bộ trong từng bộ phận, do đó giải phóng thời gian của họ. Bằng cách này, họ có thể tập trung vào công việc thực tế của mình và những gì họ làm tốt nhất. Ngoài ra, tốc độ và chất lượng dịch thuật được cải thiện đáng kể và ảnh hưởng đến hiệu suất của sản phẩm trên thị trường mục tiêu.

 Ra mắt một sản phẩm và giải quyết hiệu quả các vấn đề kèm theo nó

Rikard Eide, một Kỹ sư phần mềm từ công ty khởi nghiệp bảng điều khiển năng lượng mặt trời Na Uy Otovo, đã chứng minh bằng báo cáo kinh nghiệm của mình về sự mở rộng mang tính hiệu quả cho công ty.

Bài thuyết trình của anh ấy đã đưa chúng tôi qua hành trình thương hiệu và sự mở rộng của họ từ Na Uy đến Thụy Điển và sau đó là Pháp. Tuy nhiên, Rikard đã thấy rằng đầu tư vào bản địa hóa ngôn ngữ trước khi vào thị trường Tây Ban Nha sẽ dẫn đến việc tránh rủi ro và chuyển đổi cao hơn.

 Chất lượng dịch thuật tránh được rủi ro

Đối với chúng tôi, đây không phải là một khái niệm mới. Tuy nhiên, David Benotmane từ Tập đoàn Glossa đã thể hiện điều này cực kỳ rõ ràng trong bài thuyết trình của mình. Sau khi Meriem Beloucif từ định nghĩa về chất lượng về ngữ nghĩa, David đã tiếp cận chất lượng về các hậu quả tiêu cực tiềm ẩn của một bản dịch tồi.

Để giảm thiểu rủi ro liên quan đến trách nhiệm pháp lý và an toàn sản phẩm và vì mục đích tuân thủ quy định, các công ty cần dịch tài liệu kỹ thuật của họ. Đặc biệt trong trường hợp bản dịch thiếu sót có thể dẫn đến thương tích hoặc tử vong.

Ông tiếp tục mô tả mô hình hỏi đáp và hệ thống của họ, trong đó các quy trình quản lý rủi ro cốt lõi theo ISO 31000 được áp dụng cho các quy trình trong các dự án dịch thuật. Một ma trận rủi ro cho phép phân tích rủi ro của các văn bản cần dịch để phát triển các quy trình đó cho các dự án dịch thuật. Việc thực hiện quản lý rủi ro toàn diện cho các bản dịch dẫn đến sự tuân thủ quy định cũng như chất lượng dịch thuật tốt hơn.

 AI và Dịch tự động đang định hình tương lai của ngành ngôn ngữ

Đây là chủ đề của một cuộc thảo luận ở cuối hội nghị. Jan Hinrichs từ Beluga, Ann Huels từ Wieners&Wieners và Jonathan Wuermeling từ Lengoo đã thảo luận về kinh nghiệm của chính họ với AI và NMT cả mặt tích cực và tiêu cực.

Đó là một cách tuyệt vời để kết thúc hội nghị vì tất cả chúng tôi đều có thể nhận ra rằng AI và Dịch tự động vẫn ở đây và định hình lại ngành công nghiệp dịch thuật tuy vẫn cần nhiều sự cải tiến. Theo ý kiến riêng của chúng tôi, trái với nhiều nhà ngôn ngữ học nhận thấy mối đe dọa trong các công nghệ này, chúng tôi nhìn thấy một cơ hội.

Đó là sẽ không có ít việc làm cho các nhà ngôn ngữ học, nhưng thay vào đó, bản chất công việc của chúng tôi đang thay đổi và chúng tôi cần phải thích nghi để tồn tại.

Chúng tôi rất thích nghe suy nghĩ của bạn về Dịch tự động bằng nơron! Vì vậy, hãy để lại ý kiến của bạn hoặc liên lạc với chúng tôi trực tiếp thông qua phương tiện truyền thông xã hội.

Bài viết chia sẻ kinh nghiệm dịch thuật đọc nhiêu nhất:

Rate this post