Lý do khiến đào tạo AI nói tiếng Việt là điều khó khăn

"Phong ba bão táp không bằng ngữ pháp Việt Nam"
Câu gốc là của mấy ông đi lô xiên, phong ba bão táp không bằng ngữ pháp tiếng nga thì đúng là vì tiếng ngú khó thật, xong ko biết chế cháo thế nào cuối cùng thành tiếng Việt.
 
Tóm tắt: Ngữ liệu có đủ nhiều để cho mô hình học hay không thôi. Chứ các hệ thống ngữ pháp dần dần gần như mất hết ảnh hưởng lên các mô hình LLM rồi
 
Ngày trước đi học tiếng Đức thì cảm thấy tiếng việt quá dễ thở. Danh từ thì có ít, nhiều, giống đực, cái, chung, bao nhiêu cái cấu trúc, ngữ pháp lằng nhằng. Thằng nào lôi mấy cái pháp ngữ VN ra so ko khác gì mẫu giáo, cấp 1 so vs cấp 3.
 
T coi mấy clip nước ngoài, khi nhắc về việc học tiếng Việt thì họ chỉ thường chỉ quan tâm và chia ra ngôn ngữ 2 miền Bắc - Nam thôi. Thực tế thêm miền Trung nữa, nhưng chắc ít người hoặc ít ảnh hưởng hơn nên thấy ko dc nhắc đến.
 
Nói được thì dễ, nhưng để tạo sự nhấn mạnh trong lời nói thì mới khó. AI nó phải hiểu được đoạn đang nói cần nhấn mạnh từ nào, đoạn nào, ngắt nhịp ra sao thì mới là xịn. Chứ giờ loại đọc phiên phiến đầy, nghe cũng tạm nhưng chưa hoàn chỉnh mấy, nói ngang phè.
 
Nói được thì dễ, nhưng để tạo sự nhấn mạnh trong lời nói thì mới khó. AI nó phải hiểu được đoạn đang nói cần nhấn mạnh từ nào, đoạn nào, ngắt nhịp ra sao thì mới là xịn. Chứ giờ loại đọc phiên phiến đầy, nghe cũng tạm nhưng chưa hoàn chỉnh mấy, nói ngang phè.

AI nói thì tệ. Nhưng thấy có AI giả giọng ca sĩ rồi đó bác. Nghe giống phết mà.
 
AI nói thì tệ. Nhưng thấy có AI giả giọng ca sĩ rồi đó bác. Nghe giống phết mà.
ý fen là con suno chứ gì? nó là dựa trên những note nhạc rồi nó ghép lời đọc vào theo âm quãng đó, nói chung vẫn ngang lắm. Tiếng anh thì còn tạm đc chứ tiếng việt nhiều lúc trái dấu nó hát ko đc đâu. nghe nói fail lắm.
 
Cung cầu, và dữ liệu là chính. Mấy cái đơn giản như nhận dạng giọng nói cũng có bn người dùng đâu, bọn biết dùng thì t.a nó lại ngon rồi.
 
Tiếng việt dễ học nhưng khó hiểu, khó sử dụng trong văn bản or đối thoại sâu. Đơn giản vì ít quy tắc nên vậy, cái làm nó dễ cũng là cái làm nó khó.
Nhưng cái này đếch phải vấn đề với AI :smile:
 
Đấm vài tỏi đô đầu tư training xem có khó hay không. Đơn giản là không có tiền đầu tư, lợi nhuận ko cao thì nó ko thèm làm thôi.
 
Làm con ai giỏi tiếng việt lại thông minh như chatgpt thì khéo ra mắt 3 4 bữa là cái máy chủ bị tạm giam vì tội... :shame:
 
"Phong ba bão táp không bằng ngữ pháp Việt Nam" thật các bạn chứ cái câu này nhảm vc, cái gì con Vịt cũng phải nhất thì mới thích cơ. Ngữ pháp tiếng Việt xếp vào hàng dễ nhất, vì ngôn ngữ tiếng Việt là ngôn ngữ độc lập nhất thế giới, cái này khoa học chứng minh rồi. Các từ đứng độc lập với nhau, từ nào ra từ nấy, không có chia động từ như phần lớn các ngôn ngữ khác. 3 thể qk ht tl chỉ có đúng 3 chữ: đã, đang và sẽ. Các cấu trúc cũng dễ học vì chỉ cần nhớ từ là đủ, không cần chia. Tiếng Việt dễ hơn tiếng Trung rất nhiều vì ít từ đồng nghĩa hơn do có rất nhiều âm tiết.

Cái khó của tiếng Việt là hệ thống phát âm quá khó, và chữ viết không được quá hoàn hảo vì còn Tr, ch, d, gi, r,...

Tiếng Việt có ngữ pháp cực kỳ đơn giản.
Fact.
Học 2 ngôn ngữ trở lên (thậm chí 1) sẽ thấy câu này nhamlon.
 
Nước ngoài chắc ko có phương ngữ, từ lóng, từ gen Z chắc, thậm chí nhiều hơn, từ vựng cũng nhiều hơn
 
Lý do là “đíu cần làm tiếng Việt” :go: . Cứ vị thế nâng cao, sòng phẳng chơi đẹp thì mẹ nó sợ gì ko phổ biến đc tiếng Việt

via theNEXTvoz for iPhone
 
Cái khó là hiểu ngôn ngữ. Xong công đoạn đó thì chuyển ngữ (text to speech) là quá dễ dàng rồi còn gì mà khó.
Mà hiểu ngôn ngữ Việt thì GPT nó còn kinh hơn cả người thì chỉ có các ông Samshit yếu kém chứ đi đổ cho Vietlang?
 
Back
Top