thảo luận Truyện tàu dịch máy (MTL)

nhân tiện thì các bạn có muốn mấy chức năng như:
  • đánh giá bình luận truyện
  • tạo list truyện đề cử
  • diễn đàn thảo luận

không để tôi làm luôn, vụ database thì qua thử nghiệm đống review yousuu cũng khá ổn rồi đấy, làm cái tương tự cho tiếng việt cũng chẳng khó.

hay là vẫn ưu tiên máy dịch hơn?

/// nói chung các bạn phải nêu ra ý kiến thì tôi mới có nhiệt tình mà làm, không thì tôi cũng lười lắm, giờ muốn làm nhất là app thêm translation annotation trực tiếp trên raw page manga cơ :(
Mấy cái kia cũng na ná nhau, tạm thời tôi thấy nên làm cái bình luận truyện cho nó đơn giản. :big_smile:

Còn cái máy dịch thì tôi đề xuất vài ý kiến như này:

1. Thêm nghĩa khác nhau khi từ loại khác nhau -> bỏ bớt mấy từ loại kiểu danh động, danh tính, chuyển thành độ ưu tiên cao thấp (động > tính > danh chẳng hạn).

2. Thêm một số cấu trúc dễ gặp, ví dụ với AB là cụm từ: A不A/A没A -> có A hay không, A不AB/A没AB -> có AB hay không, A了B -> AB,... sau đó có thể xóa hết mấy cái entry kiểu này đi.

3. Một entry = một hoặc nhiều từ. Nói chung cái máy dịch tuy chia từ khá tốt nhưng vẫn tồn tại những trường hợp kiểu như 知道家庭, để nguyên thì nó dịch thành [biết] [đạo gia] [đình], thêm cái entry thành một cục [biết gia đình] thì lại không biết cho nó thành từ loại gì do ảnh hưởng đến ngữ pháp.

-> Sửa thành thay vì xử lý một entry dài (>= 3 chữ) thành một cục thì có thể coi như một cụm nhiều từ, 知道家庭 = động từ 知道 + danh từ 家庭 chẳng hạn.
 
Mấy cái kia cũng na ná nhau, tạm thời tôi thấy nên làm cái bình luận truyện cho nó đơn giản. :big_smile:

Còn cái máy dịch thì tôi đề xuất vài ý kiến như này:

1. Thêm nghĩa khác nhau khi từ loại khác nhau -> bỏ bớt mấy từ loại kiểu danh động, danh tính, chuyển thành độ ưu tiên cao thấp (động > tính > danh chẳng hạn).

2. Thêm một số cấu trúc dễ gặp, ví dụ với AB là cụm từ: A不A/A没A -> có A hay không, A不AB/A没AB -> có AB hay không, A了B -> AB,... sau đó có thể xóa hết mấy cái entry kiểu này đi.

3. Một entry = một hoặc nhiều từ. Nói chung cái máy dịch tuy chia từ khá tốt nhưng vẫn tồn tại những trường hợp kiểu như 知道家庭, để nguyên thì nó dịch thành [biết] [đạo gia] [đình], thêm cái entry thành một cục [biết gia đình] thì lại không biết cho nó thành từ loại gì do ảnh hưởng đến ngữ pháp.

-> Sửa thành thay vì xử lý một entry dài (>= 3 chữ) thành một cục thì có thể coi như một cụm nhiều từ, 知道家庭 = động từ 知道 + danh từ 家庭 chẳng hạn.

máy dịch thì dần dần cải thiện dần, mấy cái đề nghị này thực ra lại dễ, cái khó là tổng hợp pattern vào mà làm + test

cái đau đầu hơn là phân biệt bổ ngữ, tân ngữ, rồi áp dụng các luật ngữ pháp với liên từ cơ.
nói chung implement thuật toán thì dễ, cái khó nhất với tôi là tổng hợp đủ sample để quản lý chất lượng, vì rõ ràng là nhiều khi nó đúng chỗ này nhưng không đúng chỗ kia.

mà cái tri đạo gia đình có vẻ sai rồi, nếu đúng thì tri đạo 1 từ 2 chữ gia đình 1 từ 2 chữ dc ưu tiên cao hơn 1 + 2 + 1 :confused: để tôi xem lại xem vụ ưu tiên từ có sai ở đâu không.

nói chung cũng muốn thêm phần thảo luận, đặc biệt thảo luận chung về dịch thuật cũng là vì vụ này, một thread ở voz không đủ, phải có cả cái forum mỗi cái chia label ra.

thực ra thì các kênh thảo luận khác có khả năng hơn, ví dụ slack, discord nó có threads, cơ mà ở đay chả ai dùng. cũng khó.

hoặc là github issue nó cũng là kênh tổng hợp issue ngon, cơ mà cũng chả ai vào :( tôi thì trí nhớ cũng kém rồi, nhiều cái các bạn nói nhưng về sau quên luôn :confused:
 
mà nghĩ lại thì mấy cái review hay booklist thì để sau cũng dc

còn bình luận truyện thì chia ra là thảo luận chung với bình luận truyện của một bộ.
mỗi topic lập ra sẽ nằm ở một trong hai cái này, khi lập topic dc thêm một vài nhãn cố định như "thảo luận", "dịch thuật", "hỏi đáp", "yêu cầu" gì đó nữa để phân loại. bên trong cũng làm comment đơn giản thôi.

mấy cái khác thêm sau.

kể ra có cái bình luận chương cũng vui, mà chivi có nhiều nguồn cái này lại thành khó, haizz.
 
mà nghĩ lại thì mấy cái review hay booklist thì để sau cũng dc

còn bình luận truyện thì chia ra là thảo luận chung với bình luận truyện của một bộ.
mỗi topic lập ra sẽ nằm ở một trong hai cái này, khi lập topic dc thêm một vài nhãn cố định như "thảo luận", "dịch thuật", "hỏi đáp", "yêu cầu" gì đó nữa để phân loại. bên trong cũng làm comment đơn giản thôi.

mấy cái khác thêm sau.

kể ra có cái bình luận chương cũng vui, mà chivi có nhiều nguồn cái này lại thành khó, haizz.
Bình luận đơn chương thì có thể cho user quyền hạn đề cử nguồn (của từng bộ truyện), hoặc là đếm lượt đọc của nguồn, cái nào nhiều nhất thì recommend.

Không giải quyết được 100% nhưng chắc cũng cỡ 70%, đoán thế. :burn_joss_stick:
 
Bình luận đơn chương thì có thể cho user quyền hạn đề cử nguồn (của từng bộ truyện), hoặc là đếm lượt đọc của nguồn, cái nào nhiều nhất thì recommend.

Không giải quyết được 100% nhưng chắc cũng cỡ 70%, đoán thế. :burn_joss_stick:
tôi thì định giải quyết là lúc đọc chương vẫn mở dc cái panel bình luận ra ở bên phải (giống cái giải nghĩa), nó sẽ hiện lên danh sách các topic của bộ truyện đang đọc, nếu các bạn thích có thể mở một cái topic để thảo luận riêng về chương đang đọc, lúc đó thì xem chương đó ở nguồn nào cũng ổn, hơi mất công tìm chút thôi.
 
Vụ review với bình luận tôi không ý kiến, có thì tốt không có cũng không sao.

Về máy dịch anh tôm tép nói khá chuẩn rồi, nhất là mục 2 do đọc khó chịu quá nên tôi thêm lại 1 mớ entry dạng đó, chờ implement mấy trường hợp đó rồi thì xóa đi.
Thêm mấy case sở hữu dạng đại từ + danh từ rất dễ sai. Ví dụ nhân vật tên A nói "ta A ...." -> "A của ta ....".
Các case sở hữu có 的 thì thường chỉ đảo từ ngay trước và sau 的, nếu trước 的 là một cụm từ dài thì sau khi đảo câu cú sẽ cực kì nát. Nhưng nếu thêm cả cụm lại không hợp lý về việc phân từ loại...
Việc chia từ loại bây giờ cũng quá phức tạp, nhiều từ không biết nên chọn từ loại gì cho chuẩn, đúng trường hợp này thì sai trường hợp kia. Người dùng bình thường khi thêm từ và nhìn vào đống từ loại cảm giác cực kì kinh dị.
 
Vụ review với bình luận tôi không ý kiến, có thì tốt không có cũng không sao.

Về máy dịch anh tôm tép nói khá chuẩn rồi, nhất là mục 2 do đọc khó chịu quá nên tôi thêm lại 1 mớ entry dạng đó, chờ implement mấy trường hợp đó rồi thì xóa đi.
Thêm mấy case sở hữu dạng đại từ + danh từ rất dễ sai. Ví dụ nhân vật tên A nói "ta A ...." -> "A của ta ....".
Các case sở hữu có 的 thì thường chỉ đảo từ ngay trước và sau 的, nếu trước 的 là một cụm từ dài thì sau khi đảo câu cú sẽ cực kì nát. Nhưng nếu thêm cả cụm lại không hợp lý về việc phân từ loại...
Việc chia từ loại bây giờ cũng quá phức tạp, nhiều từ không biết nên chọn từ loại gì cho chuẩn, đúng trường hợp này thì sai trường hợp kia. Người dùng bình thường khi thêm từ và nhìn vào đống từ loại cảm giác cực kì kinh dị.
haizz, vì mấy cái này cho nên tôi mới lười chả muốn làm.

hôm nọ ngồi đọc về từ trạng thái, đọc mãi đọc mãi chả thấy nó khác tính từ ở chỗ nào :v.
mà tàu cũng không có tính từ mà là có hình dung từ, ứng dụng rộng rãi hơn, lại càng nát.

một đống từ nó phân loại xong chả hiểu vì mục đích gì, muốn tìm hiểu thì: 1. check tất cả những từ được phân loại dạng đó trong từ điển. 2. tìm tài liệu tiếng trung xem giải thích của nó.

hiện tại thì chỉ chắc chắn dc số từ với lượng từ, mấy cái khác vẫn còn đang tìm hiểu.
đậu má làm cái này vất vả vãi :confused:

mà các bạn check thử xem chế độ dịch cơ bản đã ổn chưa hay vẫn còn lỗi? còn thiếu vụ xử lý ngày tháng năm là nó tương đương với bản cũ rồi đấy, dùng tạm cũng dc.
 
haizz, vì mấy cái này cho nên tôi mới lười chả muốn làm.

hôm nọ ngồi đọc về từ trạng thái, đọc mãi đọc mãi chả thấy nó khác tính từ ở chỗ nào :v.
mà tàu cũng không có tính từ mà là có hình dung từ, ứng dụng rộng rãi hơn, lại càng nát.

một đống từ nó phân loại xong chả hiểu vì mục đích gì, muốn tìm hiểu thì: 1. check tất cả những từ được phân loại dạng đó trong từ điển. 2. tìm tài liệu tiếng trung xem giải thích của nó.

hiện tại thì chỉ chắc chắn dc số từ với lượng từ, mấy cái khác vẫn còn đang tìm hiểu.
đậu má làm cái này vất vả vãi :confused:

mà các bạn check thử xem chế độ dịch cơ bản đã ổn chưa hay vẫn còn lỗi? còn thiếu vụ xử lý ngày tháng năm là nó tương đương với bản cũ rồi đấy, dùng tạm cũng dc.

Qua nay tôi dùng mode cơ bản thấy cũng ổn, không có vấn đề gì quá lớn. Chủ yếu vẫn là việc nó dùng từ điển pleb riêng nên nếu lâu lâu gặp từ muốn xóa phải chạy qua mode nâng cao rồi chạy về...
 
Qua nay tôi dùng mode cơ bản thấy cũng ổn, không có vấn đề gì quá lớn. Chủ yếu vẫn là việc nó dùng từ điển pleb riêng nên nếu lâu lâu gặp từ muốn xóa phải chạy qua mode nâng cao rồi chạy về...
ờ cái này thì tôi cũng gặp. đang tính là tách đống [hv] với [qt] ra một từ điển riêng, chỉ show ra khi ở mode nâng cao.

thế cũng ổn rồi, coi như có cái ổn định mà chạy, cái dịch nâng cao là cả quá trình dài hơi chứ không ngon ngay được.

mà tôi xem thế này thì đúng là cần ưu tiên làm diễn đàn.

thứ nhất là giải thích mấy phân loại từ nó dùng thế nào, cái này tôi cũng cần check dần rồi viết dần.

thứ hai là giờ mỗi lần các bạn report toàn nói chung chung không đưa ra dc cả câu cụ thể cũng rất khó cho tôi, nếu có diễn đàn thì tôi thêm cái nút tạo topic có template sẵn về dịch thuật với đầy đủ context để tôi kiểm tra thì dễ hơn nhiều .cái icon bên trái của thêm từ là dành cho vụ này

report về lỗi cả chương cũng dễ hơn.

thứ ba là để mở rộng thêm nhiều thành viên, phải có nhiều người vào cùng phát triển cùng nêu ý kiến thì nó mới ngon dc, giờ có vài mống mà định làm cái perfect translator nói thật là quá viển vông :v

p/s: mà của khỉ nguồn bqg_5200 bị lỗi mấy tuần rồi chả ai nhắc đến nhỉ :-j chả lẽ người dùng của chivi rớt hết rồi
 
p/s: mà của khỉ nguồn bqg_5200 bị lỗi mấy tuần rồi chả ai nhắc đến nhỉ :-j chả lẽ người dùng của chivi rớt hết rồi

Tôi chả rờ tới nguồn đó luôn...mà theo cảm giác của tôi thì hiện tại chivi có vài người dùng thôi: anh, tôi, tôm tép, eet789, Linhh. Hết.
Lịch sử sửa từ điển cũng quanh quẩn nhiêu đó.
Thảo luận thớt này cũng nhiêu đó.
Free user thì tôi không biết rồi
 
Tôi chả rờ tới nguồn đó luôn...mà theo cảm giác của tôi thì hiện tại chivi có vài người dùng thôi: anh, tôi, tôm tép, eet789, Linhh. Hết.
Lịch sử sửa từ điển cũng quanh quẩn nhiêu đó.
Thảo luận thớt này cũng nhiêu đó.
Free user thì tôi không biết rồi

Vì chỉ có mấy người đó là đc quyền thêm từ mà 🤣 thêm vài bạn nữa thôi.

Còn lại thì google analytics báo mỗi ngày có hơn trăm người vào. Vấn đề là không ai thảo luận gì thôi. Cho nên tôi muốn thử thêm diễn đàn xem có khác gì không.
 
Đợt này đang chơi game mobile nên ít đọc truyện xD

Với cả truyện bây giờ có 2 thằng biqubao với bxworg load tốt hơn bqg_5200, nên cũng chả để ý mấy xD
 
Đợt này đang chơi game mobile nên ít đọc truyện xD

Với cả truyện bây giờ có 2 thằng biqubao với bxworg load tốt hơn bqg_5200, nên cũng chả để ý mấy xD
tôi từ tháng 5 cũng bỏ đọc, làm vì các bạn thôi :)

btw, check lịch sử đọc thì chỉ tầm 20 registered users còn đọc trong vài ngày này =)

thôi đợi tôi rảnh hoàn thiện đầy đủ tính năng rồi đi quảng bá các chỗ khác vậy. với lại trang chivi thực ra cũng không thân thiện với người dùng lắm, các bạn ở đây thì còn được hướng dẫn dùng, chứ người thường vào xem chả hiểu cóc khô gì, kể cả việc thêm từ :confused: cần dành thêm thời gian sửa lại trang, thêm hướng dẫn các kiểu...
 
à mà đệt tôi vừa nhớ ra một nguyên nhân, đơn giản là vì các chương truyện không cập nhật nữa :LOL:)
trước tôi cho nó tự động cập nhật mỗi khi có người click vào, kể cả là bot, cho nên dữ liệu luôn up to date, mặc dù lag.
vụ bấm button cập nhật nhiều người còn không rõ luôn, thấy không có chương mới họ lại chả bỏ đi :)
 
à mà đệt tôi vừa nhớ ra một nguyên nhân, đơn giản là vì các chương truyện không cập nhật nữa :LOL:)
trước tôi cho nó tự động cập nhật mỗi khi có người click vào, kể cả là bot, cho nên dữ liệu luôn up to date, mặc dù lag.
vụ bấm button cập nhật nhiều người còn không rõ luôn, thấy không có chương mới họ lại chả bỏ đi :)

Vụ không cho free user refresh mấy nguồn truyện chính + sửa từ điển riêng đuổi đi khá nhiều người ấy nhỉ :)
Btw, bộ Atlantis chiến ký (亚特兰蒂斯战记) trên chivi không có text à?
 
Vụ không cho free user refresh mấy nguồn truyện chính + sửa từ điển riêng đuổi đi khá nhiều người ấy nhỉ :)
Btw, bộ Atlantis chiến ký (亚特兰蒂斯战记) trên chivi không có text à?
nói chung người dùng thì có thể build dần, làm website đủ tính năng cái đã.

ờ text của mấy bộ xxx chưa có đâu nhé, lần nào cũng bảo để rảnh thêm vào mà cuối cùng lười chưa thêm. đợi hết 8/8 project thằng bạn end sale xem dc bao nhêu xiền thì tôi tập trung làm tiếp. giờ distract quá :">
 
Một số từ ghép được với 的 ở cuối câu đều bị đổi thành "của của", ví dụ đại từ nhân xưng hay tên riêng, một số khác như tính từ thì không sao.

Mode nâng cao nhé.

1627869333803.png

1627869364406.png
 
@Nipin khi nào có thời gian ông cân nhắc thêm tính năng xem thư đơn bên yousuu được không?

//tính năng tự thêm chương truyện vào nguồn chivi đang lock ở lv mấy vậy ông?
 
Last edited:
Back
Top