thảo luận Truyện tàu dịch máy (MTL)

tk tech của thím sao chuyển tiền toàn lỗi
9ZCJReH.png

Để xem có sai không. Mà có vài bạn khác vẫn gửi được mà :/

P/s đổi sang số này thử xem
tqy6Fgp.jpg


Sent from HUAWEI COR-L29 using vozFApp
 
Last edited:
28ZS76w.png


phần quản lý từ điển bây giờ đã sắp xếp theo lần sửa mới nhất (dữ liệu chưa up to date đâu nhé). à có vấn đề là tôi lưu trữ tất cả thông tin nhập, kể cả kết quả cũ cho nên nếu tìm kiếm theo tiếng trung sẽ thấy bị trùng.

mai thêm phần giải nghĩa + batch insert là coi như đủ dùng.
đầy đủ tính năng thì phải có cả sửa xoá hàng loạt + download nữa, mà độ ưu tiên thấp thôi để sau.
 
Cái textbox tìm kiếm trên thanh điều hướng của dev.chivi đang không dùng được nhé, enter và click cái button kính lúp đều không được.

1626445856877.png


Ờ với cả cái ở sidebar cũng không send được request bằng enter. Bấm cái button kính lúp thì được, cơ mà hai cái button đang bị chồng lên nhau, di chuột vào thì button kính lúp đè lên.

1626446262157.png
di con trỏ vào ->
1626446339438.png
 
Cái textbox tìm kiếm trên thanh điều hướng của dev.chivi đang không dùng được nhé, enter và click cái button kính lúp đều không được.

View attachment 656217

Ờ với cả cái ở sidebar cũng không send được request bằng enter. Bấm cái button kính lúp thì được, cơ mà hai cái button đang bị chồng lên nhau, di chuột vào thì button kính lúp đè lên.

View attachment 656232 di con trỏ vào -> View attachment 656237
đã sửa xong:
  • hiển thị kết quả tìm kiếm: quên cập nhật logic
  • enter để tìm kiếm: cái này là lỗi ở nhiều chỗ luôn, bất cứ cái nào cần enter đều bị lỗi, đã sửa :">
  • vụ button đè lên nhau thì chắc chỉ mấy cái iOS hay MacOS mới dính, tôi tạm thời bỏ đoạn css liên quan tới normalize search input đi xem có hết không, hết nhớ confirm :D

p/s: sửa mấy cái lặt vặt này cảm giác có thành tựu vãi, làm mấy chức năng to cả tuần hoặc vài tháng không xong mà xong cũng chả ai nói gì :(

à mà nhân tiện thì đợt trước đổi cơ sở dữ liệu sang database tử tế, tôi bảo ngừng vì có vấn đề với cái thư viện đang dùng, mà ngay hôm đó tôi đổi thư viện khác, tự sửa tí code thì đã chạy được rồi. đợi xong đợt này thì quay ra làm website tử tế vậy, ít nhất thì cũng phải có phần diễn đàn thảo luận để thông báo cập nhật hay báo lỗi (tiện thể chat về dịch thuật hay tìm truyện luôn), chứ cứ rải rác mấy chỗ thế này mệt vãi.
 
Nhân tiện, bên dev.chivi đang có vụ bấm next chapter thì không nhảy thẳng lên đầu chap mới mà ngồi chờ nó cuộn ngược lên, ảnh hưởng reading exp vãi :(
 
À với lại nhiều chỗ tự nhiên viết hoa sau dấu phẩy, check data không thấy vấn đề, ông nipin coi lại thử. Cũng bên dev.chivi
 
À với lại nhiều chỗ tự nhiên viết hoa sau dấu phẩy, check data không thấy vấn đề, ông nipin coi lại thử. Cũng bên dev.chivi
lần sau báo lỗi thì nhớ chụp ảnh hoặc link tới chỗ lỗi, không thì ai mà biết mà tìm cho bạn?

Nhân tiện, bên dev.chivi đang có vụ bấm next chapter thì không nhảy thẳng lên đầu chap mới mà ngồi chờ nó cuộn ngược lên, ảnh hưởng reading exp vãi :(
cái này nó check theo hệ thống, bạn muốn không animation thì bỏ cái animation từ hệ thống là hết.

https://mcmw.abilitynet.org.uk/how-turn-animations-windows-10
https://developer.mozilla.org/en-US/docs/Web/CSS/@media/prefers-reduced-motion

tất nhiên nếu nhiều bạn không thích cái animation này thì tôi có thể bỏ đi luôn cũng dc, có một dòng css.

btw, đã thêm phần giải nghĩa trong trang quản lý từ điển + giờ phần giải nghĩa sẽ hiển thị cả dòng thay vì một đoạn như trước. đù mất toi một đêm tweak cái này mà vẫn chưa vừa ý: muốn thêm cái button thêm/sửa từ bên cạnh mấy cái entries nữa cho tiện.
thôi để sau :v
 
p/s: sửa mấy cái lặt vặt này cảm giác có thành tựu vãi, làm mấy chức năng to cả tuần hoặc vài tháng không xong mà xong cũng chả ai nói gì :(
Mấy cái UI lặt vặt này mới dễ thấy chứ back/engine có vjp pro thế nào cũng chỉ có dev ngồi tự high với nhau.
WawmAwM.png
Cũng định chuyển sang dev.chivi xem cái phân loại từ mới mà data chưa up to date hẳn, đọc cũng lười sửa lần 2. Thôi đợi tí vậy.

Enter thì ok rồi mà cái button kính lúp trên thanh điều hướng vẫn chưa bấm được:
1626481100575.png


Ờ mà đm soi kỹ mới thấy cái này cũng bị chồng icon, mà thôi minor bug kệ đi cũng chẳng ảnh hưởng lắm.

À hôm nào ổn ổn thì quét lại yousuu thêm mấy bộ mới mới nhé. Thêm cái vỏ rỗng thôi cũng được tôi đọc bộ nào tự load chương bộ đấy. Thấy bọn qidian giới thiệu mấy bộ nghe cũng hay ho mà tìm không thấy.
yBBewst.png
 
@Nipin Vừa phát hiện logic bug này trong dev.chivi.

Ví dụ một đoạn văn:

1626483012656.png


Phần chữ Hán và Hán Việt thì ok, nhưng ở phần Vietphrase, có vẻ các từ đặc biệt (着,是,地。。。) bị bỏ qua và không được tính là 1 entry, dẫn đến tình trạng bị lệch từ giữa Vietphrase - chữ Hán.

Cụ thể hơn, trước các từ đặc biệt thì mọi thứ vẫn bình thường:

1626483353504.png

1626483371117.png

1626483388523.png


Sau từ đặc biệt là bắt đầu bị lệch:

1. Click vào "mà"

1626483429713.png


2. Click vào "xem"

1626483475072.png


3. Click vào "lấy"

1626483508882.png


4. Click vào "tác chiến" (càng về sau càng nhiều từ đặc biệt nên lệch càng xa)

1626483581438.png
 
Mấy cái UI lặt vặt này mới dễ thấy chứ back/engine có vjp pro thế nào cũng chỉ có dev ngồi tự high với nhau.
WawmAwM.png
Cũng định chuyển sang dev.chivi xem cái phân loại từ mới mà data chưa up to date hẳn, đọc cũng lười sửa lần 2. Thôi đợi tí vậy.

Enter thì ok rồi mà cái button kính lúp trên thanh điều hướng vẫn chưa bấm được:View attachment 657628

Ờ mà đm soi kỹ mới thấy cái này cũng bị chồng icon, mà thôi minor bug kệ đi cũng chẳng ảnh hưởng lắm.

À hôm nào ổn ổn thì quét lại yousuu thêm mấy bộ mới mới nhé. Thêm cái vỏ rỗng thôi cũng được tôi đọc bộ nào tự load chương bộ đấy. Thấy bọn qidian giới thiệu mấy bộ nghe cũng hay ho mà tìm không thấy.
yBBewst.png
à chỗ điều hướng thì nó không phải button, chỉ là icon thôi :v không bấm dc là phải.... mà đang cân nhắc có nên bỏ đi không.

cái icon bên trong thì rõ ràng là chỉ hàng apple mới bị rồi, để rảnh tôi check :/

vụ quét thì thực ra có job chạy crawl liên tục, cái chính là tôi đợt trước sửa hết sang logic mới (dùng database) rồi, cái generation cũ (ra file) không còn chạy nữa, cũng lười sửa :v
đợi update lên một thể nhé, tầm 1 2 tuần nữa.
 
@Nipin Vừa phát hiện logic bug này trong dev.chivi.

Ví dụ một đoạn văn:

View attachment 657650

Phần chữ Hán và Hán Việt thì ok, nhưng ở phần Vietphrase, có vẻ các từ đặc biệt (着,是,地。。。) bị bỏ qua và không được tính là 1 entry, dẫn đến tình trạng bị lệch từ giữa Vietphrase - chữ Hán.

Cụ thể hơn, trước các từ đặc biệt thì mọi thứ vẫn bình thường:

View attachment 657653
View attachment 657655
View attachment 657656

Sau từ đặc biệt là bắt đầu bị lệch:

1. Click vào "mà"

View attachment 657657

2. Click vào "xem"

View attachment 657658

3. Click vào "lấy"

View attachment 657660

4. Click vào "tác chiến" (càng về sau càng nhiều từ đặc biệt nên lệch càng xa)

View attachment 657662
haizz một đêm vẫn chưa xong, thôi bỏ qua tính sau. phần này còn phải sửa nhiều :confused:
 
@ToomSpaet à mà tôi nhớ ra rồi, không phải là do từ đặc biệt đâu, là do tôi nhầm 2 giá trị index với nhau (một cái là index của cụm từ, một cái là index của ký tự trong text), pass nhầm giá trị cho nên nó bị lệch đấy.

btw, cũng fix luôn vụ bấm vào nhiều khi nó không highlight hán việt rồi :D
 
@ToomSpaet à mà tôi nhớ ra rồi, không phải là do từ đặc biệt đâu, là do tôi nhầm 2 giá trị index với nhau (một cái là index của cụm từ, một cái là index của ký tự trong text), pass nhầm giá trị cho nên nó bị lệch đấy.

btw, cũng fix luôn vụ bấm vào nhiều khi nó không highlight hán việt rồi :D
OK vừa xem lại thì thấy được rồi. :big_smile:
 
@themaestro đã fix vụ viết hoa sau dấu phẩy, đúng hơn là dấu phẩy liệt kê.
đáng lẽ chỗ đó check dấu chấm giữa · thế quái nào lại thành dấu :v

vụ animation thì bạn nào muốn bỏ không để tôi bỏ luôn :confused:
 
tôi mới thử thêm ngữ pháp vào bên dev.chivi.xyz.

để highlight màu nền đậm cho dễ phân biệt, mấy cái màu đỏ đều là có áp dụng luật ngữ pháp.

các bạn rảnh vào check thử xem chất lượng thế nào nhé?

à mà vì chưa thêm động từ li hợp vào cho nên một số cái bị hơi sai, kiểu mấy chỗ như "đả" hay "mang" gì gì đó. đợi fix dần :D

với lại từ điển nhiều khi đánh dấu sai nữa, cái này cũng cần sửa :)
 
tôi mới thử thêm ngữ pháp vào bên dev.chivi.xyz.

để highlight màu nền đậm cho dễ phân biệt, mấy cái màu đỏ đều là có áp dụng luật ngữ pháp.

các bạn rảnh vào check thử xem chất lượng thế nào nhé?

à mà vì chưa thêm động từ li hợp vào cho nên một số cái bị hơi sai, kiểu mấy chỗ như "đả" hay "mang" gì gì đó. đợi fix dần :D

với lại từ điển nhiều khi đánh dấu sai nữa, cái này cũng cần sửa :)
Phải sửa nhiều đấy.
BdgiW7R.png
Bao giờ deploy lên chivi thì ông thêm cái toggle bật tắt ngữ pháp để sửa từ từ mà đỡ ảnh hưởng mọi người.

Chủ yếu là từ loại bị sai, một số từ loại dễ bị lẫn lộn (trạng từ - tính từ chẳng hạn), cái này chả có cách nào khác ngoài sửa dần. Nhân tiện có cái paper nào nói về mấy cái từ loại nào thì ông quăng lên đây luôn đi.

Một số entry được dành riêng cho convert truyền thống như 这些,那些 chẳng hạn, giờ đã có thể tách ra thành từ đơn 这 (đại từ chỉ thị) và 些 (lượng từ), nhưng sẽ ảnh hưởng chất lượng khi tắt ngữ pháp:

1626567332284.png


Bỏ 那些:

1626567369511.png


Đau đầu nhất là mấy từ đa nghĩa đa từ loại thường dùng không biết nhét vào đâu như 只,老, mấy từ này theo tôi tốt nhất là để riêng như 是,会, sau này làm ngữ pháp riêng luôn chứ không éo biết sửa như nào luôn.
ME1tJB0.png


Mấy từ kiểu 形状 cũng vậy, thỉnh thoảng nó là danh từ, thỉnh thoảng nó là ngữ tố danh từ, thành ra 一个爱心形状的手势 -> (một cái ái tâm) (thủ thế hình dáng).

Ừ mà qua cái ví dụ trên thì thấy có vẻ ngữ pháp cũng chưa xong hẳn với mấy cái ngữ tố? Cái rule bỏ 的 khi trước cụm đó là động từ hình như cũng chưa có.
 
Phải sửa nhiều đấy.
BdgiW7R.png
Bao giờ deploy lên chivi thì ông thêm cái toggle bật tắt ngữ pháp để sửa từ từ mà đỡ ảnh hưởng mọi người.

Chủ yếu là từ loại bị sai, một số từ loại dễ bị lẫn lộn (trạng từ - tính từ chẳng hạn), cái này chả có cách nào khác ngoài sửa dần. Nhân tiện có cái paper nào nói về mấy cái từ loại nào thì ông quăng lên đây luôn đi.

Một số entry được dành riêng cho convert truyền thống như 这些,那些 chẳng hạn, giờ đã có thể tách ra thành từ đơn 这 (đại từ chỉ thị) và 些 (lượng từ), nhưng sẽ ảnh hưởng chất lượng khi tắt ngữ pháp:

View attachment 659316

Bỏ 那些:

View attachment 659317

Đau đầu nhất là mấy từ đa nghĩa đa từ loại thường dùng không biết nhét vào đâu như 只,老, mấy từ này theo tôi tốt nhất là để riêng như 是,会, sau này làm ngữ pháp riêng luôn chứ không éo biết sửa như nào luôn.
ME1tJB0.png


Mấy từ kiểu 形状 cũng vậy, thỉnh thoảng nó là danh từ, thỉnh thoảng nó là ngữ tố danh từ, thành ra 一个爱心形状的手势 -> (một cái ái tâm) (thủ thế hình dáng).

Ừ mà qua cái ví dụ trên thì thấy có vẻ ngữ pháp cũng chưa xong hẳn với mấy cái ngữ tố? Cái rule bỏ 的 khi trước cụm đó là động từ hình như cũng chưa có.
à mà tôi mới kiểm tra được độ khả dụng của thuật toán thôi chứ về ngữ pháp thì chắc được 1/3 là cùng.
gớm một tối dính vòng lặp vô tận liên tục, treo cả cái WSL phải restart lại mấy lần. giờ thì ngon hẳn rồi :D

- số lượng từ thì còn phải viết cái thuật toán dịch riêng, ví dụ một ngàn vạn phải dịch ra được là một trăm triệu (ra 100.000 thì dễ cơ mà không hay).
cái này còn 2 trường hợp đặc biệt là kết hợp số và chữ, ví dụ 100 vạn thì dịch chuẩn là ra 1 triệu chứ không phải là một triệu....
với lại còn trường hợp bảy tám trăm vạn, hai ba mươi ngàn các kiểu nữa.... cái này có vẻ cũng khoai.

- rồi thì vụ ngày tháng, trước có hack chút hơi lỗi nên bỏ đi, giờ cũng chưa làm lại.

- nhận dạng đường link, chữ số latin, mấy cái +10 +10 hay -10 gì đó thì + - phải viết liền... cái này thì bản cũ có bản này thì chưa

- còn rất nhiều từ loại khác cũng chưa xử lý như trợ từ, giới từ, khu biệt từ, liên từ, động từ ly hợp, mấy từ dạng "một dạng", "bàn"... đến cả danh động tĩnh còn chưa cover hết trường hợp kết hợp...

- hiện tại tôi check thì thấy vấn đề nữa là quá nhiều trạng từ, cũng chưa phân loại, có một số trạng từ kết hợp với tính từ động từ được thôi, cái khác thì không. để xem sai chỗ nào, cũng chưa check lại kỹ.

- vụ đích với động từ thì đúng là còn thiếu, lý tưởng thì sẽ có logic check là động từ nào đóng vai trò là chủ ngữ, hoặc cần thiết consume danh từ đằng sau....

- xử lý các cụm từ đặc biệt đa nghĩa: cái này thì còn dài, sửa chán, có khi để phân biệt từ "bả" có nghĩa gì thì còn phải chia danh từ ra vũ khí, đếm được các kiểu nữa :v

- vụ opt-in thì cũng là trong dự định, cơ mà vì phải có chỗ để toggle choice cho nên tuần trước mới bỏ thời gian ra làm lại giao diện.

được cái là approach lần này có vẻ ổn, trước tôi sợ là để áp dụng luật ngữ pháp phải dùng đủ các thể loại thuật toán đệ quy, nhưng làm thử thì thấy thực ra cũng không cần thiết: đơn giản thì chỉ cần chạy từ trái sang phải, thấy các thực từ: danh động tĩnh đại, số lượng... các kiểu thì check ngược về trái... cá biệt thì vẫn check chút sang phải, nhưng đặt trọng tâm vào các thực từ thì thấy dễ xử lý được các trường hợp hơn :D

nhân tiện thì tôi thấy thực ra chia từ cũng không cần quá phức tạp như bây giờ, chỉ cần phân biệt được từ nào kết hợp dc với danh/động/tĩnh, kết hợp theo quy luật thế nào (đặt trước, đặt sau, cả trước cả sau...)... theo dự đoán của tôi thì cuối cùng chỉ có tầm hơn 10 loại từ thôi, các trường hợp đặc biệt không tính.

mà cái này chắc là tương lai dài hạn, giờ cứ khám phá dần thôi.
đợi tôi hôm nay làm nốt cái tính năng opt-in opt-out rồi đẩy code lên trang chủ, để lâu cũng mốc rồi :D

// p:s: lại nói đến, theo logic mới thì tổng số truyện mới là gần 90k bộ, gấp rưỡi bây giờ, cũng fix được kha khá lỗi cùng bộ khác tên, cố gắng tuần sau đẩy nốt lên không cũng mốc :(
 
- số lượng từ thì còn phải viết cái thuật toán dịch riêng, ví dụ một ngàn vạn phải dịch ra được là một trăm triệu (ra 100.000 thì dễ cơ mà không hay).
cái này còn 2 trường hợp đặc biệt là kết hợp số và chữ, ví dụ 100 vạn thì dịch chuẩn là ra 1 triệu chứ không phải là một triệu....
với lại còn trường hợp bảy tám trăm vạn, hai ba mươi ngàn các kiểu nữa.... cái này có vẻ cũng khoai.
Cái này chắc cũng chỉ có mỗi cách chia case. :sweat: Ừ mà chính ra số lượng từ ghép lại còn bớt khắm hơn danh động tính, số lượng từ tính đâu ra đấy cũng chỉ có gần 2 chục từ (零一二三四五六七八九十百千万亿), mà lại còn đứng liền nhau nữa nên ghép lại thành một cục là xong, không chuối như danh động tính còn phải đảo ngược đảo xuôi đủ kiểu. :haha:
- hiện tại tôi check thì thấy vấn đề nữa là quá nhiều trạng từ, cũng chưa phân loại, có một số trạng từ kết hợp với tính từ động từ được thôi, cái khác thì không. để xem sai chỗ nào, cũng chưa check lại kỹ.
Cái này giống cách chia danh động tĩnh cũ vẫn đang apply bên chivi. Không hiểu sao một núi các thành ngữ 4 chữ bị đánh thành động từ, trong khi đám này rất hay đứng trước 地 nên thường thường phải gắn label tính từ. Sang dev.chivi thì lại biến thành trạng từ, còn phải sửa dài dài. :amazed:
được cái là approach lần này có vẻ ổn, trước tôi sợ là để áp dụng luật ngữ pháp phải dùng đủ các thể loại thuật toán đệ quy, nhưng làm thử thì thấy thực ra cũng không cần thiết: đơn giản thì chỉ cần chạy từ trái sang phải, thấy các thực từ: danh động tĩnh đại, số lượng... các kiểu thì check ngược về trái... cá biệt thì vẫn check chút sang phải, nhưng đặt trọng tâm vào các thực từ thì thấy dễ xử lý được các trường hợp hơn :D
Chạy thử trên chương 2 vạn chữ thì thấy khá ổn, không khác bọt mấy so với không có ngữ pháp. :big_smile:
nhân tiện thì tôi thấy thực ra chia từ cũng không cần quá phức tạp như bây giờ, chỉ cần phân biệt được từ nào kết hợp dc với danh/động/tĩnh, kết hợp theo quy luật thế nào (đặt trước, đặt sau, cả trước cả sau...)... theo dự đoán của tôi thì cuối cùng chỉ có tầm hơn 10 loại từ thôi, các trường hợp đặc biệt không tính.
Thế mới cần paper hướng dẫn chứ. Mà thật ra đại đa số trường hợp cũng chỉ dùng đến danh động tính là căng hết cỡ.

Nhân tiện vừa sửa 这 từ "cái này" thành "này" để tránh trường hợp kiểu 这两个... -> cái hai cái ... này.

P/S: Lẫn cả dấu phẩy vào này, cụm này là ([ngữ tố động từ], [danh từ]) nhé.

1626574822055.png


P/S #2: Ngữ tố danh từ đứng sau 的 bị thêm vào cả đầu và cuối cụm ngữ pháp:

到了小傲娇的(侧 ngữ tố danh từ)边
1626575576571.png

Nếu sửa 侧边 thành ngữ tố danh từ thanh vì 侧:
1626575768813.png
 
Last edited:
Back
Top