thảo luận Truyện tàu dịch máy (MTL)

lol hôm nay tôi mới biết là google translation có public api, trước cứ nghĩ là nó khoá lại không cho dùng.

để xem nhét vào cái thêm từ thế nào, có cái này thì dịch tên eng/jap sẽ tiện hơn kha khá.
ừ hoặc là gợi ý dịch sang tiếng việt sao cho thuần việt nữa, trong chivi giờ hán việt nhiều quá.
 
Tôi có đổi lại logic của chỗ button "Lưu" trong phần thêm sửa từ rồi.

bây giờ muốn chuyển từ từ điển chung sang từ điển riêng thì bấm bên trái, bên phải luôn là lưu.
đổi sang kiểu này để đỡ nhầm, với lại chủ yếu là tôi không khuyến khích việc thêm vào từ điển cá nhân cho nên làm nó khó tiếp cận hơn chút.

nhân tiện thì giảm yêu cầu quyền hạn của từ điển riêng xuống một bậc xem thử thế nào :v

chưa check lỗi cho nên có vấn đề gì thì các bạn cứ report.

tối nay cải thiện nốt phần phân loại từ (thêm keyboard shortcut các kiểu nữa).
 
@ToomSpaet tôi đã integrate cái google translate vào cái thêm sửa từ.
chỗ này có thể bấm 3 lần, lần đầu nó sẽ dịch từ trung sang anh, lần hai là dịch từ trung sang việt, lần ba là dịch từ nhật sang anh.

từ nhật sang anh nếu nó phát hiện là tên người gồm 2 từ thì nó sẽ đảo ngược họ với tên cho chuẩn tiếng việt.
 
Cuối cùng thì cũng có thời gian viết cái hộp thoại cài đặt tử tế:

  • Đã đổi được màu nền, cỡ chữ, font chữ và giãn cách dòng
  • Chế độ Zen là chế độ đọc truyện thuần tuý, sẽ không có gạch chân gợi ý cụm từ nữa
  • Chế độ Dev sẽ hiển thị các cụm từ đã được áp dụng các quy luật ngữ pháp.
  • Hiển thị song song tiếng Trung và tiếng Việt cho bạn nào dùng chivi để học tiếng Trung

Sửa một số lỗi liên quan tới giao diện như sau khi nhập từ xong thì không dùng nút mũi tên để cuộn trang được nữa. Hoặc là trang nhảy lung tung.

// Cũng đã có chút cải thiện cho ô dịch thuật, nhưng chức năng này chưa hoàn thiện, sẽ có một bài post sau.
 

Attachments

  • Screenshot 2021-11-24 at 17-33-37 Kiện Tiên Lục Địa.png
    Screenshot 2021-11-24 at 17-33-37 Kiện Tiên Lục Địa.png
    48.3 KB · Views: 53
@Nipin cái phần tìm truyện ấy, thím có thể thêm option tìm nhiều Phân Loại cho 1 truyện ko? Vì ví dụ có nhiều truyện kết hợp giữa huyền ảo lẫn kỳ huyễn, nên thay vì chỉ được tìm 1 phân loại, cho tìm nhiều phân loại sẽ dễ dàng tìm dc thể loại yêu thích hơn.:big_smile:
làm thì làm được, sửa logic tầm 30 phút là dc. mà không đáng.

thực ra thì gốc của các bộ này thì chỉ có một phân loại thôi, nhưng lúc tôi nhập thì có tổng hợp phân loại từ nhiều nguồn mỗi nguồn nó phân loại một kiểu cho nên có lúc ra 3 4 loại (trong chivi là nó cắt còn 2 loại đầu rồi đấy).

đang định là thêm phần nhãn truyện để có nhiều kiểu phân loại hơn, mà đợi các task khác xong đã.
 
thằng crystal tôi dùng làm ngôn ngữ viết backend chivi đang có kha khá tiến bộ trong việc support windows.

chắc tầm 1 2 tháng nữa là đủ dùng. đến lúc đó chắc tôi sẽ viết ra vài cái binary về crawl text/split text file cho các bạn dùng trước.

p/s: tôi đang định gộp địa danh + tổ chức thành "nơi sở thuộc", không rõ có quá khó hiểu không :confused:
 
Ủa sao dạo này thêm chương không được thế @Nipin
vì tôi đang muốn thống nhất id của các chương truyện vào một mối.
mà như đợt trước thì mấy chương người dùng đăng nó bắt đầu đếm lại từ 1, lệch cả trăm vị trí.

cân nhắc mãi chưa tìm dc cách nào hiệu quả nên tôi đóng lại đỡ damage.

trong tuần này sẽ mở lại.
 
mừng vkl hôm nay tôi mò vào server của chivi, tự dưng phát hiện một thư mục chứa reviews yousuu cũ (last modified là 25 tháng 7)

check qua thì không thấy cái nào bị "Nội dung ẩn cần thiết đăng nhập".

tuy đống này cũ rồi khả năng cao là không cover được hết dữ liệu, nhưng mà phục hồi dc chừng nào ngon chừng đấy, nói chung là mừng vãi lều :D
 
vkl hí hửng định fix đống review thì dính infinity loop đập vào mặt, hoá ra là do thằng "第"

cũng tốt, ngứa mắt thằng này lâu rồi mà chưa có dịp viết rule riêng, giờ thì có rồi nhé. các trường hợp sau đã xử lý
Code:
第十  thứ mười
第十年 năm thứ mười
第一  thứ nhất
第一更 canh thứ nhất
第二重 tầng thứ hai
第一个月  tháng thứ nhất
史上第一掌门  chưởng môn đệ nhất trong lịch sử
天下第一医馆  y quán đệ nhất thiên hạ
còn vụ "第 + số + lượng + danh" => "lượng + danh + 第 + số" thì chưa thử, nhưng chắc là ổn.
 
tôi thêm page changelog: https://chivi.app/notes/changelog
có gì vào đó xem update tốt hơn, đỡ mất công post chỗ nọ chỗ kia.

mà đang chạy script sửa review sắp xong rồi, gớm lỗi suốt, hết máy dịch lỗi thì gặp vụ user_id + username của bên yousuu không trùng khớp.

@ToomSpaet vụ thêm text thì tôi nghĩ sắp thủng rồi, cơ mà chắc delay vài hôm xem có vấn đề gì không.

trước có một vài băn khoăn:
  • người dùng nhập chương đánh số lung tung phải làm sao, nhập xong về sau phát hiện thiếu phải làm sao, vì trước là để tên file theo số thứ tự, đổi số thứ tự một cái là phải giải nén zip + rename + zip lại, rất phiền
  • thằng này sửa đè của thằng kia thì thế nào, làm sao hạn chế nó ghi đè lung tung
  • có nên chia làm 2 cái một cái để người dùng cơ bản nhập linh tinh, một cái là power user nhập tử tế hay không...

giải pháp hiện tại là tên file không phụ thuộc vào số thứ tự của nó trong một bộ truyện nữa mà sẽ có một chỗ riêng quản lý, đánh số id, lưu trữ thông tin người gửi các kiểu vào đấy, chỗ này là immutable hết.

không tách riêng ra hai folder mà vẫn giữ lại một cái cho mọi người vào sửa, nhưng sẽ dựa vào cái quản lý chung ở trên để phục hồi nếu cần thiết.

vì tên cố định theo lượt submit chứ không phải số thứ tự, cho nên việc chèn đè xoá chương sẽ ảnh hưởng tới ít file hơn.

...
 
đang làm lại chỗ đọc chương, nhiều chỗ còn hơi lỗi chắc ngày mai là xong hết.

nói đến, đây là một trong những feature đầu tiên tôi muốn làm khi phát triển chivi là phần mềm nâng cấp của quicktranslator: có thể dùng bàn phím để di chuyển vị trí các cụm từ được highlight, để thực hiện nhanh mấy việc như thêm sửa từ hoặc xoá từ không cần phải dùng đến chuột.

// cơ mà đáng tiếc là giờ bản thân chivi nó cũng tự xoá sạch hết các cụm từ thừa rồi, cho nên cũng mất một nửa độ sướng =)
 
@Nipin Hôm nào rảnh thử làm hộ cái từ điển theo theme nhé. Mỗi lần đọc một bộ LoL là sửa đái ra máu. :burn_joss_stick:
ừ vụ quản lý từ điển.
ngoài từ điển liên quan tới game/novel riêng ra còn nhiều cái có thể tổng hợp riêng ra một chỗ nữa

  • nghĩa bối cảnh hiện đại/phong kiến/tây phương/nhật bản khác nhau từng bộ
  • nhiều bộ truyện dùng chung từ điển như Lục Triều tam bộ khúc
  • tên tác giả tác phẩm nổi tiếng truyện mạng cần thiết lúc đọc review, nhưng cho vào trong bộ truyện thì chưa chắc đã hợp lý
  • ...

cái tôi muốn là có giải pháp nào thoả mãn dc tất cả mấy vấn đề này, mà không ra.

nhưng dự định ban đầu thì có thể approach kiểu khác, là cung cấp 2 tính năng thêm nhiều từ một lúc, và cung cấp tính năng copy từ từ điển bộ này sang từ điển bộ khác.
ừ tất nhiên để lên mức tính năng thì nó phải có giao diện để fine turning: sửa lại từ loại (trường hợp copy từ điển từ dth về không có từ loại), bỏ mấy cái dữ liệu thừa không cần thiết.

làm xong cái đó thì sẽ có thể mở rộng ra thêm các từ điển riêng biệt không phụ thuộc vào bộ truyện mà có thể để riêng làm cơ sở để thêm vào các bộ truyện khác, cái này làm được.

nâng cao hơn thì có thêm tính tăng sync, mỗi lần cập nhật vào từ điển riêng biệt này nó sẽ thêm được luôn vào các từ điển phụ thuộc, cơ mà cái này mới nghĩ thử đã thấy tiềm ẩn vấn đề, đợi nghĩ thêm.

còn một giải pháp nữa là phân loại từ theo nhãn chứ không theo tên từ điển, lúc nào cần có thể check một vài nhãn các kiểu thì có vẻ quá xa xỉ, khi nào thời cơ chín muồi may ra mới có khả năng.

ừ hiện tại còn có vấn đề nữa là các từ điển nâng cao khi vai trò của từ trong câu thay đổi, ví dụ thành lượng từ, đứng sau "chi", từ li biệt hiện tại đang hard code trực tiếp trong máy dịch nữa: https://github.com/np-nam/chivi/tree/master/src/cvmtl/_consts

tôi cũng muốn làm sao để người dùng có thể tự thay thế dc, trong trường hợp tôi chán không maintain chivi nữa thì nó vẫn có khả năng cái thiện. ừ về sau còn có thêm 2 cái nghĩa của từ khi biến từ danh động về danh, danh hình về danh nữa, nếu người dùng thêm dc cũng khá nhẹ gánh.

cơ mà nhét vào chỗ nào cho tiện thì chưa nghĩ ra, haizz. giờ cái máy dịch vẫn ở giai đoạn prototype thử nghiệm thôi, muốn tinh tế nhiều lựa chọn thì còn lâu lắm.
kiểu như tôi muốn có option để đảo ngược danh xưng lên trước, ví dụ Lâm tỷ tỷ => chị Lâm gì gì đấy mà tới giờ vẫn chưa tìm ra chỗ nào nhét vào :v
 
Vụ danh xưng đảo lên trước tôi thấy cũng hay, đọc cho nó thuần Việt. :big_smile:

Cái từ điển theo chủ đề thì theo tôi không nên làm sync (sửa từ điển này thêm từ điển kia) vì rất loạn. Idea của tôi là làm hẳn từ điển chủ đề riêng, sau đó đổi flow từ riêng -> chung thành riêng -> chủ đề -> chung.

User có thể chọn từ điển chủ đề ở phần giới thiệu truyện, ví dụ thêm cái select box để chọn từ điển ở chỗ này chẳng hạn:

1638368529351.png


Tiếp đó cái box sửa từ có thể mở rộng ra, ngoài hai thẻ riêng/chung thì thêm một thẻ từ điển chủ đề, khi sửa ở thẻ chủ đề của bộ nào thì nó cập nhật vào từ điển chủ đề của bộ đó:

1638368569617.png


Tất nhiên ai có quyền chọn từ điển chủ đề và ai có quyền sửa cũng phải cân nhắc. :big_smile:
 
Vụ danh xưng đảo lên trước tôi thấy cũng hay, đọc cho nó thuần Việt. :big_smile:

Cái từ điển theo chủ đề thì theo tôi không nên làm sync (sửa từ điển này thêm từ điển kia) vì rất loạn. Idea của tôi là làm hẳn từ điển chủ đề riêng, sau đó đổi flow từ riêng -> chung thành riêng -> chủ đề -> chung.

User có thể chọn từ điển chủ đề ở phần giới thiệu truyện, ví dụ thêm cái select box để chọn từ điển ở chỗ này chẳng hạn:

View attachment 899803

Tiếp đó cái box sửa từ có thể mở rộng ra, ngoài hai thẻ riêng/chung thì thêm một thẻ từ điển chủ đề, khi sửa ở thẻ chủ đề của bộ nào thì nó cập nhật vào từ điển chủ đề của bộ đó:

View attachment 899804

Tất nhiên ai có quyền chọn từ điển chủ đề và ai có quyền sửa cũng phải cân nhắc. :big_smile:
ừ mấy cái này tôi cũng từng cân nhắc, cho nên từng chuẩn bị trước khả năng mở rộng cho mấy thứ này:

  • máy dịch có thể dùng một danh sách từ điển bất kỳ dài ngắn, cho một từ điến cũng được cho cả chục cái cũng được. vụ dùng chung độ ưu tiên (thay vì ưu tiên bộ truyện hơn chút) cũng là vì cân nhắc cái này
  • trên database có một bảng lưu thông tin của người dùng với mỗi bộ sách, giờ mới chỉ dùng để đánh dấu đang đọc/hoàn thành với lịch sử đọc, nhưng dự định là sẽ có thêm đủ thứ
  • chỗ thêm từ thì trước nó có 3 lựa chọn: bộ truyện, thông dụng và hán việt. tôi nhét hán việt vào sau cái v cũng vì ý định là thêm các loại từ điển nâng cao bên trong đó. làm cụ thể thế nào thì chưa cân nhắc ra thôi.

cơ mà vấn đề ở đây vẫn là chivi là website cho nhiều loại người dùng. thế giới lý tưởng thì ai cũng hiểu biết hết, ai cũng có quyết định chuẩn xác, mọi người đều có quyền nhảy vào thêm sửa... cơ mà thực tế nó không như thế. với lại là webapp cho nên cái gì cũng cần giao diện tương tác, làm khá phiền, ứng dụng máy bàn thì nhiều khi vào sửa cái file text là được. cho nên phức tạp quá cũng không ổn.

vụ sync thì không phải là sync tự động, mà là sync bằng tay thôi, sẽ có thêm nhiều tính năng bổ sung để cho việc này thuận tiện (QT nó cũng từng làm), ví dụ chỉ import những từ được nhập sau một khoảng thời gian nào đó (lý tưởng hơn thì sau mỗi lần import thì lưu cái action này lại về sau có thêm gợi ý), chỉ nhập các từ do một số người dùng nào đó thêm vào... nếu kết hợp dạng references, ví dụ một từ điển một bộ nó có references tới đô thị + LoL + nhật bản thì lúc import này có thể import cùng lúc từ 3 cái references, cũng đỡ kha khá.

quay lại thì nếu làm một ứng dụng cho cá nhân dùng thì dễ, nhưng tôi muốn phát triển một cái ứng dụng mà người trước trồng cây người sau hưởng bóng mát cơ, cho lựa chọn tự do cuối cùng mỗi người một kết quả cảm giác hơi lãng phí, đi ngược với cái mà tôi hướng đến.
cho nên có một từ điển chung mọi người cùng sửa thì tôi vẫn ưa hơn là chia nhỏ phức tạp mỗi thằng một kiểu. thêm nữa là dù là cùng một theme nhưng chưa chắc đã dùng từ vựng giống nhau, vì bộ truyện đâu chỉ có một theme?
 
mà tốt nhất tôi nghĩ là làm ra dc cái diễn đàn, nhiều người vào đóng góp, thảo luận, trao đổi về dịch thuật. rồi sau đó uỷ quyền một người quyền hạn cao chỉnh sửa trực tiếp, thế tốt hơn là phải cân nhắc lằng nhằng.

cái CC_CEDICT nó cũng không cho người dùng thêm trực tiếp vào từ điển, mà là có một cái thread riêng mọi người vào đưa ý kiến rồi mod thêm sau.

từ tuần này ngoài việc cải thiện dần máy dịch ra chắc tôi sẽ làm diễn đàn, để lâu mốc rồi.
 
tuishujun có vẻ ít cmt hơn kha khá đấy, mấy bộ mới hoặc ko nổi lắm là trắng bóc luôn. Đc cái có tiến độ truyện, cái đợt tự thêm toàn check mấy bộ bị 404 bên này xem đến chap nào rồi
wLXBDHZ.gif
 
Back
Top