thảo luận Truyện tàu dịch máy (MTL)

đang cân nhắc sẽ tách một chương ra thành nhiều page, mỗi page tầm 3k chữ. chắc sẽ load nhanh hơn.

tôi giờ đang dùng mạng vnpt, cứ tối là mạng lag như điên, khá khó chịu.
 
đang cân nhắc sẽ tách một chương ra thành nhiều page, mỗi page tầm 3k chữ. chắc sẽ load nhanh hơn.

tôi giờ đang dùng mạng vnpt, cứ tối là mạng lag như điên, khá khó chịu.
Chia thành nhiều page nhưng cắt theo đoạn chứ đừng cắt theo số chữ, mịa mấy cái site tàu cứ cắt theo chữ đọc ức chế vãi.

Web Chivi.xyz chạy mượt vãi lúa.
zFNuZTA.png

Tiếc là dịch máy nên câu cú lủng củng quá, bần đạo không theo được
t5IcdBZ.png
. Không biết có tính năng dùng bộ từ điển của ai đó đã làm sẵn không nhỉ? Ví dụ như là ai đó đọc trước mình, chỉnh sửa câu cú ngữ pháp các kiểu và lưu lại, giờ mình muốn đọc thì chỉ cần chọn bộ của người đó đọc thôi là được.
Nhân tiện vừa đọc được thím này tôi quote vào đây luôn.

Tương lai ông Nipin có định làm thêm khu truyện dịch/edit không? Thêm cái source [Chivi Dịch/Edit] rồi lúc thêm chương thì thêm bằng tiếng Việt là được. :big_smile:

Tất nhiên là sau này cần hút user thì làm ấy chứ giờ server vẫn đang phò phạch thì thôi.
 
Chia thành nhiều page nhưng cắt theo đoạn chứ đừng cắt theo số chữ, mịa mấy cái site tàu cứ cắt theo chữ đọc ức chế vãi.


Nhân tiện vừa đọc được thím này tôi quote vào đây luôn.

Tương lai ông Nipin có định làm thêm khu truyện dịch/edit không? Thêm cái source [Chivi Dịch/Edit] rồi lúc thêm chương thì thêm bằng tiếng Việt là được. :big_smile:

Tất nhiên là sau này cần hút user thì làm ấy chứ giờ server vẫn đang phò phạch thì thôi.

ừ chia theo line mà, đọc file text, đếm số chữ, chia cho 3000, làm tròn thành số pages, chia số chữ với số pages ra số chữ mỗi page mới => chạy hàm bóc tách theo dòng mỗi khi số lượng chữ lớn hơn số giới hạn này, aka một page tầm 2250 chữ tới 4500 chữ.

đùa chứ chạy cái này lâu vkl, tôi chạy từ tối hôm qua mà chưa xong (120GB), mà khốn nữa là cái server lởm chạy stress cpu nó sẽ tự shutdown (hôm nay chivi off mấy phát), cho nên giờ tôi phải chạy cái phân chia này trong máy bàn rồi upload lên sau... kiểu này chắc 3 4 ngày mới xong.

cơ mà xong rồi thì sẽ ngon hơn, đảm bảo load mượt hơn nhiều. với lại kích thước nhỏ đi cũng cho phép tôi gửi nhiều metadata hơn, kiểu như đang nghĩ làm cách nào cho nó hiện từng từ trong cụm từ đã gộp bởi máy dịch, đỡ phải mất công đổi trái đổi phải.

vụ khu dịch/edit thì... đùa chứ đọc xong tôi lại cảm thán một câu bạn Toomspaet đúng là soulmate của tôi, nhiều khi phát biểu chả khác gì tôi đang định viết.

nói chung cái này mấy hôm nay cũng đang nghĩ rồi, dự tính là chỗ menu của chương sẽ có một cái item là Giao diện dịch, bấm vào đấy nó sẽ ra một trang hỗ trợ tốt hơn cho việc dịch truyện.

chỉ là chưa nghĩ kỹ là sẽ cho sửa kiểu wiki mỗi người sửa tí, hay là làm kiểu riêng tư ai sửa nấy, submit lên nhận full credit. còn cả việc là bản edit thì ai được quyền đọc cũng là mấy cái cần cân nhắc.

nói chung mấy cái này đều đang nghĩ rồi, đợi thực hiện thôi :)

Sent from Xiaomi M2101K9G using vozFApp
 
Last edited:
đã bắt đầu quay lại sửa máy dịch. có lỗi gì các bạn cứ báo nhé, tôi không check hết dc cho nên nhiều khi đúng chỗ này sẽ thành sai chỗ khác.

nhân tiện thì tựa truyện (mấy cái trong < >) đang dự định là sẽ chỉ viết hoa chữ đầu thay vì viết hoa toàn bộ như trước. các bạn ưa kiểu nào thì bảo, sửa dễ thôi
 
vl hôm nọ code nhầm vụ đánh dấu entry vietphrase, nếu là trong 5 phút thì loại bỏ luôn cái vừa nhập lỗi. về ý tưởng thì rất hợp lý, nhưng mà chả hiểu sao lúc đso tôi gõ thế nào lại đánh dấu cái loại đi là cái... mới hơn.
thảo nào hôm nọ import sang format mới xong thấy nhiều chỗ sai vãi.

đánh dấu đây để hôm nào chạy lại hàm import :D
 
tôi đổi lại độ ưu tiên của các từ điển rồi nhé.

trước là "bộ truyện + cá nhân" > "bộ truyện + cộng đồng" > "thông dụng + cá nhân" > "thông dụng + cộng đồng".

giờ đổi "thông dụng + cá nhân" lên trước "bộ truyện + cộng đồng". hiện tại thì không khác gì, nhưng về sau có nhiều người cùng đọc cùng sửa thì cái cộng đồng nó ghi đè lên cái cá nhân cũng ghét.

nhân tiện thì theo thiết kế thì nếu xoá ở từ điển bậc cao thì nó vẫn dùng nghĩa nếu có ở từ điển bậc thấp, giờ thì các bạn chỉ cần thêm nghĩa là [[pass]] thì nó sẽ nhận cái xoá này, ignore cả cụm từ.

ừ, cũng là chức năng cho tương lai khi mà người nhiều edit từ lung tung gây tranh cãi, có cái [[pass]] thì kể cả delete cũng ghi đè được luôn :)
 
không liên quan nhưng tôi vừa đăng kí domain chivi.app, oai hơn chivi.xyz :)

cái chivi.xyz còn có hạn tới hết năm nay, đang cân nhắc có nên renew không :confused:
 
đã đổi sang dạng tách chương mới. có lỗi nhớ bảo. phần này làm vất vả vãi.

// mà nguồn biqubao đã dẹo, đi tìm nguồn khác thôi :(
 
mà lần đổi mới này nhìn vào từ ngoài thì không khác mấy, có khác là một chương chia nhiều khúc load nhanh hơn, nhưng thực tế là tôi đã sửa rất nhiều thứ:

  • lưu dữ liệu số chương, tên chương gốc tiếng trung theo từng khoảng 128 items, lúc trước là lưu tất, thành ra có bộ dài hơi như Diablo chi huỷ diệt sẽ làm nặng kha khá.
  • rename lại sao cho performance nhất thay vì dễ nhìn (trước tên file dạng 001.tsv, 002.zip, giờ tôi để hết về 1.tsv, 0.zip...)
  • danh sách chương tiết bản tiếng việt sẽ bị đánh dấu là outdated sau khoảng 1 ngày.
  • chưa hoàn thiện, nhưng dự định là phần bookmark chương nó cũng sẽ hỗ trợ cả việc đang nằm trong page nào, sẽ dễ mò hơn tí cho những chương dài cả mét (ví dụ của lục triều), minor improvement.
  • có lưu các thông số như số chữ trong một chương (đại khái), ngày tải về các kiểu... đợi mai hiển thị lên chỗ danh sách chương để biết chương nào đã được tải về chương nào chưa.

cái này có lưu ý là hiển thị chưa chuẩn hẳn do mấy hôm hệ thống crash liên tục, có nhiều dữ liệu đã dc down về rồi nhưng khả năng cao là vẫn chưa hiển thị, cái này thì phải chịu thôi, trong code nó có đoạn self-heal hi vọng đỡ dc chút.

à mà tạm thời việc thêm custom text tôi đã disable nhé, phần đó chưa test.
 
kek, tuy dự định từ tháng 8 nhưng tới giờ mới bắt tay vào làm lại phần từ vựng được. mà không sao, better late than never.

đang bắt đầu từ việc tìm hiểu vai trò của các loại từ vựng và cách dùng/phân loại của nó trong câu.

bước đầu thì xong được cái từ khu biệt:
https://chivi.app/guide/ngu-phap/khu-biet-tu

cái khác biệt giữa từ khu biệt với hình dung từ (tính từ) trong chivi là từ khu biệt kết hợp dc luôn với danh từ đằng sau, trong khi tính từ thì chỉ có vài trường hợp đặc biệt thôi.

với lại có nhiều cấu trúc kết hợp dc với tính từ nhưng khu biệt từ thì không.
ví dụ danh + tính + đích + danh....

ừ nói qua thế, mấy cái này về sau sẽ viết hết ra hướng dẫn tử tế :)

p/s: push nhầm dev branch rồi thọt vãi, để tắt tạm
 
Last edited:
tôi bật lại chế độ tự động cập nhật danh sách chương tiết từ nguồn khi bấm vào trang mục lục rồi. từ giờ không phải mất công bấm vài lần nữa.

có phân chia theo quyền hạn though, quyền hạn càng cao thì thời gian tính outdated càng ngắn.

nếu thấy load chậm thì bảo tôi để tôi sửa. nhớ hồi đầu năm ám ảnh vãi :))
 
vl cái vụ đổi cấu trúc tới giờ vẫn còn lỗi, mấy cái latest chap sai lè lè, thế mà không thấy ai nói gì có vẻ các bạn đã nghỉ chơi hết rồi :LOL:

mà không sao, đợt này đang phát triển lỗi lung tung, nhiều người vào thay đổi nhiều tôi đổi cũng mệt.

// nói đến vẫn chưa sửa phần thêm chương, không ai nói gì chắc cứ kệ đấy, đợi phần này stable đã rồi tính.

phấn đấu sau 2 tuần có thể bỏ chế độ dịch cơ bản.
 
mà làm tôi nhớ đến, đã đến lúc upgrade cái panel tra từ bên phải:
  • chỗ vietphrase có hiển thị loại từ + tên từ điển của từ đó
  • có nút bấm trực tiếp để activate modal thêm/sửa từ
edit: ok đã xong.

thêm cái nữa cũng dự định làm nhưng chắc đợi sửa ngữ pháp hòm đã, hông thì toàn false positive, là báo lỗi dịch của cả cụm từ. tương lai thì đoạn nào các bạn thấy dịch sai thì chỉ cần tạo mội cái issue card, nó sẽ tự động thêm vào câu văn bị lỗi, từ điển đang dùng, liên kết... các kiểu, các bạn chỉ cần nhập lý do vào thôi.
 
Last edited:
Back
Top