thảo luận Truyện tàu dịch máy (MTL)

@Nipin khi nào có thời gian ông cân nhắc thêm tính năng xem thư đơn bên yousuu được không?

//tính năng tự thêm chương truyện vào nguồn chivi đang lock ở lv mấy vậy ông?
thư đơn hả, để check xem. thực ra trong thiết kế có sẵn cho thư đơn yousuu rồi, chưa crawl thôi.

ờ vụ thêm chương thì level 2 là thêm dc rồi, nhưng nó lỗi tôi cũng chưa check lại. hôm nọ bảo làm lại phần thêm text mà lười bỏ qua luôn :v
 
thư đơn hả, để check xem. thực ra trong thiết kế có sẵn cho thư đơn yousuu rồi, chưa crawl thôi.

ờ vụ thêm chương thì level 2 là thêm dc rồi, nhưng nó lỗi tôi cũng chưa check lại. hôm nọ bảo làm lại phần thêm text mà lười bỏ qua luôn :v

Hèn gì, chiều down text bộ loli trên pan baidu định thêm vào mà click Thêm chả phản hồi gì :rolleyes:
Sau implement thêm text có tích hợp tách chương từ file gộp thì ngon :love:
 
Một số từ ghép được với 的 ở cuối câu đều bị đổi thành "của của", ví dụ đại từ nhân xưng hay tên riêng, một số khác như tính từ thì không sao.

Mode nâng cao nhé.

View attachment 687906
View attachment 687907
định thử thêm xem cái đó có thành của hắn, của ta được không mà lúc merge với nhau lại chọn nhầm cái node làm pilot :v đã sửa thanks
 
ok đã sửa việc thêm chương.
nhưng mà giờ hạn chế chỉ thêm dc một chương một lần, việc thêm nhiều chương thì cần phải cải thiện cái text splitter, cái đó thì chưa đủ dữ liệu chưa làm.

các bạn cứ đưa text đây tôi thử viết script tự động split/upload luôn :)
 
ok đã sửa việc thêm chương.
nhưng mà giờ hạn chế chỉ thêm dc một chương một lần, việc thêm nhiều chương thì cần phải cải thiện cái text splitter, cái đó thì chưa đủ dữ liệu chưa làm.

các bạn cứ đưa text đây tôi thử viết script tự động split/upload luôn :)
https://www.mediafire.com/file/vgm5...%E9%A5%B2%E5%85%BB%E6%97%A5%E8%AE%B0.txt/file

text của bộ này: https://chivi.xyz/-la-ly-dung-gia-tu-duong-nhat-5kvk :shame:
 
ok đã sửa việc thêm chương.
nhưng mà giờ hạn chế chỉ thêm dc một chương một lần, việc thêm nhiều chương thì cần phải cải thiện cái text splitter, cái đó thì chưa đủ dữ liệu chưa làm.

các bạn cứ đưa text đây tôi thử viết script tự động split/upload luôn :)
Ngon, trước thêm một bộ mấy trăm chương mỏi cả tay.

Tiện thể xem hộ tôi bộ này luôn nhé:

https://www.mediafire.com/file/k8mjl3zxowd0lp7/

Text của:

https://chivi.xyz/-nga-dich-tieu-di-tu-toi-can-h0q4 :shame:

Còn mấy bộ nữa mò mãi đ' ra text, đậu phộng. :amazed:
 
Ngon, trước thêm một bộ mấy trăm chương mỏi cả tay.

Tiện thể xem hộ tôi bộ này luôn nhé:

https://www.mediafire.com/file/k8mjl3zxowd0lp7/

Text của:

https://chivi.xyz/-nga-dich-tieu-di-tu-toi-can-h0q4 :shame:

Còn mấy bộ nữa mò mãi đ' ra text, đậu phộng. :amazed:
tìm được website thì đưa cũng được nhé, mấy trang đánh lẻ thì viết script crawl cả trang cũng được :) nếu nhiều rồi thì có thể cho vào chivi sau.

mà giờ tôi đã viết lại đống script crawl, nói chung ổn không tốn thời gian nhiều như trước, đợi rảnh cũng thêm một vài nguồn truyện nữa cho phong phú, note ở trello vài cái mà cũng chưa làm :D

mà hôm nay có cậu contact bên facebook mới nhớ ra là tôi khoá vụ fetch text tàu từ lâu rồi, yêu cầu ít nhất là quyền hạn 1, mà hồi tháng 6 reset hết quyền hạn về 0, aka các bạn đó vào toàn báo không có text lại chả lượn hết :LOL:)))))))))))))
 
Last edited:
ạch, một đêm vất vả làm tool chia chương sao cho nó hợp với mọi loại text mà không xong (đậu má text tiếng trung format tệ vãi), tôi mới chợt nhận ra là mình lại làm quả chết não nữa =)

thực ra thì cái thêm chương bên webapp có thể thêm được nhiều chương bằng giải pháp khá đơn giản: các bạn tự thêm đánh dấu phân chương.

để cho dễ hình dung thì các bạn có thể dán một đoạn dài tầm 10 chương gì đấy, giữa mỗi chương các bạn thêm một đoạn //////// (số lượng tuỳ ý miễn hơn 4), tôi nghĩ cũng không mất bao công.
có đoạn //// này rồi thì bên server chia chương cũng khá đơn giản.

về sau thì tôi có thể nâng cấp dần cho nó dễ dàng hơn bằng bổ sung việc tự động chèn //// dựa theo một số cách chia chương phổ biến của bọn tàu (thường thì nó có 2 kiểu chia, một là chia bằng 2 dòng trắng, hai là lùi đầu dòng)... sau đó các bạn chỉ cần review lại là xong.

tôi thấy cái này khá ổn, các bạn có thể nhập 10 20 chương một lúc rồi đọc dần, tôi cũng không phải hack não nghĩ ra thuật toán đúng hết dc các trường hợp (khá là impossible).

à mà đấy là bên webapp, vẫn cần tool tự động split text rồi cập nhật bên backend, tôi chợt nhớ ra là giờ mấy bộ có local text từ trước giờ mất hết vì tôi chưa viết script phục hồi, haizz lại thêm task nữa :(
 
ạch, một đêm vất vả làm tool chia chương sao cho nó hợp với mọi loại text mà không xong (đậu má text tiếng trung format tệ vãi), tôi mới chợt nhận ra là mình lại làm quả chết não nữa =)

thực ra thì cái thêm chương bên webapp có thể thêm được nhiều chương bằng giải pháp khá đơn giản: các bạn tự thêm đánh dấu phân chương.

để cho dễ hình dung thì các bạn có thể dán một đoạn dài tầm 10 chương gì đấy, giữa mỗi chương các bạn thêm một đoạn //////// (số lượng tuỳ ý miễn hơn 4), tôi nghĩ cũng không mất bao công.
có đoạn //// này rồi thì bên server chia chương cũng khá đơn giản.

về sau thì tôi có thể nâng cấp dần cho nó dễ dàng hơn bằng bổ sung việc tự động chèn //// dựa theo một số cách chia chương phổ biến của bọn tàu (thường thì nó có 2 kiểu chia, một là chia bằng 2 dòng trắng, hai là lùi đầu dòng)... sau đó các bạn chỉ cần review lại là xong.

tôi thấy cái này khá ổn, các bạn có thể nhập 10 20 chương một lúc rồi đọc dần, tôi cũng không phải hack não nghĩ ra thuật toán đúng hết dc các trường hợp (khá là impossible).

à mà đấy là bên webapp, vẫn cần tool tự động split text rồi cập nhật bên backend, tôi chợt nhớ ra là giờ mấy bộ có local text từ trước giờ mất hết vì tôi chưa viết script phục hồi, haizz lại thêm task nữa :(

Vất vả anh.
Khi nào xong vụ đánh dấu nhớ báo để tôi thêm text tay
 
Vất vả anh.
Khi nào xong vụ đánh dấu nhớ báo để tôi thêm text tay
đã đẩy lên server.

nhớ là từ 4 / trở lên nhé, 3 / hơi nhạy cảm :) đùa chứ nếu thấy thế hơi nhiều thì bảo tôi để tôi hạ xuống, để nhiều cho chắc chắn thôi.

nhân tiện nếu các bạn muốn thêm tên quyển thì có thể thêm đằng sau mấy cái //, ví dụ //// 正文, nếu không có thì nó sẽ nhận cái nhãn mặc định ở dưới.
không cần thiết phải thêm hết, chương sau mặc định nhận nhãn quyển của chương trước trong đoạn text.

tuy tôi nghĩ cái này ít người dùng nhưng cho vào cho tận thiện tận mỹ :)

p/s: đã thử với bộ này, cơ bản ok: https://chivi.xyz/-van-de-muoi-muoi-luyen-thuong-nga-baac/chaps/chivi
 
đã đẩy lên server.

nhớ là từ 4 / trở lên nhé, 3 / hơi nhạy cảm :) đùa chứ nếu thấy thế hơi nhiều thì bảo tôi để tôi hạ xuống, để nhiều cho chắc chắn thôi.

nhân tiện nếu các bạn muốn thêm tên quyển thì có thể thêm đằng sau mấy cái //, ví dụ //// 正文, nếu không có thì nó sẽ nhận cái nhãn mặc định ở dưới.
không cần thiết phải thêm hết, chương sau mặc định nhận nhãn quyển của chương trước trong đoạn text.

tuy tôi nghĩ cái này ít người dùng nhưng cho vào cho tận thiện tận mỹ :)

p/s: đã thử với bộ này, cơ bản ok: https://chivi.xyz/-van-de-muoi-muoi-luyen-thuong-nga-baac/chaps/chivi

Tối đa một lần input bao nhiêu chương vậy anh?
 
Tối đa dựa vào giới hạn kiên nhẫn của anh. Tôi chưa làm giới hạn gì hết 🤣

Sent from HUAWEI COR-L29 using vozFApp

Tôi mới thử 10, 15, 25...
Nhanh hơn input từng chương nhưng ngồi paste 3 sọc vẫn oải :rolleyes:
 
Tôi mới thử 10, 15, 25...
Nhanh hơn input từng chương nhưng ngồi paste 3 sọc vẫn oải :rolleyes:
Mấy trăm chương thêm tay đến bao giờ.
BdgiW7R.png


Ngồi rảnh viết cái mini script thấy chỗ nào có (第[0-9]+章) thì replace thành ///(第[0-9]+章), làm một mẻ khỏe cả đời.

Ừ mà lại phải tra regex chữ hán, lười vcl.
yBBewst.png
 
Tôi mới thử 10, 15, 25...
Nhanh hơn input từng chương nhưng ngồi paste 3 sọc vẫn oải :rolleyes:
*4 sọc.

ừ cho nên về sau sẽ có công cụ chèn sọc tự động. còn nếu cả trăm chương hoặc hơn thì cứ send tôi, vụ split text tự động tôi đang làm, hôm nay hoặc mai là xong rồi.

chắc nhân tiện thêm luôn text của một số nguồn tôi lưu từ trước, như zadzs (nguồn này giống zxcs.me, nhưng giờ site đã die), hoặc mấy bộ tôi tự tải tay :)

nếu suôn sẻ thì làm phần thêm các bộ mới luôn (giờ auto dựa theo các nguồn cố định), có mấy bộ truyện xxx tôi để ở máy cũng vài năm rồi mà chưa đọc :) đặc biệt là truyện của tay rescueme (tác giả đại học hình pháp khoa) đọc khá vui :)

windows thì có thể dùng notepad++, thay thế \n\n bằng \n//// thôi.
 
Mấy trăm chương thêm tay đến bao giờ.
BdgiW7R.png


Ngồi rảnh viết cái mini script thấy chỗ nào có (第[0-9]+章) thì replace thành ///(第[0-9]+章), làm một mẻ khỏe cả đời.

Ừ mà lại phải tra regex chữ hán, lười vcl.
yBBewst.png
nhắc lại lần nữa là 4 sọc mới nhận, 3 sọc không nhận đừng khóc.... đùa chứ chả lẽ tôi sửa lại code?

mà có nhiều bộ nó tách biệt đơn giản bằng 2 dòng trắng liên tiếp nhau, thử xem?
 
*4 sọc.

ừ cho nên về sau sẽ có công cụ chèn sọc tự động. còn nếu cả trăm chương hoặc hơn thì cứ send tôi, vụ split text tự động tôi đang làm, hôm nay hoặc mai là xong rồi.

chắc nhân tiện thêm luôn text của một số nguồn tôi lưu từ trước, như zadzs (nguồn này giống zxcs.me, nhưng giờ site đã die), hoặc mấy bộ tôi tự tải tay :)

nếu suôn sẻ thì làm phần thêm các bộ mới luôn (giờ auto dựa theo các nguồn cố định), có mấy bộ truyện xxx tôi để ở máy cũng vài năm rồi mà chưa đọc :) đặc biệt là truyện của tay rescueme (tác giả đại học hình pháp khoa) đọc khá vui :)
tôi đùa 3 sọc thôi chứ input 3 sọc làm sao split :shame:
vụ chèn sọc tự động tôi tự viết script cũng được, chủ yếu là giờ lười...
 
nhắc lại lần nữa là 4 sọc mới nhận, 3 sọc không nhận đừng khóc.... đùa chứ chả lẽ tôi sửa lại code?

mà có nhiều bộ nó tách biệt đơn giản bằng 2 dòng trắng liên tiếp nhau, thử xem?
Đùa tí. :shame:

Nhiều nhưng mà cũng không phải toàn bộ. Đậu mợ bọn này đúng là truyện lậu đíu có format thống nhất, mệt vcl.

Với lại chủ yếu là
chủ yếu là giờ lười...
 
Back
Top