Các Web Phim Đã Giảm Chi Phí Bằng TikTok Như Thế Nào?

TikTok-Jump.png


Theo như một số bài viết nào đó thì cũng như anh em đã biết, Việt Nam là đất nước con rồng cháu tiên với nghề làm web truyền thống đặc biệt là website phim, mà càng miễn phí thì lại có lượng truy cập càng cao, nhất là nội dung vi phạm bản quyền.

Vấn đề quảng cáo là một thứ không thể thiếu đối với mỗi một website phim. Chỉ cần anh em mở một web phim nào đó ra là một loạt quảng cáo đập ngay vào mặt, nào thì là i*b*t, fb** - nhà c*i đến từ Châu Phi, 0*9, yyl*ve, k*w*n, d*b*t,... nhiều vô kể. Dạo đầu loanh quanh thì mấy cái popup, banner, vào sâu thì chúng ta có TVC ít nhất 5 giây hoặc nhiều nhất có thể lên đến 30 giây, mà domain của bên nhà c*i thì cũng thay liên tục. Thậm chí cả các web mua sắm online như Shopee hoặc Lazada cũng xuất hiện nhiều lần trên web với mục đích bạn mua hàng từ link popup hiện lên thì mấy anh em làm web có thể đớp thêm cả tiền hoa hồng. Thế nên bộ thông tin truyền thông liên tục công bố trang điện tử vi phạm pháp luật và chặn tên miền nhưng các web ph*m vẫn liên tục thay đổi và vẫn hoạt động như chưa có chuyện gì xảy ra.

Đối với vấn đề web phim, anh em cũng có thể thấy chính anh em chúng ta cũng thi nhau đè đầu cưỡi cổ nhau với bộ môn thú vị này. Đơn cử có thể kể đến như website lồng tiếng khá nổi tiếng như t*h*y.org, theo quan điểm cá nhân của tôi thì họ cũng đầu tư chọn lọc phim khá hay, thuê người lồng tiếng rõ ràng, thích hợp với những người không muốn đọc phụ đề, cũng rất phù hợp cho phụ nữ mang thai và cho con bú. Chả rõ thế nào mà khoảng thời gian cuối năm 2022 đầu 2023 đã có nhiều website giả mạo mọc lên ăn hết cả traffic của web chính dẫn đến chủ website cũng phải mếu máo cầu cứu xin thêm cả donate với lý do mà ai cũng nhận ra "bị web fake nhảy lên đầu ngồi", thậm chí tôi thấy lượng quảng cáo trên web nhái còn nhiều hơn trên website gốc. Sau đó 1 thời gian thì ai cũng biết, t*h*y chấp nhận bỏ cả tên thương hiệu gắn bó với mình để tạo website với cái tên mới. Tưởng yên thân, ai dè liên tiếp các trang web vẫn thi nhau fake đến nay vẫn chưa có hồi kết. Đây là ví dụ tiêu biểu nhất tôi có thể thấy, còn có những trường hợp khác mà tôi cũng không muốn bàn đến. Kể ra cũng hay thật, con rồng cháu tiên tự đè đầu cưỡi cổ nhau đè bẹp chết dí, xong lại quay sang đè tiếp website khác, mà làm như vậy tôi thấy quá là thất đức.

Cách đây vài tuần thì nhiều nguồn tin tức, báo chí, cũng như đài truyền hình Việt Nam đã lên thông tin "Đột kích trung tâm phát tán phim lậu quy mô lớn" mà nhiều anh em làm website phim cũng khá rén đến mức phải tắt cả website. Mà điều tra kỹ hơn một tí trong nội dung các bài báo thì tôi phát hiện ra ngay chủ website sở hữu khá nhiều tên miền, đáng chú ý hơn đó chính là t*h*y fake của họ đang top tìm kiếm trên google với lượng người truy cập hàng tháng đông đảo cùng với từ khoá mạnh mẽ. Có lẽ chủ web t*h*y thật đã được một phen hú hồn khi mà đó không phải là web mình sở hữu. Vụ đó tôi thấy họ cũng dính vào cả hình sự nữa nên cũng nghiêm trọng thật, ai số đen mà dính có khi phải ngồi t* cũng khá lâu khó mà thoát được thay vì án treo.

Có thể nói với sự hiện diện của 0ph*m từ nhà c*i i*bet thì các web fake mọc lên không ngớt khiến tôi cũng phát chán mỗi lần tìm phim. Đi đâu mở ra cũng cùng một nguồn mà web phim giả mạo nhiều nham nhảm hơn trước. Trong năm 2023 có vô số trang web mọc lên theo dạng này, đọc nhìn phông chữ phát ớn, không đẹp gì cả. Phông chữ thì bèo nhèo dính từng cục lại với nhau như từng thớ thịt, chữ to nhỏ lẫn lộn. Mà nhìn các web phim dạo gần đây thì nó lại hết mất các chất riêng của nó, quảng cáo quá nhiều, phim chất lượng thấp.

Xem phim thời nay gần như không có nhiều sự lựa chọn do nhiều web dùng chung nguồn. Có lẽ do sự hiện diện quá nhiều của web xem ph*m nên các nhà mạng đã thi nhau chặn tên miền nhanh hơn trước, đặc biệt là các dịp nghỉ lễ, tôi thấy nhiều website thi nhau thay domain mỗi dịp nghỉ lễ mà có thể sắp tới sẽ là mỗi dịp tết đến xuân về. Mỗi lần chặn của nhà mạng là các web phim giả mạo lẫn nhau mọc lên nhiều hơn trước. Có lẽ trong năm 2024, kỷ nguyên dẹp loạn web phim lậu sắp đến hay chăng, khoảng cách với việc thấy web phim là chặn của nhà mạng Việt Nam không còn xa vời nữa, thậm chí điều tra cũng dễ dàng tại vì nó có đầy đủ log, anh em làm gì nó cũng biết, dễ dàng "triệu hồi" anh em bất cứ lúc nào. Anh em nào làm bên bộ có đọc bài này thì để tôi mách nước cách đi nhanh nhất nhé, theo tôi thấy thì anh em nên chặn luôn cái nguồn play phim hoặc nguồn get là tốt nhất thay vì chặn website phát tán phim, tại vì chặn web phim thì mãi đâu có hết, chặn nguồn là kha khá website chết một loạt rồi, thí dụ như domain 0ph*m1.com.

Mở đầu bài viết cũng đã dài, có lẽ phần nội dung chính cũng nên bắt đầu thôi nhỉ. Theo như tiêu đề cũng đã đề cập thì hôm nay tôi sẽ chia sẻ với anh em một chỗ upload hình ảnh free mà các web ph*m đang sử dụng gần đây có thể kể đến một vài web s*x hay một vài web a*ime đang sử dụng với mục đích trao đổi thảo luận và học tập. Không dài dòng như trước nên tôi xin nói toẹt với anh em luôn ra đó chính là server T*ktok mà dạo gần đây tôi thấy có vài anh em bán vài chục củ mà ít nhất cũng vài củ một tháng trên mạng, quá là lời đấy nhỉ, anh em nào mua sẽ không phải lo chỗ chứa phim (storage) và thiếu băng thông truyền tải (bandwidth). Thực ra tôi cũng không khuyến khích ai dùng cả, tìm được thấy vui vui nên share ra cho anh em thôi, còn chả rõ link nó sống được bao lâu nữa.

Chuyện là như thế này, vào một ngày đẹp trời, tôi đang lướt web dạo trên web vl** lướt xem một vài video tập đánh vần hay nói cách thông thường hơn là phim tình cảm gia đình bỗng thấy có một server load khá nhanh. Như một thói quen khó bỏ của tôi, kể ra video thì cũng hay đấy nhưng mà thứ tôi quan tâm không phải là nó mà chính là server đang load kia kìa, vì tôi khá ấn tượng với tốc độ của nó, chạm nhẹ là load lên đến đỉnh điểm thứ mà tôi mới trỏ chuột ấn vài giây trước. Tôi ngay lập tức mở chrome dev tools và bắt từng request để ngâm cứu. Ập ngay vào mặt tôi là dòng request lạ từ domain p21-ad-sg.ibyteimg.com và tôi quyết định vào làm việc ngồi ngâm cứu. Sau 1 thời gian thì tôi có thể dễ dàng phân tích ad-sg trong đó chính là ads dịch sang tiếng việt hay tức là quảng cáo. Còn sg thì rõ ràng rồi cdn của nó được đặt tại Singapore mà chủ sở hữu của TikTok là ai? ByteDance chứ thằng nào vào đây nữa, nó lộ rõ mồn một trong đường dẫn rồi kia mà (ibyteimg), img thì chính là viết tắt của hình ảnh. Sau đó tôi quyết định tìm thử domain gốc từ subdomain từ anh họ hàng thân thuộc tôi gặp hàng ngày - Google thì nó trỏ 1 loạt dẫn đến trang TikTok Business Center, nơi mà bạn có thể chi tiền để tạo quảng cáo cho doanh nghiệp của bạn.

Suy nghĩ một hồi, tôi quyết định tạo luôn 1 tài khoản kiểm tra thử. Vì lý do riêng tư đối với tài khoản nên tôi không chèn hình vào trong bài viết nên mong anh em thông cảm. Sau một thời gian vọc vạch trong tài khoản, tôi tìm thấy được đường dẫn đó chính là Advertising on TikTok | TikTok Ads (https://ads.tiktok.com/i18n/material/image) quản lý toàn bộ hình ảnh mà anh em có thể dùng để upload ảnh lên tài khoản, tôi có upload thử và nó ra được đường dẫn hình ảnh như tôi đang mong đợi. Tuy nhiên hình ảnh thì lại bị nén và bị cắt đi nhiều phần khiến tôi băn khoăn tại sao bên web đó lại upload được lên nhỉ? Sau một hồi tìm hiểu kỹ càng thì tôi cũng đã upload được lên bằng cách dùng lại tương tự Request Method: POST đối với link https://ads.tiktok.com/api/v2/i18n/material/image/upload/ mà tôi đã dùng để upload trước đó và chúng ta đã có nơi để lưu ảnh miễn phí. Anh em có thể dễ dàng nhận thấy từ panel chỗ nào anh em có thể upload hình ảnh thì có thể dùng luôn đường dẫn api đó để gọi request rồi post ảnh lên.

Nếu chỉ đến đây mà tôi dừng lại thì nó lại quá dễ dàng rồi, tuy nhiên thứ tôi muốn đề cập đến đó chính là với các website phim kia kìa, vậy họ làm thế nào để giảm tải lưu trữ cũng như bandwidth? Đơn giản thôi, upload lên qua api nó chỉ nhận mỗi hình ảnh nên họ sẽ phải fake ảnh 1x1px với đuôi .png do ảnh này có dung lượng rất thấp có thể dễ dàng chèn vào các file .ts có chứa những đoạn phim mà họ lưu trữ nhằm đánh lạc hướng server cho nó nhận nhầm đó chính là hình ảnh chứ không phải video nào ở đây cả, rồi sau đó sẽ get link ảnh từ chính cái link api dùng để upload. Sau đó sẽ dùng để ghép vào các files hls có đuôi .m3u8 để phát lại trên web, thay vì đường dẫn .ts thì nay ta lại chèn thêm một đường dẫn hình ảnh vào đó, mọi thứ còn lại giữ nguyên. Anh em nào không rõ có thể tìm hiểu thêm hls là gì hay .ts là file như thế nào thông qua anh họ hàng thân thiết của tôi - Google.

Đến bước này chúng ta gần như đã hoàn thiện xong rồi, việc còn lại chỉ là upload hàng loạt lên server của thằng tiktok cho nó tự cache lên server ở bên sing, lấy link ảnh đã upload rồi gắn vào file .m3u8 của anh em rồi sau đó up tạm lên một chỗ nào đó để phần access-control-allow-origin: * rồi thế là xong, anh em tha hồ vi vu load phim thôi. Tôi thấy ngứa mắt khi một vài anh em chỉ khai thác lỗ hổng bé tí ti mà ai cũng có thể thấy mà lại đi rao bán lên đến mấy chục triệu như thế này nên tôi quyết định chia sẻ đến anh em, thà cho đi để nhận lại chứ không đi bán như mấy anh em kia, mong không có anh em nào bị lùa gà và tiền mất tật mang. Bài viết của tôi cũng khá dài có lẽ đã đến lúc dừng lại. Cảm ơn các anh em đã đủ kiên nhẫn để đọc xong bài viết siêu dài hơn hai nghìn từ của tôi. Tôi không biết sẽ ra sao nếu t*ktok check thử dung lượng của họ toàn những files hình ảnh 1px lấp đầy chỗ trống trong bộ nhớ của họ ;-;

Lời chào thân ái từ người viết bài.

Disclaimer: Đây là quan điểm cá nhân của tôi, chia sẻ dựa trên việc nghiên cứu của tôi, tôi không chịu trách nhiệm bất cứ vấn đề liên quan đến bài viết này, bài viết mang tính chất giáo dục, cảm ơn các bạn đã quan tâm.

Do tài khoản bị giới hạn quyền nên tôi đăng vào phần Lập trình / CNTT mong các Mod/Admin thông cảm nếu bị lệch lạc chủ đề nào đó....
Edit: Tags cũng không thêm được từ khoá phù hợp.
Edit2: Cảm ơn mod/admin đã chuyển sang mục Chuyện trò linh tinh cho nó phù hợp chủ đề.

Do tài khoản tôi không có quyền phản hồi đối với những bài viết trong mục chuyện trò linh tinh nên mọi câu hỏi tôi sẽ trả lời luôn tại đây. Cảm ơn anh em đã quan tâm.


Chào bạn, cảm ơn bạn đã quan tâm, việc mình ghép ảnh là ghép vào file .ts chứ không phải .m3u8 bạn à, mục đích chính là cố tình để server hiểu nhầm mình đang upload ảnh lên server của họ và có thể dễ dàng sử dụng cdn của t*ktok để stream.


Nếu build website bán hàng thì có thể tận dụng để load ảnh sản phẩm nha bạn, load vù vù luôn.​


Chào bạn, bạn có tham khảo download video bằng youtube-dl tại ĐÂY nhé.

Việc đăng bài lên J2team thì tôi đã cho phép Art0rias đăng lên kèm cre rồi nha, mong anh em không nên bàn tán về vấn đề này, dù sao thì với sự đồng ý của tôi thì nó cũng hợp lệ rồi.​

Bài viết giúp ae mở mang kiến thức quá nhiều luôn. Vậy có thể backup ảnh/ video lên server này và để private ko bác? E muốn tìm thêm giải pháp lưu trữ ảnh video thay cho Google Drive, One Drive... Youtube thì như bác biết, video x là noa xoá ngay
 
hèn chi lên vl** mà tua nhanh quá cũng bị block link phải chờ 10phút mới xem lại đc như thằng tóp tóp
Xv0BtTR.png
 
Đại loại là như thế này, 1 video băm nhỏ thành nhiều file, 1 file khoảng 5-10s chẳng hạn. Với đoạn băm đó fake sang image, upload lên tiktok.

Lúc kéo về thì convert image thành đoạn băm rồi stream.
 
nó nói với tiktok rằng :

tao up 1 cái ảnh bé xíu xíu như hạt cát này thôi , ảnh là part1.PNG .

thì thằng tiktok chỉ kiểm tra mỗi cái đuôi là PNG là nó cho up lên , không kiểm tra dung lượng , không kiểm tra code bên trong .


nhưng cái ảnh đó chỉ là vỏ thôi , bên trong nó có 1 đoạn phim tầm 5-10p gì đó .

1 bộ phim nó tách thành 30-50 cái ảnh fake như thế .

rồi ai xem thì nó load dần dần từng cục về thôi .
mà làm sao có thể như vậy được nhỉ, nó upload file mà nó không validate theo file type mà lại validate theo file name ư ? không lẽ dev của Top top còn cùi hơn cả thằng middle như tôi T_T PNG là ảnh có phần nền transparent chứ đâu dùng định dạng video được nhỉ :amazed:
 
tìm hiểu được nhiều thứ khá hay

đầu tiên là HLS - HTTP Live Streaming là 1 streaming protocol dựa trên HTTP, do apple phát triển. protocol này hỗ trợ việc phân đoạn data thành các luồng (stream) data độc lập, và sẽ ghép các luồng này lại theo đúng thứ tự cần thiết ở phía client để phát cho người dùng. để biết đc thứ tự các data stream thì yêu cầu các stream này đc đánh chỉ mục và lưu vào 1 file chỉ mục, đó là file .m3u8

các data stream với trường hợp của video có thể là các Video Transport Stream (.ts file), là 1 định dạng để chứa digital data của video và audio thôi. 1 video có thể đc cắt ra thành nhiều Video Transport Stream

quay lại với file png,file ảnh nói riêng và các loại file nói chung, cơ bản thì các file đều cần có 1 định nghĩa về cấu trúc file (file structure), trong đó yêu cầu phải có 1 số đoạn/phân đoạn (chunk, segment) bắt buộc. Đại khái là phải có header chunk đc đánh dấu là các byte value nào, phải có end chunk là các byte value nào, v.v... để có thể phát triển các ứng dụng/thư viện đọc/ghi file đó. trong trường hợp file ảnh, đa số các ứng dụng/thư viện đọc file đều sẽ hoạt động theo kiểu: tìm xem có đúng header chunk ở các bytes đầu tiên của file ko, đọc phần body cho đến khi gặp end chunk, là các byte đánh dấu kết thúc dữ liệu ảnh. tuy nhiên cái "file" nó là cái container do OS định nghĩa, data trong file kết thúc ở đâu là do OS và cái file system quyết định (EOF marker khác với end chunk của image), còn các thư viện đọc dữ liệu ảnh nói chung thì chỉ đọc đến cái image end chunk là dừng. bằng cách này thì có thể chèn thêm data vào sau cái image end chunk đấy mà ko làm hỏng image data lẫn việc đọc cái image data. đây là cách che dấu thông tin vào file ảnh mà làm người dùng thông thường ko phát hiện ra, do hầu hết các OS và các ứng dụng đọc file ảnh cũng đều chỉ đọc và hiển thị đến cái image end chunk thôi

quay lại với cái HLS và m3u8, cái m3u8 file ko chỉ cho phép lưu lại chỉ mục của các data stream, còn cho phép khai báo phạm vi đọc và sử dụng data trong stream, đc hỗ trợ trong 1 cái API của HLS gọi là byte-range. google thêm document của apple (HLS do apple phát triển)

từ mấy cái trên, thì suy luận đại khái các trang phim sẽ làm như sau:

  • tạo 1 file png kích thước 1x1 siêu nhỏ, dữ liệu png này có thể nói là 1 byte array bất biến
  • cắt video thành các TS file với file size phù hợp với validation của các server
  • ghép TS data vào png file
  • upload file png mới lên các server
  • tạo file m3u8 với chỉ mục theo đúng thứ tự các png file (TS file trá hình) và định nghĩa thêm byte-range để đảm bảo client chỉ đọc data của TS file, bỏ qua cái data của png (byte array bất biến)
  • woah la, giờ thì đã có 1 bộ phim hoàn chỉnh
Vậy nếu là 1 dev của Tiktok thì mình cần làm gì để ngăn chặn hiện tượng này hả fence
hMrL3fc.png
 
mà làm sao có thể như vậy được nhỉ, nó upload file mà nó không validate theo file type mà lại validate theo file name ư ? không lẽ dev của Top top còn cùi hơn cả thằng middle như tôi T_T PNG là ảnh có phần nền transparent chứ đâu dùng định dạng video được nhỉ :amazed:
kiểm tra trong vỏ nó là video thì cũng vậy, vì nền tảng của tiktok là video
 
mà làm sao có thể như vậy được nhỉ, nó upload file mà nó không validate theo file type mà lại validate theo file name ư ? không lẽ dev của Top top còn cùi hơn cả thằng middle như tôi T_T PNG là ảnh có phần nền transparent chứ đâu dùng định dạng video được nhỉ :amazed:
Như bác ở #73 có nói ấy. Lỗi là do cái cách bọn nó đọc file. Thường chỉ đọc đến end chunk chứ không đọc đến EOF.
Về cơ bản bọn Tiktok thấy 1 file như thế là hợp lệ rồi, phần sau nó không quan tâm nữa, nhưng vẫn lưu trữ.
Chỉ có 1 cách là khi đọc đến end trunk thì EOF luôn.
Trước có ông nào ở voz có ý tưởng thành lập vlxx đấy. Có khi là IT 96. Quay tay ra tiền
JfIHa5x.png
 
mà làm sao có thể như vậy được nhỉ, nó upload file mà nó không validate theo file type mà lại validate theo file name ư ? không lẽ dev của Top top còn cùi hơn cả thằng middle như tôi T_T PNG là ảnh có phần nền transparent chứ đâu dùng định dạng video được nhỉ :amazed:
Kiểm tra thì kiểm tra được, nhưng bạn phải tính đến tốc độ nữa. 1 ngày server hứng bao nhiêu lượt upload, nên đối với các traffic khổng lồ như thế này thì mấy việc check choác cũng qua loa thôi.
 
Kiểm tra thì kiểm tra được, nhưng bạn phải tính đến tốc độ nữa. 1 ngày server hứng bao nhiêu lượt upload, nên đối với các traffic khổng lồ như thế này thì mấy việc check choác cũng qua loa thôi.
Ngược lại chứ, chính vì traffic khổng lồ nên mới cần check kỹ.
 
Vậy nếu là 1 dev của Tiktok thì mình cần làm gì để ngăn chặn hiện tượng này hả fence
hMrL3fc.png
cái post của t chỉ là suy luận về mặt lý thuyết thôi, có quá nhiều định dạng image và mỗi loại lại có cấu trúc khác nhau, thậm chí cho phép chèn thêm cả metadata của image, vậy thì sẽ có thêm rất nhiều trick khác để chèn data ẩn vào image
theo t thì chỉ có cách trace bất thường trong network bandwidth để khoanh vùng suspect image, tải về dùng hex editor kiểm tra cấu trúc theo document của image để điều tra thêm và viết code check case by case thôi
 
Ngược lại chứ, chính vì traffic khổng lồ nên mới cần check kỹ.
Cái này tùy quan điểm thiết kế thôi.

Ví dụ cần check kỹ có thể có batch các thứ check sau.v..v

Nói chung có nhiều cách, nên họ bỏ qua việc validate, validate sơ sài (cho các dạng file) mình cũng không ngạc nhiên lắm.
 
hẳn nào tua phim trên vl** nó load cái xoẹt, t cứ tấm tắc khen thằng này đầu tư mạnh thế, không hổ là dự án s*x từ voz ta :adore:
 
Back
Top