thắc mắc Không thể download tài liệu từ thư viện số này

hungtn1994

Junior Member
Em đang làm nghiên cứu bên Y Hà Nội, có thư viện luận văn của nhà trường. Muốn tải luận văn về máy để đọc khi không có mạng mà trang chặn tải.
Trước em có hỏi một bác trên này được hướng dẫn tải một lần. Cũng lâu rồi, khoảng vài năm gì đó, được hướng dẫn tải IDM và vào F12 của trang gõ vài dòng lệnh gì đó. Nick Voz cũ của e bị mất nên không tìm lại được thư inbox đó nữa. Nay hỏi lại các bác trên này.
Link thư viện luận văn e đang học:
http://dulieuso.hmu.edu.vn:8080/Vie...=0&doc=91913005944609557886046144492620415698
Screenshot 2024-06-04 100355.png
 
chịu đấy, mò 1 lúc éo được bó tay, chỉ có cách chụp màn hình ghép lại rồi in ra sách, nhưg không có tính chỉnh sửa
 
Mở Firefox -> F12 -> Network -> Reload trang -> Tìm link http://dulieuso.hmu.edu.vn:8080/ViewPdfOnline/services/view.php?loc=0&doc=91913005944609557886046144492620415698&format=pdf&page=&subfolder=91/91/30/ -> Chuột phải -> Copy as curl (windows) -> Mở powershell -> Dán lệnh đấy + --output out.pdf

Code:
curl "http://dulieuso.hmu.edu.vn:8080/ViewPdfOnline/services/view.php?loc=0&doc=91913005944609557886046144492620415698&format=pdf&page=&subfolder=91/91/30/" -H "User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:126.0) Gecko/20100101 Firefox/126.0" -H "Accept: */*" -H "Accept-Language: en-US,en;q=0.5" -H "Accept-Encoding: gzip, deflate" -H "DNT: 1" -H "Sec-GPC: 1" -H "Connection: keep-alive" -H "Referer: http://dulieuso.hmu.edu.vn:8080/ViewPdfOnline/js/pdf.worker.min.js" -H "Cookie: PHPSESSID=it59u7dh1cnopi261q2biu7dc4" -H "Pragma: no-cache" -H "Cache-Control: no-cache" --output out.pdf
 
Last edited:
Mở Firefox -> F12 -> Network -> Reload trang -> Tìm link http://dulieuso.hmu.edu.vn:8080/ViewPdfOnline/services/view.php?loc=0&doc=91913005944609557886046144492620415698&format=pdf&page=&subfolder=91/91/30/ -> Chuột phải -> Copy as curl (windows) -> Mở powershell -> Dán lệnh đấy + --output out.pdf

Code:
curl "http://dulieuso.hmu.edu.vn:8080/ViewPdfOnline/services/view.php?loc=0&doc=91913005944609557886046144492620415698&format=pdf&page=&subfolder=91/91/30/" -H "User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:126.0) Gecko/20100101 Firefox/126.0" -H "Accept: */*" -H "Accept-Language: en-US,en;q=0.5" -H "Accept-Encoding: gzip, deflate" -H "DNT: 1" -H "Sec-GPC: 1" -H "Connection: keep-alive" -H "Referer: http://dulieuso.hmu.edu.vn:8080/ViewPdfOnline/js/pdf.worker.min.js" -H "Cookie: PHPSESSID=it59u7dh1cnopi261q2biu7dc4" -H "Pragma: no-cache" -H "Cache-Control: no-cache" --output out.pdf
Em làm giống như bác nó hiện ra thế này
Screenshot 2024-06-04 155342.png
 
@hungtn1994 Thím đọc kỹ giùm mình. Phía trên mình viết tìm link http://dulieuso.hmu.edu.vn:8080/ViewPdfOnline/services/view.php?loc=0&doc=91913005944609557886046144492620415698&format=pdf&page=&subfolder=91/91/30/ cơ mà

Link của thím là http://dulieuso.hmu.edu.vn:8080/ViewPdfOnline/js/pdf.worker.min.js :sweat: Ko thì ở tab Network -> Chọn XHR để lọc mỗi link XHR thôi.
 
Em đang làm nghiên cứu bên Y Hà Nội, có thư viện luận văn của nhà trường. Muốn tải luận văn về máy để đọc khi không có mạng mà trang chặn tải.
Trước em có hỏi một bác trên này được hướng dẫn tải một lần. Cũng lâu rồi, khoảng vài năm gì đó, được hướng dẫn tải IDM và vào F12 của trang gõ vài dòng lệnh gì đó. Nick Voz cũ của e bị mất nên không tìm lại được thư inbox đó nữa. Nay hỏi lại các bác trên này.
Link thư viện luận văn e đang học:
http://dulieuso.hmu.edu.vn:8080/Vie...=0&doc=91913005944609557886046144492620415698
Save cái này thành download.bat rồi click vào là nó tự tải về ở Desktop > download
Bash:
@echo off

REM Get the desktop path
set "desktop=%USERPROFILE%\Desktop"

REM Create a directory named 'download' on the desktop
set "download_dir=%desktop%\download"
if not exist "%download_dir%" (
    mkdir "%download_dir%"
)

REM Navigate to the 'download' directory
cd /d "%download_dir%"

REM Diagnostic: Print current directory
echo Current directory: %cd%

REM Diagnostic: Test curl command
curl --version
if %errorlevel% neq 0 (
    echo curl is not installed or not available in PATH. Please install curl.
    pause
    exit /b 1
)

REM Download the file using curl
curl "http://dulieuso.hmu.edu.vn:8080/ViewPdfOnline/services/view.php?loc=0&doc=91913005944609557886046144492620415698&format=pdf&page=&subfolder=91/91/30/" ^
-H "User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:126.0) Gecko/20100101 Firefox/126.0" ^
-H "Accept: */*" ^
-H "Accept-Language: en-US,en;q=0.5" ^
-H "Accept-Encoding: gzip, deflate" ^
-H "DNT: 1" ^
-H "Sec-GPC: 1" ^
-H "Connection: keep-alive" ^
-H "Referer: http://dulieuso.hmu.edu.vn:8080/ViewPdfOnline/js/pdf.worker.min.js" ^
-H "Cookie: PHPSESSID=it59u7dh1cnopi261q2biu7dc4" ^
-H "Pragma: no-cache" ^
-H "Cache-Control: no-cache" ^
--output out.pdf

REM Check if the file was downloaded successfully
if exist "out.pdf" (
    echo Download complete. The file is saved in %download_dir%.
) else (
    echo Download failed. Please check the URL and headers.
)

pause
 
@hungtn1994 Thím đọc kỹ giùm mình. Phía trên mình viết tìm link http://dulieuso.hmu.edu.vn:8080/ViewPdfOnline/services/view.php?loc=0&doc=91913005944609557886046144492620415698&format=pdf&page=&subfolder=91/91/30/ cơ mà

Link của thím là http://dulieuso.hmu.edu.vn:8080/ViewPdfOnline/js/pdf.worker.min.js :sweat: Ko thì ở tab Network -> Chọn XHR để lọc mỗi link XHR thôi.
Em đã làm giống bác bảo, không biết có sai ở bước nào không ạ
Screenshot 2024-06-04 160516.png

Screenshot 2024-06-04 162345.png
 
Em đã làm giống bác bảo, không biết có sai ở bước nào không ạ
View attachment 2528166
View attachment 2528167
Thím chạy bằng cmd là ăn nhé
1717493694605.png

Muốn chạy powershell thì thím copy cái dòng curl ... powershell ý chứ câu trên cho vào powershell tạch tương tự
1717493748299.png


Bash:
$session = New-Object Microsoft.PowerShell.Commands.WebRequestSession
$session.UserAgent = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36 Edg/125.0.0.0"
Invoke-WebRequest -UseBasicParsing -Uri "http://dulieuso.hmu.edu.vn:8080/ViewPdfOnline/services/view.php?loc=0&doc=91913005944609557886046144492620415698&format=pdf&page=&subfolder=91/91/30/" `
-WebSession $session `
-Headers @{
"Referer"="http://dulieuso.hmu.edu.vn:8080/ViewPdfOnline/js/pdf.worker.min.js"
} -OutFile output.pdf
 
Last edited:
chắc do bác k phải chuyên mảng tin học nên cách làm đôi khi k đc trơn tru như mấy bác trên... Bác cứ làm như theo bác @Fzen là đc. Còn chi tiết thì như bác @eipi10
 
Back
Top