thắc mắc Phân tích tĩnh mã độc - để thống kê, chọn đặc trưng đưa vào mô hình học máy

haxichlo.86

Senior Member
Chào các bác ạ. Em đang có một báo cáo đề tài nhưng đang gặp khó khăn khi có ít kiến thức quá ạ. :khóc:

Đề tài : phân tích mã độc file PE trên windows.

Mục đích: phân tích và tự động lấy dữ liệu các đặc trưng của file PE để có thể thống kê và đưa ra bộ đặc trưng phục vụ cho quá trình học máy.

Hướng tiếp cận: em đã phân tích PE header và lựa chọn được các đặc trưng nhưng chỉ là phân tích từng file một, chưa đáp ứng được yêu cầu tự động hóa để lấy được bộ đặc trưng của 5000 file.

Nhờ vả: các bác có ai có ý tưởng gì về đề tài hay cách thực hiện không ạ. Em cảm ơn rất nhiều!
 
bác có bộ dữ liệu cho bài toán này chưa? Chưa hình dung được bài toán này, cho mình xin thử 1 file mẫu dataset dc k
 
tức là từ các file ban đầu có header là các thông số ở hàng đầu tiên (e_cblp,...) thím cần extract ra tập dữ liệu ở các hàng tiếp theo, hiện tại thím đang làm tay à?, v mình viết code để get được header của các file malware rồi bóc tách từng giá trị r append thêm vào dữ liệu hiện tại thôi nhỉ, cái này chắc k khó lắm.
 
tức là từ các file ban đầu có header là các thông số ở hàng đầu tiên (e_cblp,...) thím cần extract ra tập dữ liệu ở các hàng tiếp theo, hiện tại thím đang làm tay à?, v mình viết code để get được header của các file malware rồi bóc tách từng giá trị r append thêm vào dữ liệu hiện tại thôi nhỉ, cái này chắc k khó lắm.
vâng cảm ơn a, để em tìm hiểu thêm ạ tại đề tài này mới với em quá :burn_joss_stick:
 
Back
Top