cxntrxl
Junior Member
Chào các bác, hiện e đang làm 1 project về một bài toán regression bên sinh học. Dữ liệu là các dữ liệu kiểu -omics. Người hướng dẫn thì chỉ yêu cầu sao cho ra đc cái model outperform thứ khác; còn e thì muốn tìm hiểu sâu về dữ liệu và đánh giá mô hình (ko chỉ performance metric mà cả interpretability, causality). Theo e thấy thì để đo được dữ liệu omics nó nhiêu khê hơn nhiều so với dữ liệu ảnh, văn bản, âm thanh. Cụ thể luồng nó như kiểu: mẫu sinh học => chuẩn bị => xét nghiệm microarray => tiền xử lý dữ liệu thô => dữ liệu mức gene/protein/v.v. Rồi bên ML/DL mới chọc vô dữ liệu mức/protein làm dữ liệu cho bài toán của mình. Kiểu như dữ liệu omics nó giống một kiểu tabular data ấy. Nên là e ko có cảm giác ưa thích việc phải nghiên cứu DL trong bài toán y sinh, dù mấy bài kiểu này có thể xuất hiện trên cả Nature. Nhưng ngược lại e cũng thấy một số tin tức về ứng dụng ML/DL trong y sinh, như AlphaFold, hay mấy cái graph neural network đang nổi gần đấy được dùng cho dữ liệu thuốc. Vậy theo các cao nhân, tình hình thực tế của ML/DL trong lĩnh vực y sinh là ntn? Có nên quay xe nghiên cứu DL trong lĩnh vực khác truyền thống hơn: ảnh, văn bản, âm thanh? Cảm ơn các bác rất nhiều