thảo luận 4x rồi có nên học phân tích dữ liệu lớn, lập trình Python và SQL để bắt kịp xu hướng

SQL với Python thì bác cứ học căn bản để code được vài cái tool nhỏ nhỏ hoặc app đơn giản đi đã. Còn với nền tảng của bác thì chắc là học lên cao ứng dụng vào chuyên môn của mình không khó. Em không học Python nhưng mà thấy bên kteam có khóa https://www.howkteam.vn/course/lap-trinh-python-co-ban-37 . Bằng tiếng Việt luôn, bác xem thử xem.
 
Bài này là điển hình build model làm prediction của Machine Learning thôi.

Nhưng cái mình tò mò là hiện tại thím làm kiểu "phân tích truyền thống" là cụ thể làm gì để giải quyết bài toán trên nếu không biết ML?

SQL, python hay Machine Learning chỉ là tool, cho dù biết cả chục giải thuật ML rồi bỏ data vào chạy mà ko biết lý thuyết thống kê thì cũng như thợ gõ thôi. Tại thấy phía trên thím nói trước giờ làm "phân tích truyền thống... phán đoán chủ quan.." nếu vậy thì nên ưu tiên học thống kê dữ liệu trước đừng bận tâm tới mấy cái tool này.

Cảm ơn thím, cách thức truyền thống thực ra đã phải dùng thống kê rất nhiều, nhưng sẽ có những thứ được cho là luôn phải thế, như câu chuyện đèn không thể treo ngược.
Lấy ví dụ đánh giá rủi ro tín dụng một khách hàng, 10 năm trước đây chủ yếu dùng phân tích định lượng, sau đó mới đến trào lưu áp dụng Basel 2 trong đó các TCTD cố xây mô hình tính xác xuất rủi ro vỡ nợ để định giá khoản vay, tính toán các dự phòng và vốn kinh tế vân vân và mây mây.
Về lĩnh vực bán lẻ, cách truyền thống vẫn là thống kê tần suất lặp lại và tương quan, trong đó có một số quan niệm truyền thống như một năm có bao nhiêu mùa và từng mùa bán gì, các đảo khuyến mãi dẫn hành trình mua hàng, các đầu quầy kệ là điểm vàng, sản phẩm dẫn, sản phẩm kèm, màu sắc, mùi vị.... Nhiều lúc cứ nghĩ sản phẩm nào đó bán được nhiều là do khuyến mãi, nhưng thực ra do yếu tố khác, có khi chỉ là thay đổi vị trí trưng bày hay đặt gần sản phẩm nào đó :)
 
Nhiều lúc cứ nghĩ sản phẩm nào đó bán được nhiều là do khuyến mãi, nhưng thực ra do yếu tố khác, có khi chỉ là thay đổi vị trí trưng bày hay đặt gần sản phẩm nào đó :)

Nhớ ko lầm thì xác định cause and effect relationship thì nếu biết thống kê có thể dùng phân tích phương sai (ANOVA) để test như vậy mình ko phải đoán.

Nếu thím có kinh nghiệm mấy cái này rồi thì học python, Machine Learning giúp ít rất nhiều.
 
Cho mình hỏi ngu tý. Bình thường ko có SQL thì chủ thớt lấy dữ liệu ở server kiểu gì. (Chả lẽ kêu mấy cháu xuất ra file excel, csv ?)
 
Nhớ ko lầm thì xác định cause and effect relationship thì nếu biết thống kê có thể dùng phân tích phương sai (ANOVA) để test như vậy mình ko phải đoán.

Nếu thím có kinh nghiệm mấy cái này rồi thì học python, Machine Learning giúp ít rất nhiều.
Suy diễn nhân quả (causal inference) quan tâm đến bài toán ước lượng nhiều hơn, đòi hỏi sự chính xác của mô hình ước lượng. Nhiều khi phải xây dựng thử nghiệm đối chứng ngẫu nhiên mới xác định chính xác được hiệu quả của một chính sách (bán hàng) nào đó lên kết quả (doanh thu). Như một giáo sư về kinh tế ở MIT nói thì ML không có ứng dụng nhiều lắm vì lượng dữ liệu thường không quá lớn và ML tập trung vào dự đoán (prediction) nhiều hơn.

Làm thống kê thì ưu tiên sử dụng R nhiều hơn.
 
Cho mình hỏi ngu tý. Bình thường ko có SQL thì chủ thớt lấy dữ liệu ở server kiểu gì. (Chả lẽ kêu mấy cháu xuất ra file excel, csv ?)

Công cụ chính vẫn là SPSS đó thím, SQL loanh quanh mấy câu lệnh tự học và làm querry mấy buổi là quen.
 
Last edited:
Back
Top