Theo bác nhóm này hiện yêu cầu tech stack gồm những gì và sâu đến đâu nhỉ, và doanh nghiệp thường họ có yêu cầu kinh nghiệm ít nhất về 1 business domain nào không bác
Bộ trang bị khởi đầu vẫn là Excel, SQL, Power BI, Python. Mà cần học và hiểu tương đối sâu về công cụ, làm được một số use-case cơ bản. Mình note tạm một vài đầu mục ở đây, thừa thiếu nhờ các bác khác bổ sung thêm:
+ Excel: Tin học văn phòng cơ bản, dùng các hàm, format files thành thạo.
+ SQL: Hiểu được cách thức và nguyên lý làm việc của SQL. Có khả năng giao tiếp với người dùng để lấy yêu cầu và xử lý các truy vấn phức tạp. Một số kỹ thuật phải dùng mà không cần nghĩ: join nhiều điều kiện, join bất cân bằng, join nhiều bảng với nhiều lớp sub-queries phức tạp.
Nói chung là đọc đến yêu cầu lấy dữ liệu nào là dịch nó sang SQL được.
+ Power BI: Sử dụng được Power BI trong các tác vụ phân tích bao gồm nhưng không giới hạn trong:
1. Trao đổi được với người dùng để lấy nhu cầu và đề xuất giải pháp. Thuyết trình được về kết quả sau triển khai, phân tích.
2. Tư duy tổ chức, mô hình hoá dữ liệu (data modeling). Hiểu và vận dụng được các khái niệm bảng Dim, Fact; các yếu tố của các mối quan hệ và cách thức mô hình dữ liệu vận hành. Hiểu được pros & cons khi dịch yêu cầu phân tích thành mô hình dữ liệu.
3. Hiểu được nguyên lý và thực hiện được các công thức DAX một cách chủ động (thay vì đi search code trên mạng và thử sai). Một số khái niệm cần nắm (filter context, row context, context transitions). Thành thạo các nhóm hàm cơ bản. Hiểu được cách DAX tương tác với mô hình dữ liệu.
4. Hiểu được các nguyên tắc trong trình diễn dữ liệu. Vận dụng để tư vấn cho các người dùng cuối. Xây báo cáo ra sao, tinh chỉnh như thế nào. Từ bố cục báo cáo, chọn màu sắc cho đến từng chi tiết của mỗi biểu đồ.
5. Có thể xử lý, làm sạch dữ liệu với Power Query, không cần thành thạo đến mức viết mới M-Query nhưng cần hiểu cách và khả năng kết nối để tư vấn cho người dùng cách tổ chức dữ liệu sao cho hợp lý để sử dụng được.
6. Publish được báo cáo, đặt lịch, chia sẻ, quản lý workspace.
Power BI là thằng người mới học hay bị tự tin quá vì nó kéo thả cũng dễ, làm quen tí là có báo cáo đẹp đẹp rồi. Nếu cần hiểu và vận dụng được và chủ động trong các bài toán thì không đơn giản. Mấy cái nâng cao như phân quyền theo dòng dữ liệu, theo đối tượng hay tối ưu model, chi phí license các kiểu còn chưa nhắc đến ở đây.
+ Python: Hiểu basic về Python: kiểu dữ liệu, biến, hàm, cấu trúc rẽ nhánh vòng lặp. Làm việc với một số công cụ crawl dữ liệu, api. Tự làm được một số chương trình cơ bản để tự động hoá, biết cách de-bug code. Làm việc được với một số thư viện xử lý dữ liệu phổ biến (Pandas, Numpy, Pyplot, Scikilearn).
Về vụ lập trình này cứ biết cách tư duy còn lại google hoặc co-pilot sẽ giúp bạn.