kiến thức Làm sao để có tư duy phân tích dữ liệu tốt?

Lam_allex

Junior Member
Nhiều người thường bảo làm DA ko phải chỉ biết dùng tool mà cần có tư duy logic, tư duy phân tích insight.... bla bla. Vậy thì cái tư duy ấy là gì? Mình xin chia sẻ góc nhìn từ kn làm việc.

Sai lầm có lẽ các bạn DA sẽ hay gặp phải đó là không hiểu yêu cầu của doanh nghiệp hoặc của khách, sai từ bước ban đầu dẫn đến kết quả báo cáo của mình không đưa ra những thông tin có giá trị với họ. Do vậy các bạn khi làm nghề cần hiểu và xác định được yêu cầu và mục tiêu phân tích dữ liệu của doanh nghiệp hoặc của khách hàng. Ko phải tự nhiên mà những bạn background kinh tế có lợi thế hơn trong nghề DA, và các công ty ưu tiên tuyển người có domain trong lĩnh vực của cty.

Vậy ngay ở bước xác định yêu cầu phân tích, làm thế nào để đảm bảo có hướng giải quyết bài toán đúng? Mình xin chia sẻ kinh nghiệm làm mà mình đã học hỏi đc và hay áp dụng trong việc phân tích dữ liệu

(1) Khi mới phân tích tại 1 tổ chức doanh nghiệp, cần nắm được mô hình kinh doanh và vẽ quy trình nghiệp vụ Khi mới vào phân tích dữ liệu ở 1 công ty, sẽ có bạn bị bị bối rối, không hiểu các số liệu của công ty, không biết lấy dữ liệu từ đâu. Do đó, trước hết các bạn cần hiểu được mô hình kinh doanh của công ty và vẽ ra quy trình nghiệp vụ của công ty đó.

Ví dụ như trong trung tâm Tiếng Anh, mô hình hoạt động của họ là kết nối với giáo viên, mở các lớp dạy tiếng Anh (sản phẩm) và tuyển sinh học viên (khách hàng). Hiện đang có 2 lớp IELTS for newbie, giờ sếp muốn mở thêm 3 lớp đấy, muốn bạn phân tích để tính ra được KPI mà marekting và sales cần đạt được để tuyển sinh đủ lớp.

➡️ Vậy thì bạn cần nắm được cả quy trình tuyển sinh (bán hàng) của họ, thì mới biết hướng phân tích từ đâu (lấy chỉ số từ sales tính ra KPI cho marketing hay ngược lại?) và hiểu tất chỉ số mà họ quy ước (ví dụ: L1 là kh mới đăng ký, L2 là đã sale đã gọi, L3 là khách hàng có quan tâm, L4 là khách muốn học, L5 là khách đã chốt hợp đồng), biết liên hệ với bộ phận nào để khai thác thông tin mình cần.

(2) Tư duy phân tích dữ liệu đa chiều

Phân tích đa chiều là gì?
Cùng 1 chủ điểm phân tích, chúng ta sẽ xem xét dưới nhiều góc nhìn khác nhau (doanh số chi tiết theo từng sản phẩm là bao nhiêu, theo từng khu vực, từng quý là bao nhiêu,..., hoặc chi tiết hơn nữa vd như chi tiết doanh thu theo doàng sản phẩm A trong quý 2 là bao nhiều). Khi chúng ta có thể trả lời những câu hỏi đấy 1 cách nhanh chóng theo thời gian thực bằng dashboard hoặc các phân tích BI, thì đấy gọi là phân tích đa chiều. Các bước phân tích đầu bài với phương pháp phân tích đa chiều

✔️Bước 1: Xác định Dim - Fact

Trước hết, Fact là các chủ điểm phân tích dữ liệu từ yêu cầu, ví dụ yêu cầu phân tích doanh số và sản lượng bán ra trong năm nay, thì doanh số và sản lượng chính là Fact.

Dimension là các khía cạnh phân tích. Ví dụ phân tích doanh số, chúng ta có thể xem xét theo chiều thời gian (theo quý, theo tháng), theo khu vực (các chi nhánh), theo danh mục loại sản phẩm, theo nhân viên bán hàng,...

✔️Bước 2: Cần liệt kê các giá trị trong Dimension.

Ví dụ theo dimension Thời gian thì ta có các giá trị trong đó là: Tháng 1, Tháng 2, Tháng 3,... (Hoặc quý 1, quý 2,...)

Theo dimension sản phẩm thì ta có giá trị trong đó là: Sản phẩm A, Sản phẩm B, Sản phẩm C,...

Theo dimension khu vực thì trong đó ta có: Hà Nội, Hồ Chí Minh, Đà Nẵng,...
9405904f-1082-46da-b856-94aa2c8b5eee.png



✔️Bước 3: vẽ mô hình dữ liệu cho hệ thống phân tích dữ liệu

Bên tay phải có Fact (chủ điểm phân tích), và bên tay trái là Dim (chiều dữ liệu). Trong mô hình này, chúng ta hệ thống lại các chiều dữ liệu và các cấp nhỏ hơn của mỗi chiều. Cùng với đó là sự liên hệ với các chủ điểm phân tích trong hệ thống dữ liệu.

⚪ Ví dụ khi phân tích dòng sản phẩm A và ở thị trường quốc gia VN, thì chúng ta có thể phân tích về doanh số, lượng tồn kho,...

⚪ Ví dụ phân tích về giá, chúng ta không phân tích theo cửa hàng mà phân tích theo dòng sản phẩm và theo thời gian (năm, quý). Phân tích về sức mua (purchase amount) thì sẽ phân tích theo khu vực, theo dòng sản phẩm và theo thời gian, chứ không phải theo khách hàng
48045ada-fdfe-42fc-b045-5d893a5bfc1e.png



❓ Tại sao cần vẽ Data Model dạng này? Mô hình này giúp dễ dàng xác định các nhu cầu phân tích, nhu cầu làm báo cáo và xây dựng chủ điểm phân tích dễ dàng hơn.

Bên cạnh đó nó giúp hình dung các chiều dữ liệu rõ ràng hơn.

Nếu bạn chỉ cần làm 1 báo cáo nhanh bằng Excel thì việc xây dựng Data Model kiểu này giúp bạn nắm được tổng thể các chiều dữ liệu và sự liên kết trong các dữ liệu. Việc kéo thả vào pivot table, kéo thả các bar chart trong BI trở nên dễ dàng hơn. Giúp quá trình xây dựng dash tổng thể và khoa học hơn rất nhiều

Nếu bạn cần xây dựng dashboard phức tạp trên Power BI, thì mô hình này giống như 1 bản mô phỏng, giúp bạn xây dựng Data Model đầy đủ và chuẩn xác hơn
 
b đang làm domain gì? tôi thấy bên ngân hàng, tài chính, fintech, bán lẻ tuyển nhiều
Mình làm bên sản xuất. Chủ yếu là kiểm soát sản lượng , chất lượng dựa trên data của máy xuất ra, rồi làm báo cáo excel thôi , python thì lâu lâu lấy data CTY làm để lấy kinh nghiệm, với lại cho đỡ quên

Đang học lại kế toán, để hiểu thêm nghiệp vụ. Fintech thì đang học thử trên edx.
 
Mình làm bên sản xuất. Chủ yếu là kiểm soát sản lượng , chất lượng dựa trên data của máy xuất ra, rồi làm báo cáo excel thôi , python thì lâu lâu lấy data CTY làm để lấy kinh nghiệm, với lại cho đỡ quên

Đang học lại kế toán, để hiểu thêm nghiệp vụ. Fintech thì đang học thử trên edx.
khá ngách đó bác. chúc bác công việc thành công nhé 💪
 
mình có chia sẻ bài này trên diễn đàn giaiphapexcel và bị cho là copy paste, mình chưa kịp giải thích admin bên đấy đã khóa bài :v ôi thật là ba chấm ạ. từ lần sau rút kinh nghiệm là chỉ đăng trên 1 diễn đàn thôi
 
Mình làm bên sản xuất. Chủ yếu là kiểm soát sản lượng , chất lượng dựa trên data của máy xuất ra, rồi làm báo cáo excel thôi , python thì lâu lâu lấy data CTY làm để lấy kinh nghiệm, với lại cho đỡ quên

Đang học lại kế toán, để hiểu thêm nghiệp vụ. Fintech thì đang học thử trên edx.
Mình cũng làm về bên sản xuất và giờ muốn học hỏi thêm về DA để áp dụng vào công việc giống như bác.
Bác ở đâu thế có thể cho mình học hỏi chút được không :)
 
Mình cũng làm về bên sản xuất và giờ muốn học hỏi thêm về DA để áp dụng vào công việc giống như bác.
Bác ở đâu thế có thể cho mình học hỏi chút được không :)
Bạn thử làm file excel quản lí số liệu sản xuất bên bạn thử đi. Ví dụ từ raw material tới finished goods là 10 quy trình

Làm 10 file excel, thử link các số liệu lại với nhau.
Tùy theo mô hình kinh doanh . Dash board thì bỏ qua poweer BI để visual .

Làm vậy thử trước đi
 
Bạn thử làm file excel quản lí số liệu sản xuất bên bạn thử đi. Ví dụ từ raw material tới finished goods là 10 quy trình

Làm 10 file excel, thử link các số liệu lại với nhau.
Tùy theo mô hình kinh doanh . Dash board thì bỏ qua poweer BI để visual .

Làm vậy thử trước đi
Mỗi quy trình chỉ có số lượng nhập xuất OK NG thôi đâu cần mỗi quy trình 1 file exel bác nhỉ.
Mình mới có kiến thức về exel + pivot table. Đang tìm hiểu thêm về Power BI và tiếp theo là gì thì sẽ vọc thêm sau :(
 
Mỗi quy trình chỉ có số lượng nhập xuất OK NG thôi đâu cần mỗi quy trình 1 file exel bác nhỉ.
Mình mới có kiến thức về exel + pivot table. Đang tìm hiểu thêm về Power BI và tiếp theo là gì thì sẽ vọc thêm sau :(
Bên mình cụ thể là như này, có thể ko đúng với mô hình bên bạn, nhưng có thể tham khảo

Vậy làm sao bạn biết người ta ghi nhận đúng

Ví dụ : 10 tấn cafe đầu vào, sau vài quá trình sản xuất , cafe nhân là 6 tấn ( ví dụ)

Nhưng thực tế SX, công nhân ghi nhận có 5 tấn, hoặc 4,5 tấn

làm sao bạn quản lí các khâu để đạt được gần tiêu chuẩn nhất , làm sao bạn biết số liệu bạn lấy từ công nhân là đúng, và nếu sai thì xử lí ntn

Quản lí hàng tồn ntn,.....

Hàng rework ( phải làm lại ) thì tính ntn, ghi nhận vào đâu

Nhiêu đó đã đủ mệt rồi

Chưa kể làm report thì bộ phận quản lí cần file báo cáo nào , kế toán tài chính cần file nào
 
Bên mình cụ thể là như này, có thể ko đúng với mô hình bên bạn, nhưng có thể tham khảo

Vậy làm sao bạn biết người ta ghi nhận đúng

Ví dụ : 10 tấn cafe đầu vào, sau vài quá trình sản xuất , cafe nhân là 6 tấn ( ví dụ)

Nhưng thực tế SX, công nhân ghi nhận có 5 tấn, hoặc 4,5 tấn

làm sao bạn quản lí các khâu để đạt được gần tiêu chuẩn nhất , làm sao bạn biết số liệu bạn lấy từ công nhân là đúng, và nếu sai thì xử lí ntn

Quản lí hàng tồn ntn,.....

Hàng rework ( phải làm lại ) thì tính ntn, ghi nhận vào đâu

Nhiêu đó đã đủ mệt rồi

Chưa kể làm report thì bộ phận quản lí cần file báo cáo nào , kế toán tài chính cần file nào
mấy chỗ làm bao bì thùng hộp giấy thấy dữ liệu mà nản luôn, đơn hàng không có chuẩn form gì, lúc excel lúc pdf, lại còn kích cỡ ghi dạng chuỗi phải lọc bằng =SPLIT() GG sheets, xong bỏ vào excel, báo cáo thì công nhân ghi tay..........ối giời ơi lắm
 
mấy chỗ làm bao bì thùng hộp giấy thấy dữ liệu mà nản luôn, đơn hàng không có chuẩn form gì, lúc excel lúc pdf, lại còn kích cỡ ghi dạng chuỗi phải lọc bằng =SPLIT() GG sheets, xong bỏ vào excel, báo cáo thì công nhân ghi tay..........ối giời ơi lắm

Do công nhân phải đứng máy sản xuất mà, cũng ko trách đc , nhưng người đó là người ghi nhận data chính xác nhất, rồi đưa cho giấy tờ cho data entry, rồi sau đó mới clean data, làm report,

Hên hên gặp cty ngon, máy móc hiện đại thì nó ghi dữ liệu thời gian thực rồi chuyển về sever luôn, là tốt nhất, công nhân muốn chế số để đạt KPI cũng ko đc

Còn có kiểu báo cáo từ khách hàng về, nó toàn làm theo form của nó, mình phải làm lại hết theo mình nữa kìa :big_smile:.
 
Còn có kiểu báo cáo từ khách hàng về, nó toàn làm theo form của nó, mình phải làm lại hết theo mình nữa kìa :big_smile:.
pdf, excel cơm, ảnh chụp màn hình :shame:, excel từ SAP xuất ra xong thêm thắt 7749 màu, 9981 font chữ, 69 sheet, kích cỡ lúc inches lúc cm kèm chữ kèm kí hiệu 😅, dĩ nhiên 69 khách hàng thì 96 kiểu form khác nhau 🤣🤣🤣
 
Nhiều người thường bảo làm DA ko phải chỉ biết dùng tool mà cần có tư duy logic, tư duy phân tích insight.... bla bla. Vậy thì cái tư duy ấy là gì? Mình xin chia sẻ góc nhìn từ kn làm việc.

Sai lầm có lẽ các bạn DA sẽ hay gặp phải đó là không hiểu yêu cầu của doanh nghiệp hoặc của khách, sai từ bước ban đầu dẫn đến kết quả báo cáo của mình không đưa ra những thông tin có giá trị với họ. Do vậy các bạn khi làm nghề cần hiểu và xác định được yêu cầu và mục tiêu phân tích dữ liệu của doanh nghiệp hoặc của khách hàng. Ko phải tự nhiên mà những bạn background kinh tế có lợi thế hơn trong nghề DA, và các công ty ưu tiên tuyển người có domain trong lĩnh vực của cty.

Vậy ngay ở bước xác định yêu cầu phân tích, làm thế nào để đảm bảo có hướng giải quyết bài toán đúng? Mình xin chia sẻ kinh nghiệm làm mà mình đã học hỏi đc và hay áp dụng trong việc phân tích dữ liệu

(1) Khi mới phân tích tại 1 tổ chức doanh nghiệp, cần nắm được mô hình kinh doanh và vẽ quy trình nghiệp vụ Khi mới vào phân tích dữ liệu ở 1 công ty, sẽ có bạn bị bị bối rối, không hiểu các số liệu của công ty, không biết lấy dữ liệu từ đâu. Do đó, trước hết các bạn cần hiểu được mô hình kinh doanh của công ty và vẽ ra quy trình nghiệp vụ của công ty đó.

Ví dụ như trong trung tâm Tiếng Anh, mô hình hoạt động của họ là kết nối với giáo viên, mở các lớp dạy tiếng Anh (sản phẩm) và tuyển sinh học viên (khách hàng). Hiện đang có 2 lớp IELTS for newbie, giờ sếp muốn mở thêm 3 lớp đấy, muốn bạn phân tích để tính ra được KPI mà marekting và sales cần đạt được để tuyển sinh đủ lớp.

➡️ Vậy thì bạn cần nắm được cả quy trình tuyển sinh (bán hàng) của họ, thì mới biết hướng phân tích từ đâu (lấy chỉ số từ sales tính ra KPI cho marketing hay ngược lại?) và hiểu tất chỉ số mà họ quy ước (ví dụ: L1 là kh mới đăng ký, L2 là đã sale đã gọi, L3 là khách hàng có quan tâm, L4 là khách muốn học, L5 là khách đã chốt hợp đồng), biết liên hệ với bộ phận nào để khai thác thông tin mình cần.

(2) Tư duy phân tích dữ liệu đa chiều

Phân tích đa chiều là gì?
Cùng 1 chủ điểm phân tích, chúng ta sẽ xem xét dưới nhiều góc nhìn khác nhau (doanh số chi tiết theo từng sản phẩm là bao nhiêu, theo từng khu vực, từng quý là bao nhiêu,..., hoặc chi tiết hơn nữa vd như chi tiết doanh thu theo doàng sản phẩm A trong quý 2 là bao nhiều). Khi chúng ta có thể trả lời những câu hỏi đấy 1 cách nhanh chóng theo thời gian thực bằng dashboard hoặc các phân tích BI, thì đấy gọi là phân tích đa chiều. Các bước phân tích đầu bài với phương pháp phân tích đa chiều

✔️Bước 1: Xác định Dim - Fact

Trước hết, Fact là các chủ điểm phân tích dữ liệu từ yêu cầu, ví dụ yêu cầu phân tích doanh số và sản lượng bán ra trong năm nay, thì doanh số và sản lượng chính là Fact.

Dimension là các khía cạnh phân tích. Ví dụ phân tích doanh số, chúng ta có thể xem xét theo chiều thời gian (theo quý, theo tháng), theo khu vực (các chi nhánh), theo danh mục loại sản phẩm, theo nhân viên bán hàng,...

✔️Bước 2: Cần liệt kê các giá trị trong Dimension.

Ví dụ theo dimension Thời gian thì ta có các giá trị trong đó là: Tháng 1, Tháng 2, Tháng 3,... (Hoặc quý 1, quý 2,...)

Theo dimension sản phẩm thì ta có giá trị trong đó là: Sản phẩm A, Sản phẩm B, Sản phẩm C,...

Theo dimension khu vực thì trong đó ta có: Hà Nội, Hồ Chí Minh, Đà Nẵng,...
9405904f-1082-46da-b856-94aa2c8b5eee.png



✔️Bước 3: vẽ mô hình dữ liệu cho hệ thống phân tích dữ liệu

Bên tay phải có Fact (chủ điểm phân tích), và bên tay trái là Dim (chiều dữ liệu). Trong mô hình này, chúng ta hệ thống lại các chiều dữ liệu và các cấp nhỏ hơn của mỗi chiều. Cùng với đó là sự liên hệ với các chủ điểm phân tích trong hệ thống dữ liệu.

⚪ Ví dụ khi phân tích dòng sản phẩm A và ở thị trường quốc gia VN, thì chúng ta có thể phân tích về doanh số, lượng tồn kho,...

⚪ Ví dụ phân tích về giá, chúng ta không phân tích theo cửa hàng mà phân tích theo dòng sản phẩm và theo thời gian (năm, quý). Phân tích về sức mua (purchase amount) thì sẽ phân tích theo khu vực, theo dòng sản phẩm và theo thời gian, chứ không phải theo khách hàng
48045ada-fdfe-42fc-b045-5d893a5bfc1e.png



❓ Tại sao cần vẽ Data Model dạng này? Mô hình này giúp dễ dàng xác định các nhu cầu phân tích, nhu cầu làm báo cáo và xây dựng chủ điểm phân tích dễ dàng hơn.

Bên cạnh đó nó giúp hình dung các chiều dữ liệu rõ ràng hơn.

Nếu bạn chỉ cần làm 1 báo cáo nhanh bằng Excel thì việc xây dựng Data Model kiểu này giúp bạn nắm được tổng thể các chiều dữ liệu và sự liên kết trong các dữ liệu. Việc kéo thả vào pivot table, kéo thả các bar chart trong BI trở nên dễ dàng hơn. Giúp quá trình xây dựng dash tổng thể và khoa học hơn rất nhiều

Nếu bạn cần xây dựng dashboard phức tạp trên Power BI, thì mô hình này giống như 1 bản mô phỏng, giúp bạn xây dựng Data Model đầy đủ và chuẩn xác hơn
Bác có biết tài liệu nào về tư duy phân tích dữ liệu hay khoá học nào dạy cái này không ạ, cho mình xin tham khảo thêm. Mình đi học rồi thấy ngta chỉ dạy tool thôi
 
Mỗi quy trình chỉ có số lượng nhập xuất OK NG thôi đâu cần mỗi quy trình 1 file exel bác nhỉ.
Mình mới có kiến thức về exel + pivot table. Đang tìm hiểu thêm về Power BI và tiếp theo là gì thì sẽ vọc thêm sau :(
nếu mà bác có nhiều file data và cần phải xử lý để chuẩn hóa dữ liệu, đưa vào pitvot table làm báo cáo thì dùng Power Query rất tiện, thay thế VBA với các hàm cồng kềnh như index/match,.... Bác có thể tham khảo thêm cách dùng Power Query để tổng hợp, xử lý dữ liệu https://www.facebook.com/Dataanalys...XMwq1EfuJv9k79peoPK3ddcdRpqamQttffPAMsdmdA9dl
 
Bác có biết tài liệu nào về tư duy phân tích dữ liệu hay khoá học nào dạy cái này không ạ, cho mình xin tham khảo thêm. Mình đi học rồi thấy ngta chỉ dạy tool thôi
những tư duy về phân tích dữ liệu mình áp dụng trong công việc và chia sẻ ở đây là học từ thầy Tú đang dạy ở đây https://bit.ly/3Zs8G5i
bạn có thể tham khảo
 
Mình dev thôi. Nhưng đang muốn cải thiện sql. Mấy bác kiếm data ở và yêu cầu, bài tập ở đâu để luyện tập món này vậy
 
Back
Top