Data Analytics - Chia sẻ chuyện nghề.

Mình đi từ BI rồi sang DA với kn ít ỏi của mình thì mình thấy cái quan trọng vẫn là tư duy về data, và biết làm gì với data đang có. Còn kỹ năng về code hay tool thì chắc chắn cần nhưng đều học được.
 
Last edited:
Cảm ơn các bác đã ủng hộ. Mình sẽ sắp xếp chia sẻ thêm về các vấn đề mọi người quan tâm và update lên #1.

Có backgroud finace, audit sử dụng tương đối tốt excel, cơ bản về PowerQuery, DAX (đang học để nâng cao BI desktop) có việc nào làm thêm cho ké 1 slot với nhé fen :(:(:(:(

Bạn luyện tay với test này xem.
https://docs.google.com/document/d/1noQ2gXwzrqC0kDe5asb_IaL267hQor_NbsoL6rNDW3Y/

Ra đề cũng là 1 bên outsource về mảng dữ liệu, họ đưa test để tuyển cộng tác viên part time.

Đề bài: lấy dữ liệu từ SQL Db, xây báo cáo theo yêu cầu trên Power BI. Không yêu cầu phân tích.
(Khá gần công việc BI Dev)

Có tiền thưởng 1tr cho bạn nào làm tốt nhất.
 
Mình cũng vừa chuyển sang nghề DA này đc vài tháng, vừa apply ddc nên còn nhiều điều cần học hỏi. Sắp tới sẽ có nhiều thắc mắc hi vọng bác hỗ trợ. Lót dép đặt chỗ trước nha :big_smile:.
Hai tuần nay ngồi tìm hiểu về Dwh của công ty và đọc các phụ lục thông báo mà muốn trầm cảm. Gần tới deadline mà sếp dí quá trong khi nhiều số mình còn chưa biết tìm ở đâu ra. Ngoài ra còn nỗi sợ con số mình đưa ra trong báo cáo có đúng k luôn thường trực nữa, k biết bác có kinh nghiệm về cách check k chia sẻ giúp mình với nhé.:adore:

Chia sẻ kinh nghiệm apply cho các bạn khác đi bác.

Khi tiếp cận hệ thống mới mình thường chia theo subject area, xem mảng nghiệp vụ nào quan trọng thì tìm hiểu trước. Vẽ lại mô hình kinh doanh để hiểu ý nghĩa chỉ số, dữ liệu trước khi đào vào db. Bên bạn có DWH nếu kiến trúc tốt thì cũng dễ thở.

Sếp dí mà nhiều số không biết tìm ở đâu thì liệt kê ra hỏi lại sếp hoặc đồng nghiệp. Làm 1 cái danh sách để hỏi 1 thể.

Dữ liệu chưa có công thức cụ thể, không biết đúng sai như thế nào thì bác tách rõ vai trò ra, ví dụ:
  1. Định nghĩa công thức, logic tính toán.
  2. Xác định nguồn dữ liệu trong db.
  3. Tính toán chỉ số đưa ra báo cáo, thực hiện các phân tích khác.
1 cần có tài liệu hoặc người hiểu về nghiệp vụ, 2 cần tài liệu hoặc người hiểu về db. Nếu 1 và 2 đều không có thì mình tự định nghĩa, tự mò cũng được nhưng làm xong sẽ viết lại rõ ràng và xác nhận với các bên liên quan. Sau khi đó mới thực hiện tính toán.

Quá trình này có thể lặp lại nhiều lần mới ra kết quả đúng. Tách rõ ra bác sẽ biết và giải trình được vấn đề ở đâu; sau này có ai kế thừa cũng đỡ khổ.

Các dữ liệu quen tay rồi cũng nên double check cẩn thận trước khi đẩy ra ngoài. (Filter xem thử các dòng ntn, so chéo với nguồn dữ liệu khác...)
 
Chia sẻ kinh nghiệm apply cho các bạn khác đi bác.

Khi tiếp cận hệ thống mới mình thường chia theo subject area, xem mảng nghiệp vụ nào quan trọng thì tìm hiểu trước. Vẽ lại mô hình kinh doanh để hiểu ý nghĩa chỉ số, dữ liệu trước khi đào vào db. Bên bạn có DWH nếu kiến trúc tốt thì cũng dễ thở.

Sếp dí mà nhiều số không biết tìm ở đâu thì liệt kê ra hỏi lại sếp hoặc đồng nghiệp. Làm 1 cái danh sách để hỏi 1 thể.

Dữ liệu chưa có công thức cụ thể, không biết đúng sai như thế nào thì bác tách rõ vai trò ra, ví dụ:
  1. Định nghĩa công thức, logic tính toán.
  2. Xác định nguồn dữ liệu trong db.
  3. Tính toán chỉ số đưa ra báo cáo, thực hiện các phân tích khác.
1 cần có tài liệu hoặc người hiểu về nghiệp vụ, 2 cần tài liệu hoặc người hiểu về db. Nếu 1 và 2 đều không có thì mình tự định nghĩa, tự mò cũng được nhưng làm xong sẽ viết lại rõ ràng và xác nhận với các bên liên quan. Sau khi đó mới thực hiện tính toán.

Quá trình này có thể lặp lại nhiều lần mới ra kết quả đúng. Tách rõ ra bác sẽ biết và giải trình được vấn đề ở đâu; sau này có ai kế thừa cũng đỡ khổ.

Các dữ liệu quen tay rồi cũng nên double check cẩn thận trước khi đẩy ra ngoài. (Filter xem thử các dòng ntn, so chéo với nguồn dữ liệu khác...)

sao nghe toàn cào- sắp xếp rồi reporting vậy thím.

Không có dimension reduction, phân tích classification, segmentation, time series forcasting gì à?
 
Chuyên ngành học của mình ngày trước là ngôn ngữ, sau này đi ra làm nhân sự. Gần đây mình có tìm hiểu và định hướng bản thân đi theo con đường People Analytics. Nhiệm vụ chính (do mình tìm hiểu và tự nghĩ ra) sẽ là đào data về ứng viên, về con người hiện tại để xây dựng mô hình ứng viên lý tưởng cho từng vị trí và tìm hiểu/đáp ứng sự thay đổi trong cơ cấu nhân sự theo mô hình kinh doanh từng thời điểm. Thêm một vài cái nữa như xây dựng chính sách phù hợp cho công ty, xây dựng chương trình đào tạo để phát triển tổ chức.
Mình định đi theo con đường là: học Power BI và thi DA100, học thêm về 1 khóa ngắn online về xác suất thống kê, học cơ bản về SQL và lập trình Python cơ bản. Dự kiến lộ trình 2 năm và bắt đầu theo đúng thứ tự nói trên.
Mình sử dụng excel ở mức trung bình, biết hàm cơ bản như if, vlookup, index, match và có thể lồng các hàm này với nhau, pivot table. Cũng khá thích data.
Không biết các thím thấy lộ trình mình tự nghĩ ra như thế có đủ đảm bảo để áp dụng được không? Hay có thím nào đã từng đi theo con đường này, hoặc biết người nào đi theo con đường này thì chỉ thêm cho mình với.
 
sao nghe toàn cào- sắp xếp rồi reporting vậy thím.

Không có dimension reduction, phân tích classification, segmentation, time series forcasting gì à?

Người ta hỏi là "sợ dữ liệu đưa lên báo cáo không chính xác" thì liên quan gì đến mấy cái buzzword thím liệt kê ra thế?
 
Người ta hỏi là "sợ dữ liệu đưa lên báo cáo không chính xác" thì liên quan gì đến mấy cái buzzword thím liệt kê ra thế?
ý mình là quá nhiều thớt DA ở voz toàn tập trung SQL lấy dữ liệu r làm sạch bla bla mà chả thấy ai cố trả lời bài toán kinh doanh.

Người trả lương cho mấy thím cần thứ khác: Tôi phải bán cho ai, nhóm này nên quảng cáo khác thế nào với nhóm kia, những ng có đặc điểm này mang lại bao nhiêu tiền, thường sau bao lâu cần promotion để giữ chân... ít người bàn mấy cái này quá.
 
ý mình là quá nhiều thớt DA ở voz toàn tập trung SQL lấy dữ liệu r làm sạch bla bla mà chả thấy ai cố trả lời bài toán kinh doanh.

Người trả lương cho mấy thím cần thứ khác: Tôi phải bán cho ai, nhóm này nên quảng cáo khác thế nào với nhóm kia, những ng có đặc điểm này mang lại bao nhiêu tiền, thường sau bao lâu cần promotion để giữ chân... ít người bàn mấy cái này quá.
Tôi chấm hóng đợi cái này. Giờ vô bị đưa mấy cái yêu cầu rồi làm report đề xuất, mà tay ngang chả có tí kiến thức gì. Tự mò mẫm SQL với python thấy chúng nó hay và mạnh quá trời.
Wz51zuD.png
 
Tôi chấm hóng đợi cái này. Giờ vô bị đưa mấy cái yêu cầu rồi làm report đề xuất, mà tay ngang chả có tí kiến thức gì. Tự mò mẫm SQL với python thấy chúng nó hay và mạnh quá trời.
Wz51zuD.png

Học data mining đi hoặc thống kê suy luận, tụi nó có nhiều công cụ để giải quyết bài toán thực tế lắm.

Cần chi tới Python R, nếu nhạy làm mining bằng add in XMLminer của excel vẫn tốt.
 
Vừa bước chân vào lĩnh vực data dc 5 tháng. Cũng chưa xác định dc mình sẽ theo path nào và thấy còn quá nhiều thứ phải học. 1 2 năm nữa quay lại xem sao 🙄🙄🙄
 
Theo như miêu tả từ quan điểm cá nhân của bác chủ thớt ở điều 1 thì những ai học ngành Hệ thống thông tin quản lý khá hợp với nghề Data Analytics đấy. :big_smile:
 
BA khác DA ko thím. Mình đang học lấy bằng MIS chắc là sau này theo hướng BA. Cần thêm thông tin từ người đi trước.

Đang làm kế toán nên cũng có chút kinh nghiệm bàn giấy ở mảng business


via theNEXTvoz for iPhone
Khác á bác, không giống tí nào cả đâu. Nếu bác làm kế toán, nên mình nghĩ cách thói quen tính toán sẽ hợp với DA hơn vì logic nhiều.
Mà tiện hỏi bác học MIS ở đâu thế?
 
ý mình là quá nhiều thớt DA ở voz toàn tập trung SQL lấy dữ liệu r làm sạch bla bla mà chả thấy ai cố trả lời bài toán kinh doanh.

Người trả lương cho mấy thím cần thứ khác: Tôi phải bán cho ai, nhóm này nên quảng cáo khác thế nào với nhóm kia, những ng có đặc điểm này mang lại bao nhiêu tiền, thường sau bao lâu cần promotion để giữ chân... ít người bàn mấy cái này quá.

Mình có vài góp ý thế này, bạn xem sao nhé:

1. Về cách bạn ném buzzword vào comment: Mấy buzzword bạn ném ở trên không liên quan gì đến nội dung mình đang trả lời. Nếu bạn có câu hỏi hoặc muốn phát triển topic theo hướng nào có thể comment đặt câu hỏi hoặc chia sẻ quan điểm một cách rõ ràng.

2. Về nội dung các buzzword: dimension reduction là một kỹ thuật biến đổi dữ liệu; classification, segmentation, forecasting là mấy dạng bài toán phổ biến, bạn có thể kể thêm detection, clustering... nữa cho đủ bộ. Ở đây cũng chưa support gì đến ý ở dưới bạn diễn giải là không ai cố trả lời bài toán kinh doanh. Mình có thể kể cho bạn một mớ bài toán thực tế có giá trị mà không cần đàm buzzword lộn xộn ở trên.

3. "Về người trả lương cho mấy thím": mình không biết người trả lương cho bạn (nếu có) như thế nào chứ mình biết người trả tiền cho mình họ cần để tạo ra giá trị dữ liệu trong suốt vòng đời chứ không phải lên mạng chọn mấy bài toán hay ho về rồi chém cho vui.

Mấy bài toán bạn viết ở trên có bài toán nào không bắt đầu từ việc thu thập, xử lý và làm sạch dữ liệu.

Trong ngành này Garbage in, Garbage out. Bạn cứ tư duy kiểu mì ăn liền là vào doanh nghiệp xong chọn bài toán nào đấy rồi nó đưa dữ liệu ra sẵn như kiểu lên kaggle tải về chắc?

Data mining chỉ là một phần nhỏ trong vòng đời dữ liệu. Các nhu cầu về dữ liệu cũng tùy doanh nghiệp, đôi khi doanh nghiệp chỉ cần có được dữ liệu đúng đủ, chính xác đã ngon lắm rồi. Tùy mỗi hoàn cảnh và mức độ trưởng thành sẽ có những ưu tiên khác nhau, thứ tự ưu tiên về phân tích thường là Descriptive --> Diagnostic --> Predictive --> Prescriptive --> Cognitive
 
Nếu cần kết nối với team marketing để hợp tác thì bạn cần những mảng nào?

Bên mình có nhiều kinh nghiệm triển khai campaign cho mảng giáo dục. Client tiêu biểu gồm FPT Education, ILA, ACET, các trường đại học, cao đẳng …

Tối mình inbox thím trao đổi thêm nhé.
 
Mình thì đang làm Business Analyst, mình cũng quan tâm đến ngành này. Mục đích tự bản thân có thể trích xuất dữ liệu, đọc cái dữ liệu trong hệ thống và đưa ra các quyết định đúng đắn hơn. Mình thích tự lập bản thân mà không phải phụ thuộc quá nhiều người khác. Cũng mong có thể bạn chia sẻ lộ trình học từng bước cơ bản hoặc trao đổi kĩ hơn cũng được.

Trước mình có thiết kế 1 khóa Essential Skills for Data Driven BA. Trong đấy có mấy phần bạn có thể tham khảo:
  1. SQL - chủ động truy vấn dữ liệu, đỡ phải trao đổi với dev.
  2. Data flow / Database Design - BA xịn sẽ tham gia quá trình thiết kế DB luôn do là người hiểu rõ nghiệp vụ nhất. Thiết kế ở mức Concept và Logic là được rồi.
  3. A/B Testing - Thiết kế thử nghiệm trong các quyết định về tính năng.
  4. Các kỹ năng giao tiếp và làm rõ yêu cầu, quản lý dự án, quản lý tài liệu thì DA với BA cũng gần như nhau.
 
Back
Top