Data Analytics - Chia sẻ chuyện nghề.

cảm ơn góp ý của thím. Đọc góp ý của thím và chia sẻ từ các thím khác bên dưới, mình sẽ bỏ qua phần toán và Python vì suy nghĩ kĩ thì đúng là mình cũng chưa có nhiều yêu cầu để dùng đến.
Về dự án ngày trước của thím, có thể chia sẻ thêm giúp mình cụ thể hơn là thím đã lượng hóa quy trình như thế nào được không?
Ví dụ: đi từ bước khảo sát nhân viên, quản lý về hình mẫu ứng viên để tìm ra 3 tiêu chí chung bắt buộc cho phù hợp văn hóa. Sau đó từng phòng ban phải liệt kê từng vị trí và lượng hóa yêu cầu đối với ứng viên để làm sao khi phỏng vấn có thể cho điểm 1-5 từng người, từ đó chọn ra người phù hợp?
Phân tích vòng đời nhân sự có phải tính từ khi người ta nộp CV đến khi người ta rời đi và xem yếu tố gì ảnh hưởng lớn nhất dựa trên dữ liệu?

Các chỉ số chính về mảng nhân sự thì mình không nói nữa.

Về bài toán vòng đời nhân sự, bên mình làm như sau:
  • Hệ thống lại ngành, ngạch, bậc. Phân tách rõ từng line nhân sự, cấp bậc và vai trò.
  • Vẽ lại vòng đời nhân sự, đánh mã và dấu hiệu nhận biết (sự kiện) của từng cấp độ của nhân sự. (VD: Nộp CV, Pass PV 1, Pass PV 2, Thử việc, Chính thức, Nghỉ việc...)
  • Tìm và bóc dữ liệu từ các hệ thống. (Thời điểm đó có hơn chục hệ thống dữ liệu liên quan đến nhân sự: phỏng vấn, chấm công, tính lương, đánh giá, đào tạo --> Như một đống rác, nặng nhất ở đây là con SAP - HRM và Jira)
  • Song song với đó điều chỉnh lại quy trình và tích hợp các hệ thống nhân sự. Đập một số hệ thống đi nữa :LOL:)
  • Lượng hóa kết quả phỏng vấn bằng Structured Behavior Interview, bài test. Quy trình test cũng có thể phải điều chỉnh cho thống nhất.

Còn mấy bài toán nữa như quản lý định biên, phân bổ định biên và chi phí.

Vấn đề khoai nhất vẫn là chuẩn hóa được dữ liệu và quy trình do bên nào cũng muốn linh động, nhanh, nợ hồ sơ, nợ phỏng vấn. :LOL:)
 
Vẫn còn nợ câu hỏi của một số bạn ở các trang trước. Mình sẽ sắp xếp thời gian trả lời tiếp.

Chiều nay mình có tham gia một buổi chia sẻ online trên diễn đàn UEB - VNU.
Bạn nào quan tâm thì tham gia trao đổi thêm nhé.

https://fb.me/e/1shAD4xjY

Have fun.
 
Có fen nào làm dữ liệu về y sinh ko? R với Python thì có người khuyên đi 1 cái thôi, mà mình thấy cả 2 đều ngon. R nhiều tài liệu tham khảo hơn, Python viết dễ hơn nhưng chịu khó đọc tiếng Anh. Ko biết nên đi tiếp cái nào?
 
Có fen nào làm dữ liệu về y sinh ko? R với Python thì có người khuyên đi 1 cái thôi, mà mình thấy cả 2 đều ngon. R nhiều tài liệu tham khảo hơn, Python viết dễ hơn nhưng chịu khó đọc tiếng Anh. Ko biết nên đi tiếp cái nào?

Theo mình thấy thì cái gì có thì Python có cả, làm được cả. Đổi lại syntax thôi.
Nên mình nghĩ học Python hơn.
 
Có fen nào làm dữ liệu về y sinh ko? R với Python thì có người khuyên đi 1 cái thôi, mà mình thấy cả 2 đều ngon. R nhiều tài liệu tham khảo hơn, Python viết dễ hơn nhưng chịu khó đọc tiếng Anh. Ko biết nên đi tiếp cái nào?
Học gì cũng được, tập trung thành thạo 1 ngôn ngữ sẽ thành thạo mấy cái còn lại nhanh thôi.

Theo mình thấy thì cái gì có thì Python có cả, làm được cả. Đổi lại syntax thôi.
Nên mình nghĩ học Python hơn.
+ 1 Python giống bác. Vì thói quen và tính đa dụng của nó là chính (coi như sở thích cá nhân). Mấy đoạn tranh cãi ngôn ngữ nào thượng đẳng hơn vô nghĩa vc.

Có title sách nào fen tâm đắc ko? Tiếng nào cũng đc.
Python for Data Analytics - Wiley
HBR Guide to Data Analytics Basics for Managers - HBR
Modern Database Management System - Pearson
How to lie with statistic
...

Còn mấy quyển sách giáo khoa kiểu Storytelling with data... thì thôi khỏi nhắc.

Mình thấy Datacamp cũng okie. Nếu chưa muốn đầu tư lắm thì học các open course trên coursera, edx, mooc mấy trường lớn cũng nhiều khóa ngon. Quan trọng là có học hay không thôi. :LOL:
 
Data Analyst thì range lương thị trường tầm bao nhiêu chủ thớt nhĩ, hồi bữa 1 có nhận dc offer của 1 cty bảo hiểm ở TP.HCM thì hơn 15tr một xíu (gross & nghỉ t7-cn)
 
Last edited:
Data Analyst thì range lương thị trường tầm bao nhiêu chủ thớt nhĩ, hồi bữa 1 có nhận dc offer của 1 cty bảo hiểm ở TP.HCM thì hơn 15tr một xíu (gross & nghỉ t7-cn)

Còn tùy kinh nghiệm và ngành nghề:
Intern - Fresher khoảng 10 đổ lại.
Junior - 1x.
Associate trở lên thì phụ thuộc nhiều yếu tố.
Range trên là tính mặt bằng chung ở HN chỉ mang tính chất tham khảo, HCM cao hơn khoảng 20-30% (estimated).

Các trường hợp ngoại lệ thì không tính. Mảng này đang thiếu nhân sự làm được việc nên nếu tự tin, được refer vị trí phù hợp hoặc phỏng vấn tốt thì thu nhập cũng vô cùng lắm.
 
Ngành Data nói chung dạo này đang hot, các con giời lao vào cũng nhiều mà không có định hướng nên phí thời gian hoặc bị chăn dắt chẳng đi đến đâu.
Mấy tuần nay covid không đi cày được nên lập cái topic tư vấn chơi chơi và kể chuyện công việc, chia sẻ với anh em.

Sơ lược về mình:
  • Mình làm dữ liệu từ năm 2014, khởi đầu từ Data Analyst sau lấn sang làm đủ thứ từ DBA, Data Quality Control, Head of Data Department, Data Architect, MIS Project Manager.
  • Ngành học đại học là phân tích tài chính, theo mảng này phải học thêm khá nhiều về CNTT.
  • Mình có làm thêm mảng đào tạo, tư vấn, triển khai từ 2018. Hiện tại, vẫn đang làm đào tạo cho cá nhân, doanh nghiệp, liên kết với một số trường đại học.
Phạm vi topic này:
  • Kể chuyện nghề: lịch sử làm việc, những cú để đời trong quá trình hành nghề.
  • Tư vấn nghề nghiệp: Cho các bạn quan tâm, muốn theo ngành này.
  • Kết nối đến các thím cùng ngành. Mình có theo dõi vài topic, thấy cũng nhiều thím làm cùng ngành, hi vọng kết nối và hỗ trợ được lẫn nhau.
  • Tìm đồng đội: Team mình đa phần giờ các anh em đều làm sâu về chuyên môn, không có người làm marketing, vận hành và growth . Hi vọng, kết nối được với các bạn cùng chí hướng và có khả năng làm mảng giáo dục.
Miễn là anh em còn phản hồi, mình sẽ duy trì thread này.


Để mở đầu, mình note lại một số quan điểm cá nhân về một số lầm tưởng trong ngành:

1. Làm dữ liệu phải giỏi siêu nhân về toán, thần thánh về lập trình hoặc công cụ, hiểu rất sâu về business.

Quan điểm cá nhân:
Bạn code tốt hơn một ông thuần về business, hiểu về business hơn một ông dev bình thường, hiểu về toán tốt hơn cả 2 ông kia (cũng chưa biết đâu vì nhiều dev xịn mình biết học sư phạm toán với toán ứng dụng ra đấy :-s ). bạn viết truy vấn SQL có thể tốt hơn Dev vì bạn hiểu về business nhưng thử viết một stored produce xử lý một tác vụ của phần mềm xem có toang không đã nhé.

2. Bạn không cần học SQL, lập trình. Mấy cái đó chỉ dành cho các công ty nghèo không có tiền mua tool xịn như Power BI, Alteryx.... Còn làm gì có tool làm được hết rồi, cần thì request IT xử lý..

Quan điểm cá nhân:
Tool toy rất tiện và bản thân mình cũng ủng hộ tool nếu có thể. Tuy nhiên tool nào cũng có mặt hạn chế. Thử vào một doanh nghiệp và cần trích xuất dữ liệu trực tiếp với lượng dữ liệu từ vừa đến lớn với logic phức tạp thì SQL sẽ là cứu cánh để bạn triển khai được nhanh, gọn và mạch lạc hơn. Và mình học và làm việc sâu với SQL không phải vì mình "nghèo" mà vì tính phổ biến, khả năng tùy biến của ngôn ngữ và ưu điểm tuyệt đối của nó trong một số hoàn cảnh cụ thể. Ít nhất mình có quyền lựa chọn thay vì chết vì phụ thuộc tool toy.

3. Mình chỉ cần học về tư duy là đủ rồi, chứ công cụ không quan trọng.

Quan điểm cá nhân:
Việc đầu tiên khi người ta học làm bếp là học cầm con dao sơ chế miếng thịt, cá như thế nào. Với một chief có thể nấu được bữa ăn từ bất cứ những công cụ gì họ có trong tay. Họ làm được vì họ từng sử dụng qua rất nhiều công cụ chứ không phải họ chỉ ngồi học lý thuyết về ẩm thực. Trước đây mình đã từng viết 1 bài về Law of the Instrument: "if all you have is a hammer, everything looks like a nail". Quá trình sử dụng công cụ để giải quyết vấn đề giúp bạn phát triển tư duy, nếu khả năng sử dụng công cụ của bạn bị giới hạn thì rất có thể bạn sẽ dẫn về số 2, phụ thuộc vào một công cụ nào đó vì không còn quyền lựa chọn. Khá hài hước khi tư tưởng coi thường công cụ nhưng xét mặt nào đó lại bị phụ thuộc vào công cụ. :))

4. Ngược lại với 3, mình cần phải giỏi công cụ X, master công cụ Y, công ty không tuyển mình vì mình không giỏi công cụ xyz.

Quan điểm cá nhân:
Thành thạo công cụ là một điểm cộng lớn khi bạn apply công việc, nhất là với các vị trí junior. Tuy nhiên, nếu như bạn đã thành thạo và tạo được sản phẩm bằng một công cụ nào đó, bạn hoàn toàn có thể học công cụ tương đương mà không mất nhiều thời gian. Các nguyên lý và cách sử dụng công cụ, ngôn ngữ lập trình đều tương tự nhau, nếu học hãy tập trung vào một số mảng và thực sự thành thạo nó thay vì đẽo cày giữa đường để gom key word ném vào CV.

5. Mình đã luyện xong 1001 đường tịch tà kiếm phổ, sẵn sàng trở thành siêu nhân trong ngành dữ liệu.

Quan điểm cá nhân:
Bạn có thể chỉ cần thuần Excel vẫn kiếm được công việc chính thức trong ngành dữ liệu với mức lương tính bằng nghìn USD (người thật việc thật). Nhưng đa phần các công việc trong ngành dữ liệu đều cần tìm hiểu thêm rất nhiều thứ khác, tech stack khác với dự án trước đây, domain khác với domain đã biết, nghiệp vụ hoặc luật lá thay đổi. Bạn sẽ tìm hiểu đủ thứ từ marketing đến UI-UX design, human heuristics.... Giữ tư duy mở và thái độ sẵn sàng học bất cứ cái gì công việc yêu cầu. Khả năng học và vận dụng nhanh mới giúp bạn sống sót và phát triển tốt trong ngành này.

6. Làm BI/DA là phải làm dashboard đẹp, kể được câu chuyện về dữ liệu, phải có 1001 nghiêm quy giới luật về information design cần tuân thủ.

Quan điểm cá nhân:
Bạn cần phải làm được những điều trên nhưng chỉ là một phần rất nhỏ trong công việc, nếu bạn tôn thờ nó quá thì nhiều khả năng bạn làm consultant hơn là làm in-house cho doanh nghiệp. Đào bới được dữ liệu xem nó nằm đâu trong hệ thống, thống nhất được với các đơn vị xem dữ liệu nào chính xác đã hộc máu rồi. Nhiều stakeholders chỉ cần một cái pivot table hay chart đơn giản là quá đủ cho nhu cầu của họ. Quan trọng là context và mục đích sử dụng và làm sao tối đa được giá trị cho stakeholders.


Mời các cao nhân khác trao đổi và đóng góp thêm.
Bạn nào có câu hỏi gì cũng thả luôn ở đây nhé.
Phen chỉ vài chiêu DA dăm ba cái điểm số trong trường học (vd lớp 9 đi) với T_T. Một lớp 35 ông hs có nhiều môn chia làm 2 học kỳ, mỗi môn có 3 loại điểm: đểm hệ số 1, điểm hệ số 2, điểm kt hk. Điểm hệ số 1 thì có môn 1 cột, môn 2-3 cột.
=> tổ chức data như thế nào là hợp lý trước ? bảng theo môn, bảng theo học kỳ...bảng theo học sinh ??
 
Phen chỉ vài chiêu DA dăm ba cái điểm số trong trường học (vd lớp 9 đi) với T_T. Một lớp 35 ông hs có nhiều môn chia làm 2 học kỳ, mỗi môn có 3 loại điểm: đểm hệ số 1, điểm hệ số 2, điểm kt hk. Điểm hệ số 1 thì có môn 1 cột, môn 2-3 cột.
=> tổ chức data như thế nào là hợp lý trước ? bảng theo môn, bảng theo học kỳ...bảng theo học sinh ??

Phần này liên quan đến tổ chức dữ liệu thím nhé. Topic của thím mở rộng sẽ đụng đến mô hình hóa dữ liệu và thiết kế CSDL. (Mình có chứng chỉ Solution Expert của Microsoft về mảng này).

Như bài toán của thím, nếu mình tổ chức trong CSDL một cách đơn giản nhất sẽ ntn:

1. Bảng danh sách học viên:
  • Mã học viên.
  • Tên học viên, và các thông tin khác.

2. Bảng danh sách môn học:
  • Mã môn học,
  • Các thông tin khác.

3. Bảng danh sách kỳ học:
  • Mã kỳ học,
  • Ngày bắt đầu, ngày kết thúc, các thông tin khác.

4. Bảng danh sách giáo viên (nếu cần):
  • Mã giáo viên,
  • Các thông tin khác xoay quanh giáo viên.

5. Bảng điểm của học sinh:
  • Mã học sinh
  • Mã môn học
  • Mã kỳ học
  • Mã giáo viên đứng lớp
  • Mã đầu điểm
  • Hệ số đầu điểm
  • Giá trị điểm số


Với bảng 5 bạn sẽ tính toán được hầu hết các chỉ số bạn cần một cách đơn giản. (Có thể làm tương tự với Excel nếu muốn)
Đây là trường hợp đơn giản nhất, mở rộng ra thì đủ case: học sinh thi lại, học lại, cải thiện điểm, thiếu đầu điểm.....

Have fun.
 
Oánh dấu theo dõi. Tiện thể các cao nhân cho hỏi có tool nào add dữ liệu từ sql vào thẳng nhiều bảng excel ko nhỉ cho mình xin với, con alteryx thì ngon mỗi tội user đắt quá 😟
 
Phần này liên quan đến tổ chức dữ liệu thím nhé. Topic của thím mở rộng sẽ đụng đến mô hình hóa dữ liệu và thiết kế CSDL. (Mình có chứng chỉ Solution Expert của Microsoft về mảng này).

Như bài toán của thím, nếu mình tổ chức trong CSDL một cách đơn giản nhất sẽ ntn:

1. Bảng danh sách học viên:
  • Mã học viên.
  • Tên học viên, và các thông tin khác.

2. Bảng danh sách môn học:
  • Mã môn học,
  • Các thông tin khác.

3. Bảng danh sách kỳ học:
  • Mã kỳ học,
  • Ngày bắt đầu, ngày kết thúc, các thông tin khác.

4. Bảng danh sách giáo viên (nếu cần):
  • Mã giáo viên,
  • Các thông tin khác xoay quanh giáo viên.

5. Bảng điểm của học sinh:
  • Mã học sinh
  • Mã môn học
  • Mã kỳ học
  • Mã giáo viên đứng lớp
  • Mã đầu điểm
  • Hệ số đầu điểm
  • Giá trị điểm số


Với bảng 5 bạn sẽ tính toán được hầu hết các chỉ số bạn cần một cách đơn giản. (Có thể làm tương tự với Excel nếu muốn)
Đây là trường hợp đơn giản nhất, mở rộng ra thì đủ case: học sinh thi lại, học lại, cải thiện điểm, thiếu đầu điểm.....

Have fun.
Mình nghĩ bảng điểm thì không cần có mã giáo viên chứ bác. Thay vào đó nên có 1 bảng phân công giáo viên:
ID bản ghi
ID giáo viên
ID lớp
ID kỳ
ID môn.
 
Oánh dấu
Chủ thớt cho hỏi giờ có các công ty công nghệ hay tập đoàn lớn nào tuyển job DA nhỉ :D mình có kinh nghiệm 5 năm phát triển từ đầu, tối ưu và vận hành hệ thống DWH phục vụ báo cáo liên quan mảng viễn thông, muốn thử nhảy hẳn sang mảng DA xem có hợp không :beauty:
 
Back
Top