thắc mắc Phân tích dữ liệu- lộ trình học cho người mới

Bacdaik1997

Junior Member
Chào các bác, không biết nên đăng bài này ở bên lập trình hay bên kinh tế nữa, tuy nhiên thấy nó thiên về CNTT nhiều hơn nên mạnh dạn đăng vào đây hỏi các bác ạ.
Em newbie hoàn toàn không có khái niệm gì về lập trình, coding...... đang học khối ngành kinh tế và đang tìm hiểu về phân tích dữ liệu (data analysis). Tuy nhiên, như đã nói- em hoàn toàn mù tịt về cái này mặc dù có tìm hiểu rất nhiều ở google. Chắc tại vì có quá nhiều thứ: machine learning, Python, deep learning... nhưng không có lộ trình gì cả. Search các khoá học trên Lynda hoặc Cousera bằng từ khoá “data analysis”, xem thử vài khoá học thì cũng quanh quanh Python với các công cụ. Một số còn giả định rằng người học đã biết cơ bản về Python...
Vậy, do không biết lộ trình và tài liệu học ở đâu cho hợp lý, nhờ các bác chỉ giáo cho sinh viên nghèo vượt khó như em có thể vững bước đi thực tập cho cái nghề cụ thể tý, chứ học QTKD nghĩ sau này đi thực tập thì quản trị cái gì được :shame:

via theNEXTvoz for iPad
 
Chào các bác, không biết nên đăng bài này ở bên lập trình hay bên kinh tế nữa, tuy nhiên thấy nó thiên về CNTT nhiều hơn nên mạnh dạn đăng vào đây hỏi các bác ạ.
Em newbie hoàn toàn không có khái niệm gì về lập trình, coding...... đang học khối ngành kinh tế và đang tìm hiểu về phân tích dữ liệu (data analysis). Tuy nhiên, như đã nói- em hoàn toàn mù tịt về cái này mặc dù có tìm hiểu rất nhiều ở google. Chắc tại vì có quá nhiều thứ: machine learning, Python, deep learning... nhưng không có lộ trình gì cả. Search các khoá học trên Lynda hoặc Cousera bằng từ khoá “data analysis”, xem thử vài khoá học thì cũng quanh quanh Python với các công cụ. Một số còn giả định rằng người học đã biết cơ bản về Python...
Vậy, do không biết lộ trình và tài liệu học ở đâu cho hợp lý, nhờ các bác chỉ giáo cho sinh viên nghèo vượt khó như em có thể vững bước đi thực tập cho cái nghề cụ thể tý, chứ học QTKD nghĩ sau này đi thực tập thì quản trị cái gì được :shame:

via theNEXTvoz for iPad

Cái này là toán thống kê nhé bạn. Khoai đó chứ ở đó mà học.
 
Chào các bác, không biết nên đăng bài này ở bên lập trình hay bên kinh tế nữa, tuy nhiên thấy nó thiên về CNTT nhiều hơn nên mạnh dạn đăng vào đây hỏi các bác ạ.
Em newbie hoàn toàn không có khái niệm gì về lập trình, coding
Không biết lập trình thì bỏ đi :confident:
Muốn theo thì việc đầu tiên là phải học lập trình python :matrix:
 
DA thì cứ master Excel, SQL, là đủ làm junior rồi bạn, về sau chuyển qua làm chuyên sâu về cái gì thì học thêm.

Cứ nghe mấy khoá học online nhồi Python, R làm gì. Chủ yếu công việc của bạn sẽ là clean data với cook data thôi, cực hơn làm công nhân nữa -.-
 
Muốn làm phân tích dữ liệu chuyên sâu thì phải học vững xác suất, thống kê, kinh tế lượng. Đang sinh viên thì nên dành thời gian để học tập nhiều vào. Thớt tham khảo khóa Data science của MIT trên edx. Tôi cũng đang học trên đó.
Về ngôn ngữ lập trình thì nên học R trước, ngôn ngữ của dân thống kê. Nó chả khó đâu.
 
mấy bác cho em hỏi. Tại sao DA là phải học Python nhỉ? vì ngôn ngữ này nó hỗ trợ mạnh cho DA hay có các lib, frameworks của Python hỗ trợ tốt cho DA nhỉ?
em làm về JS mà nghe nói JS cũng làm dc DA.
 
Ta
mấy bác cho em hỏi. Tại sao DA là phải học Python nhỉ? vì ngôn ngữ này nó hỗ trợ mạnh cho DA hay có các lib, frameworks của Python hỗ trợ tốt cho DA nhỉ?
em làm về JS mà nghe nói JS cũng làm dc DA.
tất nhiên rôì chứ sao, có thấy ai lấy c,c++ là web app ko mặc dù nó làm đc mọi thứ
 
mấy bác cho em hỏi. Tại sao DA là phải học Python nhỉ? vì ngôn ngữ này nó hỗ trợ mạnh cho DA hay có các lib, frameworks của Python hỗ trợ tốt cho DA nhỉ?
em làm về JS mà nghe nói JS cũng làm dc DA.

Miễn là bạn đạt được mục đích của 1 data analyst, là sử dụng được data mà bạn có được để đọc được insights, và insight đó có ích cho công ty, thì bạn đừng quan tâm bạn dùng gì. Đừng nói là Python hay Javascript chứ kể cả bạn không dùng máy vi tính cũng chẳng sao, bạn vẫn có thể phân tích data bằng sổ sách và giấy bút.

Các công cụ chỉ làm con người hoạt động hiệu quả hơn. Miễn là bạn xài thấy hợp thì cứ triển. Mình đang làm data engineer cho 1 team data, có 1 thời gian trước đây khi team mới thành lập, mình luôn nghi ngờ là những việc team mình làm có rất nhiều khác biệt với những thứ công cụ, phương pháp cao siêu, đao to búa lớn mà trên mạng hay chia sẻ, ở cả khoản data engineering và data analytic, mình rất lo là ko biết có thật sự là team đang đi đúng hướng hay ko.... Sau này mình bắt đầu nhận ra rằng chúng chẳng quan trọng, cái cần là sử dụng đúng và hợp lý trong điều kiện có sẵn, tạo ra được ảnh hưởng, chứ ko phải là mù quáng chạy theo bất chấp tất cả rồi chẳng làm được gì.

Hôm trước mình có xem 1 video của anh chàng này nói về data science thực sự ở 1 công ty lớn ở Mỹ, mình bấm vào xem thử và giật mình vì nó nói gần như không khác 1 chút gì so với những thứ mà team data của mình (1 team nhỏ ở 1 công ty nhỏ ở 1 nước nhỏ) đang làm hàng ngày.

1597124680548.png


 
Miễn là bạn đạt được mục đích của 1 data analyst, là sử dụng được data mà bạn có được để đọc được insights, và insight đó có ích cho công ty, thì bạn đừng quan tâm bạn dùng gì. Đừng nói là Python hay Javascript chứ kể cả bạn không dùng máy vi tính cũng chẳng sao, bạn vẫn có thể phân tích data bằng sổ sách và giấy bút.

Các công cụ chỉ làm con người hoạt động hiệu quả hơn. Miễn là bạn xài thấy hợp thì cứ triển. Mình đang làm data engineer cho 1 team data, có 1 thời gian trước đây khi team mới thành lập, mình luôn nghi ngờ là những việc team mình làm có rất nhiều khác biệt với những thứ công cụ, phương pháp cao siêu, đao to búa lớn mà trên mạng hay chia sẻ, ở cả khoản data engineering và data analytic, mình rất lo là ko biết có thật sự là team đang đi đúng hướng hay ko.... Sau này mình bắt đầu nhận ra rằng chúng chẳng quan trọng, cái cần là sử dụng đúng và hợp lý trong điều kiện có sẵn, tạo ra được ảnh hưởng, chứ ko phải là mù quáng chạy theo bất chấp tất cả rồi chẳng làm được gì.

Hôm trước mình có xem 1 video của anh chàng này nói về data science thực sự ở 1 công ty lớn ở Mỹ, mình bấm vào xem thử và giật mình vì nó nói gần như không khác 1 chút gì so với những thứ mà team data của mình (1 team nhỏ ở 1 công ty nhỏ ở 1 nước nhỏ) đang làm hàng ngày.

View attachment 148120

cảm ơn bác chia sẻ. cơ bản em hiểu là những công cụ đó dùng để lấy data hoặc xử lý data theo ý muốn của mình. còn phần quan trọng là mình hiểu dc data đó thể hiện điều j và cách mình diễn đạt về cái data đó
 
mấy bác cho em hỏi. Tại sao DA là phải học Python nhỉ? vì ngôn ngữ này nó hỗ trợ mạnh cho DA hay có các lib, frameworks của Python hỗ trợ tốt cho DA nhỉ?
em làm về JS mà nghe nói JS cũng làm dc DA.
Lib Python nó support nhiều thôi
Mà ngôn ngữ có cái l gì đâu, chuyển ngôn ngữ mất 3 ngày là thạo chứ mấy
 
Chào các bác, không biết nên đăng bài này ở bên lập trình hay bên kinh tế nữa, tuy nhiên thấy nó thiên về CNTT nhiều hơn nên mạnh dạn đăng vào đây hỏi các bác ạ.
Em newbie hoàn toàn không có khái niệm gì về lập trình, coding...... đang học khối ngành kinh tế và đang tìm hiểu về phân tích dữ liệu (data analysis). Tuy nhiên, như đã nói- em hoàn toàn mù tịt về cái này mặc dù có tìm hiểu rất nhiều ở google. Chắc tại vì có quá nhiều thứ: machine learning, Python, deep learning... nhưng không có lộ trình gì cả. Search các khoá học trên Lynda hoặc Cousera bằng từ khoá “data analysis”, xem thử vài khoá học thì cũng quanh quanh Python với các công cụ. Một số còn giả định rằng người học đã biết cơ bản về Python...
Vậy, do không biết lộ trình và tài liệu học ở đâu cho hợp lý, nhờ các bác chỉ giáo cho sinh viên nghèo vượt khó như em có thể vững bước đi thực tập cho cái nghề cụ thể tý, chứ học QTKD nghĩ sau này đi thực tập thì quản trị cái gì được :shame:

via theNEXTvoz for iPad

QTKD với làm Data Analysis là 2 cái nghề khác nhau. Mà bác chỉ là đang tìm hiểu về Data Analysis dưới góc độ dân kinh tế thì cần gì biết mấy cái như python, machine learning... Mấy cái thống kê cơ bản trong trường dạy là được rồi, biết đọc report, charts các kiểu là ok. Tool thì Excel, SPSS.
 
Miễn là bạn đạt được mục đích của 1 data analyst, là sử dụng được data mà bạn có được để đọc được insights, và insight đó có ích cho công ty, thì bạn đừng quan tâm bạn dùng gì. Đừng nói là Python hay Javascript chứ kể cả bạn không dùng máy vi tính cũng chẳng sao, bạn vẫn có thể phân tích data bằng sổ sách và giấy bút.

Các công cụ chỉ làm con người hoạt động hiệu quả hơn. Miễn là bạn xài thấy hợp thì cứ triển. Mình đang làm data engineer cho 1 team data, có 1 thời gian trước đây khi team mới thành lập, mình luôn nghi ngờ là những việc team mình làm có rất nhiều khác biệt với những thứ công cụ, phương pháp cao siêu, đao to búa lớn mà trên mạng hay chia sẻ, ở cả khoản data engineering và data analytic, mình rất lo là ko biết có thật sự là team đang đi đúng hướng hay ko.... Sau này mình bắt đầu nhận ra rằng chúng chẳng quan trọng, cái cần là sử dụng đúng và hợp lý trong điều kiện có sẵn, tạo ra được ảnh hưởng, chứ ko phải là mù quáng chạy theo bất chấp tất cả rồi chẳng làm được gì.

Hôm trước mình có xem 1 video của anh chàng này nói về data science thực sự ở 1 công ty lớn ở Mỹ, mình bấm vào xem thử và giật mình vì nó nói gần như không khác 1 chút gì so với những thứ mà team data của mình (1 team nhỏ ở 1 công ty nhỏ ở 1 nước nhỏ) đang làm hàng ngày.

View attachment 148120


Thím chia sẽ một chút về công việc cụ thể team thím đang làm được ko? Mình cũng muốn biết các cty làm về data nó hay làm gì. Thấy nhiều cty lúc tuyển yêu cầu thì đao to búa lớn, nào là data analysis, ML, AI các kiểu, nhưng vào làm thì toàn là data processing, cleaning, ETL, làm report cơ bản thôi. Tất nhiên làm data là mấy bước này bắt buộc phải có nhưng nếu đây là công việc chính thì lại ko học hỏi đc nhiều.
 
Thím chia sẽ một chút về công việc cụ thể team thím đang làm được ko? Mình cũng muốn biết các cty làm về data nó hay làm gì. Thấy nhiều cty lúc tuyển yêu cầu thì đao to búa lớn, nào là data analysis, ML, AI các kiểu, nhưng vào làm thì toàn là data processing, cleaning, ETL, làm report cơ bản thôi. Tất nhiên làm data là mấy bước này bắt buộc phải có nhưng nếu đây là công việc chính thì lại ko học hỏi đc nhiều.

Mình làm data engineer. Công ty mình là 1 công ty làm phần mềm... có lẽ là nên xếp vào product thì hợp lý hơn, và team data nó hoạt động thế này. (Các team data của các công ty dạng khác có thể có cách hoạt động khác, có thể sẽ được tổ chức tốt hơn, hơn nữa những thứ gì mình nói dưới đây chỉ là dạng nhất thời viết ra, nó cũng ko đầy đủ/bao quát, bạn chỉ nên xem những thứ gì mình kể ra ở đây để tham khảo thôi)

Với data engineer như mình thì công việc chính là xây hệ thống data cho công việc analytic, hay là nói cụ thể hơn, có lẽ là xây data warehouse. Hiện giờ thì công ty mình, 1 công ty mới khởi nghiệp phát triển nóng trong 1 vài năm gần đây, thì từ application đến data là một mớ hỗn loạn, các team mạnh ai nấy làm, đến mức mà 1 câu hỏi kiểu "một thực thể mà chúng ta đang xử lý thực sự là gì"?, "chúng ta thực sự đang cần quan tâm đến cái gì?", "chúng thực sự được xử lý ra sao, trải qua các quy trình nào?" không một ai trong công ty định nghĩa được nó cho đàng hoàng.Thế nên 1 trong những nhiệm vụ của mình - data modeler: cố gắng định nghĩa lại thực sự cái hệ thống này đang xử lý cái gì, quy trình xử lý chúng ra sao để khái quát lên data model. Rồi sau đó thì mấy cái data mô tả quá trình xử lý đó ở đâu, có ghi lại ở đâu đó không. Nếu có thì sao? Hốt xử lý. Nếu không thì sao? Cố gắng suy đoán với 1 tỉ lệ chính xác nhất định từ 1 data manh mối khác/yêu cầu team product ghi data khi làm/từ chối request report nếu đụng phải câu hỏi liên quan đến những thứ mà data không có....


Rồi về architecture của hệ thống. Architect ở đây với mình là trò chơi hiểu và lắp ghép. Cần hiểu 1 hệ thống analytic tổng thể cần phải đạt được các mục tiêu gì? Để đạt được những mục tiêu này thì cần phải dùng những thứ gì. Dùng như thế nào, điều khiển nó ra sao, hạ tầng, giá cả thế nào. Hiểu các component nhỏ này dùng để làm gì, hoạt động thế nào. Rồi ghép chúng lại với nhau để đạt được các mục đích chung của hệ thống.

ETL, cleaning, data processing cuối cùng cũng chỉ là bề nổi của tảng băng chìm trên.

Còn data analyst (hay nếu là chiếu theo cách gọi của cái công ty của người trong video bên trên mình đăng (có vẻ là Facebook), thì là Data Scientist Analytics) của bên mình thì:

Đầu tiên là C-level họ cũng chẳng biết họ cần gì, muốn gì. Họ chỉ có 1 yêu cầu đơn giản: "Tôi muốn hiểu hơn về những gì đang xảy ra trong công ty", còn cụ thể là gì thì chẳng ai biết. Một trong những nhiệm vụ của analyst bên mình: Tìm và mớm cho họ có thể những gì họ có thể quan tâm. Sau khi người ta nhận ra mình quan tâm gì, thì bắt đầu đi đào bới các thông tin quanh vấn đề đó.

Làm report, ừ đúng là vậy. C-level họ cũng chỉ biết vậy. Nhưng mà mình nghĩ là nên nhìn rõ hơn chính xác là làm gì. Mình cảm thấy có 2 loại chính:
1. Xây dựng report metric. Nghĩa là tạo ra những report các về thông số, số đo. Bán được X tiền? Số này là ít hơn hay nhiều hơn so với năm ngoài? Tổng số lời bán ra so với vốn? Trend lời là tăng hay giảm trong vài năm gần đây... Mấy report này thường được tổ chức theo dạng có 1 trang 1 cụm vấn đề, có vài ba cái bảng và chart, rồi người dùng filter theo ý thích để họ nhìn ra các thông số của công ty.

2. Report dạng phân tích chứng minh. Dạng này là kiểu: Hiện nay hệ thống đang gặp vấn đề blah blah. Vậy vấn đề năm ở đâu. Ở X? không phải, vì blah blah có 1 mớ chart tĩnh rồi nói dông dài gì đó để chứng minh vấn đề ko phải là do X. Mà thực ra vấn đề là do Y, rồi dẫn 1 mớ chart ra rồi blah blah gì đó để chứng minh. Rồi rút ra kết luận vậy chúng ta nên blah blah. Dạng này nó thường tổ chức theo kiểu notebook, có scroll và nhiều text.

Data Analyst là người trực tiếp làm việc với những người có quyền ra quyết định. Những người này, ở đâu mình ko biết chứ bên mình, miễn là đưa ra được những thứ mà họ cần, thì cả team data đó thành công. Không cần biết team data làm bằng gì, dùng gì, hay cái hệ thống bên dưới modeling/architecture nó tốt đẹp hay tan nát như thế nào.

----------------------------
Các vấn đề về predictive analytic (do data scientist làm) thì bên mình chưa làm nhiều nên không rõ. Trước mình có cố làm một cái mô hình dự đoán số lượng nhu cầu đơn hàng của các khách hàng trong thời gian sắp tới, để công ty phân bố người. Mà team trình cùi nên làm chẳng ra gì, nói chung sản phẩm làm ra vô ích. Sắp tới có thể mình sẽ nghiên cứu thêm rồi cố gắng làm lại lần nữa.

------------------------------
Như mình đã nói ở trên thì ngay cả những người có quyền quyết định trong công ty thậm chí họ cũng chẳng biết họ muốn gì. Nếu bọn mình an phận, làm theo lối cũ, OK vẫn tốt chẳng sao, C-level họ đã quen thế, đổi mới rất rách việc. Nhưng nếu muốn phát triển bản thân, thì phải tự tìm phương pháp, thuyết phục người ta tin vào phương pháp đó, rồi tự mình làm/hoàn thành/hoàn thiện/biểu diễn. Nếu nó tạo ra impact? Quá thành công. Nếu không? Ít nhất bạn cũng biết đến những phương pháp đó, và bạn cũng đã có trải nghiệm với nó.
 
Last edited:
Mình làm data engineer. Công ty mình là 1 công ty làm phần mềm... có lẽ là nên xếp vào product thì hợp lý hơn, và team data nó hoạt động thế này. (Các team data của các công ty dạng khác có thể có cách hoạt động khác, có thể sẽ được tổ chức tốt hơn, hơn nữa những thứ gì mình nói dưới đây chỉ là dạng nhất thời viết ra, nó cũng ko đầy đủ/bao quát, bạn chỉ nên xem những thứ gì mình kể ra ở đây để tham khảo thôi)

Với data engineer như mình thì công việc chính là xây hệ thống data cho công việc analytic, hay là nói cụ thể hơn, có lẽ là xây data warehouse. Hiện giờ thì công ty mình, 1 công ty mới khởi nghiệp phát triển nóng trong 1 vài năm gần đây, thì từ application đến data là một mớ hỗn loạn, các team mạnh ai nấy làm, đến mức mà 1 câu hỏi kiểu "một thực thể mà chúng ta đang xử lý thực sự là gì"?, "chúng ta thực sự đang cần quan tâm đến cái gì?", "chúng thực sự được xử lý ra sao, trải qua các quy trình nào?" không một ai trong công ty định nghĩa được nó cho đàng hoàng.Thế nên 1 trong những nhiệm vụ của mình - data modeler: cố gắng định nghĩa lại thực sự cái hệ thống này đang xử lý cái gì, quy trình xử lý chúng ra sao để khái quát lên data model. Rồi sau đó thì mấy cái data mô tả quá trình xử lý đó ở đâu, có ghi lại ở đâu đó không. Nếu có thì sao? Hốt xử lý. Nếu không thì sao? Cố gắng suy đoán với 1 tỉ lệ chính xác nhất định từ 1 data manh mối khác/yêu cầu team product ghi data khi làm/từ chối request report nếu đụng phải câu hỏi liên quan đến những thứ mà data không có....


Rồi về architecture của hệ thống. Architect ở đây với mình là trò chơi hiểu và lắp ghép. Cần hiểu 1 hệ thống analytic tổng thể cần phải đạt được các mục tiêu gì? Để đạt được những mục tiêu này thì cần phải dùng những thứ gì. Dùng như thế nào, điều khiển nó ra sao, hạ tầng, giá cả thế nào. Hiểu các component nhỏ này dùng để làm gì, hoạt động thế nào. Rồi ghép chúng lại với nhau để đạt được các mục đích chung của hệ thống.

ETL, cleaning, data processing cuối cùng cũng chỉ là bề nổi của tảng băng chìm trên.

Còn data analyst (hay nếu là chiếu theo cách gọi của cái công ty của người trong video bên trên mình đăng (có vẻ là Facebook), thì là Data Scientist Analytics) của bên mình thì:

Đầu tiên là C-level họ cũng chẳng biết họ cần gì, muốn gì. Họ chỉ có 1 yêu cầu đơn giản: "Tôi muốn hiểu hơn về những gì đang xảy ra trong công ty", còn cụ thể là gì thì chẳng ai biết. Một trong những nhiệm vụ của analyst bên mình: Tìm và mớm cho họ có thể những gì họ có thể quan tâm. Sau khi người ta nhận ra mình quan tâm gì, thì bắt đầu đi đào bới các thông tin quanh vấn đề đó.

Làm report, ừ đúng là vậy. C-level họ cũng chỉ biết vậy. Nhưng mà mình nghĩ là nên nhìn rõ hơn chính xác là làm gì. Mình cảm thấy có 2 loại chính:
1. Xây dựng report metric. Nghĩa là tạo ra những report các về thông số, số đo. Bán được X tiền? Số này là ít hơn hay nhiều hơn so với năm ngoài? Tổng số lời bán ra so với vốn? Trend lời là tăng hay giảm trong vài năm gần đây... Mấy report này thường được tổ chức theo dạng có 1 trang 1 cụm vấn đề, có vài ba cái bảng và chart, rồi người dùng filter theo ý thích để họ nhìn ra các thông số của công ty.

2. Report dạng phân tích chứng minh. Dạng này là kiểu: Hiện nay hệ thống đang gặp vấn đề blah blah. Vậy vấn đề năm ở đâu. Ở X? không phải, vì blah blah có 1 mớ chart tĩnh rồi nói dông dài gì đó để chứng minh vấn đề ko phải là do X. Mà thực ra vấn đề là do Y, rồi dẫn 1 mớ chart ra rồi blah blah gì đó để chứng minh. Rồi rút ra kết luận vậy chúng ta nên blah blah. Dạng này nó thường tổ chức theo kiểu notebook, có scroll và nhiều text.

Data Analyst là người trực tiếp làm việc với những người có quyền ra quyết định. Những người này, ở đâu mình ko biết chứ bên mình, miễn là đưa ra được những thứ mà họ cần, thì cả team data đó thành công. Không cần biết team data làm bằng gì, dùng gì, hay cái hệ thống bên dưới modeling/architecture nó tốt đẹp hay tan nát như thế nào.

----------------------------
Các vấn đề về predictive analytic (do data scientist làm) thì bên mình chưa làm nên không rõ. Trước mình có cố làm một cái mô hình dự đoán số lượng nhu cầu đơn hàng của các khách hàng trong thời gian sắp tới, để công ty phân bố người. Mà team trình cùi nên làm chẳng ra gì, nói chung sản phẩm làm ra vô ích. Sắp tới có thể mình sẽ nghiên cứu thêm rồi cố gắng làm lại lần nữa.

------------------------------
Như mình đã nói ở trên thì ngay cả những người có quyền quyết định trong công ty thậm chí họ cũng chẳng biết họ muốn gì. Nếu bọn mình an phận, làm theo lối cũ, OK vẫn tốt chẳng sao, C-level họ đã quen thế, đổi mới rất rách việc. Nhưng nếu muốn phát triển bản thân, thì phải tự tìm phương pháp, thuyết phục người ta tin vào phương pháp đó, rồi tự mình làm/hoàn thành/hoàn thiện/biểu diễn. Nếu nó tạo ra impact? Quá thành công. Nếu không? Ít nhất bạn cũng biết đến những phương pháp đó, và bạn cũng đã có trải nghiệm với nó.

Đức. Thanks! thím trả lời rất có tâm. Ưng
 
1. Xây dựng report metric. Nghĩa là tạo ra những report các về thông số, số đo. Bán được X tiền? Số này là ít hơn hay nhiều hơn so với năm ngoài? Tổng số lời bán ra so với vốn? Trend lời là tăng hay giảm trong vài năm gần đây... Mấy report này thường được tổ chức theo dạng có 1 trang 1 cụm vấn đề, có vài ba cái bảng và chart, rồi người dùng filter theo ý thích để họ nhìn ra các thông số của công ty.

2. Report dạng phân tích chứng minh. Dạng này là kiểu: Hiện nay hệ thống đang gặp vấn đề blah blah. Vậy vấn đề năm ở đâu. Ở X? không phải, vì blah blah có 1 mớ chart tĩnh rồi nói dông dài gì đó để chứng minh vấn đề ko phải là do X. Mà thực ra vấn đề là do Y, rồi dẫn 1 mớ chart ra rồi blah blah gì đó để chứng minh. Rồi rút ra kết luận vậy chúng ta nên blah blah. Dạng này nó thường tổ chức theo kiểu notebook, có scroll và nhiều text.

1. Domain knowledge này em nói thẳng đéo dành cho junior cóc nhái mới ra trường 1 2 năm. Tức là ném cái đống số liệu sổ sách rồi tự phân tích bằng excel ra insight thôi là ngáo mẹ rồi.
2. Và skill này cũng nói thằng là đéo dành cho những cô những cậu học mấy khóa mì ăn liền 6 tháng. Vì sao chắc bác cũng hiểu.

Mình nói thẳng, hơi mếch lòng nhưng còn hơn để bạn sa lầy.
Bạn muốn làm data analyst thì bạn phải có domain knowledge của chính cái ngành business mà bạn làm từ 2 năm trở lên. Thậm chí là 3 năm để có được cái nhìn vừa tổng thể và vừa chi tiết.
Có những domain knowledge này thì bạn mới có được các insight đặc trưng của ngành.
Chứ đm kiểu lái máy bay tiêm kích với 500 giờ thực hành là đéo bay nổi đâu.

Tiếp nữa là bạn tiệp xúc với đống sổ sách giấy tờ ok ra insight rồi. Nhưng đụng vào đống data thật là 1 đống rác. Tức là để có được đống data sạch bạn cần tới 80% thời gian để clean nó.
Và thằng Engineer đéo rảnh đi extract, transform, clean, load cho bạn đâu. Bạn phải tự làm thôi. :go:

Đừng mơ mộng nhiều quá.
 
Back
Top