thảo luận [Thảo Luận] Data Analysis, ML, DL, AI (All Levels vào đây chém gió nào)

Bạn nói lại sai, mấy công ty bạn nói là làm thất bại, bạn còn chưa biết họ tại sao thất bại mà nói là bánh vẽ, tôi nói cho bạn biết có thể thất bại ngay từ lúc tuyển head data rồi nhé. Còn bạn bảo bigtech ko tuyển đúng ko, ko biết bigtech nào. Chứ bạn thử lên những hub công nghệ lớn nhất luôn dẫn đầu về công nghệ mới xem như indeed london, indeed california, indeed berlin, ... coi xem số lượng ntn so với trước kia
Nói như thím thì nói làm gì, hãy đứng vào vai trò 1 người fresher/intern mới thấy cái ngành này nó đang suy thoái như nào. Chứ job title tuyển toàn senior, phd, specialist thì ngành nào cx hot nhé thím.
 
Nói như thím thì nói làm gì, hãy đứng vào vai trò 1 người fresher/intern mới thấy cái ngành này nó đang suy thoái như nào. Chứ job title tuyển toàn senior, phd, specialist thì ngành nào cx hot nhé thím.
Lý do là người ta thần thánh Ai quá nên người ta nghĩ AI làm được mọi thứ.
Có những bài toán chỉ cần rule base là xong thậm chí rất tốt nhưng nhiều người nhất thiết phải đòi xài deep learning (Cái job hồi mình làm recsys, thay vì lọc theo thresh hold thì ông này đòi mình phải bắt model học ra thresh hold đó vừa tốn thời gian, tốn tài nguyên tính toán và làm giảm hiệu quả model)
Và có những thuật toán lâu đời rất hiệu quả (TF-IDF, thuật toán trogn thư viện SK learn) nó tốt hơn cả deep learning trong một số bài toán - đk nhất định (vd như lệch data, ít data) nhưng người ta cố nhét vào DL nên kết quả nó rất là ba chấm.
Thằng bạn mình làm bên cty kia bán sản phẩm đều đều ngon lành mà nó kêu trong này xài rule base là chính.
 
Bác ơi như em từ ngành khác giờ muốn làm DS thì ít nhất cần phải trang bị những gì bác nhỉ. Đang mông lung quá
đọc câu trả lời của thím kia mình vẫn thấy mông lung quá :D
đọc cái này An Introduction to Statistical Learning (https://www.statlearning.com) rồi cái này https://arxiv.org/pdf/1802.01528.pdf rồi đọc/làm càng nhiều càng tốt những thứ trong này Welcome to PyTorch Tutorials — PyTorch Tutorials 2.1.0+cu121 documentation (https://pytorch.org/tutorials/) và trong này Introduction - Hugging Face NLP Course (https://huggingface.co/learn/nlp-course/chapter1/1) và trong này How-to Guides — PyTorch Lightning 2.1.0 documentation (https://lightning.ai/docs/pytorch/stable/common/) nhé
xong thì chắc chắn ít nhất cũng được intern
 
Các bác ơi em 27 tuổi trước làm bên Tài Chính đang muốn chuyển việc liên quan đến DA hoặc DS thì cần trau dồi những kiến thức và kinh nghiệm gì ạ. Em có apply mấy chỗ mà toàn yêu cầu kinh nghiệm bằng cấp liên quan đến dữ liệu thấy khó quá.
P/s: Em có học qua 1 khóa về Thuật toán và 1 khóa về Machine Learning cho Beginner trên Coursera rồi, có thử tải dữ liệu về dùng Python để phân tích (kiểu nghiệp dư tay ngang vui vui thui). Trước ở công ty cũ thì em cũng hay dùng VBA để xử lí dữ liệu và cũng đang làm part time freelance mảng này trên Fiverr
Em thật sự nghiêm túc với việc chuyển ngành này nên bác nào tư vấn giúp em với ạ, em ở HCM ạ.
Chúc các bác cuối tuần zui zẻ :LOL:
Ko vứt cv lên thì ai biết mà tư vấn fen.

Chuyển ngành, xin việc nó cần nhiều thứ, đâu chỉ đơn thuần kiến thức.
 
Mình đang có ý định chuyển hướng làm bên data science. Định dk khóa học data science của trung tâm tin học khtn. Có ai biết chương trình bên họ có ổn không nhỉ? Trên web mình không để thông tin giảng viên đứng lớp. Và nếu hoàn thành xong khóa học thì cần làm gì nữa để apply jobs? Background của mình là toán tin (toán là chính).
 
Hehe các bác nói thế nào ấy, mình tìm các loại Dx đỏ cả mắt đây mà còn bị giựt ầm ầm. Các bác hạ giá chút thì chả thiếu job.
Nói thiệt sự luôn không phải ngta làm cao làm eo nhưng cái giá trả cho các Data ở VN hiện nay là bèo đó thím. Khi người lao động ngành data vào 1 cty (ít nhất đối với mình) đều đánh cược như 1 canh bạc, có 2 điều:

1. Data quality : bao gồm eco system của công ty đó là gì , lượng dữ liệu ở mức độ nào, tổ chức dữ liệu ra làm sao,….

Mình là DA.
Công ty đang làm dùng PBI nhưng qua cty khác dùng Tableau, dùng Looker hay mình dùng Mssql nhưng bên khác ngta dùng Oracle. Có chỗ dùng Gg sheet, GDS, …
Hay DE thì có chỗ dùng Spark , có chỗ chỉ đc dùng Airflow.

2. Data team : toàn công ty có bao nhiêu người DA, DS (ảnh hưởng đến perf , cái này ai đi DE qtam hơn) , từ phía IT là DBA hay MIS bao nhiêu người, công ty có DE không (rất nhiều cty vacant vị trí này nhé, mình biết 2 cty mình đã làm qua) , có các vị trí nào về data nữa không như Data Governance, Data Control, BI ,…

3. Scope of work : vai trò mình vào cty có được đặt đúng như vậy không ? Chẳng hạn như cty ko có DE thì hầu như DA phải clean data nhiều gấp 2 . Hay công ty ko có BI thì DA làm cả scope đó nhiều cty gọi vị trí merge này là BI engineering , hoặc DS mà kiêm cả DE là ML engineering như bác trên kia có nói. Công ty vẫn gọi DA nhưng làm scope của BIE thì tất nhiên là éo tính thêm tiền phần BI rồi.

Về DA và DS cứng tech rồi còn phải đối mặt với domain knowledge khi vào cty nữa , kể cả chung ngành. Như mình 2 tháng đầu mới vào cty nào mình cũng phải đọc điên cuồng về nghiệp vụ, sản phẩm, chính sách cty , rồi tìm hiểu data (nếu ko có Data governance thì quá trình này cực dữ lắm)

Mấy điều này vô cùng quan trọng với bất kỳ vai trò nào trong ngành này.Đi ứng tuyển, phỏng vấn dù có cỡ nào cũng không thể khai thác hết được, trừ khi xin login vào hệ thống 1 ngày , mà chuyện này éo bao giờ xảy ra. Mà để vượt qua được thì phải HỌC.

Học mãi học mãi đúng nghĩa. Và chi phí việc học, công sức , tgian không hề rẻ . Mình chắc chắn như vậy.

Dev người ta moving qua cty nào cũng thuần tech thì 80% kiến thức dùng lại chứ còn Data coi như chỉ có 60% (phần lớn là tech skill , nếu khác domain coi như chỉ còn 50% kiến thức sẵn có).
 
Last edited:
Nói chung mình ko phải than hay nói ngành nào cực hơn ngành nào. Nhưng vì bạn nói làm trả giá cao thì mình ko đồng ý . Nó rất cực và đánh đổi nhiều thứ.

22 tuổi ra trường, học cho nhuần nhuyễn excel cũng 2 năm(nếu chưa tốt ở đh). Từ 22 tuổi nếu vào đúng cty có data thì (nhiều trg hợp đi làm cty đầu còn dùng excel lọc cọc ko bao giờ gọi là làm data đc) thì học pbi, sql 2 năm, thêm tableau, gg sheet, python, vba cũng thêm chừng đó năm. Quay qua lại 29-30 tuổi. Muốn đi nữa thì học nữa, mở rộng về tech stack và cả domain , học mãi học mãi.

29 tuổi - 30 tuổi ngta đi chơi bồ nhí , giật lắc chứ mình chưa chắc à, giờ đang cày thêm Sas đây. Sau này chỗ khác còn có mà làm , lên lương.

Bởi nhiều ng nói DA chỉ là một kỹ năng ai cũng làm đc , xàm lông. Đã là nghề thì ko bao giờ chỉ có 1 kỹ năng.
 
De mà vắng gì, lên các group, tuyển de phải nhiều gấp 3 gấp 4 ds + da, mà cung thì ít hơn hẳn. Ds + da giờ tụi học mấy course ra rồi muốn làm nhiều như lợn con
 
Bác ơi như em từ ngành khác giờ muốn làm DS thì ít nhất cần phải trang bị những gì bác nhỉ. Đang mông lung quá
H ngành khác mà muốn làm DS thì hái sao trên trời đó bạn. Muốn chuyển hẳn thì học lên master trường có tiếng chút may ra qua vòng gửi xe, còn mấy cái courses nãy h mọi người list học cho biết chứ ko boost thêm gì về profile đâu. Trừ khi domain trái ngành hẹp họ cần mà này hiếm lắm vốn giờ trái ngành chuyển sáng DS/DA nhiều lắm rồi
 
Mình đang làm DS ở 1 công ti mà bạn vừa đề cập, có cần tranh luận tiếp ko thím. Công ti T layoff gần nhưu toàn bộ đội R&D, giờ chỉ duy trì maintain thôi thím ạ. Thực sự làm rồi mới thấy cái AI, DS nó khá làm bánh vẽ, nên giờ job thu hẹp cực kì. Điển hình là ko thấy bigtech tuyển job nữa.
T này là TS hay TCx vậy thím?
 
job AI/ML cho người giỏi vẫn nhiều.
Mình đã từ chối ít nhất 2 cơ hội trong năm nay đây.
Giỏi thì vẫn sống dc
Mình cuối năm ngoái chưa đủ 1 yoe mà từ chối 1 job
Đợt rồi có offer bên này rồi lại có offer bên kia nữa.
Nói chung job vẫn nhiều, chỉ là khó deal được cao và tuyển rất là ban căng.
Vẫn phải update bản thân liên tục không thì dễ móm lắm.
SOTA nó update liên tục, không cần hiểu kĩ nó chỉ cần biết cơ chế 1 vài cái nổi nổi hay được sử dụng trong mảng của mình là oke rồi.
 
job AI/ML cho người giỏi vẫn nhiều.
Mình đã từ chối ít nhất 2 cơ hội trong năm nay đây.
Giỏi thì vẫn sống dc
khầy có nuôi sgbb không
c6GVp0o.png
 
Nói thiệt sự luôn không phải ngta làm cao làm eo nhưng cái giá trả cho các Data ở VN hiện nay là bèo đó thím. Khi người lao động ngành data vào 1 cty (ít nhất đối với mình) đều đánh cược như 1 canh bạc, có 2 điều:

1. Data quality : bao gồm eco system của công ty đó là gì , lượng dữ liệu ở mức độ nào, tổ chức dữ liệu ra làm sao,….

Mình là DA.
Công ty đang làm dùng PBI nhưng qua cty khác dùng Tableau, dùng Looker hay mình dùng Mssql nhưng bên khác ngta dùng Oracle. Có chỗ dùng Gg sheet, GDS, …
Hay DE thì có chỗ dùng Spark , có chỗ chỉ đc dùng Airflow.

2. Data team : toàn công ty có bao nhiêu người DA, DS (ảnh hưởng đến perf , cái này ai đi DE qtam hơn) , từ phía IT là DBA hay MIS bao nhiêu người, công ty có DE không (rất nhiều cty vacant vị trí này nhé, mình biết 2 cty mình đã làm qua) , có các vị trí nào về data nữa không như Data Governance, Data Control, BI ,…

3. Scope of work : vai trò mình vào cty có được đặt đúng như vậy không ? Chẳng hạn như cty ko có DE thì hầu như DA phải clean data nhiều gấp 2 . Hay công ty ko có BI thì DA làm cả scope đó nhiều cty gọi vị trí merge này là BI engineering , hoặc DS mà kiêm cả DE là ML engineering như bác trên kia có nói. Công ty vẫn gọi DA nhưng làm scope của BIE thì tất nhiên là éo tính thêm tiền phần BI rồi.

Về DA và DS cứng tech rồi còn phải đối mặt với domain knowledge khi vào cty nữa , kể cả chung ngành. Như mình 2 tháng đầu mới vào cty nào mình cũng phải đọc điên cuồng về nghiệp vụ, sản phẩm, chính sách cty , rồi tìm hiểu data (nếu ko có Data governance thì quá trình này cực dữ lắm)

Mấy điều này vô cùng quan trọng với bất kỳ vai trò nào trong ngành này.Đi ứng tuyển, phỏng vấn dù có cỡ nào cũng không thể khai thác hết được, trừ khi xin login vào hệ thống 1 ngày , mà chuyện này éo bao giờ xảy ra. Mà để vượt qua được thì phải HỌC.

Học mãi học mãi đúng nghĩa. Và chi phí việc học, công sức , tgian không hề rẻ . Mình chắc chắn như vậy.

Dev người ta moving qua cty nào cũng thuần tech thì 80% kiến thức dùng lại chứ còn Data coi như chỉ có 60% (phần lớn là tech skill , nếu khác domain coi như chỉ còn 50% kiến thức sẵn có).
Em thấy mấy cái mà bác liệt kê thì ngành nào chả vậy. Bác so sánh với dev thì lại càng sai. Như tụi Frontend, có mấy năm mà tụi nó trải qua chắc ít nhất 3 lần chuyển biến lớn. Backend thì cứ ôm khư khư 1 cái framework thì cũng có sống nổi đâu? Nhìn rộng ra tí thì chúng ta đều là những người đi giải toán, bài toán càng khó thì càng hay ho chứ bác haha. Anw, em lại có góc nhìn khác về "2 canh bạc" của bác:
1. mssql, Oracle thì cũng là RDBMS. Bác là DA thì dùng sql để tương tác, em thấy là cũng không thay đổi nhiều lắm. BI Tool thì metabase, superset, looker,.. nó na ná nhau cả, em thấy học 1 cái rồi sau đó search google alternative in cái đã biết là được :LOL:)
2, 3. Này thì mấy bạn làm data analyst hay nói với nhau về red flag nè nhưng em nghĩ cũng dễ né mà. Nếu bác muốn kiếm nơi an nhàn, tèn tèn làm report thì vào mấy công ty lâu đời như ngân hàng, bảo hiểm, em bảo đảm thêm 10 năm nữa thì mấy cái MIS report vẫn cứ sống khỏe, đem qua công ty khác rồi thêm tí mắm muối vẫn được; customer scoring hay fraud detection chắc xây để tham khảo là chính. Còn bác không muốn thay đổi domain knowledge thì lựa mấy công ty có nhiều phòng ban về data để chia nhỏ quy trình ra ấy.
Túm cái váy lại thì ngành gì, lúc nào chả phải học :LOL: như mẹ em làm giáo viên thì vài năm vẫn phải đi học cải cách chương trình mà hahaha.
 
Hello các thím, chuyện là em mới nhận job intern DE (được hơn tháng) mặc dù không biết chữ gì bên này, thậm chí không có định hướng gì về cái này luôn. Em thấy job lương cao khỏi phải ăn bám gia đình nên nộp cv bừa, cv cũng đẹp nên họ cũng gọi phỏng vấn bừa dù skills toàn là bên BE, đến cũng toàn hỏi thuật toán, toán, sql và optimize sql các thứ, toàn mấy cái em thành thạo nên phỏng vấn khá mượt.
Sau hơn tháng đi làm thì em cũng hình dung sơ sơ được cái nghề này nó là cái gì, sinh ra phục vụ gì cho công ty, hệ thống tổng quan bên em nó như thế nào. Công ty em khá nhỏ, <500 nhân sự nên toàn bộ data đều dùng cloud lưu trữ hết. Vậy nên các thím cho em hỏi vài course/đầu sách để khởi động với ạ. Các thím hỏi là cần phần gì để tư vấn thì em cũng chịu chết vì em mù tịt, em cần tìm hàng để dùng cho người không có kinh nghiệm ạ.
 
Hello các thím, chuyện là em mới nhận job intern DE (được hơn tháng) mặc dù không biết chữ gì bên này, thậm chí không có định hướng gì về cái này luôn. Em thấy job lương cao khỏi phải ăn bám gia đình nên nộp cv bừa, cv cũng đẹp nên họ cũng gọi phỏng vấn bừa dù skills toàn là bên BE, đến cũng toàn hỏi thuật toán, toán, sql và optimize sql các thứ, toàn mấy cái em thành thạo nên phỏng vấn khá mượt.
Sau hơn tháng đi làm thì em cũng hình dung sơ sơ được cái nghề này nó là cái gì, sinh ra phục vụ gì cho công ty, hệ thống tổng quan bên em nó như thế nào. Công ty em khá nhỏ, <500 nhân sự nên toàn bộ data đều dùng cloud lưu trữ hết. Vậy nên các thím cho em hỏi vài course/đầu sách để khởi động với ạ. Các thím hỏi là cần phần gì để tư vấn thì em cũng chịu chết vì em mù tịt, em cần tìm hàng để dùng cho người không có kinh nghiệm ạ.
DE về technical thì cũng như BE đó thím. Còn về sách thì thím xem cty mình sử dụng data stack nào thì mới tìm đúng sách được chứ đâu có chung chung được. Mục đích chung thì là thiết kế, maintain pipeline data, thím có kinh nghiệm rồi thì cũng không cần làm intern đâu
 
Last edited:
Back
Top