thảo luận [Thảo Luận] Data Analysis, ML, DL, AI (All Levels vào đây chém gió nào)

Các bác cho em hỏi, em là sinh viên năm cuối học ngành nhúng. Hồi đi học thì em cũng hứng thú với AI nên có làm vài cái project liên quan đến EdgeAI. Mà bây giờ sắp tốt nghiệp rồi nên em đang mung lung không biết nên đi theo hướng AI hay làm nhúng ạ. Rất mong nhận được góp ý từ các bác
 
Case của em gặp dân trái ngành lên Ds,Da thì đa phần là học thêm thạc sỹ ở đại học khtn, hoặc thi lại. Tầm năm 2021 em đi thực tập thì cũng bắt đầu giai đoạn mà intern/ Fr khó kiếm rồi. 1 chị base Neu học thạc sĩ rồi chơi với team Data, vừa học vừa hỏi rồi sau này sang bên FPT Fis. Nhưng mà được cái danh thôi chứ lương chắc thua bọn Dev mới ra trường . 1 chị nữa thì đổi sang Role Da nhờ làm Ba cũng chơi với team Data rồi move dần sang. Còn lại thì đa phần là dân Du học, bọn Top của trường Top BKHN, ĐHCN QGHN, hoặc top bưu chính :LOL: làm role Ds. DA thì dễ hơn nhưng trái ngành và không có gì nổi bật thì khá khó, thường là sẽ down lương 1 chút so với mọi người đúng ngành. Em thấy trong ngành này connect cực kì quan trọng. Nguyên cái khóa bọn em phải tầm hơn 20đứa làm bank kiểu gọi nhau vào( 7đứa Mb, xong lải rải quanh bank khác). Nên là sự thật là nếu bác không phải kiểu thể loại top lớp ngày xưa thì kiếm 1 connect, mời cafe với người làm trong ngành thì tốt hơn nhiều thay vì chi tiền mua khóa học của mấy trung tâm lùa gà như Datapot hayô Vinh bán khóa Data thực tế hơn nhiều.
Học bên Mindx ổn không bác nhỉ? E làm bên bảo hiểm back office hỗ trợ Claim bảo hiểm cho khách hàng thôi. Nghiệp vụ thì chưa nói là sâu đc. Học xong khoá DA chắc cũng chỉ biết và kỹ năng chứ kiến thức nghiệp vụ của ngành k nhiều, cũng nghĩ đến khả năng k có cty tuyển fresher cả
 
Nếu bác theo Data Analyst thì nên có background kinh tế, tài chính, ngân hàng, còn background là IT thì nên theo Data Engineer.
Bản thân em đang làm sinh viên năm 4 ngành Hệ thống thông tin, ban đầu em cũng tính theo Data Analyst nhưng vấn đề là trên Fb rêu rao khóa học Data Analyst 6 tháng 1 năm các thứ, những khóa học đó chỉ dành cho background kinh tế, tài chính, ngân hàng học vì background này có business và cần học Data Analyst để hỗ trợ cho business đó chứ background IT không có business thì không làm Data Analyst được dù mấy kiến thức Toán, SQL, Python mình đã học rồi nhưng nhiều khi công ty không cần cao siêu như Python.

Do đó em mới theo Data Engineer là vậy vì đa số background IT mới theo Data Engineer được chứ background kinh tế, tài chính, ngân hàng thì khó lắm, Data Engineer vừa học kiến thức chuyên môn của Data Engineer như SQL mà phải biết công cụ trực quan hóa như BI, Tableau của Data Analyst lẫn AI, Machine learning của Data Science.
Bác này nói chuẩn này, cá nhân như mình thì là dạng Hybrid vì là dân kinh tế nhưng xuất phát từ hồi bé xíu lại là dân toán tin nên hiện đang fullstack. Tuy nhiên có nhiều bạn hiện nay ôm đồm khá nhiều thứ, mình cho là chưa nên
 
topic nhiều tương tác như này làm 1 kênh discord đi bro
tên là Big Data & AI Viet Nam chẳng hạn :LOL:
E rằng không nhiều ấy thím. Mảng này ngách , trong 1 vùng rất rộng của DS. Có chăng anh em lập hội thảo luận về DS nói chung luôn. Cơ mà phải có leader , activator.
Ái chà, chờ cần các bác hô cái thôi :D Nhưng cũng mong muốn có một sân chơi cụ thể cho anh em luôn
 
hiện nay thì em đang làm cho bank, 3+ yoe, cũng tạm gọi là fullstack, ... bác nào cần gì cứ hú em để anh em cùng nhau chém nhé
 
các bác lão đại cho em hỏi các thuật toán như flocking, marching cube, wave function collapse, lloyd có phải cũng là 1 phần của AI ko ạ?
ko giấu gì các bác em đang làm game programmer, trình độ cũng fresher - junior thôi, tuy trình độ còn yếu kém nhưng em xem các game áp dụng các thuật toán cao cấp vào thì thấy có 1 sức hút ko hề nhỏ và muốn tìm hiểu. qua google thì dc biết hầu hết những thuật toán cao cấp đều phục vụ AI, tuy nhiên khi em bắt tay vào code em vẫn ko nghĩ là AI khi mà hầu hết đều là if-else, switch-case. và thật sự khó khăn nhất là tìm ra các điều kiện để ra kết quả. nó ko như tưởng tượng của em như là train data, hay học máy. có phải thời kỳ đầu AI chính là các thuật toán if-else thuần túy như vậy ko ạ?
 
Case của em gặp dân trái ngành lên Ds,Da thì đa phần là học thêm thạc sỹ ở đại học khtn, hoặc thi lại. Tầm năm 2021 em đi thực tập thì cũng bắt đầu giai đoạn mà intern/ Fr khó kiếm rồi. 1 chị base Neu học thạc sĩ rồi chơi với team Data, vừa học vừa hỏi rồi sau này sang bên FPT Fis. Nhưng mà được cái danh thôi chứ lương chắc thua bọn Dev mới ra trường . 1 chị nữa thì đổi sang Role Da nhờ làm Ba cũng chơi với team Data rồi move dần sang. Còn lại thì đa phần là dân Du học, bọn Top của trường Top BKHN, ĐHCN QGHN, hoặc top bưu chính :LOL: làm role Ds. DA thì dễ hơn nhưng trái ngành và không có gì nổi bật thì khá khó, thường là sẽ down lương 1 chút so với mọi người đúng ngành. Em thấy trong ngành này connect cực kì quan trọng. Nguyên cái khóa bọn em phải tầm hơn 20đứa làm bank kiểu gọi nhau vào( 7đứa Mb, xong lải rải quanh bank khác). Nên là sự thật là nếu bác không phải kiểu thể loại top lớp ngày xưa thì kiếm 1 connect, mời cafe với người làm trong ngành thì tốt hơn nhiều thay vì chi tiền mua khóa học của mấy trung tâm lùa gà như Datapot hayô Vinh bán khóa Data thực tế hơn nhiều.
Èo e đang định đăng kí khóa của Ngô Vinh ấy bác 😥 . Nếu nói như bác thì vai trò của BE sẽ tập chung vào gì hơn so với DE nhỉ , e có tìm hướng đi giữa BE với DE mong nhận đc góc nhìn của bác :adore:
 
Èo e đang định đăng kí khóa của Ngô Vinh ấy bác 😥 . Nếu nói như bác thì vai trò của BE sẽ tập chung vào gì hơn so với DE nhỉ , e có tìm hướng đi giữa BE với DE mong nhận đc góc nhìn của bác :adore:
gần như De tập trung cho data nhiều hơn => kiểu như BE thì sẽ lưu data, log,.. , DE thì sẽ build mấy cái datalake,dataware house, thêm field, ... thuần cho DA/DS nó lấy data, Còn thường BE sẽ quan tâm việc data sinh ra từ sản phẩm thôi, còn lại công việc BE không khác mấy. Vẫn là Scale hệ thống thôi. Có tiền bú khoá của DataBrick vừa xịn vừa có người chấm điểm là người trong ngành cho. Ngô vinh cứ xàm l tư duy nghiệp vụ DA chứ Fr thì móc đâu ra kĩ năng nghiệp vụ, mà có kĩ năng nghiệp vụ. profile của lão trên linked cũng đi từ ngành khác đá sang , mà lại còn ngân hàng nữa thì DA, DE tách biệt hẳn làm gì được động vào như cty product. Mà còn đỡ hơn thảo DA đi làm 2 năm tại bank mở doanh nghiệp lùa gà ác. Năm nào cũng xàm cức nhân lực thiếu. Nội cái job research thị trường => Crawl số job đăng trên fb, các trang tuyển dụng lọc duplicate tính số lượng FR/Jn là năm nay giảm rõ rồi, range lương cũng giảm ác.
 
Em tìm hiểu theo mảng data cũng vài năm, mà đợt sau dịch kiếm việc nhập ngành hơi khoai :(Hiện tại thì đang làm BI, cũng làm việc với data nhiều nhưng mà chủ yếu loanh quanh là Preprocessing + Report, quản trị data từ mấy cái hệ thống Salesforce, SAP, ... chứ không có phân tích/build model gì cả nên cảm giác không up level được mấy.

Em cảm giác tình hình chung mấy doanh nghiệp ở VN triển khai data cho có, kinh doanh thì vẫn có lợi nhuận là được. Nhờ mấy bác thâm niên cao khai sáng 1 tí xem tình hình các chỗ khác thế nào để còn nhảy việc :byebye:bonus thêm tí scope of work thực tế thì tốt tại em chỉ học thôi chứ chưa có kinh nghiệm thực chiến nhiều.
 
Vào đây thấy đang học khoá Pro DA của Datacamp nohope quá :(
Mặc dù ngoài các khoá trong khung Cert thì mình cũng tích cực học các khoá có liên quan. Ngoài ra còn đọc sách Statistic và Programming.
 
các bác lão đại cho em hỏi các thuật toán như flocking, marching cube, wave function collapse, lloyd có phải cũng là 1 phần của AI ko ạ?
ko giấu gì các bác em đang làm game programmer, trình độ cũng fresher - junior thôi, tuy trình độ còn yếu kém nhưng em xem các game áp dụng các thuật toán cao cấp vào thì thấy có 1 sức hút ko hề nhỏ và muốn tìm hiểu. qua google thì dc biết hầu hết những thuật toán cao cấp đều phục vụ AI, tuy nhiên khi em bắt tay vào code em vẫn ko nghĩ là AI khi mà hầu hết đều là if-else, switch-case. và thật sự khó khăn nhất là tìm ra các điều kiện để ra kết quả. nó ko như tưởng tượng của em như là train data, hay học máy. có phải thời kỳ đầu AI chính là các thuật toán if-else thuần túy như vậy ko ạ?
Là AI hết bạn nhé. Hiểu AI đơn giản là máy làm hộ người thôi, còn không quan trọng cách làm.

Khác biệt giữa AI hiện đại đang phổ thông trong đại chúng (DL) và AI cổ điển/ AI ứng dụng trong nhiều ngành nghề nằm ở việc bao nhiêu phần của việc thiết kế giải thuật AI là learning-based - giải thuật sẽ được tự hình thành từ dữ liệu - và bao phần là từ kiến thức chuyên môn - giải thuật được hình thành từ việc dịch kinh nghiệm, các hệ phương trình toán/lý ứng dụng, xử lý tín hiệu cổ điển, quy trình làm việc, ... ra code trong bài toán cần giải quyết.

Càng thuần learning-based thì bạn sẽ thấy ít dần "if-else". Learning-based đúng là xu hướng phát triển của ngành AI từ xừa và cả nay, nhưng không có nghĩa đó luôn là cách tiếp cận tốt nhất cho mọi bài toán cần ứng dụng AI. Khi điều kiện cần là data nhiều và đủ sạch cho bài toán cần giải quyết không được thỏa mãn, hoặc đơn giản là do quy tắc 80/20, bạn có thể sẽ thấy giải thuật AI dựa phần nhiều vào kiến thức chuyên môn sẽ hiệu quả hơn.
 
Đang làm Junior AI Engineer cho 1 công ty nhà nước, đợt này bọn LLMs (đúng hơn là super LLMs) on trend xong e cảm giác càng ngày không đóng góp được cho công ty, dự án hiện tại thì như cax (yêu cầu trên trời đầu tư nhỏ giọt), không đi làm thì đói, nhảy sang role khác thì bắt đầu lại từ đầu => lương thấp + phải tự cày vài năm nữa, những task liên quan đến data science bên cạnh AI kiểu data warehouse hay data analysis thì hiện tại em không có.
E học trường được coi là top, ngành chắc cũng top về AI ở VN ạ, hiện chưa có ý định học cao học. Bác senior AI nào đi trước có thể cho em xin vài lời khuyên được không ạ!
Các ae AI còn lại thì sao :)
 
Last edited:
Đang làm Junior AI Engineer cho 1 công ty nhà nước, đợt này bọn LLMs (đúng hơn là super LLMs) on trend mà cảm giác càng ngày không đóng góp được cho công ty, dự án hiện tại thì như cax (yêu cầu trên trời đầu tư nhỏ giọt), không làm thì đói, nhảy sang role khác thì lương thấp, bắt đầu lại từ đầu.
Bác senior nào đi trước cho e xin vài lời khuyên với ạ!
E học trường được coi là top, ngành chắc cũng top về AI ở VN ạ, hiện chưa có ý định học cao học. Các ae AI còn lại thì sao :)
ý là bạn đang làm về LLM và do cty không chịu đầu tư nên chán hay do chán hướng đi vậy?
 
Klq nhưng cho hỏi, mâý công việc về data label (gán nhãn hình ảnh cho AI) đi làm có tương lại ko?
Làm mảng này thì có tích lũy đc kinh nghiệm gì ko?
 
Klq nhưng cho hỏi, mâý công việc về data label (gán nhãn hình ảnh cho AI) đi làm có tương lại ko?
Làm mảng này thì có tích lũy đc kinh nghiệm gì ko?
100% là có tương lai nhé, tool dán nhãn chỉ cho các vần đề phổ biến thôi, còn đầy ngóc ngách cần có người làm nhãn
còn tích lũy kn thì chắc còn ít hơn công nhân. công nhân 5 năm kn nó khác 1 năm kn nhưng mà dán nhãn 10 năm nó cũng chả hơn gì 0 kn đâu
 
Bài này mình reply 1 bạn bên thớt "Học khóa LẬP TRÌNH PYTHON CƠ BẢN", post lại bên đây cho ai muốn theo nghề Data:

Làm data thì cũng có nhiều loại, tạm chia làm 3 loại thế này:
1. Data Developer/Data Engineer: cái này làm việc như lập trình viên, nhiệm vụ là xử lý dữ liệu như đọc, ghi, load, transform, patching, làm report, một chút thiết kế database, viết tool ETL. Skills cần có tất nhiên là SQL, một ngôn ngữ lập trình hiện đại để viết tool ETL như C#, các tool làm report, ETL như SSRS, SSIS nếu theo công nghệ của Microsoft, cao hơn thì mấy cái xử lý big data như hadoop.

Nói chung cái này nặng về lập trình, thường là 1 hướng cho các bạn chuyên CNTT nhưng ko muốn làm software mà làm data. Tài liệu học mấy cái kể trên thì có rất nhiều, cái nào cũng được. Cái này dễ kiếm job hơn hai cái sau.

2. Data Anlysist: cái này là người phân tích dữ liệu, background ko nhất thiết phải là dân CNTT. Cái này nặng về phân tích.

Skill cần có và quan trọng nhất là Thống Kê. Tài liệu thì tìm khóa Statistics Probability trên khanacademy course này cực dễ hiểu. Lúc học thì chú trọng các phần như distribution, samples, mean, median, variance, standard deviation, Z-Test, T-Test, Chi-square tests, Anova. Học khóa này xong có thể thi chứng chỉ AP Statistics để làm đẹp CV.
Statistics and Probability | Khan Academy (https://www.khanacademy.org/math/statistics-probability)

Một khái niệm nữa là Data Weighting cái này cực kỳ quan trọng ai làm phân tích cũng nên biết.

Về tool: SPSS Statsitics, đây là phần mềm chuyên phân tích dữ liệu, ít nhất cũng nên làm quen với nó rồi chạy được các phân tích cơ bản như Descriptive Statistics, Frequencies, Cross-Tab, mấy cái test đã kể trên, Data Weighting. Cái thứ hai là Excel, Excel là tool phân tích dữ liệu cực mạnh mà ít người để ý, ngoài các hàm cơ bản thì phải biết được Pivot Table.

Ngôn ngữ lập trình và các tool visualize: SQL, Python, R, Tableau, Power BI. Về Tableau với Power BI thì mình prefer Tableau vì performance tốt hơn, tài liệu thì vào trang chủ của nó có Tutorial làm rất dễ.

Job nhóm này ít hơn nhóm 1 nhưng thiên về phân tích, ít lập trình hơn. Đa số các bạn học kinh tế, toán thống kê làm được.

3. ML Engineer/Data Scientist: cái này làm về Machine Learning, AI. Skill cần có thì bao gồm tất cả skill của nhóm 1 và 2, đặc biệt là nhóm 2 vì nếu ko biết thống kê thì làm như cái máy mà chẳng hiểu model mình build ra nó tốt xấu chổ nào. Có nhiều mảng khá đặc thù như Computer Vision, Natural language processing, speech recognition, nó là hướng khác mình ko nói ở đây, còn hướng gần gũi hơn mà anh em Data Analyst có thể đi lên là làm các model dự doán cho các ngành đặc thù như doanh số sales, giá bất động sản. v..v..

Học về cái này thì nên tiếp cận theo hướng top-down trước để hiểu overview xem ML, AI nó là cái gì, có các mảng nào, cần những kiến thúc gì rồi pick up 1 mảng mà học thì tiếp cận theo hướng bottom-up, học những cái cơ bản trước rồi nâng cao.

Tài liệu vê cái này thì đọc cuốn Introduction to Machine Learning with Python, cực dễ hiểu và không nặng về toán lắm, học xong có overview rồi thì học sâu về toán.
https://www.amazon.com/Introduction-Machine-Learning-Python-Scientists/dp/1449369413

Ngoài ra còn có course này Machine Learning A-Z™: Hands-On Python & R In Data Science trên Udemy và Machine Learning Andrew Ng trên Coursera

Về toán cho ML, AI: cái quan trọng nhất vẫn là thống kê như đã nói ở nhóm 2. Cái này lúc làm về nó vận dụng nhiều nhất. Cái quan trọng thứ 2 là đại số tuyến tính, bạn lên Khan Acedamy tìm khóa này https://www.khanacademy.org/math/linear-algebra cái này học để hiểu bên trong các thuật toán làm gì. Cái thứ 3 là giải tích, xem lại đạo hàm, tích phân, vi phân học để hiểu bên trong các thuật toán làm gì luôn.

Còn muốn đào sâu về toán để chém gió, hù dọa nhau thì kiếm cuốn này: The Elements of Statistical Learning :shame:
https://web.stanford.edu/~hastie/ElemStatLearn//

Job cho nhóm này đang có nhiều nhu cầu, chất, yêu cầu cao.
Bác có thể rcm cho em nguồn học giải tích được kh ạ ;-;
 
Giám đốc điện lực mà cũng lăn tăn học phí à, thím cứ viết đơn xin hỗ trợ tài chính kêu: sinh viên, thất nghiệp, hoặc đi làm nhưng lương thấp không trả nổi muốn học để đổi đời là coursera nó ok free thôi bên này nó dễ với mấy nước đang phát triển lắm, edx thì nó chỉ hỗ trợ đâu 90%, tra gg vụ này nhé :D
bác có tips viết xin cho sinh viên không ạ :<< em viết mấy lần mà không được :<
 
Back
Top