thảo luận AI/ML/DL đang bão hòa?

bão hòa thì còn lâu bác. Em nộp hồ sơ vào chương trình AI ở Vin hơn 500 hồ sơ được vài người thì bác nghĩ yêu cầu cao thế nào? Nhiều người học mà đâu phải ai cũng đủ yêu cầu. Mà nếu bão hòa thì hướng reseach vẫn sống tốt thôi.

Hướng research mà vẫn sống tốt :)))), hỏi bạn ngoài VIN với MoMo đang hype bữa giờ còn thằng nào tuyển researchers

Sent from Xiaomi Redmi Note 9S using vozFApp
 
Mấy cty lớn nhiều tiền, công nghệ cao có mấy ông đầu ngành bảo kê nữa. Mấy cái lớn lớn họ làm hết rồi, phổ cập rồi làm theo thôi. Còn tuyển dụng thì nhiều lắm bác như châu Á có Hàn Quốc nè.

Vãi Hàn xẻng mà tuyển nhiều. Bọn nó thị trường nhỏ và đóng hầu như cực ít người làm ML mà làm cho Hàn xẻng.
 
Hướng research mới là hướng khó sống hơn o VN. chỉ có Vin là đầu tư mạnh vào research thôi, nhưng cũng k biết sẽ kéo dài đc bao lâu nữa. Vin big data giờ cũng ra thành công ty riêng phải có doanh thu để sống rồi.
Giờ đã qua giai đoạn hype rồi, CV NLP đang bão hoà nhanh hơn mảng AI for business, nhưng mảng business thì đòi hỏi kết quả rõ ràng

via theNEXTvoz for iPhone

Giờ bão hoà rồi, đi đâu cũng thấy AI ML engineer researcher. Trong khi đó mấy bài toán phổ thông như chatbot, recommendation, KYC, có sẵn framework hết rồi.
Giờ nhu cầu ít, ngon ăn chỉ có làm outsource cho các công ty không thuần tech nhưng có nhu cầu áp dụng AI cho business.
 
Đang làm về ML thì cái topic này va vào mắt, xem các thím cmt rôm thế mà drop topic nhỉ?
Tôi làm SD (Software Development) 6 năm chuyên viết driver cho thiết bị, năm nay đổi không khí xin Boss sang làm MLE (Machine Learning Engineering) được gần năm rồi thì xin có vài review ngay tại cty tôi như sau:

Team research: 03 người, full là dân toán Ph.D+
Team MLE: 08 người, nửa nạc mỡ có thể là dân toán tin ra, có thể là dân cử nhân phần mềm. Thực tế đi làm MLE chủ đạo trong công việc là logic các mảnh ghép và ráp giải pháp có sẵn, nên đã có kinh nghiệm làm SD thì nhảy sang MLE tương đối nhẹ, ML nó phát triển mạnh và các vấn đề được bọc hết vào thư viện rồi, tất nhiên là vẫn có những thứ thư viện không có thì có team research vọc vạch để giải quyết. Còn đi làm ML đụng toán nhiều không? Câu trả lời là rất nhiều nhưng cũng đơn giản thôi vì cũng là vận dụng những thứ đã được chứng minh và làm mẫu sẵn hết các case như : Tính toán ma trận (cộng, nhân ma trận), Phân phối Dirichlet, Phân phối Beta, định lý Bayes’ Law ...etc thời đi học ĐH cũng va hết vào rồi, giờ gặp thì ôn lại tý là nhớ ra thôi, có docs hướng dẫn cả, đọc phát ráp vào luôn.

Còn về research ML thì nó là phạm trù khác, đã làm cái này thì kiến thức toán không bao giờ là đủ. Việc chính của team này là nghiên cứu và viết ra giải pháp có thể là bọc vào thư viện hoặc viết docs hướng dẫn cho MLE triển khai những vấn đề mới...

Và sau 11 tháng làm MLE tôi vừa mới xin Boss về lại SD, leader nhẹ 1 team 4 người cho dự án phần mềm cho đối tác chuyên về in ấn.

Riêng ngành ML tôi thấy data là quan trọng nhất, éo có data cũng chẳng làm được cái gì nên hồn. Thuật toán thì khó mấy chứ khó nữa cứ có tiền là có người về làm cho hoặc mua từ các Lab thiếu gì. Data là thứ đốt tiền, rủi ro cực cao nếu nguồn cấp data nó bị gãy. Giống như việc đang liên kết với tất cả các bệnh viện để mua data về những bệnh của trẻ em Việt Nam, đang update dữ liệu ngon, ĐM bộ ra công văn bịt kín data lại cho cty sân sau của bộ độc cmn quyền thì toang luôn. Đấy là thực tế của cuộc sống mà ta phải chấp nhận. Việc nhiều và ổn định thì cứ code App, Web app, ERP, embedd...
 
Last edited:
Mà cái ngành AI này nghe thì sang chảnh thôi chứ nó cực kỳ phụ thuộc vào 2 nhóm nhân sự sau:
  • Kỹ sư thu thập và xử lý làm sạch dữ liệu.
  • Nhân sự dán nhãn.
Vì tôi làm tôi rất rõ không có 2 đối tượng này xịn và mạnh support hàng ngày theo project thì cái sự sang chảnh của cả Kỹ sư lẫn nhà nghiên cứu AI đều ngậm tăm với nhau hết.

Mà nuôi 2 cái đội này cực kỳ tốn kém, dự án AI toàn là vẽ bánh vẽ vì éo có tiền để một là nuôi 2 đội kia hai là éo có tiền, quyền mà móc dữ liệu ra để train. Cty éo có tiếng và ảnh hưởng có đb mà móc được API bên các bộ dữ liệu như y tế, giáo dục...etc Thế nên ngành này cuối cũng về tay những thằng to hết, như VN chắc loanh quanh cỡ chục thằng lớn là tuyển nhân sự AI hàng năm chứ cty bé hơn họ tuyển ERP, code web, app là chính hoặc tuyển mộ nhân sự nào giỏi Excel, Power BI, Alteryx các kiểu.

Thị trường tuyển dụng sẽ rất cạnh tranh. Cảm thấy trình cao và đam mê hãy theo, đừng đú rồi thất cmn nghiệp thì dở đấy.
 
Mà cái ngành AI này nghe thì sang chảnh thôi chứ nó cực kỳ phụ thuộc vào 2 nhóm nhân sự sau:
  • Kỹ sư thu thập và xử lý làm sạch dữ liệu.
  • Nhân sự dán nhãn.
Vì tôi làm tôi rất rõ không có 2 đối tượng này xịn và mạnh support hàng ngày theo project thì cái sự sang chảnh của cả Kỹ sư lẫn nhà nghiên cứu AI đều ngậm tăm với nhau hết.

Mà nuôi 2 cái đội này cực kỳ tốn kém, dự án AI toàn là vẽ bánh vẽ vì éo có tiền để một là nuôi 2 đội kia hai là éo có tiền, quyền mà móc dữ liệu ra để train. Cty éo có tiếng và ảnh hưởng có đb mà móc được API bên các bộ dữ liệu như y tế, giáo dục...etc Thế nên ngành này cuối cũng về tay những thằng to hết, như VN chắc loanh quanh cỡ chục thằng lớn là tuyển nhân sự AI hàng năm chứ cty bé hơn họ tuyển ERP, code web, app là chính hoặc tuyển mộ nhân sự nào giỏi Excel, Power BI, Alteryx các kiểu.

Thị trường tuyển dụng sẽ rất cạnh tranh. Cảm thấy trình cao và đam mê hãy theo, đừng đú rồi thất cmn nghiệp thì dở đấy.
Cảm thấy bản thân ko đủ lực nên mình nhảy tàu qua BE coi bộ là quyết định hợp lí.

Ko liên quan tí, bác làm nhiều cho mình hỏi chút, labeler khi đánh bounding box cho mấy mô hình như yolo có cần chi li từng chút không hay chỉ cần object nằm trong là được, hở ra đôi chút kiểu như padding 100 200 pixel cũng ko sao? Tại muốn làm pet project mà đánh mấy cái này ngán quá.
 
Cảm thấy bản thân ko đủ lực nên mình nhảy tàu qua BE coi bộ là quyết định hợp lí.

Ko liên quan tí, bác làm nhiều cho mình hỏi chút, labeler khi đánh bounding box cho mấy mô hình như yolo có cần chi li từng chút không hay chỉ cần object nằm trong là được, hở ra đôi chút kiểu như padding 100 200 pixel cũng ko sao? Tại muốn làm pet project mà đánh mấy cái này ngán quá.
Quy tắc là dữ liệu càng lớn càng đánh chi tiết để phát triển các exceptions thành các bộ lab riêng
 
Ko liên quan tí, bác làm nhiều cho mình hỏi chút, labeler khi đánh bounding box cho mấy mô hình như yolo có cần chi li từng chút không hay chỉ cần object nằm trong là được, hở ra đôi chút kiểu như padding 100 200 pixel cũng ko sao? Tại muốn làm pet project mà đánh mấy cái này ngán quá.
đánh lệch 1 tí cũng chả sao, data augmentation cho cv còn crop lung tung cơ mà
thậm chí đánh sai luôn cũng chả sao (miễn không sai nhiều quá), mấy bộ dataset benchmark đánh sai đầy https://arxiv.org/pdf/2103.14749.pdf
 
đánh lệch 1 tí cũng chả sao, data augmentation cho cv còn crop lung tung cơ mà
thậm chí đánh sai luôn cũng chả sao (miễn không sai nhiều quá), mấy bộ dataset benchmark đánh sai đầy https://arxiv.org/pdf/2103.14749.pdf

Sao đánh sai lại k sao hả bác. Em tưởng đánh đúng thì model ms học đúng đượv feature chứ

Sent from Xiaomi Redmi Note 8 Pro using vozFApp
 
1 là bạn siêu giỏi còn không thì làm kiểu chạy mấy dự án lặt vặt kiểu thiên hướng về kĩ thuật train, ... Vì thực tế mấy cái nghiên cứu thế giới đang làm gần như hết rồi.
 
Sao đánh sai lại k sao hả bác. Em tưởng đánh đúng thì model ms học đúng đượv feature chứ

Sent from Xiaomi Redmi Note 8 Pro using vozFApp
Ý em là số bị đánh sai không nhiều quá thì không sao. Dataset 100% đúng chuẩn từng pixel/label thì tốt nhất rồi nhưng mà nhiều khi chả đáng công sức, miễn số label đúng đủ để cho mô hình học được là được rồi
 
Không phải bão hòa mà phần lớn chưa wrap thành sản phẩm có thể kiếm tiền được thì các công ty không bỏ tiền nhiều vào nữa thì ít tuyển lại thôi. 90% tuyển xong chỉ thấy tốn tiền chứ không ra tiền
 
Back
Top