thảo luận [Góc chia sẻ- Thảo Luận] Review, phân tích và giải thích những bài báo khoa học về AI/Computer Vision

em đặt slot bác viết về mấy kĩ thuật cơ bản hay dùng trong CV trước ạ. VD như loss function selection, gradient clipping, adversarial learning, v.v. Còn về các bài toán thì solution cũng là build lên từ các kĩ thuật cơ bản này mà ra cả =((
 
em đặt slot bác viết về mấy kĩ thuật cơ bản hay dùng trong CV trước ạ. VD như loss function selection, gradient clipping, adversarial learning, v.v. Còn về các bài toán thì solution cũng là build lên từ các kĩ thuật cơ bản này mà ra cả =((
+1. Sẽ lên bài về các thuật toán cơ bản trước trong computer vision.
 
Ngon, đang bí đề tài thesis :p :p :p Chủ thớt đang học gì thế, với cả theo mình hiểu thì chủ thớt đang cố gắng optimize một cái NN Model từ Paper X đúng không? :adore:
 
Mình thấy bài toán Super-resolution được đó, cùng nằm trong nhánh các bài toán khôi phục ảnh như deblur luôn. Các kiến thức cũng xoay quanh các kĩ thuật phổ biến như Pyramid, Gan, ...
 
Hơi nản do ít người thảo luận. Hôm trc lên 1 gr fb thì có thím bê bài y chang mà sửa lại luôn nguồn. Cãi mãi mới xoá mà còn k xin lỗi em
Thím cứ quăng link lên đây anh em vào cãi hộ cho.
Thím cho mình hỏi những khó khăn khi học ngành này là gì vậy? Khối lượng công việc có lớn không? Thời gian nhiều nhất là để làm gì (trừ đi kiếm data ra)? Kiến thức nó có thay đổi nhanh như bên dev không? Nhân lực ngành này ở VN và trên thế giới đang như thế nào? Cảm ơn thím :sweet_kiss:
 
Như tít, noi gương mai pen ở topic https://voz.vn/t/chia-se-lo-trinh-ielts-7-cho-vozer-de-hoc.339522/page-7#post-14437273,
mình quyết định lập topic này để review, đọc, phân tích, và giải thích những bài báo SOTA trong lĩnh vực AI và computer vision. Mong được các anh chị em ủng hộ, góp ý, thảo luận.

Những ai làm computer vision mảng application hoặc nghiên cứu đều biết literature review là 1 công việc quan trọng trước khi xây dựng ứng dụng.
Mục đích của topic:

  • Review những paper kinh điển, phải biết trong lĩnh vực, vì những công nghệ trong những bài báo này thường được sử dụng, hoặc thường dc làm benchmark trong các task, hoặc là cơ sở để build những model SOTA hiện tại.
  • Phân tích phương pháp tiếp cận toán học của paper 1 cách trực quan, dễ hiểu (thường mọi người hay ngán đọc báo do cách viết khó hiểu và toán học lằng nhằng)
  • Nhận xét ưu, khuyết điểm của mô hình, và 1 số flaws in research của author
  • Trải nghiệm thực tế, code implementation (nếu có thể)

Mình sẽ cố gắng lên 1-2 bài/tuần, danh sách các topic mình sẽ review:

1. AI in deconvolution: ứng dụng zoom ảnh siêu to (super-resolution), phục hồi ảnh mờ (deblur), phục hồi ảnh bị che (uncensor) với deep learning.

1 số thành quả của em:
Ảnh gốc bị mờ: Chưa đem vào huấn luyện bao giờ
crwg3jA1GdT31g-bzJ2CZ5xDZsn4Q56Ys55lkqzIQ69AQR-eiCOKqtmeXX8UVdtjMeJFTGBa-TmTG1-6regHc3w54LhT73RGvexuKkLrvtYZf3DLeeiN-wqQKtUM7-7ImwTQylZcNQ

Model output:
xxR4HfVYq9cLnXcqRG92NZLqEq0mp2NlPmwObPTQUrGcQo2M_hKIQzRWzvJf9IHNLp3bRdE5c7RVAGrMJAbTJwO-eFc0Cyb12CLqQCHuk0TQBv9tQ6mc_ShGSaBKveqUHD13_ubANw

Với ảnh màu:
EKQNzpAaf1e09u9WVy-usZRu4FycgZl9BkGTnCey2NadhEjiHHO4MgJI4SsxSH5hehi9srgW8e0rCunSzju6aifWJMe4GII6oJWhYkqCXEgn8pUPCT7Ho-JWd-rUgIVpnBXgisp7NA


Part 1: Xây dựng mô hình CNN deblur ảnh :




2. Deep Learning with Transformer in Computer Vision (SOTA năm 2020)

3. Self-supervised segmentation, self-supervised face recognition using classical algorithms (eigenfaces, Chan-vese)

4. Deep Learning in scene text recognition

5. Deep Learning in Motion Transfer (HOT)

6. Classical models: resnet, SE-Resnet, cơ sở toán học của PCA, decision boundaries, polyminal regression, feature selection methods...

Mỗi topic mình sẽ review 2-3 bài, nếu mọi người có suggest thì cứ comment topic + paper.

Paper đầu tiên về deblur mình sẽ update trong tuần này.
Chào bạn,

Mình cũng có mong muốn tìm hiểu về machine learning nhưng thấy cũng hơi lúng túng.
Với những người mới bắt đầu thì nên cần biết những kiến thức nền tảng nào trước.
Mong bạn có thể chia sẽ về kinh nghiệm thực tế của mình.

Thank you
 
Back
Top