Hướng dẫn cài đặt NVIDIA CUDA & GPU computing SDK

NVIDIA CUDA

Sau phần 1 của bài viết giới thiệu về CUDA của anh Võ Đức Khánh (phụ trách công nghệ CUDA tại khu vực Châu Á Thái Bình  Dương của NVIDIA), chúng tôi đã nhận được nhiều phản hồi tích cực và dự định sẽ dành thời gian cho bài viết tiếp theo đi sâu vào mô hình điện toán song song này. Bài viết này đáng lẽ không nằm trong series bài giới thiệu về CUDA như ở phần I, nhưng tôi quyết định gộp vào loạt bài này do có một vài nội dung có liên quan.

NVIDIA GPU Computing SDK

Bài viết này sẽ giới thiệu qua về gói tiện ích CUDA 3.1 và hướng dẫn cách cài đặt NVIDIA GPU Computing SDK trên Windows  để giúp máy tính sử dụng card NVIDIA hỗ trợ CUDA của bạn chạy các file video và các tác vụ render mượt mà hơn, nhanh hơn…

vozExpress

Trước khi đi vào chi tiết bài viết này, tôi xin giới thiệu một xíu về nguồn gốc bài viết: Đây là phần I trong loạt bài giới thiệu và hướng dẫn chi tiết về công nghệ đồ họa CUDA của hãng NVIDIA, anh Võ Đức Khánh – phụ trách công nghệ CUDA của NVIDIA ở khu vực Châu Á Thái Bình Dương. Anh Khánh cũng là cố vấn đặc biệt của Tạp chí đồ họa máy tính CGEZINE. Đây là bài viết tiếp theo nội dung của loạt bài giới thiệu về công nghệ CUDA trên vozExpress .Trân trọng cám ơn sự hợp tác của anh Khánh và các bạn đọc vozExpress, CGEZINE…


I – MỘT VÀI KHÁI NIỆM VỀ CUDA & GPU COMPUTING SDK

1 – CUDA 3.1 có gì mới so với CUDA 3.0?

Đặc tả CUDA 3.0

Đặc tả CUDA Toolkit 3.0

Phiên bản CUDA 3.1 vừa được NVIDIA phát hành ngày 26/06 và có thể download ở đây. Các tính năng quan trọng được cung cấp trong CUDA 3.1 bao gồm:

  • GPUDirect(tm) cho phép các thiết bị bên thứ ba truy cập vào vùng nhớ CUDA. Câu hỏi quan trọng ở đây là bạn định nghĩa thế nào về “thiết bị bên thứ ba“?
  • Hỗ trợ thực thi đồng hành cùng một thời điểm 16 đường cho tối đa 16 nhân thực thi song song trên các GPU có kiến trúc Fermi. Nói nôm na là với tối đa 16 bộ đa xử lý có trên một GPU kiểu Fermi, ta có thể gán cho mỗi bộ xử lý một tác vụ (thể hiện bởi một mã nhân thực thi) khác nhau và các tác vụ này sẽ cùng được thực thi song song.
  • Hỗ trợ cơ chế thực thi liên thông giữa hai loại API Runtime / Driver cho phép các ứng dụng trộn lẫn mã sử dụng CUDA Driver API với CUDA C Runtime và các thư viên toán học thông qua các kỹ thuật chia sẻ vùng đệm và di dời ngữ cảnh thực thi.
  • Các đặc trưng ngôn ngữ mới có liên quan đến CUDA C / C++ như:
    • Hỗ trợ hàm printf() trong mã thiết bị
    • Hỗ trợ con trỏ hàmđệ qui giúp việc chuyển đổi các thuật toán đã có sang các GPU kiểu Fermi trở nên dễ dàng hơn.
  • Unified Visual Profiler trong phiên bản này làm việc với cả CUDA C/C++ và OpenCL
    • Hỗ trợ việc khởi động/dừng quá trình thu thập thông tin đánh giá (profiling) ở thời điểm thực thi. Cơ chế này cho phép chúng ta chỉ cần tập trung vào các vùng quan trọng cần kiểm tra về hiệu năng của cả một ứng dụng có thời gian thực thi dài.
    • Hỗ trợ việc theo vết CUDA Driver API
  • Cải tiến về hiệu năng của các thư viện toán học
    • Hiệu năng của hàm erfinvf() tăng tối đa đến 25%
    • Cải tiến đáng kể về hiệu năng của phép biến đổi FFT với độ chính xác kép trong trường hợp kích thước của phép biến đổi có dạng  2ntrên các GPU kiểu Fermi
    • Trong thư viện CUBLAS giờ đây chúng ta có thể sử dụng streaming API cho việc chồng lấp các thao tác sao chép dữ liệu trong bộ nhớ với các thao tác tính toán đang diễn ra trên GPU
    • Các cài đặt tối ưu hóa mới cho các phép biến đổi Real-to-complex (R2C) và complex-to-real (C2R) trên dữ liệu có kích thước dạng 2n trong thư viện CUFFT
    • Cải tiến hiệu năng của các chương trình con GEMV và SYMV trong thư viện CUBLAS
    • Các cài đặt tối ưu hóa với độ chính xác kép cho các hàm chia và nghịch đảo trên kiến trúc Fermi
  • Nhiều mã chương trình SDK được viết mới hoặc cập nhật nhằm minh họa:
    • Cách sử dụng các con trỏ hàm trong các nhân CUDA C/C++
    • Kỹ thuật chia sẻ vùng đệm giữa OpenCL và Direct3D
    • Mô hình Markov ẩn trong OpenCL
    • Cách thức gọi một hàm Excel thực thi trên GPU thông qua ví dụ Microsoft Excel GPGPU

About elpvn

Wherever I go, there I am
This entry was posted in Hướng dẫn, Nội dung nổi bật, Đồ họa and tagged , , , . Bookmark the permalink.

10 Responses to Hướng dẫn cài đặt NVIDIA CUDA & GPU computing SDK

  1. quick says:

    Bài viết thật hữu ích. KHổ cái lỡ lao đầu vào Ati rồi ~~ Tủi

  2. jinsk8r says:

    @quick: Tiết kiệm được khối tiền dành vào việc khác hay hơn :) xoắn làm gì

  3. nguoihanoi says:

    nản, bài viết dành cho các bạn phát triển soft. Bạn buồn gì.

  4. iice says:

    Chắc bạn quick buồn vì ko đc tận hưởng cuda/physx/3dvision xD
    Mà trong cái vid kia fps thấp nhỉ toàn 3.x

  5. member forum says:

    @iice: chính xác, nhưng luôn ổn định ở mức 3X, cái ổn định mới quan trọng chứ đâu phải fps. Dùng để làm việc thì cần tốc độ xử lý chứ đâu cần tốc độ khung hình.

  6. 5750 says:

    cái này mình đọc bên CGengine lâu rùi. chờ hướng dẫn sử dụng direct compute để tăng tốc xử lý bên ATi mà ko thấy

  7. spectre says:

    Lên Youtube search AMDunprocessed ra 1 loạt Video hướng dấn ATI Stream SDK.

    Tha hồ mà vọc nhé bạn 5750

    Về Direct Compute thì ATI cho Nvidia ngửi 1 đoạn khói dài mệt nghĩ :D

  8. jinsk8r says:

    @member forum: “Ổn định” ở mức 3x fps?

    http://www.tweakguides.com/Graphics_5.html

    Đã là Computer Graphics thì phải 6x mới gọi là ổn định nhé bạn :) đây ko phải là vấn đề phim ảnh

    Còn nếu bạn đọc ko hiểu thì xem cái này cho nó trực quan

    http://www.boallen.com/fps-compare.html

  9. Nhật Minh says:

    @spectre: cái vấn đề là chẳng mấy người biết đến việc ấy anh ạ.

  10. Nguyễn Anh Tuấn says:

    cài ko có được, bài hướng dẫn rối quá, nói cài theo thứ tự mà đường dẫn download chỉ dẫn đến 1 chổ thôi, nhưng kết quả cài đặt thất bại rồi chán ghê, mình down 3 thứ, đầu tiên down driver mới nhất của card về từ trang Nvidia (card mình là 630), xong cài update lên rồi tiếp theo cài cái cuda down từ link trên mới nhất là cuda v5, rồi down toolkit v3.1 về cài theo thứ tự down nhưng khi cài xong cuda v5 nó lại hạ driver mới về driver cũ ( 320.x xuống 306.x) nhưng đến phần cài toolkit thì nó báo lỗi là The NVIDIA Setup program could not locate any drivers that are compatible with your current hardware. Setup will now exit. Mong sửa dùm lỗi và cài.

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>