vozExpress - trang tin cộng đồng xây dựng và cập nhật bởi cộng đồng thành viên vozForums,
một trong những cộng đồng trực tuyến nói tiếng Việt lớn nhất về chủ đề công nghệ.

![[Wiki] BlueGeneP rack](/wp-content/uploads/2010/05/Wiki-BlueGeneP-rack-600x560.jpg)
1 biểu tượng của mảng điện toán hiệu suất cao (HPC), Silicon Graphics International (SGI), trong 1 buổi phỏng vấn gần đây với tạp chí The Inquirer, cho biết họ không hứng thú lắm với những chiếc card Tesla mới nhất của NVIDIA, mặc dù chúng là những chiếc card cho mục đích HPC mạnh nhất của nhà khổng lồ đồ hoạ hiện nay.
(*) HPC thường được biết đến dưới thuật ngữ siêu điện toán hay siêu máy tính (supercomputing – SC)
Nhưng trước khi đi vào nội dung bài phỏng vấn, chúng ta hãy nói 1 chút về các SC và vấn đề của chúng.
Các SC cũng gần như các datacenter, khác biệt chủ yếu là 1 bên thuần về xử lý dữ liệu, còn bên kia thuần về lưu trữ / truyền tải dữ liệu. Thành phần chính của SC là các bộ xử lý còn datacenter là những thiết bị lưu trữ (như HDD, SSD, băng từ …). Nhưng các thiết bị lưu trữ dữ liệu thường không toả ra nhiều nhiệt và ngốn điện bằng các bộ xử lý. Nói ngắn gọn cho tiện hình dung, CPU trong PC của bạn cần bao nhiêu điện và hệ thống tản nhiệt như thế nào so với chiếc HDD của bạn ?
Nhìn chung các SC là những con quái vật ăn điện và “mồ hôi đổ ra liên tục”. Nếu bạn từng overclock (OC) PC của mình thì hẳn bạn sẽ hình dung được vấn đề nhiệt độ với các server farm này như thế nào. Rất nhanh chóng để hâm nóng toàn bộ bầu không khí xung quanh nhưng thường mất nhiều thời gian hơn để đưa môi trường trở lại ngưỡng nhiệt cũ. Hầu hết các đơn vị thiết kế / vận hành các server farm thường phải tính đến liệu pháp tản nhiệt nước (water cooling) để nhanh chóng giải nhiệt cho hệ thống. Những gì họ làm nhằm đạt được mục đích lượng nhiệt toả ra < lượng nhiệt mất đi (trong cùng 1 khoảng thời gian), tức đảm bảo hệ thống luôn vận hành ổn định.
Vận hành ổn định có thể xem là mục tiêu mang tính sống còn với các đơn vị quản lý server farm. Các nhà đầu tư tốn hàng túi tiền để có 1 hệ thống hoạt động liên tục từ năm này đến năm khác, 24/7. Sẽ ra sao nếu trong 1 phút bất tử, bạn đang thực hiện 1 giao dịch trên mạng thì hệ thống ngưng hoạt động ? Mà thực tế là rất nhiều giao dịch. Nôm na, chúng ta mất 1 núi tiền nhưng để đảm bảo vòng xoay của 10 núi tiền khác …
Khi bạn hiểu được vấn đề, hãy qua câu chuyện của SGI.
Bài này hay đấy! Thích đọc những tin về thể loại này! :) Nhớ “chiều” đọc giả đấy nha! ^^
“Nhưng sẽ tốn nhiều thời gian để chuẩn này thực sự cứng cáp trước các đàn anh x86 và CUDA.”
Có thể cho biết lý do được không? :D
nói nhiều về vấn đề tỏa nhiệt quá, cảm giác như mình đang bị dạy khôn :|
@kiany : 1 cái PC trục trặc vì overheat thì dễ xử lý
Nhưng nguyên 1 server farm có hàng trăm rack thì biết sự cố ở cái nào để khắc phục hở bạn ?
@backhanhchung: tớ là tớ rất thích viết mấy cái về điện toán chuyên dụng, tỉ như các hệ thống điều phối gói tin trong mạng 4 cáp 10 gigabit chạy song song tại các datacenter. Nhưng ít người quan tâm quá. Vào comment thì cũng toàn dạng “nhổ lông trâu”. Điện toán cá nhân với bạn đọc bình thường đã là quá hoành tráng rồi
@replica: những cái dễ hiểu thì nguồn quá nhiều, đọc đâu cũng thấy, tớ thích đọc về những cái khó hiểu để hiểu thêm :x