thảo luận Lộ tin CPU Intel thế hệ 12 hỗ trợ DDR5-4800, PCIe 5.0, tương thích socket LGA1700 và xài tản nhiệt mới

viết C++ mà ko viết luôn AVX2 thì pó tay. Int hay fp đều nhanh vãi hàng luôn.
Phải aligned data. C++17 có malloc new với tham số std::align_val_t để align dữ liệu cho vector AVX chạy. Vì thế mình mới phải sử dụng C++17.

Bạn ấy viết lại tối ưu rồi chạy lại đi chứ nhìn code chẳng buồn test luôn rồi.
 
Mình thì không chuyên lập trình như bạn, chỉ nghiệp dư thôi. Mình biết, code của mình có nhiều thành phần nằm ở L1 và register, sẽ save 1 phần kha khá băng thông. Mình chưa test 5950x, nhưng kết quả test 4350G mình cũng đoán được phần nào, theo kinh nghiệm thôi, đoán con 5950x tầm 240 điểm. Tuy nó là save kha khá băng thông, nhưng vẫn là code transform ma trận, và dung lượng RAM của nó đòi hỏi cũng khá lớn, nên không phải hệ thống nào cũng đáp ứng đủ cho nó sử dụng. Tất nhiên code này không phù hợp để test với nhiều software khác do tính lặp lại của mỗi software là mỗi khác. Nhưng nó lại khá khớp so với những software chuyên ngành bên mình. Do đó, đối với mình, nó luôn là điểm chuẩn mỗi khi mình mua CPU.
Nhìn thấy ma trận rồi. Nên mới nói ko dùng AVX thì khỏi test rồi. :)
 
Bạn chưa test chưa biết được đâu. :LOL:. Giống mình ngày trước vậy á. Code mình đã speedup tới x5 lần khi được optimize lên AVX2
như hồi xưa tui toàn xài function excel, hvlookup vlookup sum if các kiểu loạn cả lên, rối tung rối mù
mấy bà làm tổng hợp còn link 3-4 file loạn cả lên, ko biết đường nào lần
mỗi lần mở lên lại đơ hết cả máy
sau tối ưu lại = power query chạy ngon hơn hẳn cùng trên 1 máy

Nên ghét nhất cái câu “tao làm bao năm có sao đâu” :3
 
Last edited:
Cái này mình test bằng máy ảo 1 luồng. CPU là Ryzen 5 5600X. Bạn code ẩu nên code của bạn không hề tối ưu, bạn không stick thread vào 1 CPU, bạn để thế nó sẽ nhảy thực thi sang core khác. Đây là kết quả sau khi tối ưu lại 1 chút sau 5p sang AVX (tối đa với code của bạn), nếu code lại sang AVX2 còn cao hơn. Vì bạn không stick thread nên mình sẽ chỉ chạy máy ảo và dùng 1 nhân thôi nhé, để nó khỏi nhảy lung tung khiến perf giảm.

Screenshot from 2021-05-17 07-16-40.png
 
Cái này mình test bằng máy ảo 1 luồng. CPU là Ryzen 5 5600X. Bạn code ẩu nên code của bạn không hề tối ưu, bạn không stick thread vào 1 CPU, bạn để thế nó sẽ nhảy thực thi sang core khác. Đây là kết quả sau khi tối ưu lại 1 chút sau 5p sang AVX (tối đa với code của bạn), nếu code lại sang AVX2 còn cao hơn. Vì bạn không stick thread nên mình sẽ chỉ chạy máy ảo và dùng 1 nhân thôi nhé, để nó khỏi nhảy lung tung khiến perf giảm.

View attachment 550336
Intel Xeon Gold 6144, mặc dù nó 8 nhân, nhưng điểm số của nó 400.

nguyên con CPU 8 core 3000$ mà chưa x2 số điểm 1 core của con CPU 300$ qua máy ảo
(400/268 ~149%)
 
Last edited:
Cái này mình test bằng máy ảo 1 luồng. CPU là Ryzen 5 5600X. Bạn code ẩu nên code của bạn không hề tối ưu, bạn không stick thread vào 1 CPU, bạn để thế nó sẽ nhảy thực thi sang core khác. Đây là kết quả sau khi tối ưu lại 1 chút sau 5p sang AVX (tối đa với code của bạn), nếu code lại sang AVX2 còn cao hơn. Vì bạn không stick thread nên mình sẽ chỉ chạy máy ảo và dùng 1 nhân thôi nhé, để nó khỏi nhảy lung tung khiến perf giảm.

View attachment 550336
Bạn phải chạy nhiều nhân chớ, bằng số core CPU. 1 nhân thì dĩ nhiên nó nhanh hơn rồi.
 
Nãy mình có sửa code của bạn @vanthoan affinity 4 luồng + AVX qua máy ảo 4 core + 4GB RAM thì được hơn 800 điểm đấy. Bạn cần học tối ưu mã chứ bạn viết kiểu này performance loss nhiều quá. Tất nhiên là điểm AVX không so trực tiếp với điểm của code ban đầu bạn viết.
 
Nãy mình có sửa code của bạn @vanthoan affinity 4 luồng + AVX qua máy ảo 4 core + 4GB RAM thì được hơn 800 điểm đấy. Bạn cần học tối ưu mã chứ bạn viết kiểu này performance loss nhiều quá. Tất nhiên là điểm AVX không so trực tiếp với điểm của code ban đầu bạn viết.
Cho xin lại cái code, cảm ơn bạn.
 
Back
Top