thảo luận Lộ tin CPU Intel thế hệ 12 hỗ trợ DDR5-4800, PCIe 5.0, tương thích socket LGA1700 và xài tản nhiệt mới

hiepgia · May 16, 2021

Streamroller said:
viết C++ mà ko viết luôn AVX2 thì pó tay. Int hay fp đều nhanh vãi hàng luôn.

Phải aligned data. C++17 có malloc new với tham số std::align_val_t để align dữ liệu cho vector AVX chạy. Vì thế mình mới phải sử dụng C++17.

Bạn ấy viết lại tối ưu rồi chạy lại đi chứ nhìn code chẳng buồn test luôn rồi.

hiepgia · May 16, 2021

vanthoan said:
Mình thì không chuyên lập trình như bạn, chỉ nghiệp dư thôi. Mình biết, code của mình có nhiều thành phần nằm ở L1 và register, sẽ save 1 phần kha khá băng thông. Mình chưa test 5950x, nhưng kết quả test 4350G mình cũng đoán được phần nào, theo kinh nghiệm thôi, đoán con 5950x tầm 240 điểm. Tuy nó là save kha khá băng thông, nhưng vẫn là code transform ma trận, và dung lượng RAM của nó đòi hỏi cũng khá lớn, nên không phải hệ thống nào cũng đáp ứng đủ cho nó sử dụng. Tất nhiên code này không phù hợp để test với nhiều software khác do tính lặp lại của mỗi software là mỗi khác. Nhưng nó lại khá khớp so với những software chuyên ngành bên mình. Do đó, đối với mình, nó luôn là điểm chuẩn mỗi khi mình mua CPU.

Nhìn thấy ma trận rồi. Nên mới nói ko dùng AVX thì khỏi test rồi.

vanthoan · May 16, 2021

hiepgia said:
Nhìn thấy ma trận rồi. Nên mới nói ko dùng AVX thì khỏi test rồi.

Mình thì không nghĩ AVX có thể tăng nhiều điểm đối với trường hợp này, lý do thì mình cũng đã nói rồi :rolleyes:

hiepgia · May 16, 2021

vanthoan said:
Mình thì không nghĩ AVX có thể tăng nhiều điểm đối với trường hợp này, lý do thì mình cũng đã nói rồi

Bạn chưa test chưa biết được đâu. :LOL:

. Giống mình ngày trước vậy á. Code mình đã speedup tới x5 lần khi được optimize lên AVX2

galaxyangelzz · May 16, 2021

hiepgia said:
Bạn chưa test chưa biết được đâu. . Giống mình ngày trước vậy á. Code mình đã speedup tới x5 lần khi được optimize lên AVX2

như hồi xưa tui toàn xài function excel, hvlookup vlookup sum if các kiểu loạn cả lên, rối tung rối mù
mấy bà làm tổng hợp còn link 3-4 file loạn cả lên, ko biết đường nào lần
mỗi lần mở lên lại đơ hết cả máy
sau tối ưu lại = power query chạy ngon hơn hẳn cùng trên 1 máy

Nên ghét nhất cái câu “tao làm bao năm có sao đâu” :3

vanthoan · May 17, 2021

hiepgia said:
Bạn chưa test chưa biết được đâu. . Giống mình ngày trước vậy á. Code mình đã speedup tới x5 lần khi được optimize lên AVX2

Vậy thì bạn test và công bố số điểm hệ thống của bạn đi :byebye:

hiepgia · May 17, 2021

Cái này mình test bằng máy ảo 1 luồng. CPU là Ryzen 5 5600X. Bạn code ẩu nên code của bạn không hề tối ưu, bạn không stick thread vào 1 CPU, bạn để thế nó sẽ nhảy thực thi sang core khác. Đây là kết quả sau khi tối ưu lại 1 chút sau 5p sang AVX (tối đa với code của bạn), nếu code lại sang AVX2 còn cao hơn. Vì bạn không stick thread nên mình sẽ chỉ chạy máy ảo và dùng 1 nhân thôi nhé, để nó khỏi nhảy lung tung khiến perf giảm.

galaxyangelzz · May 17, 2021

hiepgia said:
Cái này mình test bằng máy ảo 1 luồng. CPU là Ryzen 5 5600X. Bạn code ẩu nên code của bạn không hề tối ưu, bạn không stick thread vào 1 CPU, bạn để thế nó sẽ nhảy thực thi sang core khác. Đây là kết quả sau khi tối ưu lại 1 chút sau 5p sang AVX (tối đa với code của bạn), nếu code lại sang AVX2 còn cao hơn. Vì bạn không stick thread nên mình sẽ chỉ chạy máy ảo và dùng 1 nhân thôi nhé, để nó khỏi nhảy lung tung khiến perf giảm.

View attachment 550336

Intel Xeon Gold 6144, mặc dù nó 8 nhân, nhưng điểm số của nó 400.

nguyên con CPU 8 core 3000$ mà chưa x2 số điểm 1 core của con CPU 300$ qua máy ảo
(400/268 ~149%)

vanthoan · May 17, 2021

hiepgia said:
Cái này mình test bằng máy ảo 1 luồng. CPU là Ryzen 5 5600X. Bạn code ẩu nên code của bạn không hề tối ưu, bạn không stick thread vào 1 CPU, bạn để thế nó sẽ nhảy thực thi sang core khác. Đây là kết quả sau khi tối ưu lại 1 chút sau 5p sang AVX (tối đa với code của bạn), nếu code lại sang AVX2 còn cao hơn. Vì bạn không stick thread nên mình sẽ chỉ chạy máy ảo và dùng 1 nhân thôi nhé, để nó khỏi nhảy lung tung khiến perf giảm.

View attachment 550336

Bạn phải chạy nhiều nhân chớ, bằng số core CPU. 1 nhân thì dĩ nhiên nó nhanh hơn rồi.

vanthoan · May 17, 2021

Có hiểu chuyện gì không hả con gà @barbatos_mikazuki

vanthoan · May 17, 2021

galaxyangelzz said:
nguyên con CPU 8 core 3000$ mà chưa x2 số điểm 1 core của con CPU 300$ qua máy ảo
(400/268 ~149%)

Tay nhanh hơn não rồi, không thấy người ta đổi code qua AVX hả?

galaxyangelzz · May 17, 2021

vanthoan said:
Tay nhanh hơn não rồi, không thấy người ta đổi code qua AVX hả?

ồ
vậy là Intel Xeon Gold 6144 ko có AVX để chạy rồi

vanthoan · May 17, 2021

galaxyangelzz said:
ồ
vậy là Intel Xeon Gold 6144 ko có AVX để chạy rồi

Cả cuộc đời chưa đặt tay gõ code bao giờ mới phát biểu như vậy.

barbatos_mikazuki · May 17, 2021

vanthoan said:
Có hiểu chuyện gì không hả con gà @barbatos_mikazuki

sao thế

))
có vấn đề gì về ăn gạch à

))

vanthoan · May 17, 2021

barbatos_mikazuki said:
sao thế ))
có vấn đề gì về ăn gạch à ))

Đi chỗ khác chơi. Chỗ này dành cho các cao thủ làm việc.

stores · May 17, 2021

Hẳn là cao thủ. :beat_plaster:

barbatos_mikazuki · May 17, 2021

vanthoan said:
Đi chỗ khác chơi. Chỗ này dành cho các cao thủ làm việc.

thế à

))
code tối ưu ngu như bò mà tự tin thế

))
thanh niên so sánh ngu như đám trước đây so 1800X với 1900X ấy :feel_good:

vanthoan · May 17, 2021

barbatos_mikazuki said:
thế à ))
code tối ưu ngu như bò mà tự tin thế ))
thanh niên so sánh ngu như đám trước đây so 1800X với 1900X ấy

Lăn tăn thì đem code đó ra phân tích xem, không phân tích được thì biến.

hiepgia · May 17, 2021

Nãy mình có sửa code của bạn @vanthoan affinity 4 luồng + AVX qua máy ảo 4 core + 4GB RAM thì được hơn 800 điểm đấy. Bạn cần học tối ưu mã chứ bạn viết kiểu này performance loss nhiều quá. Tất nhiên là điểm AVX không so trực tiếp với điểm của code ban đầu bạn viết.

vanthoan · May 17, 2021

hiepgia said:
Nãy mình có sửa code của bạn @vanthoan affinity 4 luồng + AVX qua máy ảo 4 core + 4GB RAM thì được hơn 800 điểm đấy. Bạn cần học tối ưu mã chứ bạn viết kiểu này performance loss nhiều quá. Tất nhiên là điểm AVX không so trực tiếp với điểm của code ban đầu bạn viết.

Cho xin lại cái code, cảm ơn bạn.

thảo luận Lộ tin CPU Intel thế hệ 12 hỗ trợ DDR5-4800, PCIe 5.0, tương thích socket LGA1700 và xài tản nhiệt mới

Đã tốn tiền

Đã tốn tiền

Member

Đã tốn tiền

Đã tốn tiền

Member

Đã tốn tiền

Đã tốn tiền

Member

Member

Member

Đã tốn tiền

Member

Member

Member

Senior Member

Member

Member

Đã tốn tiền

Member

Similar threads

Share this page