tin tức EPYC "Milan" 7003: AMD mang đỉnh cao mới đến thế giới máy chủ

cải thiện thi hành thế nào đi nữa cũng chỉ có thể giải mã 4 lệnh trên 1 xung nhịp. SMT của AMD vốn đã quá tốt rồi, đa nhân khó có thể cải nhiện nếu ko tăng số lệnh giải mã hơn.
Macro OPs có thể gồm nhiều chỉ lệnh. Mỗi Intructions x86 có thể từ 1 byte đến 15 byte nên có thể ghép nhiều chỉ lệnh lại để issue 1 lần. Nếu tăng fetch lên, có thể không lấy data kịp mà nhiều data quá có thể lại ko execute kịp, mà tăng L1/Opcache thì tốn kém, cần nhiều time hơn để tăng độ rộng fetch và execute. AMD đã mấp mé việc làm kiến trúc "wider" với zen 4 rồi. Chỉ từ 4 -> 5 fetch, và 6-> 8 execute nếu balance được mọi thứ thì +20% IPC với FrontEnd và Execute mới liền.
 
TDP tăng một chút nữa chứ ko giảm
cIO mới ăn nhiều điện hơn dự kiến. Không biết AMD có chỉnh ở các bios tiếp theo không hay là nó là vậy luôn. Core ăn được tối đa có 121W cho 64 nhân. Tính ra nhân Zen 3 cực kì tiết kiệm rồi, chỉ có IO với Memory Interface, xGMI2, PCIe 4 lại ăn quá nhiều.

122526.png
 
Last edited:
Đúng là hơi thất vọng khoản này của Zen3, đúng ra IPC cao hơn 19%, xung boost SingleT/nT cũng cao hơn mà hiệu năng chỉ vượt trội ở SingleT. Scale multicores của Zen3 so với Zen2 đúng chán luôn.
So với bên intel thì vẫn còn tốt cmn chán.
tjRRqf6.gif
SEUf3Xv.gif
 
Chắc có đấy nhưng còn gangbang 8 con ccd nữa nên ko thể yếu được
Con cIO này giống 4 con cIO của Ryzen ghép lại. Nên ăn điện y chang cIO trên Ryzen.... Latency cũng ra 4 vùng khác nhau.

Zen 4 chắc phải làm sao chứ thế này mệt mỏi à. Inter xGMI2 thì latency thấp. Qua xGMI khác thì latency lên liền.
Bounce-7763.png


Chắc không cần mai fen. Baayh xu hướng là accelerated chứ có phải là pure cpu đâu
Phung phí power cho IO trong khi có thể tiếp kiệm để đẩy xung của CPU? Còn Accelerator cũng có phải cắm full được PCIe lanes đâu?
 
Macro OPs có thể gồm nhiều chỉ lệnh. Mỗi Intructions x86 có thể từ 1 byte đến 15 byte nên có thể ghép nhiều chỉ lệnh lại để issue 1 lần. Nếu tăng fetch lên, có thể không lấy data kịp mà nhiều data quá có thể lại ko execute kịp, mà tăng L1/Opcache thì tốn kém, cần nhiều time hơn để tăng độ rộng fetch và execute. AMD đã mấp mé việc làm kiến trúc "wider" với zen 4 rồi. Chỉ từ 4 -> 5 fetch, và 6-> 8 execute nếu balance được mọi thứ thì +20% IPC với FrontEnd và Execute mới liền.

Bác đang nói đến MacroOps của Intel hay AMD vậy?
MacroOps theo định nghĩa của Intel thì chỉ đơn giản là một x86 instruction. Còn của AMD là một định dạng internal trong CPU mà nội dung phức tạp hơn microOps, nhưng kích thước vẫn cố định chứ không phải 1 đến 15 byte.
Mà kể cả có 15 byte thì không phải muốn ghép như nào thì ghép tùy ý. Nhiều khi dài quá thì lại phải decode bằng microcode. Tốt nhất thì vẫn nên tăng fetch nhưng giờ đang khó, đây là điểm yếu của x86 rồi.

Sent from Xiaomi Redmi 5A using vozFApp
 
Bác đang nói đến MacroOps của Intel hay AMD vậy?
MacroOps theo định nghĩa của Intel thì chỉ đơn giản là một x86 instruction. Còn của AMD là một định dạng internal trong CPU mà nội dung phức tạp hơn microOps, nhưng kích thước vẫn cố định chứ không phải 1 đến 15 byte.
Mà kể cả có 15 byte thì không phải muốn ghép như nào thì ghép tùy ý. Nhiều khi dài quá thì lại phải decode bằng microcode. Tốt nhất thì vẫn nên tăng fetch nhưng giờ đang khó, đây là điểm yếu của x86 rồi.

Sent from Xiaomi Redmi 5A using vozFApp
vớ vỉn, macroOps hay micro ops đều là các lệnh đã được giải mã gửi đến bộ lập lịch tiền xử lý. Intel hay AMD đều có cách giải mã x86 riêng mỗi thằng nên định nghĩa thế nào tuỳ bọn họ. Còn fetch dữ liệu thì hiện tại tối đa có 32 byte lệnh trên 1 chu kì mà thôi. Tuỳ độ dài của các lệnh mà trong 32 byte đó bao gồm bao nhiêu lệnh x86, nếu 32 byte chứa 2 lệnh 15 byte thì chỉ có thể giải mã tối đa 2 lệnh mà thôi. Còn chuyện decode bằng microcode hay ko là do các hãng ưu tiên lệnh nào cần giải mã nhanh, lệnh nào ít dùng thì giải mã bằng microcode chả liên quan đến độ phức tạp của lệnh đâu.
Hiện tại Zen giải mã tối đa 4 lệnh, nếu muốn tăng lên 6 lệnh khả năng fetch data lên tận 48 byte, opcache cũng phân phối đến 12 lệnh trên 1 xung nhịp. Bộ lập lịch có thể phân phối 9 lệnh xử lý đến các đơn vị thực thi, gấp 1.5 lần so với Zen cũ. Có lẽ AMD sẽ phải mở rộng thêm 2 đơn vị xử lý số nguyên nữa thành 10. Tối ưu hiệu năng tăng thêm khi xử lý đa nhân có thể lên tới 50%, tuy nhiên hiệu năng đơn luồng chắc ko nhiều lắm.
 
Bác đang nói đến MacroOps của Intel hay AMD vậy?
MacroOps theo định nghĩa của Intel thì chỉ đơn giản là một x86 instruction. Còn của AMD là một định dạng internal trong CPU mà nội dung phức tạp hơn microOps, nhưng kích thước vẫn cố định chứ không phải 1 đến 15 byte.
Mà kể cả có 15 byte thì không phải muốn ghép như nào thì ghép tùy ý. Nhiều khi dài quá thì lại phải decode bằng microcode. Tốt nhất thì vẫn nên tăng fetch nhưng giờ đang khó, đây là điểm yếu của x86 rồi.

Sent from Xiaomi Redmi 5A using vozFApp
'MacroOps' (made up of one or two 'micro-ops'). Dễ hiểu nhé.
 
vớ vỉn, macroOps hay micro ops đều là các lệnh đã được giải mã gửi đến bộ lập lịch tiền xử lý. Intel hay AMD đều có cách giải mã x86 riêng mỗi thằng nên định nghĩa thế nào tuỳ bọn họ. Còn fetch dữ liệu thì hiện tại tối đa có 32 byte lệnh trên 1 chu kì mà thôi. Tuỳ độ dài của các lệnh mà trong 32 byte đó bao gồm bao nhiêu lệnh x86, nếu 32 byte chứa 2 lệnh 15 byte thì chỉ có thể giải mã tối đa 2 lệnh mà thôi. Còn chuyện decode bằng microcode hay ko là do các hãng ưu tiên lệnh nào cần giải mã nhanh, lệnh nào ít dùng thì giải mã bằng microcode chả liên quan đến độ phức tạp của lệnh đâu.
Hiện tại Zen giải mã tối đa 4 lệnh, nếu muốn tăng lên 6 lệnh khả năng fetch data lên tận 48 byte, opcache cũng phân phối đến 12 lệnh trên 1 xung nhịp. Bộ lập lịch có thể phân phối 9 lệnh xử lý đến các đơn vị thực thi, gấp 1.5 lần so với Zen cũ. Có lẽ AMD sẽ phải mở rộng thêm 2 đơn vị xử lý số nguyên nữa thành 10. Tối ưu hiệu năng tăng thêm khi xử lý đa nhân có thể lên tới 50%, tuy nhiên hiệu năng đơn luồng chắc ko nhiều lắm.

Trong tài liệu của intel thì lệnh đã giải mã luôn được gọi là micro ops. Còn lệnh x86 gọi là macro ops.
Chỉ có AMD mới chia làm 2 loại micro/macro.

1615888433728.png
 

Gigabyte giới thiệu máy chủ mới với bộ xử lý AMD EPYC 7003​

Kinhtedothi - Gigabyte Technology đã giới thiệu hơn 40 máy chủ và bo mạch mới hỗ trợ cho bộ vi xử lý AMD EPYC 7003 Series mới dành cho các trung tâm dữ liệu, đám mây và ảo hóa.

Gigabyte%20gi%E1%BB%9Bi%20thi%E1%BB%87u%20m%C3%A1y%20ch%E1%BB%A7%20m%E1%BB%9Bi%20v%E1%BB%9Bi%20b%E1%BB%99%20x%E1%BB%AD%20l%C3%BD%20AMD%20EPYC%207003.jpg

Gigabyte giới thiệu máy chủ mới với bộ xử lý AMD EPYC 7003

AMD đã công bố dòng CPU AMD EPYC 7003 mới bao gồm AMD EPYC 7763. Bộ vi xử lý dòng EPYC 7003 mới giúp cho việc tính toàn hiệu suất cao HPC, đám mây và khách hàng doanh nghiệp làm được nhiều việc hơn, nhanh hơn. Chúng cung cấp hiệu suất tốt nhất của bất kỳ CPU máy chủ nào với số lệnh nhiều hơn tới 19% trên mỗi xung nhịp.

Thiết kế dựa trên tiến trình 7nm, bộ vi xử lý AMD EPYC 7002 và 7003 Series hỗ trợ lên đến 64 lõi và 128 luồng. Chúng cũng hỗ trợ bộ nhớ DDR4 lên đến 4TB cho mỗi khe cắm và lên đến 3200MHz DDR4. Đối với kết nối PCIe 4.0 nhanh giữa CPU và ổ đĩa hoặc bộ tăng tốc, 128-160 làn PCIe có sẵn.

Sự ra đời của AMD EPYC thế hệ thứ 3 sẽ giúp cung cấp CPU cho các máy chủ của các hãng sản xuất trên thế giới. Nhiều nhà sản xuất phần cứng như ASRock, ASUS, Cisco, Dell, Foxconn, Gigabyte, HPE, MSI, Lenovo và Tyan cũng đang phát hành phần cứng máy chủ để hỗ trợ bộ vi xử lý mới này của AMD. Các nhà cung cấp đám mây lớn khác như: Amazon Web Services, Microsoft Azure và Google Cloud đã cung cấp các phiên bản có sẵn với bộ xử lý EPYC 7003.

Gigabyte cũng vừa giới thiệu những máy chủ mới của mình có hỗ trợ AMD EPYC 7003 mới này. GIGABYTE đã được thử nghiệm máy chủ mới và có thể sử dụng bộ vi xử lý AMD EPYC 7003 Series.

Các máy chủ của Gigabyte mới nhất đã được thử nghiệm và sẵn sàng cho bộ vi xử lý EPYC mới nhất của AMD. Một loạt các dòng máy chủ R-series, H-series, G-series, S-series và M-series của Gigabyte cũng sẽ được hỗ trợ để nhận các CPU mới này.

Ngoài ra, Gigabyte cũng cung cấp bảng điều khiển quản lý Gigabyte (GMC) để quản lý máy chủ BMC thông qua trình duyệt web. GMC cũng đã có sẵn để tải xuống để cho phép theo dõi và quản lý.

http://kinhtedothi.vn/gigabyte-gioi-thieu-may-chu-moi-voi-bo-xu-ly-amd-epyc-7003-413015.html
 
Last edited:
Trong tài liệu của intel thì lệnh đã giải mã luôn được gọi là micro ops. Còn lệnh x86 gọi là macro ops.
Chỉ có AMD mới chia làm 2 loại micro/macro.

View attachment 449212

Mỗi kiến trúc 1 khác. Kiến trúc AMD cũng đã từng phải đưa ra Micro OPs xuống. Nhưng như thế có những lúc ko dùng hết ports dẫn đến hiệu năng bị hụt. Mới có chuyện MacroOps đưa xuống .
 
Back
Top