DPU là gì?


…Và có những điểm khác biệt nào giữa DPU, CPU và GPU?

DPU là gì?

Bạn hẳn là đã quen thuộc với Bộ Xử lý Trung tâm (Central Processing Unit), hay còn gọi là CPU – một thiết bị linh hoạt và phản ứng nhạy, và đã từng là nhân tố lập trình được duy nhất trong đa số máy tính trong suốt nhiều năm.

Tuy nhiên, thời gian gần đây, ta lại nghe nhiều tới GPU – Bộ Xử lý Đồ họa. Với khả năng mang lại các đồ họa giàu trên thời gian thực, năng lực xử lý song song của GPU đã giúp thiết bị này trở nên lý tưởng cho nhiều tác vụ gia tốc trên máy tính.

Chính vì những lý do trên, CPU và GPU là 2 yếu tố chủ chốt trong các ứng dụng trí tuệ nhân tạo, deep learning và phân tích dữ liệu lớn.

Tuy nhiên, trong thập kỷ vừa qua, điện toán đã không còn bị giới hạn trong các hộp PC và máy chủ, mà thay vào đó là các trung tâm dữ liệu quy mô lớn sử dụng CPU và GPU.

Và những trung tâm dữ liệu này lại liên quan tới một loại bộ xử lý mới, mạnh mẽ hơn. Đó là DPU (Bộ Xử lý Dữ liệu), giờ đây đã trở thành thành viên thứ ba của mô hình điện toán gia tốc trung tâm. “DPU sẽ là một trong 3 trụ cột chính, dẫn tới sự phát triển của công nghệ máy tính,” CEO của NVIDIA, ông Jensen Huang phát biểu.

“CPU thì dùng cho các tác vụ chung, GPU thì dùng cho các tác vụ gia tốc, còn DPU, với khả năng vận chuyển dữ liệu trong các trung tâm dữ liệu, thì có tác dụng xử lý dữ liệu.”

DPU – Bộ Xử lý Dữ liệu

  • Một CPU nhiều nhân, đúng tiêu chuẩn của ngành, với hiệu suất cao và khả năng lập trình được phần mềm.
  • Có các động cơ gia tốc linh hoạt và lập trình được.
  • Có giao diện mạng công suất cao.

DPU khác biệt ở điểm nào?

DPU là một bộ xử lý theo kiểm mới, lập trình được, đồng thời tích hợp 3 nhân tố chủ chốt. Cụ thể, DPU là một con chip (hoặc SOC) có tích hợp hệ thống, trong đó bao gồm:

Một CPU nhiều nhân, đúng tiêu chuẩn của ngành, với hiệu suất cao và khả năng lập trình được phần mềm, được xây dựng dựa trên kiến trúc Arm phổ biến, liên hệ mạnh mẽ với các thành phần SOC khác.

Một giao diện công suất cao với khả năng phân tách, xử lý, và truyển tải dữ liệu một cách hiệu quả ở tốc độ điều biến (tốc độ mạng còn lại) tới các GPU và CPU.

Nhiều động cơ gia tốc linh hoạt và lập trình được, có khả năng offload và cải thiện ứng dụng AI và Machine Learning, đồng thời đảm bảo bảo mật, viễn thông, và bộ nhớ thiết bị, cùng với rất nhiều tính năng khác.

Tất cả các tính năng này của DPU đều vô cùng quan trọng trong việc tạo nên các máy chủ độc lập, bare-metal, và cloud-native – những khái niệm định nghĩa nên thế hệ tiếp theo của công nghệ điện toán đám mây.

DPU: Tích hợp trong SmartNICs

DPU có thể được dùng như một bộ xử lý đính riêng biệt, song phổ biến hơn cả, là được tích hợp vào SmartNIC, một bộ điều khiển giao diện mạng, cũng là một nhân tố chủ chốt trong các máy chủ của tương lai.

Nhiều thiết bị khác tuy tự xưng là DPU, lại thiếu đi một hoặc nhiều trong 3 năng lực chủ chốt, tạo thành một DPU đúng nghĩa.

DPU có thể được dùng như một bộ xử lý đính riêng biệt, song phổ biến hơn cả, là được tích hợp vào SmartNIC, một bộ điều khiển giao diện mạng, cũng là một nhân tố chủ chốt trong các máy chủ của tương lai.
DPU có thể được dùng như một bộ xử lý đính riêng biệt, song phổ biến hơn cả, là được tích hợp vào SmartNIC, một bộ điều khiển giao diện mạng, cũng là một nhân tố chủ chốt trong các máy chủ của tương lai.

Cụ thể, một số hãng sản xuất sử dụng các bộ xứ lý độc quyền, thiếu đi hạ tầng phát triển và ứng dụng trực thuộc hệ sinh thái Arm CPU.

Trong khi đó, một số thiết bị có-vẻ-như-là-DPU khác, lại chỉ tập trung vào CPU đính kèm để xử lý data path, mà bỏ qua các yếu tố còn lại.

DPU: Tập trung cho việc xử lý dữ liệu

Điều này không hề mang tính cạnh tranh hay quy mô lớn, bởi lẽ việc đánh bại được x86 CPU truyền thống chỉ bằng brute force về cơ bản là bất khả thi. Ngoài ra, nếu khả năng xử lý lên tới 100 Gigabit/giây là đã đủ để đánh bại x86, thì tại sao ta lại phải chú trọng vào một CPU đính kèm?

Và quả nhiên là như vậy, giao diện mạng là đã đủ mạnh và linh hoạt để xử lý mọi tác vụ xử lý data path trên mạng. Do đó, CPU đính kèm chỉ nên tập trung vào việc kiểm soát tiến trình hướng và xử lý ngoại lệ, chứ không nên được sử dụng cho bất cứ tác vụ nào khác.

Các động cơ gia tốc data path mạng cần phải có ít nhất 10 năng lực sau:

  • Phân tách, liên hệ, và điều chỉnh gói dữ liệu để thực hiện open virtual switch (OVS).
  • Gia tốc chuyển dữ liệu RDMA cho Zero Touch RoCE.
  • Gia tốc trực tiếp GPU-Direct giúp bỏ qua CPU, thay vào đó chuyền dữ liệu mạng trực tiếp tới GPU (từ bộ nhớ hoặc từ các GPU khác).
  • Gia tốc TCP bao gồm RSS, LRO, checksum…
  • Ảo hóa mạng cho các overlay VXLAN và Geneve overlays, cũng như offload VTEP.
  • Gia tốc Traffic shaping (giảm tốc độ truyền các gói tin), giúp cho phép stream đa phương tiện, tích hợp các mạng lưới phân phối nội dung, cũng như hỗ trợ video 4K/8k mới qua IP (RiverMax cho ST 2110).
  • Gia tốc Precision timing (thời gian chính xác) cho telco Cloud RAN, ví dụ như 5T cho các tác vụ 5G.
  • Gia tốc Crypto (mã hóa) cho IPSEC và TLS inline, giúp duy trì hoạt động song song với các gia tốc khác.
  • Hỗ trợ ảo hóa cho SR-IOV, VirtIO, và ảo hóa song song
  • Secure Isolation (Bảo mật Tách biệt): root of trust, secure boot, cập nhật firmware bảo mật, và các bộ chứa xác thực cùng quản lý vòng đời ứng dụng.

Phía trên là 10 năng lực phần cứng cần phải có trong một DPU.

Còn DPU chính là thiết bị trong ảnh dưới đây:

BlueField-2 DPU
BlueField-2 DPU

Có thiết bị giống như DPU, song lại chỉ tập trung vào 1 hay 2 tính năng nêu trên.

Trong khi đó, một số “DPU” tệ nhất, thì lại cố offload datapath bằng các bộ xử lý độc quyền. Những DPU này chỉ có thể dùng làm mẫu mô hình, chứ hoàn toàn không khả thi, bởi lẽ các trung tâm dữ liệu có quy mô, phạm vi, và chiều rộng vượt ngoài khả năng của chúng.

Theo NVIDIAtechinsight

Thank you so much

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s