Datacenter với Chip Nvidia Blackwell bị trì hoãn do lo ngại quá nhiệt

bởi Phát Lâm

Một số khách hàng doanh nghiệp lớn của Nvidia hoãn đơn đặt hàng chip Blackwell do quá nhiệt và lỗi kết nối

Một số khách hàng doanh nghiệp lớn của Nvidia được cho là đang trì hoãn các đơn đặt hàng giá đỡ chip Blackwell mới nhất do gặp vấn đề quá nhiệt và lỗi kết nối chip. Thông tin này đã gây chấn động trong ngành công nghệ và thị trường tài chính, khiến cổ phiếu Nvidia giảm mạnh 4% trong phiên giao dịch đầu ngày.

Theo The Information, các giá đỡ Blackwell GB200 – một thành phần quan trọng trong trung tâm dữ liệu – đã gặp phải vấn đề trong quá trình triển khai ban đầu. Nguyên nhân được cho là do mức tiêu thụ điện năng chưa từng có của những GPU tiên tiến này, với mỗi giá đỡ tiêu thụ từ 120 đến 132 kW. Điều này đã đẩy hệ thống làm mát truyền thống đến giới hạn.

Hơn nữa, các lô hàng Blackwell ban đầu đã bộc lộ lỗi kết nối giữa các chip, làm cản trở việc phân phối nhiệt hiệu quả và tạo ra những điểm nóng nguy hiểm. Thiết kế module chip phức tạp, tích hợp hai GPU lớn trên cùng một gói, càng làm tăng thách thức trong việc quản lý nhiệt độ.

Khi các cấu hình triển khai ngày càng lớn, với tối đa 72 chip Blackwell trên mỗi giá đỡ, những bất cập về nhiệt lượng này càng trở nên nghiêm trọng. Các thiết kế giá đỡ hiện tại đã không đủ khả năng xử lý lượng nhiệt cực lớn, buộc Nvidia phải yêu cầu các nhà cung cấp thực hiện nhiều thay đổi thiết kế. Giải quyết vấn đề này có thể cần đến sự tối ưu hóa chip, phát triển các giải pháp làm mát tiên tiến hơn và tái thiết kế toàn diện cơ sở hạ tầng giá đỡ máy chủ.

Datacenter Với Chip Nvidia Blackwell Bị Trì Hoãn Do Lo Ngại Quá Nhiệt

Một số khách hàng lớn nhất của Nvidia, bao gồm Microsoft, Amazon Web Services, Google và Meta Platforms, đã giảm đáng kể đơn đặt hàng giá đỡ Blackwell GB200. Những công ty hyperscaler này trước đó đã đặt hàng trị giá 10 tỷ USD hoặc hơn cho công nghệ mới, và việc giảm đơn hàng này có thể gây ra những tác động lớn.

Ví dụ, Microsoft ban đầu dự định triển khai giá đỡ GB200 với ít nhất 50.000 chip Blackwell tại một cơ sở ở Phoenix. Tuy nhiên, do xuất hiện các vấn đề trì hoãn, đối tác quan trọng của Microsoft là OpenAI đã yêu cầu sử dụng chip thế hệ trước ‘Hopper’ của Nvidia thay thế.

Dù gặp những trở ngại này, tác động cuối cùng đến doanh số của Nvidia vẫn chưa rõ ràng, vì các khách hàng tiềm năng khác có thể quan tâm đến giá đỡ GB200 ngay cả khi các vấn đề kỹ thuật đã được báo cáo.

Trong quá trình thử nghiệm ban đầu với một máy chủ hàng đầu sử dụng hệ thống làm mát bằng chất lỏng chứa 72 chip mới, CEO của Nvidia, Jensen Huang, đã phủ nhận các báo cáo truyền thông về vấn đề quá nhiệt. Tháng 11 vừa qua, Huang cũng khẳng định Nvidia đang trên đà vượt mục tiêu doanh thu nhiều tỷ USD từ chip Blackwell trong quý tài chính thứ tư.

Cả Nvidia và Amazon đều từ chối bình luận về tình hình, trong khi Microsoft, Google và Meta chưa đưa ra phản hồi nào trước các yêu cầu liên quan.

0 0 đánh giá
Đánh giá bài viết

Bài viết liên quan

Theo dõi
Thông báo của
guest

0 Góp ý
Cũ nhất
Mới nhất Được bỏ phiếu nhiều nhất
Phản hồi nội tuyến
Xem tất cả bình luận
0
Rất thích suy nghĩ của bạn, hãy bình luận.x