Mục lục
Card đồ họa NVIDIA GeForce RTX™ 50 Series được trang bị NVIDIA Blackwell và AI, bao gồm GeForce RTX™ 5090, RTX™ 5090 D, RTX™ 5080, RTX™ 5070 Ti và RTX™ 5070 tại CES.
1 Điểm nổi bật:
- Kiến trúc Blackwell đột phá: Dòng RTX 50 Series được xây dựng trên kiến trúc Blackwell hoàn toàn mới, mang đến hiệu suất vượt trội, khả năng AI tiên tiến và đồ họa chân thực.
- Hiệu năng gấp đôi: NVIDIA tuyên bố RTX 5090 và RTX 5080 sẽ nhanh gấp đôi so với thế hệ tiền nhiệm RTX 4090 và RTX 4080.
- DLSS 4 với Tạo Khung Hình Đa Khung: Công nghệ nâng cấp hình ảnh bằng AI DLSS 4 được cải tiến với tính năng Tạo Khung Hình Đa Khung (Multi-Frame Generation), hứa hẹn tăng tốc độ khung hình lên đến 8 lần so với render truyền thống.
- Thiết kế Founders Edition mới: Sử dụng hai quạt tản nhiệt luồng kép, buồng hơi 3D và kết nối PCIe Gen 5 cùng DisplayPort 2.1b, hỗ trợ màn hình 8K 165Hz.
- RTX 50 Series trên Laptop: Dòng card đồ họa RTX 50 Series cũng sẽ sớm xuất hiện trên các mẫu laptop, mang đến hiệu suất chơi game di động mạnh mẽ.\
Dòng card đồ họa RTX 50 Series mới mang đến hiệu năng vượt trội so với dòng RTX 40 Series. Dưới đây là so sánh chi tiết về hiệu năng giữa hai dòng card này:
- RTX 5090 so với RTX 4090: RTX 5090 nhanh hơn gấp đôi so với RTX 4090. NVIDIA đã thử nghiệm RTX 5090 với DLSS 4.0 trên tựa game Cyberpunk 2077 và đạt tốc độ 238 FPS, trong khi RTX 4090 chạy DLSS 3.5 chỉ đạt 106 FPS.
- RTX 5080 so với RTX 4080: RTX 5080 cũng nhanh hơn gấp đôi so với RTX 4080.
- RTX 5070 Ti so với RTX 4070 Ti: RTX 5070 Ti có tốc độ nhanh gấp 2 lần so với RTX 4070 Ti.
- RTX 5070 so với RTX 4070: RTX 5070 cũng nhanh hơn so với RTX 4070. Thậm chí, CEO NVIDIA, Jensen Huang, còn tuyên bố RTX 5070 sẽ mang lại hiệu năng tương đương RTX 4090.
Sự cải thiện hiệu năng đáng kể này một phần đến từ kiến trúc Blackwell mới và công nghệ DLSS 4.0 được nâng cấp. DLSS 4.0 tích hợp Multi Frame Generation, cho phép tạo ra tối đa ba khung hình bổ sung và có thể nhân tốc độ khung hình lên 8 lần so với render truyền thống.
2 Thông tin chi tiết về từng mẫu card:
Hai mẫu card đồ họa RTX 50 series được bán sớm nhất là RTX 5090 và RTX 5080. Cả hai mẫu card này đều được NVIDIA giới thiệu tại sự kiện CES 2025 và sẽ được bán ra vào ngày 30/1/2025, NVIDIA chỉ công bố RTX 5070 sẽ được bán ra vào tháng 2/2025 mà chưa có ngày cụ thể.
Giá và thông số RTX 5090:
- Giá: 1.999 USD
- 21.760 lõi CUDA
- Bộ nhớ GDDR7 32GB
- Băng thông bộ nhớ 1.792GB/giây
- Công suất tiêu thụ điện: 575W
Giá và thông số RTX 5080:
- Giá: 999 USD
- 10.752 lõi CUDA
- Bộ nhớ GDDR7 16GB
- Băng thông bộ nhớ 960GB/giây
- Công suất tiêu thụ điện: 360W
Giá và thông số RTX 5070 Ti:
- Giá: 749 USD
- 8.960 lõi CUDA
- Bộ nhớ GDDR7 16GB
- Băng thông bộ nhớ 896GB/giây
- Công suất tiêu thụ điện: 300W
Giá và thông số RTX 5070:
- Giá: 549 USD
- 6.144 lõi CUDA
- Bộ nhớ GDDR7 12GB
- Băng thông bộ nhớ 672GB/giây
- Công suất tiêu thụ điện: 250W
3 Các công nghệ nổi bật:
- Nhân Tensor thế hệ thứ năm: Tối đa hóa hiệu suất AI với FP4 và DLSS 4.
- Nhân Ray Tracing thế hệ thứ tư: Được thiết kế để dựng hình khối khổng lồ.
- NVIDIA Reflex 2: Giảm độ trễ đầu vào, tăng cường độ phản hồi trong game.
- NVIDIA Studio: Bộ công cụ và công nghệ dành cho nhà sáng tạo, tận dụng sức mạnh của RTX cho các quy trình làm việc sáng tạo được hỗ trợ bởi AI.
- NVIDIA Broadcast: Nâng cấp livestream, trò chuyện thoại và cuộc gọi video với giọng nói và video được cải thiện bởi AI.
- RTX Remix: Cho phép các modder dễ dàng nâng cấp đồ họa của các tựa game cũ bằng ray tracing và DLSS.
Kết luận:
Với những cải tiến về kiến trúc, hiệu năng, công nghệ và thiết kế, dòng card đồ họa RTX 50 Series của NVIDIA được kỳ vọng sẽ “làm mưa làm gió” trên thị trường, mang đến trải nghiệm chơi game và sáng tạo đỉnh cao cho người dùng.
——
Dưới đây là một số điểm nổi bật về các công nghệ đột phá trong kiến trúc Blackwell:
Kiến trúc Blackwell là kiến trúc GPU mới nhất của NVIDIA, được sử dụng cho dòng card đồ họa GeForce RTX 50 Series, dòng card đồ họa này mang đến hiệu năng chơi game và sáng tạo vượt bậc. Kiến trúc này được sản xuất bằng quy trình TSMC 4NP do TSMC thiết kế riêng, chứa 208 tỷ bóng bán dẫn và bao gồm hai khuôn silicon giới hạn bởi lưới, được kết nối bằng liên kết chip-to-chip 10 TB/giây trong một GPU thống nhất duy nhất. Kiến trúc Blackwell kế thừa và phát triển từ các công nghệ NVIDIA tiền nhiệm, đánh dấu bước tiến mới trong lĩnh vực AI tạo sinh với hiệu suất, hiệu quả và khả năng mở rộng chưa từng có.
● Lớp siêu chip AI mới: GPU kiến trúc Blackwell đóng gói 208 tỷ bóng bán dẫn và được sản xuất bằng quy trình TSMC 4NP được xây dựng tùy chỉnh. Tất cả các sản phẩm Blackwell đều có hai khuôn silicon giới hạn bởi lưới được kết nối bằng liên kết chip-to-chip 10 terabyte/giây (TB/giây) trong một GPU thống nhất duy nhất.
● Công cụ Transformer thế hệ thứ hai: sử dụng công nghệ Blackwell Tensor Core tùy chỉnh kết hợp với các cải tiến NVIDIA® TensorRT™-LLM và NeMo™ Framework để tăng tốc suy luận và đào tạo cho các mô hình ngôn ngữ lớn (LLM) và mô hình Hỗn hợp Chuyên gia (MoE). Để tăng cường suy luận của các mô hình MoE, Blackwell Tensor Cores bổ sung các độ chính xác mới, bao gồm các định dạng chia tỷ lệ vi mô mới do cộng đồng xác định, mang lại độ chính xác cao và dễ dàng thay thế cho các độ chính xác lớn hơn. Công cụ Blackwell Transformer sử dụng các kỹ thuật chia tỷ lệ chi tiết được gọi là chia tỷ lệ vi tensor, để tối ưu hóa hiệu suất và độ chính xác cho phép AI dấu phẩy động 4 bit (FP4). Điều này tăng gấp đôi hiệu suất và kích thước của các mô hình thế hệ tiếp theo mà bộ nhớ có thể hỗ trợ trong khi vẫn duy trì độ chính xác cao.
● AI bảo mật: Blackwell bao gồm NVIDIA Confidential Computing, bảo vệ dữ liệu nhạy cảm và mô hình AI khỏi truy cập trái phép bằng bảo mật dựa trên phần cứng mạnh mẽ. Blackwell là GPU đầu tiên trong ngành có khả năng TEE-I/O, đồng thời cung cấp giải pháp tính toán bảo mật hiệu quả nhất với các máy chủ có khả năng TEE-I/O và khả năng bảo vệ nội tuyến qua NVIDIA® NVLink®. Blackwell Confidential Computing mang lại hiệu suất thông lượng gần như giống hệt so với các chế độ không được mã hóa. Giờ đây, các doanh nghiệp có thể bảo mật ngay cả những mô hình lớn nhất một cách hiệu quả, ngoài việc bảo vệ tài sản trí tuệ (IP) của AI và cho phép đào tạo AI bảo mật, suy luận và học tập liên kết.
● NVLink và NVLink Switch: Việc giải phóng toàn bộ tiềm năng của điện toán exascale và các mô hình AI nghìn tỷ tham số phụ thuộc vào nhu cầu giao tiếp nhanh chóng, liền mạch giữa mọi GPU trong một cụm máy chủ. Thế hệ thứ năm của liên kết NVIDIA® NVLink® có thể mở rộng lên tới 576 GPU để giải phóng hiệu suất tăng tốc cho các mô hình AI nghìn tỷ và nhiều nghìn tỷ tham số. Chip NVIDIA NVLink Switch cho phép băng thông GPU 130TB/giây trong một miền NVLink 72-GPU (NVL72) và mang lại hiệu quả băng thông gấp 4 lần với hỗ trợ NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ FP8. Chip NVIDIA NVLink Switch hỗ trợ các cụm vượt ra ngoài một máy chủ duy nhất ở mức kết nối 1.8TB/giây ấn tượng tương tự. Các cụm nhiều máy chủ với NVLink mở rộng quy mô giao tiếp GPU cân bằng với khả năng tính toán được tăng cường, do đó NVL72 có thể hỗ trợ thông lượng GPU gấp 9 lần so với hệ thống tám GPU đơn lẻ.
● Công cụ giải nén: Phân tích dữ liệu và quy trình làm việc cơ sở dữ liệu theo truyền thống dựa vào CPU để tính toán. Khoa học dữ liệu được tăng tốc có thể tăng cường đáng kể hiệu suất của phân tích đầu cuối, tăng tốc tạo giá trị đồng thời giảm chi phí. Cơ sở dữ liệu, bao gồm Apache Spark, đóng vai trò quan trọng trong việc xử lý, xử lý và phân tích khối lượng lớn dữ liệu để phân tích dữ liệu. Công cụ giải nén của Blackwell và khả năng truy cập lượng lớn bộ nhớ trong CPU NVIDIA Grace™ qua liên kết tốc độ cao — băng thông hai chiều 900 gigabyte/giây (GB/giây) — tăng tốc toàn bộ đường dẫn của các truy vấn cơ sở dữ liệu để có hiệu suất cao nhất trong phân tích dữ liệu và khoa học dữ liệu với hỗ trợ cho các định dạng nén mới nhất như LZ4, Snappy và Deflate.
● Công cụ RAS (Độ tin cậy, Khả dụng và Khả năng phục vụ): Blackwell bổ sung khả năng phục hồi thông minh với Công cụ RAS (Độ tin cậy, Khả dụng và Khả năng phục vụ) chuyên dụng để xác định các lỗi tiềm ẩn có thể xảy ra sớm nhằm giảm thiểu thời gian ngừng hoạt động. Khả năng quản lý dự đoán dựa trên AI của NVIDIA liên tục theo dõi hàng nghìn điểm dữ liệu trên phần cứng và phần mềm để có sức khỏe tổng thể nhằm dự đoán và chặn các nguồn gây ra thời gian ngừng hoạt động và kém hiệu quả. Điều này xây dựng khả năng phục hồi thông minh giúp tiết kiệm thời gian, năng lượng và chi phí tính toán. Công cụ RAS của NVIDIA cung cấp thông tin chẩn đoán chuyên sâu có thể xác định các khu vực cần quan tâm và lên kế hoạch bảo trì. Công cụ RAS giảm thời gian quay vòng bằng cách nhanh chóng khoanh vùng nguồn gốc sự cố và giảm thiểu thời gian ngừng hoạt động bằng cách tạo điều kiện khắc phục hiệu quả.
Kiến trúc Blackwell là một bước tiến quan trọng trong công nghệ GPU, mang lại hiệu suất vượt trội, khả năng xử lý AI mạnh mẽ và đồ họa tuyệt đẹp, mở ra kỷ nguyên mới cho AI tạo sinh và điện toán tăng tốc.