Architektura Ampere w szczegółach

Za nami premiera pierwszych kart z rodziny RTX3000, bazujących na nowej mikroarchitekturze GPU o kodowej nazwie Ampere. Zbudowane na jej podstawie akceleratory korzystają z nowego procesu wytwórczego 8nm firmy Samsung, który zapewnia znacznie wyższe upakowanie tranzystorów niż to miało miejsce w stosowanym dotychczas 12nm od TSMC. Konkretnie mówimy tu o różnicy rzędu 20 milionów tranzystorów na mm2 – w GA102 upakowanie tranzystorów to 44.6MT/mm2, podczas gdy w TU102 wynosi ono 24.7 MT/mm2. Jak nie trudno się domyślić to właśnie dzięki nowej litografii przygotowane przez Nvidię GPU mają znacznie więcej jednostek wykonawczych, a to z kolei przekłada się na większą wydajność bazujących na nich kart.

Największym z dostępnych obecnie GPU dla klientów detalicznych jest GA102, który trafił zarówno do RTXa 3080 jak i RTXa 3090. Układ ten składa się z 28 miliardów tranzystorów zajmujących powierzchnię 628 mm2. Zbudowano z nich 82 bloki SM z 10496 rdzeniami CUDA, 328 rdzeniami Tensor, 82 rdzeniami RT i 6MB pamięci podręcznej L2. W RTX 3090 użytkownik ma do dyspozycji wszystkie z wymienionych jednostek, natomiast w RTX3080 aktywnych jest jedynie 68 bloków SM.

Nvidia przygotowała też chip GA104, który trafił do słabszego GeForce’a RTX 3070. Składa się on z 17,4-miliarda tranzystorów ułożonych na powierzchni 392mm2, co przekłada się na 46 bloków SM z 5888 procesorami CUDA, 46RT, 184 Tensorami i 4MB pamięci L2.

Najnowsze karty Nvidii otrzymały też bardzo szybką pamięć RAM. W RTX3080 i RTX3090 jest to GDDR6X z interfejsem odpowiednio 320-bit i 384-bit, a w RTX3070 mamy 8GB pamięci GDDR6 z szyną 256-bit. Szczegółową specyfikację znajdziecie w poniższej tabelce.