Architektura Ampere w szczegółach

Za nami premiera pierwszych kart z rodziny RTX3000, bazujących na nowej mikroarchitekturze GPU o kodowej nazwie Ampere. Zbudowane na jej podstawie akceleratory korzystają z nowego procesu wytwórczego 8nm firmy Samsung, który zapewnia znacznie wyższe upakowanie tranzystorów niż to miało miejsce w stosowanym dotychczas 12nm od TSMC. Konkretnie mówimy tu o różnicy rzędu 20 milionów tranzystorów na mm2 – w GA102 upakowanie tranzystorów to 44.6MT/mm2, podczas gdy w TU102 wynosi ono 24.7 MT/mm2. Jak nie trudno się domyślić to właśnie dzięki nowej litografii przygotowane przez Nvidię GPU mają znacznie więcej jednostek wykonawczych, a to z kolei przekłada się na większą wydajność bazujących na nich kart.

Największym z dostępnych obecnie GPU dla klientów detalicznych jest GA102, który trafił zarówno do RTXa 3080 jak i RTXa 3090. Układ ten składa się z 28 miliardów tranzystorów zajmujących powierzchnię 628 mm2. Zbudowano z nich 82 bloki SM z 10496 rdzeniami CUDA, 328 rdzeniami Tensor, 82 rdzeniami RT i 6MB pamięci podręcznej L2. W RTX 3090 użytkownik ma do dyspozycji wszystkie z wymienionych jednostek, natomiast w RTX3080 aktywnych jest jedynie 68 bloków SM.

Nvidia przygotowała też chip GA104, który trafił do słabszego GeForce’a RTX 3070. Składa się on z 17,4-miliarda tranzystorów ułożonych na powierzchni 392mm2, co przekłada się na 46 bloków SM z 5888 procesorami CUDA, 46RT, 184 Tensorami i 4MB pamięci L2.

Najnowsze karty Nvidii otrzymały też bardzo szybką pamięć RAM. W RTX3080 i RTX3090 jest to GDDR6X z interfejsem odpowiednio 320-bit i 384-bit, a w RTX3070 mamy 8GB pamięci GDDR6 z szyną 256-bit. Szczegółową specyfikację znajdziecie w poniższej tabelce.

    
Architektura Ampere w szczegółach
Autor: Wedelek | źródło: VideoCardZ | 05:59     
(2) [Komentarzy (2)]
Za nami premiera pierwszych kart z rodziny RTX3000, bazujących na nowej mikroarchitekturze GPU o kodowej nazwie Ampere. Zbudowane na jej podstawie akceleratory korzystają z nowego procesu wytwórczego 8nm firmy Samsung, który zapewnia znacznie wyższe upakowanie tranzystorów niż to miało miejsce w stosowanym dotychczas 12nm od TSMC. Konkretnie mówimy tu o różnicy rzędu 20 milionów tranzystorów na mm2 – w GA102 upakowanie tranzystorów to 44.6MT/mm2, podczas gdy w TU102 wynosi ono 24.7 MT/mm2. Jak nie trudno się domyślić to właśnie dzięki nowej litografii przygotowane przez Nvidię GPU mają znacznie więcej jednostek wykonawczych, a to z kolei przekłada się na większą wydajność bazujących na nich kart.

Największym z dostępnych obecnie GPU dla klientów detalicznych jest GA102, który trafił zarówno do RTXa 3080 jak i RTXa 3090. Układ ten składa się z 28 miliardów tranzystorów zajmujących powierzchnię 628 mm2. Zbudowano z nich 82 bloki SM z 10496 rdzeniami CUDA, 328 rdzeniami Tensor, 82 rdzeniami RT i 6MB pamięci podręcznej L2. W RTX 3090 użytkownik ma do dyspozycji wszystkie z wymienionych jednostek, natomiast w RTX3080 aktywnych jest jedynie 68 bloków SM.

Nvidia przygotowała też chip GA104, który trafił do słabszego GeForce’a RTX 3070. Składa się on z 17,4-miliarda tranzystorów ułożonych na powierzchni 392mm2, co przekłada się na 46 bloków SM z 5888 procesorami CUDA, 46RT, 184 Tensorami i 4MB pamięci L2.

Najnowsze karty Nvidii otrzymały też bardzo szybką pamięć RAM. W RTX3080 i RTX3090 jest to GDDR6X z interfejsem odpowiednio 320-bit i 384-bit, a w RTX3070 mamy 8GB pamięci GDDR6 z szyną 256-bit. Szczegółową specyfikację znajdziecie w poniższej tabelce.

 

Wersje Founders Edition dwóch TOPowych GeForce’ów dostały płytkę PCB o bardzo nietypowym kształcie. Została ona zaprojektowana w taki sposób, by zastosowany układ chłodzenia mógł odprowadzić ciepło w sposób maksymalnie skuteczny. A że jest co odprowadzać, to widać już po sekcji zasilania, która jest 20-fazowa i składa się między innymi z układów DrMOS i kondensatorów tantalowych, które muszą obsłużyć prąd przesyłany zarówno przez złącze PCI-Express 4.0, jak i nową, 12-pinową wtyczkę zasilającą, która teoretycznie może dostarczyć karcie nawet 300W energii.

Widoczna poniżej płytka PCB pochodzi z RTXa 3080, co można poznać po dwóch wolnych miejscach na kości pamięci i braku złącza NV-Link do łączenia kliku kart w kombajn graficzny. W RTXie 3090 mamy zatem nie 10, a 12 kości. Te dodatkowo mają wyższą pojemność, oferując łącznie 24GB RAMu zamiast 10GB jak ma to miejsce w RTX 3080.

Pisząc o kartach z rodziny Ampere nie sposób nie wspomnieć o kilku mniejszych zmianach, które na tle przytoczonych na wstępie liczb mogą wyglądać dość blado. Mowa przede wszystkim o zmodyfikowanej budowie rdzeni RT, które potrafią teraz przetwarzać dane w oparciu o model BVH (Bounding volume hierarchy), zamiast o uproszczoną funkcję SIMD. Wykonywanie zapytań w sposób hierarchiczny ma zwiększyć precyzję wyniku i znacząco przyspieszyć niektóre operacje na obiektach, w tym między innymi śledzenie promieni światła. Możliwe jest między innymi precyzyjne określenie trajektorii promienia światła po jego odbiciu od danej powierzchni. Na tym możliwości rdzeni RT się oczywiście nie kończą. Duże zmiany poczyniono też w funkcji odpowiedzialnej za rozmycie poruszającego się obiektu. Aby tworzona animacja była jak najlepsza opracowano nową metodę bazującą na funkcji interpolacji pozycji trójkątów składających się na siatkę geometryczną obiektu w czasie. Uwzględniając w obliczeniach elementy wspólne (przecinające się) tego samego obiektu w sąsiadujących przedziałach czasu otrzymujemy na wyjściu wynikowy obiekt, którego jakość ma być zdaniem Nvidii znacznie wyższa niż to, co obserwujemy obecnie.

Usprawnień doczekały się również rdzenie Tensor, które mają oferować nawet dwukrotnie wyższą wydajność w obliczeniach związanych z maszynowym uczeniem. W grach przełoży się to na działanie technologii DLSS, która wykorzystuje te jednostki w procesach związanych z tzw. upscallingiem i inteligentnym próbkowaniem.

Na koniec trzeba też wspomnieć o wyjściu wideo, które wspiera standard HDMI 2.1. W praktyce oznacza to obsługę monitorów 8K za pomocą pojedynczego kabla HDMI.