Tachyum zapowiada swoje procesory dla SI
Firma Tachyum Inc. wprowadziła do oferty swój pierwszy, w pełni uniwersalny procesor dedykowany serwerom dla systemów maszynowego uczenia. Model Prodigy bazuje na autorskiej architekturze zbudowanej w taki sposób, by maksymalnie efektywnie mogła ona przetwarzać 16-bitowe liczby zmiennoprzecinkowe i była przy tym wygodna w użyciu. Producent chwali się między innymi wsparciem dla środowisk TensorFlow i PyTorch oraz obsługą aż 8TB danych przechowywanych na raz w pamięci RAM przez pojedynczy procesor i 64TB przez cały węzeł (node). Opisywany układ może się też pochwalić pokaźną ilością pamięci podręcznej oraz umiejętnością uruchomienia kodu napisanego dla CPU na bazie architektury x86, ARM i RISC-V.
Podobno kod napisany dla najnowszego Prodigy ma być znacznie przejrzystszy i prostszy w zrozumieniu niż ten stworzony z myślą o współpracy z CUDA lub OpenCL, co nie przeszkadza temu chipowi w osiąganiu bardzo dobrych rezultatów jeśli chodzi o wydajność. Jeśli wierzyć Tachyum, to stworzony przez nich układ jest znacznie wydajniejszy niż A100 i ponad 10x bardziej efektywny niż najszybszy z Xeonów. Przynajmniej w maszynowym uczeniu. Serwer zbudowany na bazie tych procesorów ma oferować wydajność na poziomie 32 EXAFLOPSÓW, co zdaniem producenta czyni go bezkonkurencyjnym na tle dostępnych rozwiązań. Dział PR wspomina też o 10x niższym zapotrzebowaniu na energię elektryczną w porównaniu do konkurencji, 4x lepszym TCO (całkowity koszt implementacji) i 3x niższym koszcie w przeliczeniu na wykonywane instrukcje (MIPS). Jeśli wszystko pójdzie zgodnie z planem, to opisywany procesor trafi do sprzedaży w przyszłym roku i będziemy mieli okazję na zweryfikowanie wszystkich wymienionych w tekście obietnic.
Dodam jeszcze, że aktualnie w ofercie Tachyum można znaleźć w sumie cztery procesory z rodziny Prodigy (niektóre na razie tylko na papierze). Najmocniejszy z nich, czyli T16128 ma 128 rdzeni z zegarem 4GHz, po 32KB pamięci L1 na dane i instrukcje oraz 64MB współdzielonej pamięci L3. Do tego dochodzą kontrolery PCI-Express 5.0 oferujące w sumie 48 linii, dwa interfejsy 400 Gigabit Ethernet, oraz 12-kanałowy kontroler DDR5 (4800 MT/s).
Tachyum chce ze swoimi układami załapać się na kawałek bardzo lukratywnego tortu jakim jest rynek AI. Ten ma być do 2024 roku wart ponad 300 miliardów dolarów.