Intel je u zvanično predstavio svoj Gaudi 3 procesor — namenjen ubrzanju radnih opterećenja generativne veštačke inteligencije (genAI) u preduzećima — na svojoj Vision 2024 konferenciji i otkrio niz proizvoda sledeće generacije i strateških saradnji sa ciljem da se poveća adoptacija genAI.
Strategija čip-proizvođača obuhvatila je strategiju za hardver i cloud usluge za sve, od data centara do edge uređaja, uključujući AI PC-jeve.
Izvršni direktor Intela Pat Gelsinger hvalio je eru AI, koja uključuje PC-jeve koji će koristiti novu porodicu Intel Core Ultra procesora. Kompanija očekuje da će isporučiti 40 miliona AI PC procesora u 2024. godini i 100 miliona sledeće godine.
U decembru, Intel je prvobitno najavio nadolazeće izdanje svog Gaudi 3 procesora za radna opterećenja AI u data centrima, i predstavio je pregled svojih 14. generacijskih Core Ultra "Meteor Lake" procesora za data centre i 5. generacijskih Xeon Scalable CPU-ova.
Novi Xeon 6 procesori će uključivati softversku podršku za MXFP4 format podataka, što smanjuje latenciju za naredni token do 6.5 puta u poređenju sa Xeon procesorima 4. generacije koji koriste FP16, uz mogućnost pokretanja Llama-2 velikih jezičkih modela sa 70 milijardi parametara.
Intel je ponudio i nove detalje o Gaudi 3 arhitekturi, performansama i OEM-ovima koji su se obavezali da će je dovesti na tržište, i istakao rastući broj korisnika. Kompanija je navela više od desetak "partnera" koji koriste njene Gaudi 3 akceleratore, uključujući Naver Corp., Bosch, NielsenIQ i Seekr.
Istorijski gledano, kompanija Nvidia je predvodila tržište AI hardvera sa svojim GPU-ovima (grafički procesorski uređaji) i TPU-ovima (tensor procesorski uređaji), kreiranim za napajanje i obuku velikih jezičkih modela i AI aplikacija. U skladu s tim, Intel je Gaudi 3 pozicionirao kao direktnog konkurenta Nvidia-inom H100 GPU-u.
Gaudi 3 pruža u proseku 50% bolje zaključivanje treniranih AI modela i 40% bolju energetsku efikasnost u poređenju sa Nvidia-inim H100 - "za mnogo manje novca", rekao je Gelsinger. Prema Intelu, Gaudi 3 akceleratori mogu pružiti četiri puta više AI računanja za računarske memorijske sisteme koristeći BF16 floating point format i 1.5 puta veću propusnost memorije u poređenju sa Gaudi 2. Pored toga, takođe nudi dvostruko veću propusnost mreže u poređenju sa svojim prethodnikom.
Intel je koristio TSMC-ov proces od 5 nm za izradu Gaudi 3 čipova, koji su sada dostupni originalnim proizvođačima opreme (OEM-ovima) uključujući Dell, HPE, Lenovo i Supermicro za tržište AI data centara. Čip je dizajniran da se poveže sa hiljadama drugih unutar data centara.
Prošle godine, Nvidia je kontrolisala oko 83% tržišta čipova za data centre, dok je većim delom preostalih 17% dominirao Google-ovim prilagođenim tensor procesorskim jedinicama (TPUs).
Tokom svoje Vision konferencije, Intel je takođe pružio nove informacije o svojim proizvodima i uslugama sledeće generacije u svim segmentima poslovne AI primene, uključujući i svoje nove Intel Xeon 6 procesore, koji mogu pokretati RAG procese.