Tokom ove nedelje pojavio se niz izveštaja koji su tvrdili da je Google odložio lansiranje svog velikog novog AI modela nazvanog Gemini koji je trebalo da se suprotstavi OpenAI naprednom GPT-4 modelu.
Međutim, čini se da su svi oni bili krajnje netačni jer je Google upravo lansirao Gemini. U svojoj najavi, Google tvrdi da je Gemini njegov najsposobniji i najnapredniji model do sada.
U poređenju sa drugim dostupnim rešenjima, Gemini je multimodalan, i može da radi sa tekstom, slikama, audio i video zapisima i kodom. U stanju je da kombinuje, razume i funkcioniše sa svim ovim tipovima informacija. Gemini je takođe moguće skalirati za različita okruženja, i dostupan je u 3 “veličine” – Ultra, Pro i Nano – što omogućava njegovo korišćenje na telefonima, ali i u data centrima.
Svaka od ove tri verzije koristiće različitu količinu procesorske snage, od kojih će najjača biti namenjena data centrima, dok će najslabija biti rezervisana za mobilne i druge aplikacije.
Napad na najvećeg konkurenta
Google je direktno krenuo na svog najvećeg konkurenta – GPT-4, i ne libi se da sa njim poredi sve mogućnosti koje Gemini donosi.
Kompanija je uporedila Gemini Ultra sa najnovijim modelom kompanije OpenAI u nekoliko benčmark testova, i Google-ov proizvod izašao je kao pobednik u 7, od ukupno 8 testova fokusiranih na tekst.
Testovi su uključivali razumevanje, matematiku i sposobnosti kodiranja, a kompanija je sprovela i multimodalne testove u kojima je njen AI osvojio prvo mesto u svim testovima koji su koristili slike, audio i video materijale.
Google je naglasio i da Gemini ostvaruje bolje rezultate od ljudskih stručnjaka na MMLU taskovima, koji kombinuju 57 predmeta uključujući matematiku, fiziku, istoriju, pravo, medicinu i etiku, radi testiranja znanja i mogućnosti rešavanja problema.
Naravno, u pitanju su testovi koje je sproveo Google, pa uskoro možemo očekivati i rezultate nezavisnih provera.
Google tvrdi da je za ove izuzetne rezultate odgovorna multimodalna priroda Geminija koji radi sa slikama i tekstom, pa mu nije potrebna asistencija OCR sistema, koji se uglavnom koriste kako bi čitali tekst sa slika i dokumenata i učinili ga dostupnim mašinama.
Dodatno, tehnološka kompanija tvrdi da je njen model kreiran tako da su u njegovoj srži odgovornost i bezbednost, a kompanija je koristila širok spektar tehnika kako bi bila sigurna da Gemini neće naneti zlo korisnicima, podsticati nasilje ili pružati netačne podatke.
Kada je tekst u pitanju, još nije poznato kako se Gemini snalazi sa jezicima koji nisu engleski, a to je ujedno i jedini trenutno dostupan jezik na kom će raditi.
Budućnost
Kao što smo spomenuli, Gemini je dostupan i za Google Pixel 8 Pro u okviru decembarskog Feature Drop apdejta.
Trenutno je dostupna Nano verzija koja će pružati podršku funkcijama kao što su Summarize i Smart Replies.
U narednim mesecima Gemini bi trebalo da bude dostupan na znatno većem broju proizvoda, uključujući Search, Ads, Chrome i Duet AI.
Svi zainteresovani developeri mogu da se prijave za testiranje Gemini Nano modela i dodaju ovaj AI svojim aplikacijama.
Gemini Pro i Nano polako počinju da stižu korisncima preko Bard aplikacije i Pixel telefona, dok Google još optimizuje Ultra verziju koja bi trebalo da bude dostupna odabranim partnerima, a masovniji roll-out developerima i komercijalnim partnerima se očekuje početkom naredne godine.
Google direktori već godinama pričaju o neograničenom potencijalu koji AI može da donese, a sada napokon može da vidimo na šta su tačno mislili.
Gemini možda neće promeniti svet u svojoj prvoj generaciji, ali će kompaniji svakako pomoći da uhvati priključak sa konkurencijom i napokon joj pružiti konkretnu podlogu da nastavi da razvija i inovira na ovom polju.
2 komentara