Dar a apărut și problema: Microsoft nu avea nimic asemănător cu ceea ce avea nevoie OpenAI și nu era complet sigură că ar putea construi ceva atât de mare în serviciul său de cloud Azure care să și suporte rularea unui astfel de program.
OpenAI încerca să antreneze un set din ce în ce mai mare de programe de inteligență artificială numite modele, care ingerau volume din ce în ce mai mari de date și învățau din ce în ce mai mulți parametri, variabilele pe care sistemul de inteligență artificială le-a descoperit prin antrenamente și reantrenamente. Acest lucru însemna că OpenAI avea nevoie de acces la servicii puternice de cloud computing pentru perioade lungi de timp.
Antrenamente, servere și procesoare puternice
Pentru a face față acestei provocări, Microsoft a trebuit să găsească modalități de a înșirui zeci de mii de cipuri grafice A100 de la Nvidia Corp. - calul de bătaie pentru antrenarea modelelor de inteligență artificială - și să schimbe modul în care poziționează serverele pe rafturi pentru a preveni întreruperile de curent. Scott Guthrie, vicepreședintele executiv al Microsoft care supervizează cloud-ul și AI, nu a vrut să ofere un cost specific pentru proiect, dar a spus că "este probabil mai mare" de câteva sute de milioane de dolari.
"Am construit o arhitectură de sistem care poate funcționa și fi fiabilă la scară foarte mare. Asta a dus la faptul că ChatGPT a fost posibil", a declarat Nidhi Chappell, directorul general al Microsoft pentru infrastructura Azure AI. "Acesta este unul dintre modelele care a rezultat. Vor fi multe, multe altele".
Tehnologia a permis OpenAI să lanseze ChatGPT, chatbotul viral care a atras peste 1 milion de utilizatori la câteva zile după ce a devenit public în noiembrie și care acum este atras în modelele de afaceri ale altor companii, de la cele conduse de fondatorul miliardar al fondurilor speculative Ken Griffin la serviciul de livrare de alimente Instacart Inc. Pe măsură ce instrumentele de inteligență artificială generativă, precum ChatGPT, capătă interes din partea întreprinderilor și a consumatorilor, furnizorii de servicii cloud precum Microsoft, Amazon.com Inc. și Google, aparținând Alphabet Inc., vor fi supuși unei presiuni tot mai mari pentru a se asigura că centrele lor de date pot furniza puterea de calcul enormă necesară.
În prezent, Microsoft folosește același set de resurse pe care l-a construit pentru OpenAI pentru a antrena și rula propriile modele mari de inteligență artificială, inclusiv noul robot de căutare Bing introdus luna trecută. De asemenea, vinde sistemul și altor clienți. Gigantul software lucrează deja la următoarea generație a supercomputerelor de inteligență artificială, parte a unui acord extins cu OpenAI în care Microsoft a adăugat 10 miliarde de dolari la investiția sa.
Ce este în spatele ChatGPT
Antrenarea unui model masiv de inteligență artificială necesită un grup mare de unități de procesare grafică conectate într-un singur loc, precum supercomputerul de inteligență artificială asamblat de Microsoft. Odată ce un model este utilizat, răspunsul la toate întrebările pe care le adresează utilizatorii - numit inferență - necesită o configurație ușor diferită. Microsoft implementează, de asemenea, cipuri grafice pentru inferență, dar aceste procesoare - sute de mii - sunt dispersate geografic în cele peste 60 de regiuni unde compania are centre de date. Acum, compania adaugă cel mai recent cip grafic Nvidia pentru sarcini de lucru AI - H100 - și cea mai nouă versiune a tehnologiei de rețea Infiniband de la Nvidia pentru a partaja datele și mai rapid, a declarat luni Microsoft într-o postare pe blog.
În prezent, Microsoft folosește același set de resurse pe care l-a construit pentru OpenAI pentru a antrena și rula propriile modele mari de inteligență artificială, inclusiv noul robot de căutare Bing prezentat luna trecută. De asemenea, vinde sistemul și altor clienți. Gigantul software lucrează deja la următoarea generație a supercomputerului de inteligență artificială, parte a unui acord extins cu OpenAI, în care Microsoft a adăugat 10 miliarde de dolari la investiția sa.
Noul Bing este încă în previzualizare, Microsoft adăugând treptat mai mulți utilizatori de pe o listă de așteptare. Echipa lui Guthrie organizează o întâlnire zilnică cu aproximativ două duzini de angajați pe care i-a supranumit "pit crew" (echipa de la boxe), după numele grupului de mecanici care reglează mașinile de curse în mijlocul cursei. Sarcina grupului este de a găsi soluții pentru a aduce rapid online cantități mai mari de capacitate de calcul, precum și de a rezolva problemele care apar.
"Este foarte mult un fel de adunare, în care se spune: "Hei, dacă cineva are o idee bună, haideți să o punem pe masă astăzi, să o discutăm și să ne dăm seama dacă putem economisi câteva minute aici? Putem să mai reducem câteva ore? Câteva zile?"". a spus Guthrie.
Ce îi trebuie unui serviciu cloud
Un serviciu cloud depinde de mii de piese și articole diferite - bucăți individuale de servere, conducte, beton pentru clădiri, diferite metale și minerale - iar o întârziere sau o lipsă de aprovizionare a oricărui component, oricât de mică ar fi, poate da totul peste cap. Recent, echipa s-a confruntat cu lipsa unor dispozitive care țin cablurile laolaltă. Așa că Microsoft a priectat un sistem propriu pe care îl va și produce.
Apoi a fost problema alimentării cu energie electrică a acestei super-mașini. Microsoft a trebuit să se asigure că echipamentul de rețea care se ocupă de comunicarea între toate cipurile poate face față acestei sarcini și a trebuit să dezvolte un software care să utilizeze la maximum GPU-urile și echipamentul de rețea. În prezent, compania a creat un software care îi permite să antreneze modele cu zeci de trilioane de parametri.
Pentru că toate mașinile pornesc în același timp, Microsoft a trebuit să se gândească la locul în care au fost amplasate și la locul în care au fost amplasate sursele de alimentare. În caz contrar, se ajunge la versiunea pentru centrele de date a ceea ce se întâmplă atunci când pornești un cuptor cu microunde, un prăjitor de pâine și un aspirator în același timp în bucătărie, a declarat Guthrie.
De asemenea, compania a trebuit să se asigure că poate răci toate aceste mașini și cipuri și folosește evaporarea, aerul de afară în climatele mai reci și răcitoare de înaltă tehnologie în zonele calde, a explicat Alistair Speirs, director al infrastructurii globale Azure.
Microsoft va continua să lucreze la modele personalizate de servere și cipuri și la modalități de optimizare a lanțului său de aprovizionare pentru a obține orice câștig de viteză, eficiență și economii de costuri pe care le poate obține, a spus Guthrie.
"Modelul care uimește lumea în acest moment este construit pe baza supercomputerului pe care am început să îl construim în urmă cu câțiva ani. Noile modele vor fi construite pe noul supercomputer pe care îl pregătim acum, care este mult mai mare și va permite o sofisticare și mai mare", a spus el.
Fiți la curent cu ultimele noutăți. Urmăriți DCBusiness și pe Google News
Ţi s-a părut interesant acest articol?
Urmărește pagina de Facebook DCBusiness pentru a fi la curent cu cele mai importante ştiri despre evoluţia economiei, modificările fiscale, deciziile privind salariile şi pensiile, precum şi alte analize şi informaţii atât de pe plan intern cât şi extern.