Datele sunt motorul Inteligenței Artificiale, iar GenAI transformă modul în care sunt exploatate acestea, revoluționând procesul de generare de conținut și extragere a informațiilor din volume mari de date. Dacă etapele anterioare în dezvoltarea AI se concentrau pe analiză, recunoașterea tiparelor și predicție, GenAI folosește algoritmi de deep learning pentru crearea de conținut nou (imagini, text, muzică sau video). Astfel, deschide noi posibilități în dezvoltarea produselor, personalizarea serviciilor și realizarea unor prognoze mai precise, pe baza unor cantități uriașe de date. Diversitatea de aplicații include chatboți pentru suport clienți, programare software, securitate, detectarea fraudei, threat intelligence, interacțiune în limbaj natural și traducere etc.
Însă pentru a valorifica acest potențial aproape nelimitat, organizațiile trebuie să aibă o fundație tehnologică solidă, adaptată la cerințele AI. Toate studiile arată că entuziasmul este mare la nivel global, majoritatea companiilor vor să implementeze tehnologiile AI, însă foarte puține dețin și infrastructura (servere și storage) necesară pentru a face acest lucru în mod adecvat. Ca urmare, doar 22% dintre companii folosesc eficient tehnologiile AI, potrivit unui raport Forrester Consulting citat de publicația Bursa.
Dar care sunt, de fapt, cerințele tehnice specifice GenAI?
1. Putere de procesare
Dacă datele sunt motorul, atunci hardware-ul este coloana vertebrală a AI, oferind resursele necesare pentru procesarea și analiza rapidă a seturilor mari de date. Un studiu realizat de Stanford University în 2023, a arătat că performanța GPU-urilor a crescut de aproximativ 7.000 de ori din 2003.
GPU-urile sunt esențiale datorită capacității lor de a gestiona sarcini paralele, datorită vitezei și a eficienței energetice mai mari, fiind preferate pentru sarcinile AI, față de procesoarele de tip CPU. Pentru fazele de antrenare este necesară utilizarea de GPU-uri puternice pentru accelerarea procesului. Pentru inferență (utilizarea propriu-zisă a modelului de AI antrenat), poate fi folosit hardware mai puțin puternic, deși puterea de procesare mare este cea care asigură răspunsuri rapide.
2. Capacitate de stocare
Infrastructura AI trebuie să includă și o capacitate de stocare suficientă pentru a gestiona volumele mari de date generate de aplicațiile AI sau folosite pentru antrenarea lor. Analiștii Gartner oferă recomandări specifice de stocare pentru organizațiile care utilizează GenAI, trei fiind esențiale:
- Platformă scalabilă de stocare de tip data lake, capabilă să gestioneze toate datele utilizate pentru antrenarea modelelor
- Performanță ridicată pentru a menține GPU-urile active în timpul antrenării. Alimentarea insuficientă cu date a GPU-urilor înseamnă GPU-uri inactive și resurse irosite
- Capabilități de gestionare globală a datelor, care permit managementul eficient al acestora pe infrastructuri on-premise, multiple platforme de cloud și locații edge. În absența acestora, datele necesare pentru antrenarea/îmbunătățirea unui model trebuie să fie copiate de mai multe ori, ceea ce complică procesul și poate duce la irosirea resurselor de stocare.
3. Cerințe de latență
Aplicațiile AI, în special cele care necesită procesare în timp real (chatboți, asistenți vocali), au cerințe stricte de latență. Modelele trebuie să fie optimizate pentru a procesa datele rapid, folosind tehnici precum „cuantizarea” (reducerea cerințelor de calcul și creșterea eficienței energetice a AI) sau „pruning”, o tehnică utilizată pentru a reduce complexitatea unui model AI, prin eliminarea unor parametri sau noduri din rețeaua neuronală care au o contribuție nesemnificativă la rezultatele finale.
În plus, pentru a reduce latența, este preferabil să se folosească soluții on-premises sau hibride, în locul celor 100% cloud, deoarece modelele trebuie antrenate și utilizate cât mai aproape de locul unde sunt stocate datele.
4. Dependența de date
Modelele de GenAI depind în mare măsură de calitatea și cantitatea datelor disponibile pentru antrenament, ceea ce poate afecta semnificativ performanța modelului. Pregătirea și „curățarea” datelor sunt părți esențiale ale unei infrastructuri AI Ready, deoarece accesarea unor seturi mari de date de înaltă calitate este esențială pentru crearea de modele personalizate.
Ce înseamnă „AI Ready Storage” și de ce sunt necesare aceste soluții în mediul enterprise?
AI Ready Storage presupune soluții de stocare capabile să gestioneze workload-uri de AI, inclusiv Machine Learning (ML), deep learning, Large Language Models (LLMs) și GenAI. Soluțiile AI Ready Storage sunt concepute pentru a gestiona volumele mari de date generate și utilizate de aplicațiile AI, oferind performanță ridicată, scalabilitate și capacități avansate de management al datelor, esențiale pentru antrenarea și inferența eficientă a modelelor.
Aceste sisteme utilizează tehnologii precum deduplicarea, compresia și tiering-ul pentru a maximiza eficiența și a reduce costurile. De asemenea, pun un accent deosebit pe securitatea datelor, prin controlul accesului și criptare, pentru a proteja informațiile sensibile.
Dell PowerScale, cea mai eficientă soluție AI Ready Storage de pe piață
Dell PowerScale este una dintre cele mai flexibile, eficiente și securizate soluții de tip Network-Attached Storage (NAS) de pe piață, recunoscută și premiată la nivel global pentru performanțele sale de top. Dell Technologies a fost declarat lider global în domeniul NAS prin IDC Quarterly Enterprise Storage Systems Tracker 2024. Totodată, compania a fost desemnată lider pentru al nouălea an consecutiv în Gartner® Magic Quadrant™ 2024, la categoria Distributed File Systems and Object Storage.
Familia PowerScale include platforme scalabile de stocare a fișierelor, configurate cu sistemul de operare OneFS pentru performanță și flexibilitate ridicate. OneFS permite crearea unor soluții de stocare modulare, care pot fi adaptate în funcție de evoluția afacerii. Un cluster PowerScale OneFS poate include noduri de stocare all-flash, hibride sau de arhivare, oferind performanță, eficiență, scalabilitate, securitate și protecție pentru gestionarea unor volume mari de date nestructurate.
PowerScale oferă suport GPUDirect cu NVIDIA, fiind unul dintre primii furnizori de soluții de stocare care implementează această tehnologie. În plus, asigură acces la stocare cu latență scăzută prin NFSoRDMA și capacități multi-tenant, precum și un nivel excepțional de fiabilitate/uptime (disponibilitate de 6x9s) și reziliență pentru funcționarea neîntreruptă în etapele de inferență.
Cele mai noi modele PowerScale oferă performanțe remarcabile, inclusiv creșterea vitezei de ingestie a datelor cu 220% (modelele F600p vs F710) și o viteză de data retrieval cu până la 99% mai rapidă (F600p vs F710). PowerScale asigură și un write throughput de trei ori mai mare pe fiecare rack unit comparativ cu concurența, și reduce amprenta de stocare cu până la 50% (după lansarea drive-urilor QLC de 61TB, la sfârșitul anului 2024), potrivit datelor Dell.
Dell PowerScale este și primul furnizor de stocare certificat pentru NVIDIA DGX SuperPOD pe bază de ethernet de pe piață, iar prin recenta lansare a modelului F910, Dell AI Ready Storage atinge un nou nivel de performanță.
Soluția Dell AI Ready Storage F910 oferă beneficii de neegalat
PowerScale F910 este un nod all-flash de ultimă generație, pregătit pentru AI, care oferă performanță de top și capacitate mare într-o configurație densă de 2U. Fiecare nod găzduiește 24 de SSD-uri NVMe. F910 permite scalarea stocării brute de la 92 TB la 736 TB pe nod, cu o capacitate maximă de 186 PB pe cluster. În plus, modelul maximizează eficiența prin compresie și deduplicare inline.
Un cluster poate avea minimum trei noduri și poate fi scalat până la 252 de noduri – noi noduri pot fi adăugate în aproximativ 60 de secunde. Soluția este ideală pentru industrii precum media și divertisment, tranzacționare de înaltă frecvență, sănătate și aplicații GenAI. Alte beneficii pentru mediul enterprise sunt următoarele:
- F910 permite obținerea mai rapidă a informațiilor valoroase și a rezultatelor relevante dintr-un model de AI (time to AI superior), cu o performanță de streaming write îmbunătățită cu până la 127% față de modelele PowerScale anterioare.
- Accelerează fazele de antrenare și checkpointing (salvarea modelelor intermediare în timpul antrenării), și garantează utilizarea optimă a GPU-urilor, având până la 300 petabytes (PB) de stocare per cluster.
- Prin recenta lansare a Dell APEX File Storage pentru Azure, PowerScale asigură o flexibilitate mai mare și opțiuni suplimentare pentru accesarea datelor în cloud, oferind o performanță a clusterului de 6 ori mai mare, comparativ cu Azure NetApp Files.
- F910 optimizează și eficiența stocării, oferind un echilibru între performanță și costuri pentru clienții enterprise. Cu o unitate de stocare de 2U, modelul maximizează densitatea și minimizează spațiul necesar în centrele de date, având cu 20% mai multă densitate pe rack unit (RU) față de modelul anterior, F710. De asemenea, F910 controlează costurile stocării și optimizează utilizarea acesteia, oferind performanță de până la 2 ori mai mare per watt, față de modelele anterioare.
- Toate nodurile PowerScale utilizează compresia și deduplicarea datelor în timp real pentru a optimiza utilizarea stocării. Data lake-ul unic elimină silozurile de date, maximizând astfel eficiența.
- Suport simultan multi-protocol. PowerScale suportă accesul universal prin protocoale NFS, SMB, HDFS, S3, NDMP, REST, HTTP și FTP către același pool de date partajate, facilitând crearea unei strategii eficiente de data lake. Astfel, datele rămân conectate și accesibile tuturor utilizatorilor cu minimum de efort.
La fel de important este și că PowerScale protejează datele critice împotriva întreruperilor și atacurilor cibernetice, oferind disponibilitate de nivel enterprise, redundanță, securitate, protecție a datelor și replicare. Soluția integrată de protecție împotriva ransomware-ului, cu Smart AirGap și Cyber Recovery Vault, ajută la apărarea datelor împotriva atacurilor cibernetice.
Dacă doriți să fiți pregătiți pentru viitor, soluțiile Dell AI Ready Storage sunt alegerea potrivită, iar reprezentanții NOD vă pot ajuta cu mai multe informații tehnice sau comerciale.