Za začetek najprej pomislite, koliko podatkov premorete in kako ter kje jih hranite. Se jim lahko kaj hudega zgodi? Kako bo to vplivalo na vas? Zdaj pa pomislite na podjetja, ki hranijo podatke o več tisoč ali celo milijonih strank. Kako hranijo vse te podatke? Še več, kako jih obdelujejo, da z njimi zagotavljajo boljše informacije, vpoglede in uporabniške izkušnje. Da, izraz podatkovna znanost ni iz trte zvit, podatkovna znanost je svojevrstna tehnološka umetnost.
Podjetja, ki bodo znala iz zbranih podatkov čim hitreje izluščiti čim več vrednosti, pa bodo med zmagovalci nove dobe.
Ko se podatkov loti umetna inteligenca
Umetna inteligenca spreminja naša življenja na vseh področjih, spremenila pa bo tudi področji hrambe in obdelave podatkov, kot ju poznamo do sedaj. Vplive umetne inteligence lahko že vidimo na področjih zmogljivosti, zanesljivosti in pri podatkovni paradigmi, v prihodnosti pa bo umetna inteligenca še bolj vplivala tudi na razširjenost, trajnost in strukturo podatkov.
Maja je bil v Berlinu organiziran prav poseben hrambi in obdelavi podatkov posvečen dogodek, poimenovan Huawei Innovative Data Infrastructure Forum. Na njem je nastopil tudi dr. Peter Zhou, predsednik oddelka rešitev za shranjevanje podatkov v korporaciji Huawei. V svojem govoru je govoril predvsem o redefiniciji shranjevanja podatkov v dobi t. i. podatkovnega prebujanja, ki smo mu priča v zadnjih letih: »Huawei se osredotoča na izzive in zahteve strank v dobi prebujanja podatkov. Zavezani smo h gradnji vodilne podatkovne infrastrukture, pripravljene na umetno inteligenco, saj bo ta ustvarila kar največjo vrednost za stranke.«
Kakšni so torej načrti podjetja Huawei na področju shranjevanja podatkov? V grobem bi jih lahko razdelili v šest kategorij.
Izjemne zmogljivosti. Huawei povečuje zmogljivosti shranjevanja podatkov za velikostni razred 10 v primerjavi s tradicionalnimi pomnilniškimi mediji. Pa razkošno odmerjena prostornost ni edini adut, saj sodobne rešitve za hrambo podatkov omogočajo tudi izjemno pasovno širino, ki dosega neverjeten petabajt na sekundo (PB/s) prenosa podatkov (!) in kar 100 milijonov vhodno-izhodnih operacij (IOPS). To je kot nalašč za sodobne strežnike in podatkovne centre, ki beležijo na milijone poizvedb s strani uporabnikov. Te so se v dobi rabe generativne umetne inteligence še bistveno okrepilo in podjetja bodo morala poskrbeti, da jim bo nizkonivojska arhitektura sploh kos. Saj vemo, nihče ne želi čakati ...
Varnost in zanesljivost podatkov. Inovativna arhitektura in tehnologije povečujejo tudi zanesljivost hrambe podatkov. Ta v primeru najsodobnejših Huawei sistemov znaša zavidljivih 99,99999 % oziroma, povedano drugače, če ravno vi doživite okvaro, lahko še isti dan kupite loterijsko srečko. K izjemno zanesljivemu delovanju rešitev hrambe podatkov znatno prispeva tudi vgrajeni mehanizem za zaznavanje zlonamerne programske opreme z natančnostjo odkrivanja 99,99 %. O izjemni prožnosti novodobne hrambe podatke priča še neverjetno kratek čas obnove kontrolne točke med usposabljanjem z umetno inteligenco – postopek, ki je včasih trajal ure ali celo dneve, je zdaj skrajšan na manj kot minuto!
Nova podatkovna paradigma. Inženirji podjetja Huawei so se lotili tudi enega najbolj trdovratnih izzivov na področju umetne inteligence – t. i. halucinacij. Za odpravo halucinacij v velikih modelih algoritmov umetne inteligence so vpregli ogromno bazo znanja in razvili tehnologijo RAG (Retrieval-Augmented Generation), kjer večdimenzionalni tenzorski podatki omogočajo hitro pridobivanje vpogledov iz podatkov preko inteligentnega iskalnika – brez izmišljenih rezultatov.
Razširljivost. V dobi, ki jo nekatera podjetja že enačijo s poplavo podatkov, postaja velik izziv že sama hramba le-teh. Ne le da so pomnilniške zmogljivosti posameznih sistemov omejene, nekateri so tudi slabo razširljivi in kot taki lahko predstavljajo resno ozko grlo za podatkovno gnano poslovanje. Huawei je svoje podatkovne rešitve nove generacije zasnoval tako, da je posamezno pomnilniško gručo mogoče razširiti do nivoja eksabajta hrambe podatkov, poleg tega pa je možno posamezne sisteme za obdelavo podatkov še razširiti z dodatnimi GPE, DPE ali NPE, odvisno od vrste in namena obdelave podatkov.
Trajnost. Inovacije v pomnilniških medijih in napravah so prinesle izjemno energetsko učinkovitost shranjevanja. Huawei je postavil nov rekord v industriji, saj z najzmogljivejšimi sistemi dosega porabo manj kot 1 vat na terabajt podatkov, prav tako vodi v kategoriji gostote shranjevanja (več kot en petabajt na enoto (1 PB/U). Oboje znatno vpliva na cenovno učinkovito trajnost kratko- in dolgoročne hrambe podatkov.
Matričje podatkov. Zmožnosti upravljanja in iskanja prek metapodatkov – kot v matrici – omogočajo globalno vidljivost in upravljanje podatkov, ki tako postanejo bolj »mobilni«, učinkovitost iskanja pa kar desetkrat višja. Kdor prej pride do pravega odgovora na vprašanje, pa je zmagovalec v poslovnem svetu, kajne?
OceanStor – idealno skladišče za podatke
Opisanih šest dimenzij je združenih v eni napravi, škatli po imenu OceanStor A800. Gre za napreden sistem za hrambo in obdelavo podatkov, ki je prilagojen aplikacijam z umetno inteligenco. Proizvajalec navaja, da lahko ti sistemi obdelujejo več skupin podatkov, hitrost obdelave z umetno inteligenco lahko povečajo za kar 30 odstotkov. Na področju zmogljivosti izstopata še visoka pasovna širina in visoko število operacij, ki sta trenutno okoli štirikrat do osemkrat višji od najboljših konkurenčnih rešitev.
Na področju razširljivosti OceanStor A800 podpira nadgradnjo do zmogljivosti ravni eksabajtov, saj je lahko opremljen z do 512 krmilniki, pri čemer omogoča pa nadgradnjo z do največ 4096 razširitvenimi karticami. Ta neverjetni podatkovni strežnik omogoča izjemno gostoto shranjevanja 1 PB/U in dosega energetsko učinkovitost 0,7 W/TB. Posledično sam piše novo podatkovno paradigmo z vektorskim indeksiranjem, tenzorskimi podatki in tehnologijo obogatenih in natančnih poizvedb RAG.
Bliskovito hitre inovacije tudi na področju podatkovnih diskov
Za prebojne inovacije je Huawei poskrbel tudi v svetu pogonov SSD. Njegovi novi pogoji SSD zagotavljajo kar 10-krat večjo zmogljivost hrambe podatkov ob enaki fizični velikosti medija prejšnje generacije, kar lahko dodatno zmanjša porabo energije podatkovnega centra. Z zmogljivostjo 128 TB na medij novi pogoni SSD porabijo 88 % manj prostora za shranjevanje in 92 % manj energije kot konkurenčni pogoni SSD (preračunano na hrambo PB podatkov).
Podjetja morajo biti pripravljena na podatke
Če želijo biti podjetja pripravljena na umetno inteligenco, morajo najprej biti pripravljena na podatke. Za obvladovanje le-teh je Huawei predstavil globalni datotečni sistem Omni-Dataverse, ki omogoča vidnost, upravljanje in mobilnost virov podatkov podjetij po regijah. S tem tehnološki gigant gradi temelje v obliki podatkovnega jezera za aplikacije umetne inteligence za podjetja.