Byłem kilka dni temu na warsztatach informatycznych, na których pokazywano pewne ciekawe rozwiązania dotyczące backupów, czyli archiwizacji, wykonywania kopii tego, co mamy w komputerach. Oczywiście rozwiązanie adresowane jest do średnich i dużych firm, a z uwagi na swoją skalowalność może być wykorzystywane przez przedsiębiorstwa o różnej wielkości i działające w różnych branżach. Jak się dowiedziałem od jednego z prowadzących warsztaty, takie narzędzie stosowane jest także przez Škodę.
Zanim jednak przejdziemy do puenty, pozwolę sobie językiem zrozumiałym, mam nadzieję, dla ludzi spoza branży wyjaśnić, na czym polega to rozwiązanie.
Z pewnością większość z Was doskonale się orientuje, że przechowując kopie swoich danych w dużej mierze uodparniamy się na ewentualne problemy, czy to ze sprzętem (różnego rodzaju awarie), czy z oprogramowaniem (przypadkowe skasowanie, zniszczenie danych przez wirusy i inne tego typu cholerstwa). Jeśli kopie wykonywane są sensownie, to mamy duże szanse, że da się z nich skorzystać i w razie problemów dość szybko przywróci się system do działania. A dziś, kiedy życie tak szybko płynie, ważna jest nie tylko jakość kopii, ale i szybkość jej wykonywania i potem odtwarzania.
Nic więc dziwnego, że praktycznie każda działająca firma, która wykorzystuje w swojej działalności komputery, stosuje najróżniejsze rozwiązania mające zabezpieczyć dane na wypadek jakichkolwiek problemów. Robią to oczywiście także firmy motoryzacyjne, które bez komputerów nie miałyby dziś racji bytu.
Rozwiązanie, które oglądałem na warsztatach, jest bardzo interesujące. Stosuje tzw. deduplikację. Z grubsza działanie systemu polega na tym, że przegląda ono zawartość wskazanych komputerów (mogą to być tysiące najróżniejszych maszyn, działających pod kontrolą różnych systemów operacyjnych, także maszyny wirtualne itp.), znalezione tam pliki dzieli na bloki o różnej długości, i odkłada po jednym takim bloku w swoich archiwach. Gdy przegląda kolejne pliki, bądź komputery, i natrafi na analogiczny blok (a są to naprawdę niewielkie kawałki danych), już ich nie odkłada, tylko wpisuje znacznik, gdzie taki blok się znajduje. Dzięki temu odkłada stosunkowo niewiele takich unikalnych bloków – stanowią one, zależnie od rodzaju plików – od kilku do mniej więcej 30% pojemności wszystkich danych. Co więcej – dane na dyskach przecież co trochę się zmieniają, ale w tym systemie nie ma potrzeba ciągłego ich analizowania. Rozwiązanie potrafi bowiem wychwycić jedynie zmienione bloki, z którymi postępuje dokładnie tak samo, jak z po raz pierwszy czytanymi danymi. I zrzuca tylko to, co się zmieniło, z uwzględnieniem mechanizmu analizy bloków, co skutkuje tym, że pojedyncze przyrosty, zależne oczywiście od intensyfikacji prac, które modyfikują pliki, zajmują już naprawdę niewiele miejsca. Dzięki temu łatwo je przesłać przez sieć, choćby przez Internet, odbywa się to szybko i bezboleśnie. W efekcie są globalne korporacje, które potrafią dziesiątki tysięcy komputerów archiwizować w ten sposób w jednym miejscu!
Sposób licencjonowania tego narzędzia jest również dość ciekawy. Kupuje się określoną pojemność dyskową urządzenia oraz pojemność, jaką spodziewamy się mieć po zarchiwizowaniu wszystkich założonych danych. Podstawowym wariantem jest 2 TB (dwa terabajty) pojemności dyskowej i pół terabajta (czyli 500 GB) danych po deduplikacji. Dane te przyrastają bardzo wolno, bo pierwsze zebrane są przy pierwszej archiwizacji, a potem dorzucane są tylko informacje o zmianach. W efekcie więc nawet te 0,5 TB wystarcza niemałym często firmom.
Mam nadzieję, że z grubsza wiecie, w czym rzecz. Clou z tego wszystkiego, to fakt, iż w firmie, w której szybko zmienia się wiele danych, dość dynamicznie przyrasta wielkość tych danych poddanych deduplikacji i w efekcie zarchiwizowanych przez system. No a efektem tego z czasem staje się zwiększanie pojemności dyskowej, jaką dysponuje firma w swoim rozwiązaniu. I odwrotnie – w firmach, w których istotnych zmian danych nie jest wiele, wartość pół terabajta okazuje się wystarczająca na długi czas.
No właśnie – i tu pojawia się Škoda ;-) Prowadzący nasze warsztaty powiedział sam z siebie o paru przedsiębiorstwach, w których działa to rozwiązanie (na całym świecie są dziesiątki tysięcy klientów korzystających z rozwiązań tej firmy) i wspomniał także o czeskim producencie samochodów. Informatycy ze Škody kupili rozwiązanie dość duże – przestrzeni dyskowej naprawdę sporo, a i licencja na zdeduplikowane dane też niemała. I okazało się, że po pierwszym zasileniu systemu kolejne jego przyrosty okazały się nadzwyczaj małe!. System został przeszacowany, choć to akurat nie jest jakiś problem. Ponieważ jednak owe zasilenia przyrostowe są naprawdę niewielkie, to znaczy, że zmian jest w Škodzie niewiele. I muszę przyznać, że wcale mnie ta informacja nie zaskoczyła – przecież tak niewiele się zmieniły samochody tej marki na przestrzeni ostatnich lat, że… ;-)
Możemy sobie więc robić podśmiechujki ;-) z zachowawczego designu czeskiej marki, ale popatrzcie, jak oni są oszczędni – nie muszą upgrade’ować licencji na pojemność archiwum! ;-) A to przecież kosztuje. A tak? Nie płacimy za przyrosty kopii, nie zmieniamy maszyn w tłoczniach, nie zmieniamy kolorów, nie zmieniamy wnętrza itd. Wyobrażacie sobie, jakie oszczędności daje włącznik świateł przywodzący na myśl pokrętło w pralce Frania? Od lat taki sam ;-)
Podejrzewam, że Volkswagen stosuje analogiczny system backupowania swoich danych ;-) I też ma niewielkie przyrosty zdeduplikowanych kopii… :-)
Krzysiek Gregorczyk
Najnowsze komentarze