Backup w Data Center

Budowa Data Center (DC) jest skomplikowanym projektem, gdyż wymaga stworzenia środowiska, które zagwarantuje nie tylko odpowiednią wydajność, ale i bezpieczeństwo danych uwzględniające różnorodne mniej lub bardziej hipotetyczne zagrożenia. Rozwiązania klastrowe i replikacja danych są elementami, które zapewniają bezpieczeństwo danych. Jednak nie ochronią one przed potencjalnymi zagrożeniami, jak np. niebezpieczne kody czy działania ludzkie (np. działania serwisowe oraz administracyjne). Dlatego trudno sobie wyobrazić DC bez rozwiązania backupowego klasy Enterprise.

To właśnie backup jest „ostatnią instancją”, ostatnim elementem zabezpieczenia danych, bo korzystamy z jego usług wtedy, gdy inne zabezpieczenia czy procedury zawiodły.

Z tych powodów przy budowie DC backup zajmuje bardzo ważną pozycję, a o rzetelność wybranego rozwiązania warto zadbać zawczasu.

Backup w Data Center
Backup w Data Center, źródło: Symantec

Na rynku znajduje się kilka produktów backupowych uznawanych za rozwiązania klasy Enterprise: Symantec NetBackup, Legato Networker i TSM. I to właśnie najczęściej jeden z nich można spotkać w DC. Nowoczesne systemy backupowe wykorzystywane w DC muszą cechować się wieloma funkcjonalnościami wykorzystywanymi w tych środowiskach. Jednym z głównych wyzwań przy backupowaniu w DC jest wybranie odpowiedniego wolumenu danych. W takich miejscach nie mamy do czynienia z dziesiątkami czy setkami TB danych, ale z wolumenem znacznie większym (PB). Szybkość i skalowalność backupu jest jednym z głównych kryteriów doboru systemu backupowego i z tego względu preferowane są systemy z trójwarstwową architekturą (klient-media serwer-serwer zarządzający). Kolejnym kryterium jest elastyczność, a więc wsparcie różnorodnych systemów operacyjnych (Windows, Linux, Unix), baz danych czy aplikacji. Nie należy pomijać wirtualizacji, ponieważ trudno wyobrazić sobie typowe DC bez tej technologii, zazwyczaj opartej o produkty firmy Vmware lub Microsoft. Jest to następny ważny wskaźnik dla oprogramowania backupowego – sposób i skuteczność backupu.

Wraz z ogromną ilością danych pojawia się problem ze składowaniem kopii zapasowych i kosztów pamięci masowych. Odpowiedzią na ten problem jest deduplikacja. Dzisiaj trudno sobie wyobrazić system backupowy bez tego komponentu. Wydajna i skalowalna deduplikacja pozwala zaoszczędzić ogromne ilości miejsca w obszarze pamięci masowych, a więc ograniczyć koszty (mniejsze urządzenia, mniej dysków, łatwiejsze zarządzanie).

Obecne trendy rynkowe jednoznacznie wskazują, że backup przeznaczony dla dysków jest najbardziej preferowany. Nie oznacza to jednak, iż urządzenia taśmowe „odchodzą do lamusa”. Biblioteki taśmowe są wciąż wykorzystywane w DC głównie w dwóch przypadkach: pierwszy to długoterminowe przechowywanie danych (5, 10 lat lub więcej). Druga sytuacja to bazy danych i duży wolumen (dziesiątki czy setki TB), które powodują, iż tylko wydajne biblioteki taśmowe pozwalają na sprostanie takiemu wyzwaniu backupowemu.

Poza wcześniej omówionymi przypadkami, dyski (pamięci masowe) oraz deduplikacja są dzisiaj najbardziej typowymi miejscami składowania danych. Należy przy tym pamiętać, iż dzięki takiemu składowaniu dużo łatwiej i prościej zaprojektować i zrealizować replikację danych (kopii backupowych) do ośrodka zapasowego. Szczególnie jest to łatwe do zrealizowania w momencie wykorzystania deduplikacji. Wówczas ograniczamy znakomicie wolumen danych replikowanych, przez co zmniejszamy koszty łączy pomiędzy ośrodkami.

Inną ważną cechą systemów backupowych w DC jest optymalizacja backupu ogromnych wolumenów danych plikowych, a więc tzw. backup „milionów małych plików”. Każdy z producentów oprogramowania różnorodnie podchodzi do tego wyzwania. Generalnie wszyscy starają się minimalizować ilość pełnych backupów, a więc minimalizować czas na skanowanie systemów plikowych. Następną cechą systemu backupowego w DC jest wysoka dostępność usługi backupowej. Ogólnie rzecz ujmując, systemy backupowe powinny oferować możliwość uklastrawiania aplikacji backupowej, przez co jest ona odporna na awarię sprzętu. Większość systemów oferuje także możliwość balansowania ruchu czy wznawiania zadań backupowych w momencie ich przerwania. Wszystkie te cechy zwiększają skuteczność wykonania kopii, a więc zwiększają bezpieczeństwo danych.

Podsumowując, aby system backupowy w DC należycie zabezpieczał dane, powinien cechować się:

  • wysoką dostępnością aplikacji backupowej (klaster)

  • mechanizmem balansowania ruchu backupowego

  • możliwością tworzenia wielu kopii danych jednocześnie

  • deduplikacją i replikacją danych do innego ośrodka

  • zaawansowanym systemem raportowym

  • mechanizmem do backupu dużych ilości danych czy to plikowych czy bazodanowych (Big Data)

  • elastycznością i wsparciem dla różnorodnych systemów czy aplikacji

  • mechanizmem GRT (Granual Restore Technology) dla odtwarzania szczegółowego z pojedynczego backupu całych zasobów czy pojedynczych plików lub maili

  • wydajnym i zaawansowanym backupem dla środowisk wirtualnych, minimum Vmware i Hyper-V

  • uniwersalnym i elastycznym licencjonowaniem opartym o wolumen danych.

Dlatego warto podkreślić, że wybór systemu backupowego w DC jest równie istotny jak wybór innych komponentów, a więc serwerów, macierzy, aplikacji czy systemów operacyjnych

Autorem tekstu jest Jerzy Janowski, Senior Systems Engineer Symantec Poland

DLP expert magazyn
DLP expert 2/2013

Tekst pochodzi z magazynu DLP expert 2/2013 (5)- który bezpłatnie można pobrać ze strony: https://www.dlp-expert.pl/magazine

Źródło: Redakcja