Migrace dat : jak a proč

Ondřej Bačina
15 minuty, 48 sekundy
3

Jaké jsou největší výzvy migrace dat a co jsou důvody pro migraci. Jak nám může pomoci virtualizace a nebo přímo diskové pole s HW podporou migrace ? Odpovědi najdete v tomto článku. Tak jak jsme zde již několikráte popisovali v článcích o diskových polích (např. http://www.optimalizovane-it.cz/storage/storage-pro-smb.html ) je v současné době nárůst dat opravdu významný a je to aktuální problém skoro každé společnosti. Tento problém se pak projeví nejen ve vlastní datové správě této kapacity, ale také v případě migrace z jednoho zařízení na druhé. Migraci dat chápejme jako kompletní přesun dat celé aplikace nebo dokonce celého diskového pole.

Největší výzvy migrace dat ?

Migrace dat z jednoho diskového pole na druhé je velice těžce proveditelná pokud diskové pole nebo OS nám v tomto nějak neumějí pomoci. V takovém případě se přesun dá udělat pouze v Off-line režimu, tzn. musíme aplikaci vypnout a odpojit od serveru a pak přesunout data. Po úspěšném přesunutí dat se musí provést přemapování svazku mezi diskovým polem a serverem a pak teprve opět nastartovat aplikaci.

Jak rychle se to přesune ?

Zde je jeden z mála příkladů, kdy se OPRAVDU využije propustnost diskového pole, nicméně to jako vždy závisí na spoustě dalších faktorů než jen na “trubce”, která mi vede z diskového pole. Podíváme-li se na čísla (ve kterých je dost často zmatek) tak hodnota přenosu dat je udávána v b per second tedy bps (Bit  http://en.wikipedia.org/wiki/Bit ) ukládání dat se ale udává v B (tedy Byte http://en.wikipedia.org/wiki/Byte) jak se dopočítat ? Jeden Byte = 8xbit Mám-li k dispozici propojení mezi diskovými poli 1Gb pak je to 1024(Mega bit)/8= 128(Mega Byte) TEORETICKA maximální propustnost (která ale není nikdy v reálném nasazení dosažená) je 128MB za jedu vteřinu. Reálně se můžeme bavit o hodnotě kolem 100MB/s přes 1Gb síť. Pokud máme diskový svazek velký 1TB a chceme ho přesunout přes 1Gb síť (1024GB = 1048576MB /100 = 10485,76 Sekund přenosu /60 = 174,7626666666667 minut /60 = 2,912711111111111 Hodiny) pak ho přenášíme v ideálním případě skoro 3 hodiny. Pokud se jedná o data kritické aplikace jistě je takováto doba naprosto neakceptovatelná ! Teoreticky mohu použít propojení 10Gbit a můžu se dostat k 10ti násobku na nějakých 30min. jenže praxe není tak jednoduchá jako teorie. Nehledě na to, pokud budeme přenášet data z celého diskového pole, kde to mohou být Tera Bajty dat, pak mi ani větší “roura” nepomůže k tomu, abych neměl výpadek.

Jaké jsou omezující faktory ?

Celý systém je pouze tak rychlý jako je nejpomalejší součást celého systému.

Disky

Pokud budu mít v systému pouze pár pevných disků nepomůže mi ani kdybych byl propojen 100Gbitem. Je to samozřejmě závislé od výrobce disku. Běžně počítá s hodnotou kolem 40MB/s na jeden disk. Dnes jsou již na trhu disky s větší propustností, nicméně pokud budeme přesouvat data z diskového pole staršího na novější tak můžeme typicky počítat s takovouto hodnotou. Pak pokud budu mít 10 HDD dostanu se k nějaké teoretické rychlosti 400MB/s a nebudu tedy schopen využít ani 1x 10Gbit linku. Čím rychleji chci, aby se data přenesla, tím více HDD/SSD musím v systému mít (na obou stranách !)

Storage Procesory diskového pole

Další omezující faktor celého systému migrace dat jsou vlastní procesory diskových úložišť. Nejen, že záleží na tom jak moc je výkonný procesor daného modelu, ale také jakým způsobem je udělána architektura celého diskového pole. Nehledě na to, že pokud se bavíme o migraci ONLINE musíme počítat s tím, že diskové pole nedělá pouze migraci dat, ale právě naopak ! Jeho hlavním úkolem je poskytování výkonu a služby pro produkční prostředí a migraci provádí “na pozadí” nejlépe s nižší prioritou, nebo v lepším případě stejně rychle jako vše ostatní. Většina diskových polí k tomto přistupují tak, že uměle omezují propustnost jednoho Threadu ( http://en.wikipedia.org/wiki/Thread_(computing) ) pokud bych provedl kopírování na úrovni HOSTA (tedy serveru) pak se mi každé kopírování bude tvářit jako jeden thread. Běžné je omezení kolem 100MB/s na jeden thread. Pak se opět dostáváme do situace, že můžu mít kolik chci pevných disků a “rouru” jak od kanalizace, ale udělám-li jedno kopírování nikdy nevyužiji plný potenciál celého systému. Viz. obrázek, kde každý thread je rozdělen na svůj tok dat bez možnosti využít šířku celého dostupného pásma.

Storage Area Network

Samozřejmě, že je také velice důležité, abych nebyl omezován nějakými nekvalitními nebo výkonově nedostatečnými síťovými přepínači. Zde je nejdůležitější celková propustnost CPU celého přepínače. Často se stává, že hlavně ty cenově nižší přepínače používají tzv. oversubscribtion. Jedná se o nižší propustnost celého switche než je jeho maximální osazení. U iSCSI je pak důležitá podpora JUMBO FRAMES (http://en.wikipedia.org/wiki/Jumbo_frames) a vůbec celkově optimalizace switche na iSCSI jako jsou např. naše switche PowerConnect hlavně třídy 6000 a výše, protože ty mají automatické nastavení parametrů pro iSCSI a dokonce rozeznají např. diskové pole EqualLogic a nastaví se přesně pro jeho potřeby. Nebo je ideální zapojit do procesu nějaké Cache na úrovni switche jako máme např. u Dell Force10 S60, který má buffer až 1,25GB ! Dokáže tak pojmout výkonové špičky nejen storage komunikace. (http://www.dell.com/us/enterprise/p/force10-networking)

Host

Jedná se o server, který řídí celou operaci datového přenosu. Zde může být jeden z největších limitů celé operace. Propojení serveru s diskovými poli probíhá pomocí tzv. HBA (http://en.wikipedia.org/wiki/Host_bus_adapter) Toto je jedno z úzkých hrdel systému, protože obvykle nemá jeden server stejnou propustnost jako disková pole ke kterým je připojen. Zrovna tak je třeba myslet na to, že díky řízení celého přesunu dat musí z jednoho diskového pole data číst a do druhého pole data zapisovat. Probíhá zde tedy IN/OUT operace přecházející přes OS daného serveru a pokud jsou zde nějaké další procesy běžící na serveru dojde logicky ke zpomalení celého procesu. TUTO ČÁST PŘESUNU DAT LZE VYNECHAT POKUD MI PŘESUN DAT PODPORUJE PŘIMO STORAGE tzv. SAN TO SAN MIGRACE

SAN to SAN migrace

Moderní disková pole tento způsob migrace dat často nativně podporují. U některých výrobců je funkcionalita v základní ceně, u jiných se licencuje per zařízení či per Terabyte. Nejznámější disková pole, která tuto technologii podporují jsou Hitachi USP, IBM SVC(StorWize) či DELL Compellent. Princip takovéhoto fungování je, že si diskové pole připojí to “staré” pole, jako kdyby bylo “server” a provede kopírování maximální možnou rychlostí na blokové úrovni. Například DELL Compellent umožňuje pro účely migrace připojení těchto polí jiných výrobců, aniž by k tomu byla vyžadována speciální licence: EMC AX, EMC CX, DELL MD, HP MSA, HP EVA, HP 3PAR, HP XP, IBM FastT, IBM ESS, IBM DS, IBM StorWize, IBM XIV, IBM SVC, SUN StorageTek, NetApp FAS, Hitachi USP, Infortrend EonStor, a další …

 

Migrace pomocí virtualizace

Migraci velice usnadňuje virtualizace serverů a možnosti, které přináší Hyper-V a VMware ESX. Dnes mohu provést ONLINE Migraci dat z jednoho typu storage na druhou pomocí nativních funkcionalit virtualizace. Tyto schopnosti jsou ale licencovány a např. u VMWARE se jedná o funkcionalitu dostupnou v poslední verzi již v Standard edici.

Složitější migrace nastává tam, kde je zapotřebí migrovat Pass-Through disky (Hyper-V), RDM disky (VMware), případně disky, které jsou součástí High-Availability clusterů. V takových chvílích můžou pomoci nástroje jako např. DoubleTake nebo Dell AppAssure. Dále také většina společností ještě není 100% zvirtualizováno. Zrovna tak, jsou systémy jako např. Tru64, AIX či HP-UX pro které se migrační nástroje shánějí těžko, případně jsou velice drahé. Zde je nejvhodnější použít možnosti externí SAN virtualizace a migrace dat SAN to SAN. Nehledě na to, že migrace probíhá na SW úrovni a zatěžuje tak virtualizaci.

Pomoc s migrací

Nástroje jsou krásná věc, ale k jejich úspěšnému používání jsou třeba zkušenosti z praxe. Rozhodně lze tedy doporučit každou migraci pečlivě naplánovat a objednat její provedení od certifikovaných specialistů. Při migraci formou služby se často využívají různé migrační appliance, které umožní přenášet data mezi diskovými poli i během běžného provozu. V Dellu si můžete objednat službu, která využívá Fluid Data Mover a umožnuje připojit jakékoli diskové pole a jen s drobným odstavením z provozu přesunout data za chodu na jakékoli Dell pole.

Při nákupu diskového pole si nechte nabídnout i pomoc s migrací dat. Nezapomeňme, že tato práce storage administrátora potká jednou za x let, kdežto odborníci od dodavatele to dělají každý den. 

Kdy potřebuji migrovat ?

Migrace dat může být nutná v těchto případech :

Horizontální Tiering

Jedná se rozdělení více diskových polí dle vlastností použitelnosti a hlavně tzv. SLA ( http://en.wikipedia.org/wiki/Service-level_agreement ) toto můžeme vidět hlavně ve velkých společnostech. Můžeme si to představit na příkladu, kdy společnost potřebuje nastartovat např. marketingovou kampaň, jak je to ukázáno na obrázku. Pak na jejím začátku se jedná o velice důležitou aplikaci, která směřuje na Tier 1 Diskové pole. Kampaň může běžet třeba půl roku a po jejím zakončení a vyhodnocení jsou data použitelná pouze pro referenční a archivační účely. Je tedy velice neekonomické ponechat tato data v té nejdražší a nejlepší T1 Storage. Pro dosažení optimálního poměru cena/výkon bychom měli data přesunout na archivační typ storage T3+.

 

Fluid Data architektura plnohodnotný tiering

Naše architektura nezná pouze klasický vertikální tiering o kterém jsme si již psali zde : http://www.optimalizovane-it.cz/storage/co-to-je-automaticky-storage-tiering.html Nýbrž také horizontální tiering ONLINE bez výpadkový a naprosto transparentní vůči připojeném serveru. Díky přesunu v rámci SAN 2 SAN konverze se jedná o maximální možnou rychlost přesunu dat, ale hlavně bez omezení chodu společnosti. Tyto technologie jsou dostupné jak v Dell EqualLogic tak v Dell Compellent.

Diskové pole přeroste kapacitu nebo je třeba technologický update

Většina výrobců nabízí diskové pole schopné růst jen do určité velikosti, pak je třeba provést velice drahý upgrade na větší model. Nejhorší je případ, kdy tento upgrade směřuje do jiné vývojové řady, kde tento upgrade v drtivé většině případů znamená zahození prvotní investice. V USA se začalo tomuto způsobu říkat tzv. Fork-lift upgrade, tedy upgrade pomoci vysokozdvižného vozíku, kterým naložíte vaší původní investici a vyhodíte jí. Na obrázku je vidět typické rozdělení storage dle segmentů a jejich omezení.

Tento upgrade v naší Fluid Data architektuře nehledejte. Fluid Data architektura dokáže více diskových polí brát jako jedno a využívat tak zdroje z obou a růst pomocí tzv. Scale Out (http://en.wikipedia.org/wiki/Scale_out#scale_out) Znamená to, že začnete s menší konfigurací a pokud potřebujete růst není problém dokoupit další puzzle do mozaiky a dojde k rozšíření infrastruktury.

Jediné co je důležité si vybrat, je způsob konektivity a zaměření storage, zkrátka pokud půjdete do Dell EqualLogic nebo Dell Compellent. Co je opravdu důležité je, že naše architektura dokáže mixovat i různé druhy technologií a tedy vás nenutí k drahému upgrade při změně technologie jako se to děje v současné době např. u diskových polí s FC Back End (http://en.wikipedia.org/wiki/Disk_array_controller#Front-end_and_back-end_side) na nové s konektivitou SAS 2.0. Jak je zřejmé z obrázku níže u naší architektury se nemusíte obávat nových technologií. Pokud hodláte nakoupit diskové pole teď, jistě počítáte s provozem min. 5 let, aby se vám investice dobře vrátila. V tom případě je VELICE důležité, aby jste si ověřili, jakým způsobem bude váš dodavatel tuto záležitost řešit, protože v těchto 5ti letech se bude přecházet na novou back end technologii SAS 3.0 (a kdo ví co ještě), které velice pravděpodobně bude mít nový konektor = bude třeba novou storage. Nová storage pak většinou znamená migrace dat a jste zase na začátku našeho článku. Pokud výrobce umožňuje upgrade bez migrace, tak se připravte na to, že si to také nechá velice dobře zaplatit. Mám zprávy od zákazníků, kteří zažili nabídky na 90% ceny nového diskového systému. Jak vidíte na obrázku níže u Fluid Data architektury tyto problémy neexistují. Je možné provádět nejen rozšiřování, ale i přidávat nové technologie bez nutnosti migrací dat a drahých re-investic.

 

Konec životního cyklu diskového pole

Toto je jeden z nejčastějších důvodů pro migraci dat. Pokud máte současné diskové pole a to vám vychází ze záruky, je na čase podívat se po náhradě. Pokud budete nakupovat u jiného výrobce než máte aktuální storage, pak vás čeká migrace dat. Nejhorší je ale situace, že existuje spousta případů, kdy vás toto čeká i když zůstanete u stávajícího výrobce. Může to být způsobeno jednak změnou technologie, jak jsme popisovali v přechozím odstavci, nebo nutností jít do jiného typu storage, kde pak mezi sebou nejsou použité komponenty kompatibilní. Na obrázku níže máme příklad kdy jsme koupili větší diskové pole a v průběhu jeho používání výrobce představil novou řadu. To poznáte podle toho, že vám zaťuká obchodník na dveře a začne vám vysvětlovat jak strašně potřebujete jedinečnou technologii, kterou má právě tato generace. Zde jsme odolali “útokům” a nechali si stávající technologii, protože nám ještě zbývala záruka. Po dalších letech již ale naše storage vychází ze záruky a my jsme nuceni provést upgrade na novou generaci. Velice pravděpodobně nás bude obchodník chlácholit, že se technologie vyvinula a  že již nepotřebujeme tak výkonnou storage a aby snížil cenu, tak vám nabídne nižší model. Je to asi stejné  jako, když budete jezdit 3 roky Superbem a pak vám obchodník “natlačí” Oktavii. Srovnání uživatelského komfortu nechám na vás. Díky tomu, že dříve byla připojení disků FC a tato nová storage již má SAS 2.0 tak i když jste si před dvěma lety zakoupili diskové police s funkčními disky ještě pod zárukou, můžete teď použít vysokozdvižný vozík a poslat disky do věčných lovišť, protože je nemůžete připojit do nového diskového pole. Právě zažíváte Fork-lift upgrade.

U naší Fluid Data architektury se tohoto nemusíme obávat. Ať Dell EqualLogic nebo Dell Compellent, obě disková pole umožní pokračovat online bez výpadku i na novém HW. V České republice díky tomu, že zde byl EqualLogic přítomen již před akvizicí společností Dell, máme reálné zákazníky, kteří používají dohromady původní EqualLogic PS100 spolu s novými PS5000 a nejnovějšími PS6100, což je  opravdu nejlepší ukázka ochrany investice zákazníka. U Compellentu naopak můžeme použít referenci z našeho Co-Pilot centra (Proaktivní supportní středisko pro diskové systémy Compellent). Zákazníku, který provede propojení  storage s naším Co-Pilotem, je automaticky nastaven jeho profil a hlídání funkce storage. Máme tak přehled o všech aktivních Compellentech připojených do tohoto systému. Můžeme hrdě sdělit, že 98% Compellentů prodaných od r. 2004 je STÁLE ONLINE A FUNKČNÍCH ! Samozřejmě, že ne všechny běží na původním HW, ale jejich upgrade na nový HW proběhl bez výpadku a transparentně vůči serverům. Tyto upgrady proběhli také za příznivějších cenových podmínek, protože Compellent má life-time licencing model, který zabezpečuje, že v případě přechodu na nový HW zákazník platí pouze upgrade HW nikoli SW jako u většiny konkurence.

  Nejdůležitější je, že všechny tyto upgrade v rámci Fluid Data architektury probíhají bez nutnosti problematické migrace dat ! Nemusíte se tedy zabývat touto složitou otázkou.

Autor: Ondřej Bačina

Následující článek Předchozí článek