Jak funguje deduplikace

Deduplikace u zdroje

Při provádění zálohování do deduplikačního úložiště počítá agent aplikace Acronis Backup otisk pro každý blok dat. Takový otisk se často nazývá hodnota hash.

Před odesláním bloku dat do úložiště zkontroluje agent deduplikační databázi, zda není hodnota hash položky stejná jako hash u některé již dříve uložené položky. Pokud ano, agent odešle pouze hodnotu hash, jinak odešle blok samotný. Uzel úložišť ukládá obdržené bloky dat do dočasného souboru.

Některá data, například šifrované soubory nebo bloky disku nestandardní velikosti, nelze deduplikovat. Agent vždy přenáší taková data do úložiště bez výpočtu hodnot hash. Další informace o omezeních deduplikace naleznete v tématu Omezení deduplikace.

Po dokončení procesu zálohování úložiště obsahuje výslednou zálohu a dočasný soubor s unikátními bloky dat. Dočasný soubor bude zpracován v následujícím kroku. Záloha (soubor TIB) obsahuje hodnoty hash a data, která nelze deduplikovat. Další zpracování této zálohy není nutné. Lze z ní okamžitě obnovit data.

Deduplikace u cíle

Po dokončení zálohování do deduplikačního úložiště uzel úložišť spustí indexování. Tato aktivita deduplikuje data v úložišti následujícím způsobem:

  1. Přesune bloky dat z dočasného souboru do speciálního souboru v úložišti, přičemž duplicitní položky uloží pouze jednou. Tento soubor se nazývá deduplikační datové úložiště.
  2. Ukládá do deduplikační databáze hodnoty hash a odkazy, které jsou potřebné k „sestavení“ deduplikovaných dat.
  3. Po přesunutí všech bloků dat je dočasný soubor odstraněn.

Výsledkem je, že datové úložiště obsahuje určitý počet unikátních bloků dat. Na každý blok ukazuje jeden nebo více odkazů ze záloh. Odkazy jsou obsaženy v deduplikační databázi. Zálohy zůstaly nedotčeny. Obsahují hodnoty hash a data, která nelze deduplikovat.

Následující diagram znázorňuje výsledek deduplikace u cíle.

Dokončení úlohy indexování může zabrat mnoho času. Stav této aktivity můžete sledovat na serveru pro správu výběrem příslušného uzlu úložišť a kliknutím na Zobrazit podrobnosti. V tomto okně můžete tuto úlohu také ručně spustit nebo zastavit.

Pokud zálohujete velké množství jedinečných dat, úloha indexování může selhat z důvodu nedostatečné paměti RAM v uzlu úložišť. Zálohování bude nadále pokračovat. Můžete do uzlu úložišť přidat více paměti RAM nebo odstranit nepotřebné zálohy a spustit stlačování. Po příštím zálohování bude indexování spuštěno znovu.

Stlačování

Po vymazání jedné nebo více záloh nebo archivů z úložiště – buď ručně nebo během čistění – může datové úložiště obsahovat bloky, na které již není odkaz z žádného archivu. Takové bloky jsou odstraněny úlohou stlačování, která je plánovanou úlohou prováděnou uzlem úložišť.

Ve výchozím nastavení se úloha stlačování spouští každou neděli v 03:00 v noci. Úlohu můžete přeplánovat výběrem příslušného uzlu úložišť, kliknutím na Zobrazit podrobnosti a poté kliknutím na Plán stlačování. Na této kartě můžete také ručně spustit nebo zastavit úlohu.

Protože odstranění nepoužívaných bloků je náročné na prostředky, úloha stlačování jej provádí pouze tehdy, když se nashromáždí dostatečné množství dat k odstranění. Práh je určen parametrem konfigurace Práh spuštění stlačování.