Центрове За Данни

Архивиране или резервно копиране? Важно е да знаем разликите

Владимир Владков

Ако искате да докарате апоплектичен удар на човек, отговарящ за резервните копия, поискайте старо копие на архива. Това е просто срамежлив начин да кажете, че не е необходимо данните в RAID масива да бъдат резервирани. Добрата новина е, че разликите между резервното копие и архива са доста ярки и лесни за разбиране.

Какво е резервно копие?

Резервирането е копие на данните, създадено, за да бъдат възстановени те в случай на повреда или загуба. Оригиналните данни не се изтриват след създаване на резервното копие. Примерите за резервно копиране включват нощното резервно копиране на всички файлове от вашия лаптоп или настолен компютър или на всички ваши снимки от iPhone в iCloud, съответно снимките от Adroid телефона в Google Cloud, като вие можете да си ги възстановите напълно дори да си загубите или повредите/замените телефона. Ние правим резервни копия на файлови сървъри (неструктурирани данни) и на бази данни (структурирани данни). Резервното копиране може да се фокусира върху данните при разтоварване на базата данни, на операционната система на сървъра при резервиране на „хардуерно ниво” (bare metal) или и на двете, както е при резервното копиране на .VMDK файлове на VMware.

Дефиницията за резервно копиране на практика идва от целта, а целта на резервното копие винаги е била една и съща - възстановяване на данните, ако нещо се случи с тях. Например масив RAID 6 може да се сблъска с повреда на три диска, а всички негови данни трябва да бъдат възстановени. Някой може случайно или умишлено да изтрие една или повече виртуални машини от вашата конфигурация VMware, Hyper-V или AWS EC2, като тези VM трябва да бъдат възстановени. Един ден може да осъзнаете, че всеки файл във вашата организация е бил шифрован от криптовирус. Без добра система за резервиране изборът ще се сведе до две опции – да платите откупа или да се „простите“ с данните. С добра система за резервиране можете да разберете кой е източникът на атаката с криптовирус, да го спрете, а след това да възстановите всичките си данни, без да плащате на хакера.

А какво е архив?

Архивът е копие на данните, създадено за справочни цели. Макар че това не се изисква, често оригиналните данни се изтриват след създаване на архива.

Когато целта на архива е да се върне нещо обратно по начина, по който е изглеждало (обикновено) вчера, архивът може да послужи за многобройни задачи. Най-разпространената е да ви помогне да намерите някои данни, записани много отдавна. Друга задача би могла да бъде отделен файл, в който има наистина важна част, например договор, подписан от клиент преди няколко години. Това може да е свързано с група от данни като всички строителни чертежи на сградата, която просто се е сринала. Или може би това са всички CAD чертежи на приспособление, което вашата компания е използвала за нещо, което е излязло от модата, но изведнъж стилът пак става актуален.

Друг свързан набор от данни може да са всички е-писма и/или файлове, които могат да докажат дадена гледна точка. Ако служител вярва, че е получил разрешение за втора допълнителна работа, а след време бива уволнен заради това. Последващият съдебен процес може да направи заявка за електронно откриване, като поиска всички е-писма от и до съответния служител да бъдат претърсени за думите "втора работа" (на англ. терминът е доста по-цветист - moonlight, което предполага, че втората работа на служителя се извършва след стандартното работно време, например нощем), изразът „след работно време“ или името на компанията, за която служителят изпълнява задачи след работно време. Друг пък може да се опитва да докаже враждебна работна среда и иска да види всички е-писма от определен кръг мениджъри, които съдържат определен списък от думи, които не е необходимо да изброяваме тук.

Архивът е онова, което ще помогне за изпълнението на всички подобни задачи. Може да имате архив на всяка поръчка за продажба, оферта или договор, която някога е дала вашата компания. Можете да запазите онлайн текущите договори и поръчки, но съхранявате всички в архива, който трябва да има индекс, позволяващ ви да извличате поръчки и договори чрез съдържанието на тези поръчки. Също така може да имате архив на всяко е-писмо, изпратено или получено от вашата компания.

Някои системи за архивиране на електронна поща могат да изчистят от е-пощенския сървър е-писма, които са архивирани, които са по-големи от определен размер и/или не са били достъпвани за повече от N на брой дни. Това помага да поддържате по-лека система за електронна поща, като пестите ресурсите за изчисления и съхранение и улеснявате резервното копиране. Това дори може да е целта на този архив, ако не сте задължени по закон да пазите всички електронни писма.

 

Възстановяване срещу извличане

Дори ако целта на даден архив е да спести място на основното хранилище, трябва да можете да осъществявате извличане вместо възстановяване, ако това ще се нарича архив. Системите за архивиране възстановяват и архивират системите.

Системите за резервиране възстановяват, а системите за архивиране извличат.

Когато възстановявате нещо, обикновено то е един файл, един сървър или една база данни. Когато извличате нещо, това обикновено е колекция от свързани данни, които могат да са или да не са съхранявани на един и същ сървър или дори в един и същ формат. Възстановяването се извършва към даден времеви момент, например възстановяване на база данни по начина, по който е изглеждала вчера. Извличането използва по-широк времеви период, например всички е-писма за последните 3 години.

Възстановяването изисква да знаете много за това къде са били файлът или данните, когато са били резервирани; в противен случай не можете да ги намерите. Необходимо е да знаете името на сървъра, на който е бил файлът, базата данни или директорията, в която е бил, името (имената) на файла или таблицата, която желаете да получите, както и датата, на която за последно е бил видян. Извличането няма нужда от тази информация; просто знае, че има нужда от всички файлове или записи, които съответстват на даден набор от параметри. “Дайте ми всички файлове или е-писма, създадени през последните 3 години, които съдържат определена фраза или са създадени от конкретен човек”, може да гласи заявката за извличане.

Трябва ли да знаем разликата?

Много хора се опитват да използват своята система за резервни копия като архивираща система, което означава, че поддържат резервните си копия в продължение на много години - или дори завинаги. Първия път, когато получите заявка за истинско извличане, ще откриете колко е трудно да осъществите извличане от нещо, чиято цел е била просто „възстановяване“. Това ще направи извличането много, много трудно и дълго – понякога месеци вместо минути - и ще струва много, много скъпо - милиони долари вместо няколко долара.

Ако извличането е по повод искане за електронно откриване, направено по време на съдебен процес, а вие не сте в състояние да го удовлетворите своевременно, рискувате съдията да издаде инструкция за „неблагоприятно заключение“. Отнема ви 6 месеца, за да задоволите нещо, което съдията знае, че е обикновена молба, и вие сте “доникъде“ с нейното изпълнение. Съдията постановява, че се опитвате да скриете нещо, и го казва на съдебното жури. След това просто губите делото. Това не е въображаем сценарий, а реална случка. В делото на Morgan Stanley те загубиха милиарди точно по описания сценарий.

Не използвайте вашите резервни копия като архиви. Ако се налага да използвате дългосрочно съхранение, проучете пазара за истинска архивираща система. Тя ще струва повече пари, в дългосрочен план те ще се изплатят.

© Ай Си Ти Медиа ЕООД 1997-2020 съгласно Общи условия за ползване

X