Большой архив статей, книг, документации по программированию, вебдизайну, компьютерной графике, сетям, операционным системам и многому другому
 
<Добавить в Избранное>    <Сделать стартовой>    <Реклама на сайте>    <Контакты>
  Главная Документация Программы Обои   Экспорт RSS E-Books
 
 

  Раздел: Компьютерная документация -> Периферийные устройства -> Накопители

 

Классификация систем хранения данных

Введение 

Рассматривая любую информационную систему, нельзя не выделить такой процесс как хранение информации. Именно информация представляет основную ценность в любой организации, а вся инфраструктура, предназначенная для её обработки, хранения, передачи – лишь следствие данного факта. Хотелось бы уделить внимание процессу хранения информации, методах аппаратной защиты информации от потери и управлению хранением информации. В современном мире любая компания ощущает на себе следующие тенденции: информация играет ключевую роль в работе организации, рост данных происходит в экспоненциальной пропорции. К примеру, IDC утверждает, что объем ежегодно создаваемой и дублируемой информации увеличится в 6 раз в период с 2006 по 2010 гг.

В первую очередь, интересует продолжительное во времени хранение на жестких дисках (в перспективе на SSD накопителях). Данный материал дает представление об аппаратных методах организации хранения и защиты данных.  Рассмотрены иерархия систем хранения данных на жестких дисках, их общие классы. Такие системы как NAS серверы или VTL не рассматривались, хотя могут иметь место как надстройка к описанным системам.

Угрозы для информации, ведущие к её потере при хранении на жестких дисках

  • Аппаратные - отказ, порча, поломка оборудования.
  • Программные - отказ, сбой, неправильная работа программного обеспечения.
  • Человеческие – неправильные, неадекватные действия персонала.
  • Инфраструктурные – сбой средств передачи информации, обрыв кабелей, выключение роутеров, плохие контакты.
  • Электропитание – потеря данных вследствие низкого качества или исчезновения электроэнергии.
  • Аварии – пожар, затопление и прочие угрозы масштаба серверной комнаты, здания.
  • Катастрофы – проблемы районного, городского масштаба.

Итак, начиная от простого к сложному.

Прямое подключение HDD

Жесткий диск подключается к интегрированному контроллеру материнской платы. Подразумевается, что никаких дополнительных устройств хранения нет. Если данный тип подключения почти всегда реализуется в домашних условиях, то для любой фирмы он совершенно неприемлем как средство хранения хоть сколько-нибудь важной информации.

Один жёсткий диск - не самое лучшее решение 

Данные не защищены и любой сбой (аппаратный или программный) может привести и однажды приведет к потере данных. Ценность Вашей информации противопоставлена не только прогнозам фирмы производителя на гарантийные расходы, но и качеству электроэнергии, квалификации персонала, софта и прочих надсистемных факторов.

Информация не защищена от:

  • Аппаратных проблем
  • Программных сбоев 
  • Человеческого фактора
  • Инфраструктурных проблем
  • Сбои электропитания
  • Аварий
  • Катастроф

Внутренний RAID контроллер

RAID (англ. redundant array of independent/inexpensive disks) - избыточный массив независимых/недорогих жёстких дисков — матрица из нескольких дисков, управляемых контроллером, взаимосвязанных скоростными каналами и воспринимаемых как единое целое. В зависимости от типа используемого массива может обеспечивать различные степени отказоустойчивости и быстродействия.

Типичный RAID контроллер - Adaptec ASR-5805

Два или более дисков подключаются к контроллеру в сервере либо внешняя дисковая полка подключается к контроллеру, в зависимости от выбранного уровня отказоустойчивости, защищает от поломки одного или более дисков, сохраняя работоспособность.

При наличии энергонезависимого кэша и использовании SAS дисков, защищает от проблем, связанных с перебоями электропитания, за исключением тех случаев, когда происходит электрическое повреждение оборудование. Но при повреждении сервера возможна потеря данных.

Защищает данные от:

  • Аппаратных проблем - отказ, порча, поломка оборудования. Частично, только от отказа жестких дисков.
  • Сбои электропитания – частично, защищает данные, хранимые в буфере контроллера в очереди на запись, но ограниченное время и только при наличии аккумулятора на контроллере.

Не защищает от:

  • Программных сбоев
  • Человеческого фактора
  • Инфраструктурных проблем (хотя все соединения, как правило, находятся внутри сервера).
  • Аварий
  • Катастроф

Основная цель применения – защита данных от потери при отказе жесткого диска, так же, одна из причин внедрения - потребность в повышенной производительности дисковой подсистемы.

RAID контроллеры поставляют многие компании: IBM, DELL, SUN,  HP, Adaptec, 3ware, LSI, и прочие.

Внешний RAID массив

Начальный уровень. Диски и контроллер вынесены в отдельную внешнюю систему. Один или несколько серверов могут быть подключены к внешнему массиву различными интерфейсами, к примеру SAS, iSCSI, FC. Почти все такие системы имеют дублирование вентиляторов и блоков питания, многие предусматривают возможность установки дублирующего контроллера. Сами по себе, внешние RAID массивы более производительны и надежны по сравнению с внутренними RAID контроллерами и могут расширяться до более чем сотни дисков (при помощи дисковых полок).

Внешний RAID массив

На данный момент во многих моделях есть продвинутые средства мониторинга и управления, как самим массивом, так и данными на нём. Средства контроля за состоянием дисков заранее оповещают о возможном отказе, большинство достойных производителей меняют диски только на основании данных сообщений, до факта неработоспособности. У некоторых моделей есть возможно делать мгновенные снимки – (snapshot), что позволяет защитить данные и упрощает резервное копирование.

Защищает данные от:

  • Аппаратных проблем - частично, при наличии дублирования всех систем.
  • Программных сбоев - частично, некоторые массивы обладают функциями создания мгновенных копий, что поможет создавать множественные снимки.
  • Инфраструктурных проблем– защищают при условии дублирования всех массивов вне сервера.
  • Сбои электропитания – частично, защищает данные в буфере контроллера на запись при наличии аккумулятора. Наличие дублированных блоков питания гарантирует большую надежность.

Не защищают от:

  • Человеческого фактора
  • Аварий
  • Катастроф

Причиной внедрения является либо потребность в консолидации ресурсов хранения, их более простом управлении, возможности одновременного доступа (например при создании кластера), либо потребность в высокой производительности, либо потребность в большей надежности (дублирование путей к контроллеру).

Типичные представители класса: Xyratex 5xxx/6xxx, Dell MD3000, IBM 3XXX, HP MSA 2000.

Дисковый массив уровня предприятия

Средний уровень. Иногда довольно сложно провести грань между Entry level и Midrange, но в основном ведущие производители сходятся в том что основной критерий это надежность системы и её функционал. Производительность или масштабируемость, которые, естественно больше, также имеют значение, но не на первом плане. Естественно, что в системах среднего уровня есть всё, что и в entry level и даже больше - обязательным считается дублирование всех систем в том числе контроллеров, интерконектов, питания, можно сказать что 99,99% доступности для таких систем это уже минимум (менее часа простоя в год) и новый стандарт это 99,999. И, соответственно, богатый набор средств управления и мониторинга. К каждой системе возможен широкий набор опций к примеру, синхронная и асинхронная репликация, копирование томов, набор утилит как для сервера так и для массива.

 Дисковый массив уровня предприятия - HP EVA

Таким образом, посредством репликации можно добиться от системы устойчивости к авариям и даже катастрофоустойчивости, средствами одного только массива.

Защищает данные от:

  • Аппаратных проблем.
  • Программных сбоев - частично, все массивы обладают функциями создания мгновенных копий.
  • Человеческого фактора – частично, более продивинутая система управления, как правило, старается предупредить неправильные действия.
  • Инфраструктурных проблем – защищают при дублировании всех систем вне массива.
  • Сбои электропитания – частично, защищает данные в буфере контроллера на запись при наличии аккумулятора на контроллере. Наличие дублированных блоков питания гарантирует большую надежность.
  • Аварий– при работающих системах репликации.
  • Катастроф – при работающих системах удаленной репликации.

Когда применяется. Причиной перехода на системы такого уровня может стать либо потребность в дополнительных сервисах для резервирования, либо сокращения затрат на поддержание инфраструктуры. Так же компания может быть заинтересована в более рациональном распределении ресурсов (а следовательно и экономии), что достигается за счет высокой масштабируемости таких систем, применении технологий виртуализации. Нельзя забывать и о высоких стандартах надежности.

Dell EqualLogic 

Типичные представители серии: HP EVA (на рисунке), DELL EqualLogic, IBM DS 4xxx

Системы хранения данных класса Hi-End

Hi-end системы. Данные системы востребованы только крупными корпорациями, что, учитывая их стоимость, вполне понятно. Предоставляя высочайшую надежность, на уровне близком к абсолютному, и уникальные функциональные возможности. Не имея возможности раскрыть весь функционал в рамках данного материала, можно однозначно сказать, что данные решения оправдывают свою стоимость, если, конечно у вас есть несколько миллионов долларов.

Данные системы строятся на базе, так называемых non-stop систем. Дублируются все компоненты системы, в том числе процессоры, операционная система проходит тестирование для исключения любых ошибок, поэтому вероятность отказа крайне мала. В дополнение значительную ценность представляет и программное обеспечение, поставляемое с данной системой.

Hitachi USP V - система хранения класса Hi-End

Фактически данные устройства являются уже не средством хранения информации, а решением по управлению и виртуализации данных, представляя собой комплексное решение, выходящее за рамки организации простого хранения информации.

Данное оборудование поставляют ведущие производители HDS, HP, IBM, EMC, SUN. (на рисунке Hitachi USP V).

Несколько слов о RAID – массивах

RAID (англ. redundant array of independent/inexpensive disks) избыточный массив независимых/недорогих жёстких дисков — матрица из нескольких дисков управляемых контроллером, взаимосвязанных скоростными каналами и воспринимаемых как единое целое. В зависимости от типа используемого массива может обеспечивать различные степени отказоустойчивости и быстродействия. Служит для повышения надёжности хранения данных и/или для повышения скорости чтения/записи информации (RAID 0).

RAID 0

RAID 0 («Striping») представляет собой дисковый массив из 2 или более дисков, в котором информация разбита на блоки Аn и последовательно записана на жесткие диски. Соответственно информация записывается и читается одновременно, что увеличивает скорость.

RAID 0

К сожалению, при отказе одного из дисков информация необратимо теряется, поэтому применяется либо в домашних условиях, либо для хранения файла подкачки, своп файла.

RAID 1

RAID 1 (Mirroring - «зеркалирование»). В данном случае один диск полностью повторяет другой, что гарантирует работоспособность при поломке одного диска, но объем полезного пространства уменьшается вдвое. Поскольку диски покупаются одновременно, в случае бракованной партии возможен отказ обоих дисков. Скорость записи приблизительно равна скорости записи на один диск, возможно чтение сразу с двух дисков (если контроллер поддерживает данную функцию), что увеличивает скорость.

RAID 1

Применяется чаще всего в малых офисах под базы данных, либо для хранения операционной системы.

RAID 5

RAID 5. В данном случае все данные разбиваются на блоки и для каждого набора считается контрольная сумма, которая хранится на одном из дисков – циклически записывается на все диски массива (попеременно на каждый), и используется для восстановления данных. Устойчив к потере не более чем одного диска.

RAID 5

RAID 5 имеет высокие показатели чтения – информация считывается почти со всех дисков, но уменьшенную производительность при записи – требуется вычислять контрольную сумму. Но самая критичная операция перезапись, так как она проходит в несколько этапов:

  • Чтение данных
  • Чтение контрольной суммы
  • Сравнение новых и старых данных
  • Запись новых данных
  • Запись новой контрольной суммы

Применяются при необходимости большого объема, и высокой скорости чтения.

RAID 6

RAID 6 (ADG). Логическое продолжение RAID 5. Отличие заключается в том что контрольная сумма высчитывается 2 раза, и, как следствие имеет большую надежность (устойчив при поломке более 2 дисков), и меньшую производительность.

 RAID 6

RAID 10

RAID 10 (RAID 1+0). Сочетает в себе принципы RAID 0 и RAID 1. При его применении каждый жесткий диск имеет свою «зеркальную пару», при это используется половина полезного объема. Работоспособен пока существует один рабочий диск из каждой пары. Наиболее высокие показатели записи/перезаписи, сопоставимы с RAID 5 по скорости чтения. Применяется для хранения баз данных, при высокой нагрузке.

Автор: Дмитрий Нечаев
Источник: www.hwp.ru



  Добавить закладку на материал: 


Ссылки по теме
Домашний дисковый массив RAID5 на 3.5 Тб своими руками
Хранение данных: задачи, решения, перспективы
Диски будущего
HDD будущего: перпендикулярная запись и не только
Будущее накопителей информации. Часть 1. Жесткие диски
Будущее накопителей информации. Часть 2. Ее величество оптика
Будущее накопителей информации. Часть 3. MEMS

Вся документация накопители

 

Компьютерная документация от А до Я - Главная

 

 
Интересное в сети
 
10 новых программ
CodeLobster PHP Edition 3.7.2
WinToFlash 0.7.0008
Free Video to Flash Converter 4.7.24
Total Commander v7.55
aTunes 2.0.1
Process Explorer v12.04
Backup42 v3.0
Predator 2.0.1
FastStone Image Viewer 4.1
Process Lasso 3.70.4
FastStone Image Viewer 4.0
Xion Audio Player 1.0.125
Notepad GNU v.2.2.8.7.7
K-Lite Codec Pack 5.3.0 Full


Наши сервисы
Рассылка новостей. Подпишитесь на рассылку сейчас и вы всегда будете в курсе последних событий в мире информационных технологий.
Новостные информеры. Поставьте наши информеры к себе и у вас на сайте появится дополнительный постоянно обновляемый раздел.
Добавление статей. Если вы являетесь автором статьи или обзора на тему ИТ присылайте материал нам, мы с удовольствием опубликуем его у себя на сайте.
Реклама на сайте. Размещая рекламу у нас, вы получите новых посетителей, которые могут стать вашими клиентами.
 
Это интересно
 

Copyright © CompDoc.Ru
При цитировании и перепечатке ссылка на www.compdoc.ru обязательна. Карта сайта.