SCSI или Serial ATA - что же выбрать?
Введение
В последнее время, в связи с массовым появлением на
рынке различных серверных систем с применением IDE и особенно Serial
ATA жестких дисков, в компьютерном сообществе часто возникают споры
по поводу быстродействия и надежности подобных систем по сравнению
со SCSI системами. Разделим вопросы надежности и быстродействия и
подробно остановимся на каждом из них. Поскольку IDE жесткие диски
уходят с рынка, мы будем сравнивать SCSI с Serial ATA (SATA)
системами.
Быстродействие
Итак, на чем строятся
аргументы сторонников SCSI дисков в качестве основы высокоскоростных
серверных дисковых подсистем? Первый аргумент – интерфейс SCSI
отличается бОльшим "интеллектом" по сравнению с SATA. Но даже
обычный рядовой пользователь компьютера понимает, что сам по себе
жесткий диск представляет собой некую механическую систему для
записи/считывания данных и весь интеллект SCSI обеспечивается
контроллером на самом жестком диске и контроллером SCSI компьютера.
Именно такая пара и обладает весьма важными "интеллектуальными"
способностями по обмену данными. Безусловно, пара из обычного SATA
контроллера и SATA диска таким "интеллектом" не обладает. Но нас
интересуют серверные системы и системы хранения данных - давайте
рассмотрим применение SCSI и SATA в них. В этих системах
крайне редко применяются диски сами по себе – требования к
надежности хранения данных обуславливают необходимость применения
RAID контроллеров и даже для хранения операционной системы
используются RAID 1, а для хранения данных применяются, как правило,
отдельные RAID массивы уровня 5. Поэтому логично и разумно
рассматривать всю дисковую подсистему в целом, т.е. пару RAID
контроллер плюс подключенные к нему диски. Для SCSI систем RAID
контроллер состоит из процессора, занимающегося обработкой данных,
кэш-памяти процессора и обычного SCSI контроллера, с помощью
которого данные поступают от процессора к дискам или от дисков к
процессору. На одном SCSI контроллере обычно "висят" несколько SCSI
дисков. Конечно, есть многоканальные (до 4-х каналов) SCSI RAID
контроллеры, но и в случае их применения к каждому каналу подключают
по несколько дисков. Еще раз обращаем ваше внимание на эту важную
особенность – несколько SCSI дисков обслуживаются одним
контроллером. Из этого факта следует еще один важный вывод – без
какого-либо "интеллекта" работа нескольких дисков на одной
физической шине SCSI контроллера была бы просто очень
медленной. Для SATA систем RAID контроллер также состоит из
процессора, занимающегося обработкой данных, кэш-памяти процессора и
раздельных для каждого диска SATA контроллеров, с
помощью которых данные поступают от процессора к дискам и от дисков
к процессору. Тем самым видна принципиальная разница между SCSI RAID
контроллерами и SATA RAID контроллерами – в первом случае несколько
дисков обслуживаются одним контроллером и все диски подключены на
одну физическую шину, во втором – каждый диск подключен к своему
контроллеру индивидуально. Теперь простой вопрос – что
мешает возложить на процессор RAID SATA контроллера все те
интеллектуальные задачи, которые решает SCSI контроллер? Ответ также
прост – ничего не мешает и производители хороших RAID контроллеров,
такие как 3WARE,
например, так именно и делают. Следующий аргумент в пользу
SCSI дисков – они быстрее, поскольку скорость вращения шпинделя у
SCSI дисков составляет минимум 10000 об/мин, а максимум 15000
об/мин. Действительно, скорость вращения у SCSI дисков больше и,
если использовать SCSI дис-ки со скоростью вращения 15000 об/мин, то
почти в два раза больше. Но нельзя оценивать только скорость
вращения, поскольку большую роль играет плотность записи/чтения на
пластины жесткого диска. А вот тут ситуация не столь радужная для
SCSI – плотность за-писи на SCSI дисках как минимум в два раза
меньше, соответственно за один оборот диска можно считать/записать в
два раза меньше с/на SCSI диск, чем с/на SATA. Конечно, нельзя
утверждать, что большая плотность записи полностью компенсирует
бОльшую скорость вращения, но для потоковых операций это практически
так и есть, а для множественных операций с небольшими
файлами/блоками данных большая скорость вращения предпочтительнее,
но в этом случае очень многое зависит от процессора RAID контроллера
– насколько он оптимально управляет дисками.
Теперь
рассмотрим специализированные внешние дисковые массивы, в которых
сейчас также наблюдается массовый переход от SCSI к SATA. Даже такие
гранды компьютерной индустрии как Hewlett-Packard (модель HP
StorageWorks Modular Smart Array 1500 cs) и IBM (модель IBM
TotalStorage® DS4100 Storage Server), например, выпустили модели
внешних дисковых массивов с SATA дисками в 2004
году. Конструктивно внешние дисковые массивы (их еще
называют системами хранения данных) устроены просто – для
подключения к компьютеру используется либо SCSI 160/320, либо Fibre
Channel, а для управления работой массива применяется
специализированный компьютер на базе RISC процессора Intel 80303 или
80321 (в некоторых системах применяется процессор Power PC) с
оперативной памятью от 128 мегабайт и внутренней шиной (шинами)
PCI-X. Понятно, что с точки зрения компьютера, к которому
подключается такая система хранения данных, это обычное SCSI
устройство, поддерживающее все возможности SCSI
интерфейса. Сейчас мы попробуем доказать, что
производительность системы хранения данных зависит в первую очередь
не от типа интерфейса жестких дисков внутри системы, а от мощности
специализированного компьютера, обслуживающего жесткие диски.
Представим себе, что в систему установлен один жесткий диск.
Очевидно, что достичь большей производительности, чем позволяет
единственный установленный жесткий диск, нельзя. Никакой процессор
не сможет ускорить работу механики жесткого диска и/или увеличить
плотность хранения на нем и тем самым скорость записи/чтения данных.
Но если установить 5 дисков, например, то при наличии мощного
процессора в системе хранения данных можно увеличить
производительность в 5 раз относительно производительности одного
диска. Добавляя все больше и больше дисков, можно тем самым
увеличивать производительность, но только до тех пор, пока процессор
системы хранения данных будет успевать обслуживать каждый диск без
малейших задержек. Как только процессор перестанет успевать,
дальнейшее увеличение количества дисков не приведет к увеличению
производительности. Так вот, лучшие на конец 2004 года системы
хранения данных на процессоре Intel 80321 600 MHz достигли
максимальной скорости чтения по нашим тестам 235 мегабайт/сек. Это
означает, что для получения такой производительности достаточно
иметь не более 7 современных SATA дисков или 4 SCSI дисков на 15000
об/мин. Но, как известно, минимальные системы хранения данных
рассчитаны на 8 дисков и тем самым, вне зависимости от интерфейса
жестких дисков предельная скорость доступа к данным не превысит того
значения, которое сможет добиться процессор этой системы
хранения. Тестирование двух систем хранения на разных
процессорах, но с идентичными жесткими дисками, также доказывает
правоту этого утверждения. Поэтому можно со всей ответственностью
утверждать, что производительность системы хранения данных зависит в
бОльшей степени от процессора системы, чем от интерфейса и типа
жесткого диска.
Надежность
Совершенно очевидно, что
для серверных систем масштаба предприятия надежность во многих
случаях важнее, чем производительность. Потеря корпоративной базы
данных даже на несколько часов, необходимых для ее восстановления с
резервного носителя, может обернуться для компании многомиллионными
убытками. Исторически считается, что надежность весьма дорогих SCSI
дисков значительно превышает надежность дешевых IDE или SATA дисков.
Официальные гарантийные сроки для SCSI дисков всегда были не менее 5
лет, а на IDE/SATA диски только недавно стали устанавливать такие же
сроки гарантии. К сожалению, нам неизвестны достоверные источники
информации о реальной статистике отказов жестких дисков IDE/SATA по
сравнению со SCSI. Производители жестких дисков, разумеется,
приводят в технических характеристиках своей продукции параметр MTBF
(Mean Time Between Failure – среднее время между отказами) и для
SCSI дисков этот показатель обычно равен 1 200 000 часов, а для
IDE/SATA MTBF, как правило, не превышает 500 000 часов. Проблема в
том, что нет сведений о корреляции MTBF с реальной статистикой
отказов – понятие среднего времени между отказами напоминает среднюю
температуру по больнице. Понятно, что чем MTBF больше, тем должно
быть лучше, но непонятно, каким образом можно использовать значение
MTBF в реальной жизни для представления о надежности используемого
оборудования. Тем не менее, известная корпорация Western
Digital выпустила в середине 2004 года новую серию SATA дисков WD
Caviar RAID Edition, официально предназначенных для круглосуточной
работы в RAID массивах. MTBF этих дисков объявлен в 1 000 000, что
не намного меньше MTBF для SCSI дисков. Но, даже если
считать надежность SATA дисков заведомо более низкой, чем у SCSI
дисков, стоимость SATA дисков позволяет добавить в RAID массив один
или два диска для " горячего" резерва без заметного удорожания
системы. Поэтому надежность работы RAID на SATA дисках в целом можно
сделать не ниже надежности RAID на SCSI дисках.
Перспективы
Оборудование
На наш взгляд, перспективы систем на SATA дисках
выглядят более радужными для серверных систем, чем на SCSI дисках.
Компания Intel, например, объявила поддержку SATA во всех
новых версиях своих серверных платформ - SR1400 (1U), SR2400
(2U) и SC5300 (Desktop и 5U Rack). Практически все именитые
производители серверного оборудования выпустили в 2004 году модели
внешних дисковых массивов с SATA дисками. Что касается собственно
производителей систем хранения данных, таких как Maxtronic
International, Medea Corporation, Enhance Technology, AXUS, Silicon
Graphics Inc и многих других, то они уже давно применяли IDE диски,
а сейчас выпустили множество моделей с поддержкой SATA дисков. У
ряда производителей систем хранения данных модели на SCSI дисках
просто отсутствуют в списке выпускаемого оборудования.
Интерфейсы
-
SATA - В дисках и контроллерах с новыми
версиями интерфейса SATA должна появиться поддержка набора
инструкций Native Command Queuing (Очередь или конвейер команд).
При использовании Native Command Queuing контроллер SATA
выстраивает запросы ввода-вывода таким образом, чтобы
минимизировать время поиска данных на диске. Конечно, размер
очереди в новой версии SATA меньше, чем в SCSI - 32 против 256, но
тем не менее, эта возможность должна придать "интеллектуальные"
свойства и SATA системам, причем это будет особенно заметно при
работе SATA дисков не в составе RAID массивов, а в обычных
настольных компьютерах.
-
SCSI - классический вариант параллельного
SCSI интерфейса, судя по всему, реального развития уже никогда
иметь не будет. Новый интерфейс Serial Attached SCSI (SAS -
Последовательный SCSI), который сейчас разрабатывается,
принципиально отличается от сегодняшнего параллельного SCSI,
поэтому его успешность или не успешность на рынке будет видна еще
не скоро.
Заключение
Оно
кратко - нет никаких достаточных оснований утверждать, что RAID
системы с SATA дисками заметно уступают как в быстродействии, так и
в надежности RAID системам на SCSI дисках. Кроме этого,
RAID массивы на SATA дисках позволяют создать бОльшие по емкости
массивы – до 6 терабайт на 16-ти дисковой системе хранения данных.
На SCSI дисках такой массив должен включать в себя не менее 44
дисков и стоимость его будет как минимум в 3 раза выше. Поэтому, на
наш взгляд, движение индустрии пойдет в сторону все большего и
большего применения SATA дисков с сохранением популярности SCSI и
его оптического аналога Fiber Channel в качестве интерфейса для
обмена данными.
Автор: Сергей Блохнин
Источник: www.spline.ru
|