Подсистемы хранения данных


Хранение данных: задачи, решения, перспективы


Семен Горотов

"Экспресс Электроника"

Отказ в доступе к данным послужил причиной очень крупных проблем у целого ряда компаний. По оценкам Gartner, более 40% из них вынуждены были прекратить свое существование, остальные "отделались" потерей клиентов, части бизнеса и, как следствие - понесли крупные убытки. Такого развития событий могло и не быть, если бы эти фирмы своевременно уделили внимание внедрению грамотно построенных СХД.

С проблемой обеспечения надежного хранения данных IT-сообщество столкнулось с момента появления первых накопителей, и с тех пор специалисты непрерывно занимаются ее решением. Задача не столь проста, как кажется на первый взгляд, — объемы информации лавинообразно возрастают, соответственно, повышаются требования к скорости доступа и обеспечению целостности информации. По сведениям IDC, темпы ежегодного увеличения объема данных составляют более 80%, при этом затраты на IT возрастают всего лишь на 20% в год. Согласно оценке других компаний, например Storage Networking Industry Association, за год количество данных в компаниях возрастает на 60–100%, но только около 60% из них расположены именно там, где им и положено быть — остальные могут находиться у локальных пользователей, что создает весьма существенные проблемы с доступом.

Первые попытки решить эти проблемы ставили своей целью в первую очередь обеспечить надежность хранения информации. Создание RAID-контроллеров было первым шагом на пути к совершенству, а первым же способом обезопасить данные от потери — их дублирование на нескольких носителях (например, режим Mirror). Забегая вперед, отметим, что этот принцип сохранился и по сей день — только «клонируются» уже не столько накопители, сколько внутренние компоненты систем, такие как каналы связи.

На протяжении нескольких лет корпоративные требования обусловили четкую позицию — необходимость перехода от децентрализованной модели хранения данных к централизованной. Рассмотрим вкратце основные задачи, которые призвана решать современная СХД.


Система хранения данных представляет собой комплексное решение по организации надежного хранения информационных ресурсов и предоставления гарантированного и безотказного доступа к ним серверов центра обработки данных (ЦОД), причем оба компонента (и ЦОД, и СХД) тесно взаимосвязаны не только между собой, но и с другими компонентами ИС, зачастую обладая весьма высоким уровнем интеграции. В то же время не стоит забывать, что СХД не является самостоятельным (независимым) локальным узлом инфраструктуры — скорее, это развернутая подсистема, которая может быть территориально распределенной, но совершенно прозрачной для остальных составляющих ЦОД. Также стоит отметить, что рассматривать СХД как «дисковый массив» (ДМ) совершенно неверно. Хотя ДМ и является базовым компонентом, но кроме него система в обязательном порядке должна содержать и другие подсистемы: ленточные библиотеки, специализированную инфраструктуру доступа серверов к устройствам хранения данных, ПО управления хранением данных, систему управления качеством сервиса и централизованную систему резервного копирования и восстановления.

Таким образом, при разработке и создании СХД в обязательном порядке требуется решение, обладающее оптимальным соотношением производительности, доступности, надежности, отказоустойчивости и совокупной стоимости владения. Разумеется, любое из этих требований влияет на цену системы в целом, и далеко не всегда оправдано применение наиболее дорогостоящих компонентов — окончательный выбор определяется исключительно особенностями решаемых задач и приложений. При рассмотрении типа проектируемой СХД сегодня большое влияние оказывает концепция виртуализации — при таком подходе маскируется физическое расположение данных на дисках от серверов. В SAN это осуществляется либо методом in-band с помощью специальных устройств, расположенных между FC-коммутаторами, либо out-off-band, посредством самих FC-коммутаторов, получающих информацию о конфигурации виртуального дискового пространства с внешнего устройства.



Многие поставщики решений предлагают на российском рынке готовые решения СХД — как универсальные, так и концептуальные, ориентированные (или, точнее, подстраиваемые) на решение задач определенного типа. В большинстве случаев внешние системы хранения данных — это DAS-, NAS- или SAN-системы, которые строятся на основе отдельных функциональных блоков.

Компания EMC, чья продукция широко известна на отечественном рынке, предлагает две линейки систем хранения данных: SAN — системы высшего уровня Symmetrix и системы среднего уровня CLARiiON. Самая крупная разработка — Symmetrix DMX-3 — предоставляет объем в 1 Пбайт и рассчитана на потребителей, которым необходимо хранить соответствующие объемы данных: телекоммуникационные компании, финансовые учреждения и госслужбы. Нужды менее крупных предприятий позволяет удовлетворить линейка CLARiiON. В модельном ряду присутствуют разработки «на любой вкус» — от изделия начального уровня CLARiiON AX150 (емкостью до 6 Тбайт) до представляющей серию CLARiiON CX3 UltraScale CLARiiON CX3 model 80, самой мощной в отрасли системы среднего уровня, с возможностью наращивания объема до 237 Тбайт.

Среди продукции IBM стоит отметить System Storage DS6000 (8 Тбайт) и DS8000 (320 Тбайт), ориентированные на создание крупных систем промышленного класса. Как отмечают специалисты компании, внедрение 4-гигабитных технологий Fibre Channel и FICON позволило сократить объем задействованных сетевых ресурсов, благодаря чему упростилось управление и уменьшились расходы на инфраструктуру. Среди дополнительных возможностей моделей System Storage DS8000 есть смысл упомянуть усовершенствованные средства для создания многоуровневых систем хранения, функции для повышения производительности и эффективности приложений DB2 при выполнении на серверах IBM System p и поддержку «трехузловых» решений для обеспечения непрерывности бизнеса. Для начального и среднего уровня IBM также предлагает ряд устройств: сюда входят Total Storage DS300/DS400, DS4100, DS4300, DS4500 и DS4800.



Несмотря на заявления некоторых аналитиков о том, что HP теряет свои позиции на рынке СХД, компания продолжает развивать это направление. Наибольшей популярностью пользуются три семейства дисковых массивов StorageWorks. Так, MSA рассчитано на начальный уровень (до 24 Тбайт), EVA предназначен для СХД среднего уровня (до 72 Тбайт) и XP — для систем hi-end класса (до 165 Тбайт). Каждое из них имеет набор базовых свойств, позволяющие подобрать конфигурацию под любые задачи, а также расширять в будущем СХД с наименьшими затратами.

Среди российских поставщиков свои изделия предлагает компания Aquarius. Спектр ее решений включает разнообразные дисковые массивы, от начального уровня до емких, отказоустойчивых и масштабируемых систем уровня предприятия. Одна из них, AquaArray CX3-20, рассчитана на построение SAN с пропускной способностью 4 Гбит/с. Она представляет собой гибкое решение, удовлетворяющее требованиям хранилища к поддержке электронной почты, баз данных, файловых серверов и серверов печати, веб-служб и распределенных приложений. AquaArray CX3-20 масштабируется от 5 до 120 дисков, что позволяет достичь максимальной емкости 59 Tбайт, поддерживает четыре соединения со скоростью 4 Гбит/с и до 128 двунаправленных хостов. Система AquaArray CX3-20 имеет техническую возможность подключать диски Fibre Channel и SATA II. Для нужд требовательных приложений, которым необходима максимально возможная производительность, модель поддерживает диски Fibre Channel 4 Гбит/с (15 тыс. об/мин). Для приложений, нуждающихся в оптимальном соотношении цены и производительности, доступны диски Fibre Channel 2 Гбит/с (10 тыс. об/мин).

В заключение несколько слов о перспективах развития этого направления. Практически повсеместно технологии СХД, развиваясь, прошли довольно длинный путь от простейших DAS до суперсовременных SAN, постепенно обрастая всяческими технологическими новинками. На сегодняшний день редко кто, говоря о СХД, имеет в виду некую дисковую стойку, соединенную каналом связи с сервером: современные системы хранения данных подразумевают не только наличие дополнительных подсистем, описанных в начале статьи, но и централизованную систему управления ресурсами, возможность наращивания функциональности (а не только объема), а также концептуальный подход к безопасности и распределению прав доступа.

Предложенная (и, пожалуй, самая перспективная) идея виртуализации хранилищ предполагает объединение разнотипных СХД (SCSI, iSCSI или Fibre Channel) в единый централизованно управляемый и распределяемый пул хранения, в состав которого включаются практически все типы существующих решений: подключаемые к сети сетевые ресурсы, выделенные сети хранения и даже локальные накопители, подсоединяемые непосредственно к серверам. В результате такой консолидации серверам будут доступны так называемые виртуальные тома, предоставляемые в виде логических устройств (Logical Unit Number), характеризуемые более высокой отказоустойчивостью, лучшим использованием дискового пространства, повышением эффективности управления и снижением TCO. В идеале подобная инфраструктура должна обладать всеми характеристиками plug-n-play — впрочем, до этого еще далеко, хотя некоторые тенденции такого подхода уже прослеживаются.


Содержание раздела