Большой архив статей, книг, документации по программированию, вебдизайну, компьютерной графике, сетям, операционным системам и многому другому
 
<Добавить в Избранное>    <Сделать стартовой>    <Реклама на сайте>    <Контакты>
  Главная Документация Программы Обои   Экспорт RSS E-Books
 
 

   Базы данных -> Разное -> Закрома информации


Закрома информации

Деятельность как крупных, так и малых предприятий сегодня невозможно представить без использования баз данных, которые составляют фундамент любой информационной системы. Что же представляют собой современные базы данных и системы управления ими?

Древние считали, что мир держится на трех китах. Если эту легенду соотнести с миром ИТ, то одним из китов, на которых держатся информационные системы, будут базы данных и программы для управления ими. Действительно, сфера применения СУБД очень широка, гораздо шире, чем может показаться на первый взгляд. Фактически основными задачами, для решения которых изначально предполагалось использовать ЭВМ, являются хранение и обработка данных, а также сложные математические вычисления.

И хотя сегодня мало кто целенаправленно применяет ПО для математических расчетов, с базой данных любой пользователь ПК сталкивается ежедневно много раз, порой даже не подозревая об этом. Ведь имеющаяся на любом компьютере файловая система также представляет собой подобие базы данных. Популярный телефонный сервис 09, карта города с поиском по адресам, почтовый клиент, персональный органайзер - все эти приложения опираются на определенную систему управления данными, то есть СУБД.

Несмотря на то, что с момента создания ЭВМ индустрия испытывала огромную потребность в хранилищах данных, это направление начало развиваться позже, чем ПО для математических вычислений. Связано это с тем, что первые ЭВМ попросту не имели внешних запоминающих устройств большой емкости. И лишь появление съемных магнитных дисков с подвижными головками, обладавших существенно большей емкостью, чем используемые ранее магнитные барабаны, и обеспечивающих удовлетворительную скорость доступа к данным, ознаменовало начало эры информационных хранилищ.

Первые СУБД могли хранить только текстовую и числовую информацию. О хранении графических, аудио- и видеоданных речь не шла, что было в значительной степени обусловлено недостаточной мощностью самих аппаратных систем. Ранние СУБД не отличались высокой степенью целостности данных. И все же именно опыт создания первых БД позволил впоследствии разработать гораздо более мощные и надежные базы данных, используемые в наши дни.

Ранние хранилища данных

Среди первых СУБД наиболее часто использовались три типа систем управления базами данных - основанные на инвертированных списках, иерархические и сетевые. Эти системы активно использовались в течение нескольких десятков лет, некоторые из них применяются до сих пор. Для этих систем накоплены громадные базы данных, и поэтому одной из проблем является их использование совместно с современными системами.

К числу наиболее известных и типичных представителей систем, основанных на инвертированных списках, относятся Datacom/DB компании Applied Data Research, Inc. (ADR) и Adabas компании Software AG.

Организация доступа к данным на основе инвертированных списков используется практически во всех современных реляционных СУБД, но в этих системах пользователи не имеют непосредственного доступа к инвертированным спискам (индексам). База данных, организованная с их помощью, похожа на реляционную БД, но с тем отличием, что хранимые таблицы и пути доступа к ним видны пользователям.

Следует отметить, что общие правила определения целостности в таких БД отсутствуют - в основном, забота о защите данных возлагается на прикладную программу.

Иерархическая БД состоит из упорядоченного набора деревьев (иерархий). Дерево состоит из одного <корневого> столбца и упорядоченного набора нескольких поддеревьев (каждое из которых является некоторым типом дерева). Тип дерева в целом представляет собой иерархически организованный набор типов записи. Например, для телефонной базы 09 иерархическую структуру можно представить в виде: Город-Улица-Дом-Квартира -ФИО-Номер телефона. Здесь Город является предком для Улицы и Дома, а Квартира, ФИО и номер телефона - потомками Дома, Улицы и Города.

В иерархических БД определен полный порядок обхода - сверху вниз, слева направо. Здесь применяется основное правило - никакой потомок не может существовать без своего родителя. Благодаря этому автоматически поддерживается целостность ссылок между предками и потомками.

Всем знакомый реестр Windows использует иерархическую структуру БД для хранения всех конфигураций системы
Среди иерархических систем наиболее известным и распространенным представителем является Information Management System (IMS) компании IBM, первая версия которой вышла в 1968 году. Надо заметить, что на мэйнфреймах до сих пор используется огромное количество баз данных этого типа, что препятствует переходу на современные БД и новую технику.

Иерархическая структура оказалась очень удобной для хранения данных во многих случаях. Например, практически все файловые системы построены по иерархическому принципу. Всем известный реестр Windows - также иерархическая база данных.

Сетевой подход к организации данных является расширением иерархического. В иерархических структурах запись-потомок должна иметь только одного предка; в сетевой структуре данных такая запись может иметь любое число предков.

Типичным представителем таких систем является продукт Integrated Database Management System (IDMS) компании Cullinet Software, Inc., предназначенный для использования на мэйнфреймах IBM. Впервые сетевые системы появились в 70-х годах, среди них была и IDMS.

Среди достоинств ранних СУБД можно отметить низкоуровневые средства управления данными во внешней памяти, а также возможность построения эффективных прикладных систем вручную. Однако эти сильные места являются также и недостатками, поскольку при создании приложений СУБД были очень сложны в применении (фактически были необходимы знания о физической организации), а прикладные программы сильно зависели от этой организации.

Тем не менее первые хранилища данных сыграли важную роль в развитии систем хранения и обработки информации. Некоторые же из этих продуктов успешно используются до сих пор.

Состояние мирового рынка СУБД

Наиболее крупные производители СУБД
Покупка IBM компании Informix в 2001 году привела к перераспределению позиций на рынке реляционных СУБД, в результате IBM к середине 2001 года стала лидером на рынке баз данных (за счет примерно 3 % доли Informix), оттеснив Oracle на второе место. Однако Oracle уверенно лидирует на рынке баз данных для UNIX, годовой объем которого составляет $3 млрд. Общий же объем рынка СУБД для Windows составляет только $2,5 млрд, а лидером продаж здесь является продукция Microsoft.

Подобно другим игрокам на рынке ИT, производители баз данных достаточно сильно пострадали от недавнего кризиса. По информации Oracle, в первом квартале 2002 года объем продаж новых лицензий упал на 30 %.

Опрос 500 пользователей Oracle, проведенный в апреле 2002 года Morgan Stanley и Oracle International User Group, показал, что одной из существенных причин замедления продаж является нежелание пользователей переходить на новые версии систем. Лишь 1 % опрошенных заявили о своем намерении купить Real Application Cluster в ближайшее время, 7 % - указали на необходимость покупки новых лицензий.


Все решают отношения

В основу создания реляционных БД были заложены положения реляционной алгебры, причем первые теоретические обоснования в этой области БД были сделаны еще в 70-х. Хотя прототипы реляционных СУБД появились в то же время, процесс их совершенствования занял довольно длительный период времени. И только к середине 80-х годов реляционные системы практически вытеснили с мирового рынка ранние СУБД.

В реляционных cистемах структура базы данных построена на отношениях (реляциях) между таблицами данных. Набор повторяющихся данных выносится в отдельную таблицу-справочник, благодаря чему исключено или сведено к минимуму дублирование информации. Таким образом, структура ранее упомянутой телефонной базы 09 при реляционном подходе изменяется. Все наименования улиц переносятся в отдельный справочник, где будут содержаться только уникальные значения, а в таблицу телефонов вместо названия улицы помещается уникальный код улицы в справочнике (первичный ключ), то есть ссылка на записи этого справочника. Каждая запись в справочнике должна ссылаться на одну или более записей в основной таблице данных либо не ссылаться ни на что. Это условие называется требованием целостности по ссылкам.

Практически все современные персональные и промышленные СУБД построены по реляционному принципу. Для текстовых и числовых значений такие системы являются идеальным выбором. И только лишь когда речь заходит о хранении крупных бинарных объектов, например, видео- и аудиофайлов, такой тип СУБД оказывается неоптимальным в использовании. Более приемлемым в этом случае оказываются объектно-ориентированные СУБД.

ВЗГЛЯД

Сергей Орлик, менеджер по продуктам Borland

Рынок СУБД рождается заново

Наравне с традиционными характеристиками СУБД (быстродействие, стабильность, многоплатформенность и т. п.) на передний план сегодня все чаще выходят такие свойства баз данных, как легкость встраивания в тиражируемые решения и поддержка разных механизмов доступа к данным. Не менее важно наличие соответствующих высокоуровневых компонентных библиотек, учитывающих специфику конкретных СУБД, а также минимальные требования по администрированию прикладных решений, построенных на основе таких СУБД.

Практически все предыдущие годы СУБД пытались превратить в многофункциональное и весьма громоздкое решение. Сегодня, когда использование серверов приложений для выполнения бизнес-логики стало основой современных корпоративных решений, мы снова возвращаемся к корням - к той функциональности, ради которой, вообще говоря, создавались СУБД, то есть хранению и непротиворечивой модификации данных в многопользовательском режиме работы. Так или иначе, с точки зрения Borland, рынок СУБД переживает второе рождение и основные направления его развития лежат в области встраиваемых СУБД (embedded database).


Объектно-ориентированные СУБД

Прогресс в области реляционных хранилищ данных и следующее хронологически за ними семейство БД, в которых поддерживается управление сложными объектами, привели к новому типу СУБД - объектно-ориентированным базам данных (ООБД). При разработке таких систем были задействованы принципы объектно-ориентированных языков программирования, в частности, немалое влияние на создание ООБД оказал язык Smalltalk. Само направление объектно-ориентированных баз данных возникло сравнительно недавно - в середине 80-х годов.

Любая сущность реального мира в объектно-ориентированных языках и системах моделируется в виде объекта. Любой объект при своем создании получает генерируемый системой уникальный идентификатор, который связан с объектом все время его существования и не меняется при изменении состояния объекта.

Реакцией производителей РСУБД на растущую популярность объектной технологии стало появление реляционно-объектных СУБД. В ядро таких БД добавлены объектные расширения, что позволяет определять любые типы данных. Однако основная ориентация ядра такой универсальной СУБД на реляционную модель отрицательно сказывается на его производительности.

ОСНОВЫ

Глоссарий

CLI (Call Level Interface) - разработанная группой SAG спецификация API для вызова SQL-запросов.

EJB (Enterprice JavaBeans) - это технология разработки серверных приложений на Java

JDBC (Java DataBase Connectivity) - это Java API (набор классов и интерфейсов) для выполнения SQL-запросов к базам данных

ODBC (Open Database Connectivity) - открытый интерфейс взаимодействия приложений с базами данных. Наиболее широко используется в среде Windows, существуют реализации для UNIX.

OLTP (On-Line Transaction Processing) - система оперативной обработки транзакций, то есть ввод данных (операций, документов) в режиме реального времени.

OLAP (OnLine Analytical Processing) - технология многомерного анализа данных, применяемая в системах принятия решений. Для этой цели OLAP использует хранилища данных. В отличие от базы данных OLTP, хранилища данных относительно стабильны: процесс пополнения представляет собой просто добавление новых записей за определенный срок без изменения прежней информации, уже находящейся в хранилище.

SQL (Structured Query Language) - единый интегрированный язык, содержащий все необходимые средства для работы с БД, начиная от ее создания, и обеспечивающий базовый пользовательский интерфейс с базами данных. SQL позволяет определять схему реляционной БД и манипулировать данными. Язык SQL содержит специальные средства определения ограничений целостности БД и авторизации доступа к ее объектам.

View - средство ANSI SQL, позволяющее ограничивать доступ к таблицам или создавать новые представления данных.

Реплицируемость - способность одной базы данных иметь несколько физических копий, расположенных в разных участках сети, причем изменения, произведенные в одной физической копии, распространяются на все остальные через некоторое время.

Транзакция - это законченная последовательность действий с базой данных, рассматриваемых СУБД как единое целое. При успешном выполнении транзакции СУБД фиксирует все изменения, произведенные этой транзакцией, во внешней памяти, в противном случае содержимое БД во внешней памяти не меняется. Транзакции являются основным механизмом обеспечения целостности данных.

Триггер - процедуры, которые активизируются при выполнении команды изменения данных в таблице или столбце.


Распределенные системы

Довольно актуальной для различных компаний является проблема интеграции применяемых разнородных информационных систем с целью создания распределенной базы данных. Отдельные БД подключаются друг к другу через локальную или глобальную сеть, при этом, с точки зрения пользователя, они представляют собой единое целое.

Распределенные базы данных бывают однородными и неоднородными. В однородной - каждая локальная база данных управляется одной и той же СУБД. В неоднородной системе БД могут управляться СУБД разных производителей и даже разных типов. Интеграция неоднородных баз данных - сегодня очень актуальная и сложная проблема. И хотя во многих случаях удается найти компромиссное решение, все же такие интегрированные системы часто не обладают достаточной эффективностью.

Высокая потребность в продуктах управления и хранения данных как в крупных корпорациях, так и в малых предприятиях, привела к появлению двух типов систем управления базами данных - мощных промышленных СУБД и гораздо менее функциональных настольных систем (desctop-класс)

Состав СУБД

Очень упрощенно базу данных можно представить в виде таблицы или совокупности таблиц. Каждая из строк таблицы называется записью, а ее столбцы - это свойства записи (в реляционной базе данных они называются атрибутами). Каждый из столбцов представляет собой определенный тип данных, например: символьный, числовой, логический. При обработке такого массива данных могут предъявляться следующие стандартные требования: поиск нужного значения, отбор по заданному критерию, удобная методика добавления/изменения данных и т. д.

Для примера рассмотрим популярную базу 09. При работе с ней может потребоваться найти номер телефона по фамилии человека, или же по телефонному номеру определить ФИО и адрес абонента. Кроме того, возможны дополнительные запросы - отфильтровать всех абонентов, проживающих на указанной улице, отсортировать весь список по любой колонке по алфавиту или в обратном порядке и т. д. Задача может показаться простой, если речь идет о нескольких десятках телефонных номеров в вашей записной книжке. Но решение поставленной цели без помощи соответствующих ИТ-средств оказывается очень сложным, если речь идет о нескольких миллионах записей при условии параллельной работы многих пользователей.

Кроме всевозможных запросов по выборке и поиску данных, на СУБД также возложена задача оптимизации данных во внешней памяти, управления буферами в оперативной памяти, журнализации и восстановления базы данных после сбоев, поддержка языков БД. За решение каждого задания в современных системах отвечает свой компонент.

Ядро СУБД (database engine) отвечает за обработку данных во внешней и оперативной памяти, управление транзакциями и журнализацию. Ядро СУБД является основной резидентной частью СУБД и обладает собственным интерфейсом, не доступным пользователям напрямую.

Журнал - это особая часть БД, в которую поступают записи обо всех изменениях основной базы данных, например, операции изменения или удаления строки из таблицы, добавления новых данных и т. д. Журнал является одной из критически важных частей СУБД, используемой при восстановлении БД после сбоев. Как правило, ведется две копии журнала, которые располагаются на разных физических дисках, часто даже раснесенных в пространстве. При ведении журнала применяется стратегия упреждающей записи в журнал (Write Ahead Log - WAL), то есть запись об изменении любого объекта БД заносится во внешнюю память журнала раньше, чем сам измененный объект отобразится во внешней памяти основной части БД. Благодаря использованию протокола WAL при ведении журнала можно решить все проблемы восстановления БД после любого сбоя.

В отдельные утилиты БД обычно выделяют такие процедуры, которые слишком накладно выполнять с использованием языка БД, например: загрузка и выгрузка БД, сбор статистики, глобальная проверка целостности БД и т. д. Утилиты программируются с использованием интерфейса ядра СУБД, а иногда даже с проникновением внутрь ядра.


Склад данных на столе

Системы управления базой данных desktop-класса предназначены для персонального использования или создания решений автоматизации для небольших рабочих групп. Как правило, настольные СУБД поставляются в составе офисных пакетов, например: MS Office, Corel PerfectOffice, Lotus SmartSuite. Такие системы обладают гораздо меньшими возможностями по сравнению с мощными профессиональными продуктами, но в то же время отличаются легкостью в использовании, простым и удобным интерфейсом, наличием автоматизированных инструментов для быстрой разработки приложений.

MS Access

Самым популярным пакетом в секторе настольных СУБД является MS Access. Одной из причин этого является, конечно, огромная популярность офисных пакетов от Microsoft, с другой стороны, среди desktop-систем этот продукт обладает наибольшей функциональностью и возможностями. Например, еще Access 97 поддерживал репликацию данных, а ведь эта функция не всегда присутствует даже в гораздо более мощных системах.

При разработке приложений можно использовать как макросы, так и довольно мощный язык программирования Visual Basic for Application (VBA), который позволяет создавать массивы, собственные типы данных, контролировать работу приложений с помощью OLE Automation. При необходимости можно целиком создать базу данных посредством программирования.

Одно из основных преимуществ MS Access - это тесная интеграция с MS Office и MS SQL Server 2000. Благодаря последнему, настольную БД на MS Access довольно легко превратить в клиент-серверное приложение, в котором MS Access будет играть роль клиента.

FoxPro

Довольно известный продукт FoxPro ведет свое происхождение от настольной СУБД FoxBase фирмы Fox Software. При разработке FoxBase в конце 80-х годов эта компания преследовала цель создать СУБД, функционально совместимую с dBase, но существенно превышающую ее по производительности. Некоторое время спустя это продукт был выкуплен компанией Microsoft, на основе которого она выпустила новую СУБД Visual FoxPro.

В отличие от MS Access, в котором вся БД заключена в одном файле, здесь каждая таблица и индексы для них хранятся в отдельном файле (обычно имеют расширение *.dbf), BLOB- (Binary Large Objects) и Memo-поля также хранятся в отдельных файлах (обычно с расширением *.dbt).

Среди основных функций можно отметить средства публикации данных в Интернете и создания вэб-клиентов, инструменты создания ASP-компонентов и вэб-приложений. Visual FoxPro cодержит средства, позволяющие взаимодействовать с другими приложениями Windows, а также получать доступ к SQL-серверам баз данных посредством ODBC.

Paradox

Первая версия разработанной компанией Ansa Software СУБД Paradox увидела свет в 1985 году. Впоследствии продукт был приобретен компанией Borland, а с 1996 года он принадлежит компании Corel и поставляется в комплекте офисного пакета Corel PerfectOffice. Этот продукт является полноценной системой управления реляционными базами данных, предназначенной для автоматизации делопроизводства небольших рабочих групп.

Программа отличается визуальным режимом разработки форм, запросов и отчетов БД, возможностью публикации данных и отчетов в Интернете, создания вэб-клиентов. Для доступа к данным формата Paradox из Windows-приложений присутствует ODBC-драйвер, есть также средство для доступа к данным из Java-приложений.

Популярность Paradox в последнее время значительно снизилась, главным образом за счет роста популярности MS Access. Однако в мире эксплуатируются еще немало информационных систем, созданных с его помощью.

Промышленные СУБД

На рынке мощных многопользовательских коммерческих СУБД игроков не так уж много, фактически cегодня можно выделить лишь четырех основных производителей: Oracle, IBM, Microsoft и Sybase.

Oracle

Целью основанной Ларри Эллисоном в 1977 году компании Oracle было создание коммерческой реляционной базы данных. В то время реляционная модель была принципиально новым подходом к хранению структурированной информации, и Oracle стала первым (и основным) поставщиком этой технологии для бизнес-приложений.

Продукт очень быстро добился всеобщего признания, и в 1983 году СУБД была портирована с мэйнфрейма на VAX и переписана на языке C. В 1986 году база данных стала клиент-серверным приложением (до того Oracle была библиотекой на VAX, правда, работающей в кольце защиты, недоступном напрямую для пользовательского кода). Язык PL/SQL, процедурная надстройка над SQL с синтаксисом, очень близким к синтаксису языка Ada, был реализован в 1988 году.

Современный сервер базы данных Oracle 9i R2 включает в себя виртуальную машину Java (в дополнение к PL/SQL), процессор XML, контейнер EJB, средства работы с медиа- и пространственными данными. Начиная с Oracle 8i начали поддерживаться объектные средства.

Oracle уделяет огромное внимание надежности продукта. Версия 9i дает возможность производить резервное копирование (и получать непротиворечивые снимки) на работающей СУБД. Возможна онлайн-репликация рабочей БД, содержащей актуальную копию данных.

Oracle применяется для организации больших баз данных (хотя существует и Oracle Personal Edition), эффективно поддерживает кластеры и многопроцессорные машины. Для поддержки хранилищ данных был создан модуль Oracle Data Mining, позволяющий классифицировать, предсказывать поведение и выявлять взаимосвязи больших объемов данных.

Oracle работает на основных коммерческих UNIX, при этом ведущей платформой разработки является SUN Solaris. Для компьютеров на процессорах Intel выпускаются версии для Windows NT и Linux. Нужно отметить, что Oracle активно поддерживает Linux, вплоть до того, что выпуск базы для других UNIX, работающих на платформе ПК, был прекращен (Oracle сертифицирован для работы под Linux Kernel Personality под SCO Unixware 7.x, то есть под эмулятором Linux).

Стоимость лицензии на Oracle 9i зависит от количества пользователей, либо же от мощности cервера, на который СУБД будет устанавливаться. Cуществуют три разные редакции продукта. Oracle 9i Database Enterprise Edition - самый полный вариант СУБД, Standard Edition может быть установлена на компьютеры, содержащие не более четырех процессоров, и, наконец, версия Personal Edition предназначена для использования на рабочей станции пользователя. Кластерная технология от Oracle называется Oracle Real Application Clusters и лицензируется отдельно.

ВЗГЛЯД

Сергей Каплун, старший технический консультант представительства Oracle в Украине

Цели у всех производителей одни

Задачи компаний-разработчиков систем управления базами данных весьма похожи. Ведь все производители современных СУБД пытаются обеспечивать высокую производительность при максимальной эффективности использования аппаратных средств и гарантировать высоконадежный непрекращающийся доступ к данным. Кроме того, все стремятся должным образом защищать хранящиеся данные, а также предоставлять возможность централизованного хранения и управления любым типом данных.

Немалое значение также имеет эффективная реализация как приложений аналитической обработки информационных хранилищ, так и транзакционных высокоинтерактивных программ. При этом наблюдается тенденция сокращения совокупной стоимости владения БД, что обусловлено появлением соответствующих инструментов, упрощающих выполнение всех операций администирирования базы данных. Выбор же той или иной системы автоматизации в значительной мере обусловлен вышеуказанными характеристиками СУБД, при этом фактор стоимости также играет далеко не последнюю роль.


Sybase ASE

СУБД SQL Server от компании Sybase была первой базой, ориентированной на он-лайн-обработку большого потока транзакций. Версия 4.2, портированная на OS/2 1.x совместно с Microsoft, впоследствии стала называться MS SQL Server.

Начиная с версии 11.5, продукт был переименован в Sybase Adaptive Server Enterprise (ASE). Основной областью применения текущей версии 12.5 является обработка транзакций в реальном времени в критически-важных приложениях. Это обусловливает высокую популярность ASE в банковской сфере.

ASE 12.5 включает в себя EJB-контейнер и поддержку XML. Для программного доступа к базе Sybase предлагает OpenClient - набор клиентских библиотек. Также присутствуют ODBC- и JDBC-драйверы.

Нужно отметить, что протокол доступа к серверу TDS (Tabular DataStream) является общим для Sybase и MS SQL Server. Поэтому иногда возможно нестандартное использование библиотек OpenClient, например, для доступа к MS SQL Server с UNIX-машин.

Продукт предлагается для всех основных коммерческих UNIX, Windows NT/2000 и Linux. Версия 11.0 для Linux бесплатна для любого (в том числе и коммерческого) использования. Версия 11.9 для Linux и FreeBSD бесплатна для разработчиков.

ВЗГЛЯД

Владислав Дмитриев, заместитель технического директора Sybase CIS

Борьба на рынке СУБД обостряется

Мы наблюдаем сейчас достаточно интересную ситуацию на рынке СУБД, когда отголоски глобальных мировых кризисов и потрясений последних лет заставляют потребителей снижать затраты на системы обработки данных, одновременно повышая требования к их возможностям. И сегодня поиск новых решений в такой устоявшейся сфере, как серверы баз данных, становится ключевым моментом успеха или провала информационных проектов.

Именно поэтому пользователи стали привередливее подходить к выбору СУБД, выбирая именно тот продукт, который наилучшим образом подходит для построения конкретной системы. Современному руководителю важно иметь стратегическое видение, зная, что в обработке данных критично для него сегодня и как он будет развивать информационную систему в будущем, если требования бизнеса станут другими.

Если говорить о технологических тенденциях, то я отметил бы появление в последнее время в СУБД множества возможностей, не связанных напрямую с реляционными базами данных. Среди них поддержка Java, XML, LDAP-протокола и множества других. Некоторые технологии пришли из Интернета, другие стали ответом на растущие требования к объемам обрабатываемой информации. Появились новые стандарты для построения ИT-систем, и современные СУБД, конечно же, должны им соответствовать.


Informix

Одна из гигантов рынка СУБД Informix была изначально ориентирована на платформу промышленных UNIX. Но когда сегмент рынка Windows стал расти, компания портировала свой продукт на эту ОС. Система команд и управления Informix для обеих ОС совершенно одинакова, поэтому с точки зрения администрирования они очень похожи.

Текущая версия Informix IDS 9.30 поддерживает как внутренние, так и внешние типы данных, то есть фактически любые. Для предопределения внешних типов данных и методики их обработки в СУБД используется фирменная технология DataBlades (<лезвия данных>). Данная технология позволяет расширить функциональность ядра БД на разных аппаратных платформах. Кроме того, Informix предлагает технологию разработки <лезвий данных> для своих собственных целей. Другой особенностью Informix является динамическая масштабируемая архитектура (DSA), которая позволяет использовать линейку серверов БД как в настольных, так и в мощных системах SMP и MPP.

В конце квартала текущего года ожидается новый релиз Informix 9.40, а также планируются к выпуску версии 9.50 и 9.60. В последующих версиях будет повышена безопасность данных, увеличен макcимальный объем хранимых данных. Так, уже версия 9.40 на одном узле будет обрабатывать до 128 петабайт информации, что в десятки тысяч раз больше, чем содержимое, к примеру, библиотеки конгресса США.

DB/2

Разработанная IBM система управления данными DB/2 изначально использовалась на мэйнфреймах, однако со временем она была портирована на платформу промышленных UNIX. Начиная с версии 7.2 присутствует возможность обработки в одном узле информации, которая хранится в других базах данных, - то, что называется федеративным свойством БД. То есть, в DB/2 встроен механизм, который позволяет напрямую работать с Oracle, MS SQL Server, Sybase. Эта особенность очень важна для построения распределенных хранилищ данных.

DB/2 является самоадаптивной и самонастраиваемой СУБД. Продукт содержит функции, которые позволяют тонко настраивать ядро сервера БД. Помимо этого имеется специальный пакет, который облегчает администрирование многих узлов в рамках корпорации, что приводит к снижению общей стоимости обслуживания. DB/2 с самого начала проектировалась для работы с большими объемами оперативной памяти, эта особенность и сейчас позволяет ей оптимально использовать большие объемы ОЗУ (от 2 ГБ и выше). Кроме того, у DB/2 очень мощный оптимизатор.

Для обработки внешних типов данных DB/2 использует технологию extenders, то есть Plug-in-модулей, которые встраиваются в базу данных и позволяют работать с различными типами данных - XML-документами, мультимедийной информацией и т. д. Однако в отличие от Informix, DB/2 не предлагает инструментальные средства для создания таких модулей расширения силами сторонних разработчиков.

И DB/2, и Informix - это открытые СУБД, которые поддерживают стандарты JDBC, ODBC, CLI. Для разработчиков у Informix есть свои решения 4GL, а также собственный инструментальный пакет Informix Client SDK, который поддерживает доступ к ядру БД на языках С, С++, JDBC. Кроме того, имеется пакет DataBlade Development Kit для разработки модулей DataBlade.

В апреле 2001 года СУБД Informix IDS была выкуплена компанией IBM. Причиной послужили, во-первых, желание приобрести фирменные технологии DataBlade и DSA, во-вторых, намерение IBM занять более уверенные позиции на рынке СУБД для промышленных UNIX. Еще некоторое время и DB/2, и Informix IDS будут развиваться независимо, однако в 2004 году планируется выход совершенно новой СУБД BlueArrow Ahead, которая будет содержать лучшие свойства обоих продуктов. Новая СУБД будет представлять собой универсальную среду обработки и хранения любых типов данных, используемых в реальности, с возможностью использования от КПК до мэйнфрейма.

В отличие от SQL-запросов, в запросах по образцу (QBE) не требуется указывать вручную все названия таблиц и полей

MS SQL Server

В 1988 году совместно Microsoft и Sybase была разработана первая версия СУБД MS SQL Server для платформы OS/2. В начале 90-х Microsoft разработала новую версию продукта, но уже для платформы Windows NT. В 1992 году были выпущены Windows NT 3.1 и SQL Server 4.2 для NT, а в 1994 году партнерство Microsoft и Sybase было формально прекращено. В 1995 году была выпущена следующая версия 6.0 однако, начиная с версии 4.2 продукт работает исключительно на платформе Windows.

Самый последний релиз системы вышел в 2000 году. SQL Server 2000 предоставляет расширенную поддержку XML, обеспечивает одновременное функционирование многих копий сервера на одном компьютере, обладает модернизированными мастерами. В новой версии улучшены средства бизнес-анализа с помощью дополнительной программы Analisis Services - средства анализа OLAP-данных посредством доступа к блокам информации через Интернет. Кроме того, продукт отличается возможностью симметричной мультипроцессорной обработки (на платформе Windows NT/2000 Server), поддерживает объем ОЗУ до 64 ГБ, динамическое управление памятью и удаленный контроль. Благодаря дополнительному модулю MS Cluster Server обеспечивается более надежная защита SQL Server от сбоев.

Одно из основных преимуществ SQL Server 2000 - развитые графические средства визуального администрирования, благодаря которым можно значительно снизить административную нагрузку при обслуживании решения. Стратегия Microsoft, состоявшая в сочетании высокой производительности c удобством и простотой пользовательского интерфейса, оказалась весьма успешной. Сегодня этот продукт уверенно занимает первое место среди СУБД для платформы Windows.

В будущем Microsoft планирует выпустить новую версию СУБД, которая сейчас известна под кодовым названием Yukon. Новая система будет являться максимально универсальным хранилищем данных, более масштабируемым, надежным и удобным для работы с системами анализа данных. Кроме того, эта СУБД будет использоваться в качестве файловой системы для будущей ОС Windows.

ВЗГЛЯД

Игорь Квилинский, директор по продажам HPS Holding GMBH

Будущее - за универсальными СУБД от именитых производителей

Все системы управления базами данных развиваются в одном направлении, отвечая сегодняшним запросам рынка к системам хранения данных. Это подразумевает применение в этих системах всех типов данных, которые используются в реальном бизнесе. И здесь говорить просто о СУБД уже недостаточно, надо говорить о среде хранения, обработки и анализа данных. К этому движутся все производители, и, в частности, IBM со своими продуктами Informix и DB/2. Через несколько лет компания планирует выпустить продукт Blue ArrowHead, - СУБД совершенно нового типа, представляющую собой универсальную среду для хранения и обработки любых типов данных, используемых в жизни, причем с возможностью использования от КПК до мэйнфрейма.

Что касается экономических аспектов, влияющих на популярность того или иного продукта, то разработчики крупных информационных проектов (например ERP- или CRM-систем) обычно фокусируются на СУБД известных производителей. Ведь любая малоизвестная или бесплатная система может перестать завтра развиваться или поддерживаться, а значит заказчик будет нести потери. Поэтому выбираются сильнейшие на рынке.


Бесплатные СУБД

По аналогии с ОС, среди систем управления БД также есть бесплатные и свободные продукты. Часть из них разрабатывается программистами - cторонниками открытого ПО, исходный код некоторых других продуктов был открыт самими производителями.

Мощная и открытая

Свободно-распространяемая PostgreSQL начала разрабатываться как следующее поколение системы Ingress в университете Калифорнии в Беркли. Текущая версия 7.3.1. распространяется под новой BSD-лицензией, т. е. на использование кода не накладывается никаких ограничений.

PostgreSQL - клиент-серверная система. Сервер работает под всеми основными вариантами UNIX-подобных систем и на Windows NT/2000/XP под реализацией Posix cygwin. Имеются библиотеки для разработки клиентских приложений для языков C, C++, perl, python, tcl для UNIX и Win32. Есть также драйверы ODBC и JDBC.

Сервер поддерживает ANSI SQL 92, транзакции, триггеры, вложенные запросы и т. д. Кроме того, программа обладает такими уникальными средствами, как наследование таблиц, массивы и определяемые пользователем типы данных. PostgreSQL работает с множеством процедурных языков, основной среди которых - PL/PgSQL.

Продукт очень быстро развивается. Семейство 7.2.x зарекомендовало себя как быстрый и надежный сервер. Из новых возможностей версии 7.3 прежде всего нужно отметить поддержку схем (пространств имен), подготовленных запросов и автоматическое отслеживание зависимостей. В этой версии исправлены проблемы с так называемым вакуумированием (специальная процедура в PostgreSQL, предназначенная для сборки "мусора" и фиксации id-транзакций).

В PostgreSQL не реализована репликация и поддержка распределенных хранилищ. Отсутствует инкрементное резервирование и возможность восстановления базы по журналу до выбранной оператором даты. Однако эта СУБД прекрасно подходит для использования в средних и крупных проектах, в которых важна надежность, простота эксплуатации и полный контроль разработчиков и заказчика над применяемыми средствами.

Ориентация на Интернет

СУБД MySQL достаточно интересна как своими техническими характеристиками, так и политикой лицензирования. Продукт разрабатывается компанией MySQL AB (Швеция). Сервер общедоступен под лицензией GPL, компания продает коммерческие лицензии и поддержку.

Прежде всего, нужно отметить, что MySQL более похожа на структурированное хранилище записей, а не на реляционную базу. Ядро сервера MySQL, обрабатывающее запросы, отделено от процедур управления таблицами. Текущая стабильная версия 3.23.x не обладает такими возможностями, как View, триггеры или хранимые процедуры. Все это обещано в следующих версиях - уже доступной как гамма 4.0.7, находящейся в стадии разработки 4.1 и планируемой 5.0. Зато MySQL уже сейчас поддерживает репликацию.

С сайта MySQL можно скачать исходный код продукта, но разработчики рекомендуют пользоваться готовыми сборками. Продукт работает под различными UNIX- и Windows-системами. MySQL очень популярна как быстрое и надежное решение для вэб-сайтов. К примеру, ресурс www.slashdot.org использует MySQL. Но отсутствие таких средств, как целостность по ссылкам или триггеры исключает применение MySQL во многих других случаях.

ВЗГЛЯД

Андрей Крючков, специалист отдела .NET представительства Microsoft в России

Возможности растут, цена падает

Рынок собственно СУБД развивается параллельно с рынком информационных технологий в целом. Сегодняшняя тенденция такова, что бюджеты на ИТ-нужды в компаниях сильно урезаются, соответственно, ИТ-менеджеры вынуждены потуже затягивать пояса. Поэтому рынок СУБД сегодня не показывает такой динамики,_как было несколько лет назад, развиваются только отдельные сегменты и, прежде всего, рынок СУБД для ОС Windows. Здесь наблюдается устойчивый рост, и доля Microsoft SQL Server постоянно растет.

С технической точки зрения производители СУБД пытаются отвечать запросам рынка. А это экономичность решения, низкая совокупная стоимость владения, наличие различных функций, высокая производительность и надежность. Так, в Microsoft SQL Server 2000 входит модуль для анализа данных, поддерживаются технологии OLAP и хранилища данных. Дальнейшее развитие получили системы интеллектуальной настройки сервера для оптимального использования ресурсов_и максимальной производительности. Немаловажными являются низкие стоимость лицензий на продукт и расходы на администрирование, и это при функциональности, достаточной для работы самых сложных приложений.


Родители и потомки

Детище компании Borland - СУБД InterBase - до версии 5.6 распространялась на коммерческой основе. Однако в начале 2000 года Borland приняла неожиданное решение открыть коды своего продукта. Так появилась бесплатная версия 6.0, которая распространялась по лицензии InterBase Public License, в соответствии с которой код InterBase разрешалось использовать для создания коммерческих продуктов, в том числе и с закрытым кодом.

На основе InterBase 6.0 была построена СУБД FireBird, которая содержит некоторое количество небольших технических изменений в сравнении с оригиналом. Вскоре после этого Borland приняла решение закрыть код своей СУБД. Поэтому новая InterBase 7.0 продается за деньги.

Firebird является реляционной СУБД, которая работает на платформе Linux, Windows и многих промышленных UNIX. Система обладает высокой производительностью, мощной языковой поддержкой для хранимых процедур и триггеров, кроме того, довольно легка в инсталляции и обслуживании. Как InterBase, который на протяжении уже нескольких лет поставляется в составе инструментальных средств Borland, так и FireBird, в основном, используются огромной армией разработчиков на Delphi.

По данным одной из исследовательских компаний в области ИТ на каждого человека Земли на сегодняшний день приходится в среднем около 20 МБ информации. Учитывая стремительный рост объема мультимедиа-данных в Интернете, эта цифра в ближайшие годы увеличится в несколько раз. Поэтому будущее - за универсальными СУБД, поддерживающими большие объемы информации и способными работать с разными типами данных.


Автор: Константин Белоусов, Олег Пилипенко
Источник:www.chip.ua



 

 
Интересное в сети
 
10 новых программ
CodeLobster PHP Edition 3.7.2
WinToFlash 0.7.0008
Free Video to Flash Converter 4.7.24
Total Commander v7.55
aTunes 2.0.1
Process Explorer v12.04
Backup42 v3.0
Predator 2.0.1
FastStone Image Viewer 4.1
Process Lasso 3.70.4
FastStone Image Viewer 4.0
Xion Audio Player 1.0.125
Notepad GNU v.2.2.8.7.7
K-Lite Codec Pack 5.3.0 Full


Наши сервисы
Рассылка новостей. Подпишитесь на рассылку сейчас и вы всегда будете в курсе последних событий в мире информационных технологий.
Новостные информеры. Поставьте наши информеры к себе и у вас на сайте появится дополнительный постоянно обновляемый раздел.
Добавление статей. Если вы являетесь автором статьи или обзора на тему ИТ присылайте материал нам, мы с удовольствием опубликуем его у себя на сайте.
Реклама на сайте. Размещая рекламу у нас, вы получите новых посетителей, которые могут стать вашими клиентами.
 
Это интересно
 

Copyright © CompDoc.Ru
При цитировании и перепечатке ссылка на www.compdoc.ru обязательна. Карта сайта.