Информационные хранилища. Витрины данных. Документооборот. Системы электронного документооборота. (2ч).

Лекция № 21

Хранилище данных (data warehouse) –это автоматизированная информационно- технологическая система, которая собирает данные из существенных баз и внешних источников, формирует, хранит и эксплуатирует информацию как единую. Оно обеспечивает инструментарий для преобразования больших объемов детализированных данных в форму, которая удобна для стратегического планирования и реорганизации бизнеса и необходима специалисту, ответственному за принятие решений. При этом происходит слияние из разных источников различных сведений в требуемую предметно-ориентированную форму с использованием различных методов анализа.

Особенность новой технологии в том, что она предлагает среду накопления данных, которая не только надежна, но по сравнению с распределенными СУБД и оптимальна в отношении доступа к данным и манипулирования ими.

Хранилище информации предназначено для хранения, оперативного получения и анализа интегрированной информации по всем видам деятельности организации.

Данные в хранилище характеризуются следующими свойствами:

· предметная ориентация – данные организованы согласно предмету, а не приложению ( в соответствии со способом их применения);

· интегрированность – данные согласуются с определенной системой наименований, хотя могут принадлежать различным источникам и их формы представления могут не совпадать;

· упорядоченность во времени – данные согласуются во времени для использования в сравнениях, трендах и прогнозах;

· неизменяемость и целостность – данные не обновляются и не изменяются, а только перегружаются и считываются, поддерживая концепцию «одного правдивого источника».

· Большой объем и сложные взаимосвязи данных.

К основным категориям данных, которые располагаются в хранилище, относятся:

· метаданные, описывающие способы извлечения информации из различных источников, методы их преобразования из различных структур и форматов и доставки в хранилище;

· фактические данные (архивы), отражающие состояние предметной области и конкретные моменты времени;

· суммарные данные, полученные на основе проведенных аналитических расчетов.

В информационных хранилищах используются статистические технологии, генерирующие информацию об информации; процедуры суммирования; методы обработки электронных документов, аудио-, видеоинформации, графов и географических карт.

Витрины данных - небольшие хранилища с упрощенной архитектурой, предназначенные для хранения части данных информационного хранилища с целью снятия нагрузки с основного информационного хранилища. В основном витрины содержат ответы на конкретный ряд вопросов, например, данные АРМ сотрудников организации. Информация в разных витринах может дублироваться.

Рассмотрим три типа архитектуры информационных хранилищ: витрины данных, двух и трехуровневые архитектуры.

Двухуровневая архитектура информационного хранилища обеспечивает ретроспективные запросы (запросы данных за прошлые годы), анализ тенденций, поддержку принятия стратегических решений. Они ориентированы на оперативные базы организации и внешние источники, доступные по Интернету.

Трехуровневая архитектура информационного хранилища обеспечивает наличие информационного хранилища и витрин данных За счет использования витрин данных ускоряется обслуживание и увеличивается число пользователей по сравнению с двухуровневой архитектурой.

Примерами информационных хранилищ могут служить Oracle VLM, разработанная фирмами Oracle и Digital, Red Brick Warehouse 5.0 корпорации Red Brick Systems, Business Information Warehouse и др.