Характеристика основных компонентов программных средств ИАС
Основные компоненты программных средств ИАС | Назначение, задачи |
Средства создания и сопровождения инфор мационного хранилища — DWH (Data Warehouse) | Информационные хранилища выполняют задачи сбора информации из баз данных, отображающих отдельные бизнес-процессы, автоматизированных рабочих мест, информационных систем и других источников информации, в том числе из глобальных компьютерных сетей, как, например, Интернет Сбор данных из различных источников сопряжен с тем, что информация в них формируется в различных форматах, имеет разнообразную структуру Программные средства собирают информацию и формируют информационное хранилище с определенной структурой и форматами данных Мощные ИАС насчитывают до 50 типов форматов, с которыми может взаимодействовать система |
Средства оперативного анализа — О LAP (On-Lme Analytical Processing) | Одной из задач оперативного или OLAP-анализа является быстрое (в пределах секунд) извлечение необходимой аналитику или лицу, принимающему управленческое решение, информации из информационного хранилища Средства OLAP обеспечивают возможность сортировки и выборки данных по заданным условиям, могут задаваться различные качественные и количественные условия Средства OLAP позволяют выполнять аналитические работы различного характера в предметной области пользователя собственными средствами, не прибегая к программированию Для описания специфических для данного пользователя аналитических процессов могут применяться встроенные средства в виде языков высокого уровня, электронных таблиц со встроенными функциями, графических конструкторов, визуальных средств |
Средства интеллектуального анализа — DMg (Data Mining) | Предназначены для фундаментального аналитического исследования проблем в той или иной предметной области Требования ко времени менее жесткие, чем в OLAP-средствах Средства DMg представляют собой наиболее сложную, интеллектуально насыщенную часть ИАС, поэтому входят в состав наиболее развитых ИАС Основными задачами интеллектуального анализа являются — выявление взаимозависимостей, причинно-следственных связей, ассоциаций и аналогий, — определение значений факторов времени, локализация событий или явлений по месту, — классификация событий и ситуации, определение профилей различных факторов, — прогнозирование хода процессов, событий При решении сложных аналитических задач используются мощные специальные программные средства, инструменты . |
Средства создания и сопровождения ИАС имеют в своем составе средства сбора данных из источников, созданных на различных аппаратных платформах (Intel, RISC, AS/400 и др ) и операционных средах (Windows, Unix, AIX, Linux, OS-2 и др ) Они обеспечивают совместную работу со многими СУБД (Access, MS SQLServer, Oracle, Informix и др.).
Централизованное хранилище данных представляет собой многомерную базу данных, которая имеет различные названия в конкретных реализациях ИАС: Univers (система Business Objects), выборка (система «Контур Стандарт»), гиперкуб (системаSAS), пул (система SAP R-3) и др Создание централизованного хранилища данных предъявляет повышенные требования к техническим средствам ИАС. В зависимости от масштабов предметной области потребуется персональный компьютер с предельно высокими техническими характеристиками, особенно объемами памяти, или компьютер класса мэйнфрейм и даже суперкомпьютер.
В распределенном хранилище данных реализован подход к хранению данных на основе распределения функций информационного хранилища по местам возникновения информации между локальными базами данных. Такой подход предусматривает трансляцию каждого запроса к каждой базе данных, обработку, увязывание, согласование, компоновку извлеченных данных в режиме реального времени и предоставление их пользователю. При этом происходит экономия ресурсов (прежде всего, памяти) вычислительной системы, но увеличивается время реакции системы на запрос пользователя, что предопределяет повышенные требования к программным и техническим средствам телекоммуникаций, обеспечивающим информационный обмен данных. Распределенное хранилище данных позволяет реализовать режим непосредственного обмена on-line, когда каждое изменение в источнике мгновенно отражается в OLAP-системе. Однако реализовать этот режим не всегда возможно в силу того, что источник может быть выключен или закрыт для доступа из-за неудовлетворительного состояния каналов связи и по другим причинам
Средства О1АР обеспечивают быстрый доступ к любой информации, содержащейся в информационном хранилище (DWH), и ее оперативную аналитическую обработку. Основу инструментальных OLAP-средств составляет язык запросов SQL (Structured Query Language) усеченного или расширенного типа, в развитых ИАС в комплект инструментальных средств входят и специализированные языки различного уровня. Например, в системе Business Objects используется стандартный SQL, в системе «Контур Стандарт» — проблемно-ориентированный язык Python, в системе Oracle Express OLAP-работы ведутся в профессиональной инструментальной среде для визуальной объектно-ориентированной разработки приложений Express Objects, в составе которой имеется язык Express Basic.
В состав OLAP-средств могут входить средства визуального конструирования запросов и отчетов. Реализация их направлена на максимальное упрощение действий пользователя в процессе анализа. Основным принципом действия является сборка из элементов, представленных в графическом виде на экране компьютера, структур аналитических отчетов. Конструирование отчетов может быть организовано и на основе электронных таблиц.
В ходе OLAP-процедур извлечение информации из информационного хранилища сопровождается обработкой ее по несложным алгоритмам. Например, производится суммирование итогов, определение процентов от заданных величин, расчет относительных показателей, вычисление величин с заданными коэффициентами и другие действия над данными с разной степенью детализации. Анализ проводится с данными, представленными в виде электронных таблиц, над которыми предоставляется возможность оперативно выполнять более сложные вычисления. При этом решают разнообразные аналитические задачи.
Примером задачи OLAP-анализа в производственной сфере может быть определение суммарных издержек на производство всего ассортимента продукции предприятия в течение заданного периода. Последующие этапы анализа могут быть связаны с детализацией суммарных затрат по каждому изделию за более короткие промежутки времени, затем можно выявить наиболее затратные процессы, места их возникновения. В сбытовой сфере можно изучать объемы продаж, их динамику, привязку к регионам и т. п.
Результаты анализа представляются в виде напечатанных отчетов или электронных презентаций, которые состоят из страниц, таблиц, графиков. Кроме того, они могут быть перенесены в другие программно-информационные среды, где с учетом эстетических и психофизиологических требований дополняются рисунками, кино-, фото-, аудио-, видеоматериалами. Экспорт аналитических данных может быть осуществлен и в веб-среду.
Средства интеллектуального анализа (DMg)предназначены для получения на основе аналитической обработки данных, накопленных в информационных хранилищах, знаний о тех или иных объектах экономического анализа.
Знания — это высшая форма информации, определяющая зависимости, взаимосвязи и скрытые закономерности между различными явлениями, процессами и фактами.
Для выполнения интеллектуального анализа используются все достижения математической науки и информационных технологий, в первую очередь методы линейной алгебры, классического математического анализа, дискретной математики, многомерного статистического анализа, который делится на факторный, дисперсионный, регрессионный, корреляционный анализы. Эти методы позволяют решать многочисленные задачи в области экономики и менеджмента, которые являются составной частью аналитической подготовки принятия решений.
К специфическим методам интеллектуального анализа относятся методы нечеткой логики, классификационные и регрессионные деревья решений, нейронные сети, генетические алгоритмы и др. Эти методы стали широко и эффективно применяться в последнее десятилетие XX века. Они находят применение в тех ситуациях, когда обычные методы анализа трудно или невозможно применить из-за отсутствия сведений о характере или закономерностях исследуемых процессов, взаимозависимостях явлений, фактов, о поведении объектов и систем из разных предметных областей, в том числе социальной и экономической.
Специфические методы интеллектуального анализа связаны с развитием информационных технологий и появлением интеллектуальных информационных систем, к которым относятся системы искусственного интеллекта и системы подготовки принятия решений (DSS).
Средства интеллектуального анализа входят в состав наиболее развитых ИАС, поэтому в связи со сложностью выполняемых задач интеллектуальный анализ чаще реализуется автономными программными системами. Частично наиболее отработанные и легко реализуемые функции интеллектуального анализа выполняют OLAP-системы.
К специализированным системам интеллектуального анализа относится PolyAnalyst (российская фирма Megaputer). Набор средств реализован в следующих версиях:
• Polyanalyst Lite, Polyanalyst Power — программные продукты для индивидуальных пользователей и малого бизнеса;
• Polyanalyst Professional для MS Windows NT— мощная система интеллектуального анализа для профессионалов;
• Polyanalyst Knowledge server — клиент-серверная версия предназначена для работы на высокопроизводительных плат-
формах, обеспечивает доступ к SQL-СУБД (Oracle, DB-2,
Informix, MS SQL-Server и др.) и к OLAP-системам. Все семейство продуктов обеспечивает:
• извлечение знаний в больших массивах данных;
• автоматическое построение и тестирование формул, описывающих функциональные зависимости;
• составление классификационных правил по заданным примерам;
• формирование многомерных кластеров;
• алгоритмы решений.
Наиболее развитой зарубежной системой в отношении возможностей интеллектуального анализа является система SAS (фирма SAS Institute Inc., США). В комплект инструментальных средств этой системы входят:
• SAS/ETS — модуль реализует методы анализа временных рядов, экономического системного моделирования и прогнозирования, финансового анализа и формирования отчетов. Производит восстановление пропущенных значений методом интерполяции, изменение временной привязки временного ряда, выделение сезонного компонента во временных рядах, построение трендов;
• SAS/STA — модуль использует статистические методы регрессионного, дисперсионного анализа, нелинейного моделирования, анализа категориальных данных, многомерного, в том числе факторного анализа, кластерного и непараметрического анализа;
• SAS/INSIGHT — модуль представляет собой динамическое средство для исследования и анализа данных, использует методы статистического исследования одномерных и многомерных данных;
• SAS/IML — модуль, реализующий поддержку интерактивного матричного языка программирования, оперирующего с матрицами данных, которые могут быть числовыми и символьными;
• SAS/OR — модуль, представляющий собой инструмент моделирования анализа, решения задач исследования операций, управления проектами;
• другие модули.
Широко распространенный пакет OLAP-анализа Business Objects имеет в своем составе модуль интеллектуального анализа IVliner, выполняющий ряд задач этого класса, в том числе деревья решений, кластерный анализ. Однако основные функции интеллектуального анализа предусмотрено выполнять средствами MS Excel, возможна интеграция с пакетом Statistica.
На российском рынке инструментальных средств НАС представлены в основном программные продукты американских фирм. В последние годы наметился рост российских аналитических систем, которые имеют целевой характер и ориентированы, как правило, на финансовый анализ. На наш взгляд, можно выделить следующие классы инструментальных средств ИАС:
• неспециализированные программные пакеты, имеющие аналитические возможности;
• специализированные программные средства создания информационного хранилища данных и проведения анализа;
• целевые аналитические программные пакеты, реализующиеконкретные методики анализа;
• встроенные в интегрированные ЭИС аналитические модули или подсистемы.