1.9. Об использовании баз данных и баз знаний для Аналитики
Аналитика тесно связана с использованием глобальных и локальных информационных сетей, баз данных (БД) и баз знаний (БЗ)[36].
Данные – это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства. При обработке на ЭВМ данные, полученные в результате измерений и наблюдений, трансформируются, приобретая различные формы представления – таблицы, протоколы, справочники, модели (структуры) данных в виде диаграмм, графиков, функций. На машинных носителях информации данные фиксируются с помощью различных языков их описания в виде баз данных. БД организуется в соответствии с определёнными правилами и представляет собой совокупность данных, характеризующей актуальное состояние некоторой предметной области и используемой для удовлетворения информационных потребностей пользователей.
Знания – это закономерности предметной области, представленные через принципы, связи, законы, полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области. Они основаны на данных, полученных эмпирическим путем, представляют собой результат мыслительной деятельности человека. При обработке на компьютере знания трансформируются аналогично данным. Материальными носителями знаний выступают различного рода научные публикации – монографии, учебники, методические пособия. Существует также такое понятие как поле знаний – условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих.
Отличие баз знаний от баз данных состоит в следующем. БД представляет собой жестко структурированную модель записей однородных данных, а БЗ представляет собой открытую модель семантической сети, которая может содержать разнородные и разнотипные данные.
База знаний, – это особого рода база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний. Раздел искусственного интеллекта, изучающий базы знаний и методы работы со знаниями, называется инженерией знаний. Под БЗ понимается совокупность фактов и правил вывода, допускающих логический вывод и осмысленную обработку информации. Например, в языке Пролог[37] базы знаний описываются в форме конкретных фактов и правил логического вывода на основе баз данных и процедур обработки информации, представляющих сведения и знания о людях, предметах, фактах событиях и процессах в логической форме.
Современные БЗ работают совместно с системами поиска информации, имеют классификационную структуру и формат представления знаний. Полноценные БЗ содержат в себе не только фактическую информацию, но и правила вывода, допускающие автоматические умозаключения о вновь вводимых фактах и, как следствие, осмысленную обработку информации.