Взаимодействие человека с информацией, существующей в машиночитаемом виде (данными), осуществляется при помощи специализированных программных комплексов – информационных систем (ИС), предназначенных для:
• организации хранения информации (организация хранилищ, поддержка систем хранения данных);
• управления информацией (добавление, модернизация, изменение данных);
• управления доступом к информации (контроль исполнения правил регламентации доступа к данным), идентификация данных;
• поиска информации;
• извлечения информации и предоставления ее пользователю (приложению) в необходимом ему виде;
• визуализации (представления) информации в соответствии с требованиями пользователя (4; 7).
Исходя из тенденций развития систем коммуникаций и практики организации локальных хранилищ данных современная ИС должна удовлетворять некоторым общим требованиям, а именно:
• она должна быть распределенной – РИС13;
• РИС должна обеспечивать контролируемый доступ к различным информационным ресурсам для пользователей и администраторов различных уровней;
• РИС должна обеспечивать сквозной поиск, в том числе полнотекстовый, по различным критериям;
• РИС должна предоставлять информацию в требуемом пользователем виде;
• внутренние технологии РИС должны быть скрыты от пользователей;
• внешние интерфейсы должны быть стандартизованы (6).
При попытках разработки РИС, удовлетворяющих перечисленным требованиям, возникают проблемы, связанные с различными аспектами их функционирования. Эти проблемы можно сгруппировать в следующие классы (2; 6):
• модели и стандарты представления информации и метаинформации.
К сожалению, следование рекомендациям международного сообщества о стандартизации схем данных не является характерной чертой подавляющего большинства разрабатываемых и функционирующих информационных систем14;
• автоматическая классификация информации.
Разработчики ИС не используют модели классификации хранимой информации, затрудняя тем самым включение механизмов, в том числе внешних, для ее автоматической классификации;
• доступ к распределенным и разнородным коллекциям (интероперабельность, масштабируемость, обнаружение релевантной информации, интеграция метаинформации).
Интероперабельность создаваемых информационных систем не выдерживает даже минимальной критики (2);
• интерфейсы пользователей, визуализация и анализ данных.
К сожалению, подавляющее количество существующих ИС оперирует только с графическими веб-интерфейсами доступа к данным. При этом возможность доступа к данным вне графических интерфейсов, как правило, не реализуется. Это исключает возможность интеграции