◆ формат текстовых файлов Американского национального института стандартов (American National Standards Institute, ANSI) (.txt) для кодовой страницы Microsoft (MS) Windows;
◆ формат MS Word для Windows (.doc) – поддерживаемый всеми формат Microsoft;
◆ формат документов (Rich Text Format, RTF) (.rtf) – поддерживаемый всеми формат Microsoft. Сохраняет исходное форматирование, а также стили начертания символов. Файлы могут содержать графические картинки с различными параметрами. Поддерживает 256 цветов;
◆ формат передаваемого документа (Portable Document Format, PDF) (.pdf) – обеспечивает получение точной копии необходимого документа.
С фрагментами этих файлов можно работать, как с текстом. Заметим, что последний формат фактически обеспечивает представление изображения текста и иллюстраций документа. В этой связи необходимо также отметить близкие по назначению к тестовым новые форматы:
◆ графический формат DJVU (дежавю) (.djvu) – применяется для создания и размещения в Internet отсканированных книг (сканированных объемных документов) без распознавания текста. Обеспечивает компактное представление графического материала. Это лучший формат для электронного представления в Internet научной и технической литературы, стандарт де-факто для электронных библиотек;
◆ формат FictionBook2 (FB2) (.fb2) – для создания электронных книг. Он является открытым, основан на расширяемом языке разметки (eXtensible Markup Language, XML) [11].
Гипертекст. Важнейшим средством структурирования информации является гипертекст (ГТ) (Hypertext – нелинейный текст) – информационная структура, состоящая из дискретных узлов данных и семантических связей между ними, где узел – текст или ГТ, а связи могут быть локальными, глобальными и смешанными. То есть ГТ – это некоторая метаструктура текста, которая может быть и многоуровневой, со сложными семантическими сетевыми отношениями между различными фрагментами текста [12]. По сути, значение ГТ может быть приравнено к значению книгопечатания. История ГТ начинается с середины 40-х годов:
◆ 1945 г. – Ванневар Буш (советник президента США Франклина Делано Рузвельта) предложил саму идею ГТ;
◆ 1965 г. – Теодор Хольм Нельсон предложил термин «гипертекст», развил и реализовал идеи работы с нелинейными текстами;
◆ 1968 г. – Дуглас Энгельбард (изобретатель «мыши») продемонстрировал работу ГТ-интерфейса в системе телекоммуникаций;
◆ 1975 г. – разработана система ZOG – информационная ГТ-система внутреннего распорядка авианосца «Карл Винстон»;
◆ 1989 г. – Тим Бернерс-Ли предложил блестящую идею применить ГТ-модель к информационным ресурсам, распределенным в сети, причем самым простым способом.
Он же разработал язык гипертекстовой разметки (HyperText Markup Language, HTML), универсальный способ адресации сетевых ресурсов (Universal Resourse Locator, URL), протокол передачи ГТ (HyperText Transport Protocol, HTTP). общий интерфейс шлюзов (Common Gateway Interface, CGI) разработали позднее в