4. Подсчет количества различных единиц L и частоты каждой из них f, где i = 1, 2…. L.
5. Расчет относительной частоты – частотности р^ – для каждой из выделенных единиц содержания как отношения ее частоты f к общей сумме всех единиц Х1, с точностью до одной сотой (0,01):
f 15’tf
(как показывает практика, большая точность здесь не требуется).
6. Оценка разнообразия, или неопределенности, для каждой единицы (по К. Шеннону, в битах):
h, = – Р, log; р» бит.
На практике используется таблица перехода от относительных частот р к оценкам неопределенности li (таблица 4).
7. Подсчет суммарной оценки разнообразия для каждой категории анализа и для текста в целом:
L
Н = I h, бит.
8. Оценка доли общего разнообразия (в %), приходящейся на отдельные категории – темы, подтемы, микротемы… – в рамках текста.
Таблица 4
Значения h= – plog^p, в битах. Выдержки из таблицы 20А (по: 9. С. 244–245)
Возьмем самый простой случай из четырех рассмотренных: сочинение четвероклассницы Б. М.
«У меня есть подружка Света. Мы очень давно познакомились. Ходили в один садик, учимся в одном классе. На улице мы играем в мячик, в прятки, в догонялки. Мы друг друга не оставляем в беде. Света очень хороший друг! У меня есть сестренка. Света помогает мне с ней нянчиться».
1. В сочинении выделяется то, что характеризует друга.
2. Основные категории анализа определяются в данном случае дедуктивно: на основе сформулированных выше соображений о генезисе сознательного образа человека. Это фиксация поведенческих актов, различные оценки и интерпретация.
3. Выделение в тексте единиц содержания – слов и/ или выражений – и распределение их по категориям (таблица 5).
Таблица 5
Распределение единиц счета по категориям при анализе сочинения четвероклассницы Б. М.
4. Подсчет количества различных единиц L и общего их количества f (таблица 6, столбцы 2 и 3).
Таблица 6
Оценка единиц, категорий анализа и текста в целом (сочинение четвероклассницы Б. М.)
5. Расчет относительных частот – частотностей р^, таблица 6, столбец 4.
6. Оценка разнообразия, или неопределенности, отдельных единиц по К. Шеннону, в битах (li).
В таблице 4 строки содержат десятые доли относительных частот р^, столбцы – сотые доли. Для каждого значения частотности р на пересечении соответствующих строки и столбца находим нужное значение неопределенности h. Для р=0,10 п=0,332; для р=0,20 п=0,464 бит. (См. столбец 5 в таблице 6.)
7. Расчет оценки разнообразия для каждой категории и для текста в целом: таблица б, столбцы 5 и 6. Разнообразие категории «поведение» Н^ =1,66 бит, категории «оценка» Нд = 1,13 бит, категории «интерпретация» Н^ = 0,33 бит. Общее тематическое разнообразие сочинения в данном случае Н = 3,12 бит.
8. Оценка