Если вхождение в Союз писателей уже представляет собой значимый фильтр, гораздо более выпукло внутреннюю иерархию истории поэзии отражают литературоведческие исследования, посвящённые конкретным эпохам, как в этом случае: «Основное содержание эпохи и подлинно национальные интересы народа выражали поэты-демократы М. Гафури, Д. Юлтый, Ш. Бабич, С. Кудаш» [Ахмадиев 1971: 24] (все они есть в выборке). В предисловии к очеркам истории башкирской литературы [История 1963] упомянуто 10 поэтов (9 из них присутствует в корпусе), в главе о поэзии октябрьской эпохи – 9 персоналий (6 из них есть в корпусе), в очерке о 1920-х годах – 13 писателей (9 из них есть в выборке), в очерке, посвящённом башкирской поэзии 1930-х годов, место уделено 11 авторам (творчество 10 из них отражено в корпусе).
Наконец, о представленности в корпусе наиболее значимых для своего времени имён можно судить по составу антологий. В книге [Поэты 1950] в переводах на русский язык собрано творчество 25 поэтов, из них 19 (76 %) присутствует в выборке. Таким образом, можно сказать, что в анализируемом корпусе собрано большинство прошедших институциональный отбор башкирских поэтов, а в отношении центральных для своего периода персоналий покрытие выборки ещё лучше и может превышать 90 %.
Другим важным для исследования параметром является датированность текстов в корпусе. Многие явления метрики проанализированы в динамике, их история прослежена с 1900-х до 2000-х годов. В этих подсчётах участвует только та часть произведений, датировка которых известна и отражена в метаданных текстовой коллекции. Эта часть составляет 7938 стихотворений, то есть 44,36 % от общего объёма корпуса. В то же время датированные тексты в целом длиннее недатированных, так что привязанная ко времени часть выборки – это 242 141 строка и 932 283 слова, то есть 51,69 % и 52,49 % всего корпуса соответственно.
Все датированные тексты распределены по десятилетиям, их соотношение представлено в таблице 2 ниже. На рис. 3 датировка стихотворений представлена более детально.
Если в отношении текстов мы видим подавляющее преимущество стихотворений, написанных в 1960-е годы, а за второе по полноте представления десятилетие соперничают 1950-е и 1970-е, то распределение строк выглядит иначе. Наибольшую долю в корпусе также имеют 1960-е годы, однако второе место делят между собой 1950-е и 1930-е, и только за ними следуют 1970-е и 1940-е. Середина века получает широкое покрытие, материал 1900-х годов имеет статус вспомогательных данных (строго говоря, стихи, написанные в это время, создаются не на башкирском языке, а на тюрки́), а объем текстов, охватывающих 2000-е годы, недостаточен для серьёзных выводов.
Таблица 2. Распределение датированного