Как понял Шеннон, изучив эту область, «гены заключены в палочковидных телах, именуемых хромосомами; большое количество генов лежат бок о бок по всей длине хромосомы». (Сами хромосомы состоят из молекул ДНК, которые кодируют гены четырехбуквенными сочетаниями, хотя об этом никто еще не знал.)
У большинства видов, состоящих из более чем одной клетки, особи имеют определенное количество парных хромосом (у человека их двадцать три пары). У тех видов, которые размножаются половым путем, одна хромосома передается от матери, а одна – от отца. Чтобы было понятнее, Шеннон предложил рассматривать организм всего с двумя парами хромосом и шестнадцатью генами. Свой генетический код он представил следующим образом:
A1B1C3D5 E4F1G6H1
A3B1C4D3 E4F2G2H2
Левая верхняя комбинация A1В1С3D5 – это хромосома от одного родителя, а левая нижняя комбинация А3В1С4D3 – хромосома от второго родителя. Вместе они образуют одну хромосомную пару. Колонка из A1 и А3 (буквы выделены жирным шрифтом) составляет позицию генов. Если брать их по отдельности, то A1 – это аллель, или ген от одного родителя с одной наследуемой чертой. Ограниченное количество аллелей возможно в любой позиции генов, а взаимодействие аллелей от матери и отца определяет те качества, которые наследует их потомство. Шеннон перевел в символы возможные аллели с помощью чисел в нижнем индексе. А1 и А3 – это различные проявления одной черты (к примеру, цвета волос – единица обозначает каштановый, а двойка блондин), а качество, которое превалирует, зависит от того, какой ген доминирует.
Теперь еще больше упростим эту схему. Допустим, мы хотим изучить целую популяцию индивидуумов, выбрав всего две черты, А и В.
А что если целую популяцию и все ее релевантные гены можно представить в виде всего одного алгебраического выражения?
И снова каждый ряд символов получен от одного родителя, а каждая колонка обозначает позицию гена. Скажем, существуют две возможные аллели для А (к примеру, каштановые и светлые волосы) и три для В (высокий, среднего роста и низкорослый). В этом случае получится двадцать один генетически отличный от других индивидуум (поверьте нам), варьирующийся от
A1B1
A1B1
до
A1B3
A2B2
Итак, как мы можем смоделировать генетические изменения населения со временем, или предсказать