Так как же находятся нужные иголки в таком необозримом стогу сена? Есть некоторые очевидные идеи, помогающие понять, как можно выявить нужные пользователю веб-страницы, – по ключевым словам, которые он вводит в строку поиска. Но те же самые ключевые слова содержат бесчисленные страницы. Если искомые ключевые слова часто появляются на какой-то странице, это еще не значит, что именно их разыскивает большинство пользователей. Возможно, здесь полезно свернуть с основной дорожки и приглядеться к содержанию различных страниц. Было испытано множество вариаций этой темы, но все равно, похоже, ничего не получалось. Тут уж легко было сдаться и решить, что Паутина слишком разрослась и индексирование страниц и любая осмысленная навигация по ним – задача в принципе непосильная.
Прорыв, который совершили Брин и Пейдж, произошел благодаря их интересу к сетевому устройству Паутины: она содержит уйму полезной информации, ведь такое устройство не случайно. Одни веб-страницы связаны с другими веб-страницами, которые имеют для них важность. Так как же Брин и Пейдж поняли и использовали эту информацию? Главная догадка заключалась в том, что лучший способ выявить ту страницу, которую пользователь захочет увидеть в первую очередь, – это посмотреть на те веб-страницы, откуда тянутся связи к этой самой веб-странице. Если к какой-либо странице тянутся связи от других важных веб-страниц, значит, скорее всего, это важная страница. Нельзя судить о странице просто по числу ее связей с другими страницами: вопрос заключается в том, связана ли она с теми страницами, которые сами имеют множество связей. В очень многих областях гораздо важнее иметь друзей “с хорошими связями”, чем просто иметь много друзей.
Это как бы круговое определение: страница “важна”, потому что связана с другими “важными” страницами, которые, в свой черед, оказываются “важными”, потому что связаны с “важными” страницами. Несмотря на этот круговой характер, решение получается красивое – и чрезвычайно полезное для сетевой среды.
Предположим, что нам нужно распространить слух или какую-то информацию, которая, как мы полагаем, будет разноситься путем “сарафанного радио”. Чтобы понять, почему здесь не годится прямолинейный принцип популярности, посмотрите на сеть, изображенную на рисунке 2.5. Даже беглого взгляда на нее достаточно, чтобы заметить, что положения Нэнси и Уоррена сильно разнятся, хотя оба они имеют по двое друзей. Различие состоит в том, что их друзья обладают разным качеством связей, а потому и сами они занимают разное положение в сети. У каждого из друзей Уоррена лишь по два друга, тогда как у друзей Нэнси – семеро и шестеро. Таким образом, пускай Уоррен и Нэнси занимают одинаковое положение с точки зрения “степени” (то есть по количеству друзей), у друзей Нэнси