В чем проблема? Поиск в Интернете основывался на ключевых словах. Поэтому, если ты искал информацию о лошадях, поиск выдавал тебе каждый сайт, на котором упоминалось слово «лошадь». И тебе приходилось сидеть и загружать каждый результат в надежде наткнуться на нужную информацию.
Это было похоже на поход в библиотеку с просьбой рассказать о лошадях. Библиотекарь берет каждую книгу, журнал и брошюру, в которых есть по крайней мере одно слово «лошадь». Затем он сбрасывает их в беспорядочно перемешанные кучи, в которых тебе предстоит рыться, пока ты наконец не найдешь то, что искал. Таким был поиск до изобретения Google. Не многим хватает мужества вспоминать о тех временах. Нам был необходим способ как-то организовывать эту информацию.
PageRank[5]
Математический мозг Сергея Брина был идеальным котелком для варки идей алгоритма, который бы анализировал ссылки и ранжировал веб-страницы. Это было похоже на фирменный рецепт блюда. Ларри и Сергей назвали этот особый соус PageRank.
Слово PageRank звучит знакомо? Ты угадал! Ларри и Сергей назвали его в честь Ларри, используя его фамилию, Пейдж.
Представь, что ты опубликовал веб-страницу, на которой ты восторгаешься фильмом «Звездные войны: Пробуждение силы» (что, кстати говоря, по праву). Как алгоритм сможет отличить твой сайт от, например, StarWars.com? Какой сайт уместнее? Какой авторитетнее? Какой лучше освещает тему? Ответ кроется в обратных ссылках. Со столь же огромной, как твоя любовь к кинокартине, вероятностью на твой фан-сайт все-таки ссылается не так много людей, как на StarWars.com. В конце концов, StarWars.com может похвастаться сенсациями, играми, видео, закулисными кадрами, анонсами и т. д. Между тем на твоем фан-сайте может быть размещен лишь один пост о том, какое впечатление на тебя произвел этот фильм. PageRank может определить, какой сайт важнее, исходя из количества входящих ссылок. А теперь настоящий вынос мозга. Важно не то, сколько ссылок ведут на твой сайт, а то, насколько важны сайты со ссылками на твой… что определяется количеством входящих ссылок на эти сайты. Затем, когда определенной странице присвоен рейтинг PageRank, Сергей также нашел способ проанализировать такие факторы, как ключевые слова, капитализация, размер шрифта, расстояние между словами на странице и многое другое. Эти ориентиры называются «сигналами». Анализ всех этих сигналов помог Сергею разработать алгоритм, который вырисовал довольно четкую картину релевантности веб-страницы.
Как сказал Ларри интервьюеру: «Мы преобразуем всю сеть в большое уравнение с несколькими сотнями миллионов переменных, которыми выступает PageRank всех веб-страниц; и миллиардами свободных членов, в качестве которых выступают ссылки». Другими словами, сеть была просто гигантской, сложной математической задачей. Той, которую решили Ларри и Сергей.
Когда изобретатели создают что-то новое, они подают патент на свое изобретение. Эта документация защищает изобретение, чтобы другие не могли его скопировать. Поскольку PageRank был создан студентами Стэнфорда на кампусе, патентом на PageRank владеет Стэнфордский университет. Стэнфорд лицензировал этот патент исключительно для Google в обмен на акции в компании. Когда университет продал эти 1,8 миллиона акций Google в 2005 году, они заработали 336 миллионов долларов. Неплохо! (Думаю, это компенсирует недостающие компьютеры.) С патентом можно ознакомиться здесь: https://www.google.com/patents/US6285999.
В 1996 году, когда Ларри и Сергей запустили BackRub для сканирования в Интернете и создания индекса ссылок, они затем использовали PageRank для организации и ранжирования всех этих веб-данных. Анализируя результаты, они поняли, что их проект был очень похож – ну очень похож – на поисковик, только с точными результатами. Эврика! Они сравнили результаты запроса с результатами самых популярных поисковых систем тех лет. Бесспорно, результаты PageRank оставляли всех остальных далеко позади.
Как и у любого пользователя сети, первый поиск Ларри на BackRub был… его собственное имя.
Ларри и Сергей поняли, что они только что случайно произвели революцию в веб-поиске.
Скриншот первоначальной страницы BackRub из Internet Archive WayBack Machine
Взлет
Шумиха вокруг BackRub разлетелась по кампусу как пожар. Студенты, в частности, были очень взволнованы: не каждый день возвращаешь назад часы своей жизни. Дни просеивания бессмысленных результатов поиска закончились. Это поражало воображение. Челюсти отваливались.
Впервые ты мог искать и быстро находить в Интернете нужную информацию – даже ту самую, что ты искал!
Уже вскоре BackRub ежедневно использовали десять тысяч человек.
Спрос на BackRub резко подскочил. Однако не только он один бурно развивался.
Сама сеть росла с безумной скоростью, втрое увеличившись в размере с 1996 по 1997 год.
Это означало, что Ларри и Сергею было нужно еще больше компьютеров и дискового хранилища для сканирования постоянно расширяющейся сети и хранения постоянно растущего количества ссылок.
Чтобы поспевать за спросом, они добавляли компьютеры, различные части и стойки – их раздутый самодельный сервер быстро заполонил весь их угол кабинета. На очереди была комната Ларри. Они и ее заполнили серверами. Сергей также пожертвовал своей комнатой. Теперь это был бизнес-офис BackRub.
Но по мере роста сети серверов Ларри и Сергея их электроснабжение не возрастало. Им нужен доступ к рубильнику, который находился в запертом подвале. Но отсутствие ключа (или разрешения) ставило их в безвыходное положение. Тогда Сергей обратился за помощью к одной из своих любимых книг: «Руководство Массачусетского технологического института по отпиранию замков». Несложно угадать, что произошло потом. Они проникли в подвал и поддали мощности своей компьютерной системе.
Проникновение в подвал также решило еще одну проблему. Вопрос с пропускной способностью. Одним лишь щелчком тумблера BackRub мог получить доступ к полной пропускной способности Стэнфорда в 45 Мбит/с вместо простых 10 Мбит/с, выделенных их зданию. Переключившись, они увеличили свою пропускную способность более чем в четыре раза.
Но сколько бы сил они ни вкладывали в проект, им всегда требовалось больше. Их инновационное домашнее задание регулярно оставляло Стэнфорд без подключения к Интернету. Они использовали более половины пропускной способности института. И BackRub не просто потреблял тонны электричества, серверного пространства и интернет-соединения, он также занимал каждый свободный ото сна час Ларри и Сергея.
Позвольте дать небольшой совет…
Когда Ларри и Сергей поступили в Стэнфорд, каждому из них был назначен научный руководитель, или профессор, который должен был помогать им на пути к докторской степени. Эти взаимоотношения очень важны: он отсеивает твои идеи, помогает решать проблемы и определиться с направлениями исследования, утверждает твою тему диссертации и любые другие вещи (не важно, хорошие, плохие или трудные), которые ты предлагаешь.
Руководителем Ларри назначили Терри Винограда, пионера человеко-машинного взаимодействия. Для Ларри Виноград не был незнакомцем. Наоборот, несколько лет назад, когда Ларри