Насколько нам известно, одним из самых ранних (он появился на заре компьютеризации корпораций) примеров полностью автоматического принятия решений была разработка кредитного рейтинга, отражающего платежеспособность людей, то есть вероятность того, что они возвратят ссуду определенного размера. Ранее это весьма важное решение традиционно принимали специалисты по кредитованию в филиалах банков, которые оценивали заявления на основе собственного опыта, иногда в сочетании с директивами или инструкциями. Однако Билл Фейр и Эрл Айзек подумали, что машины справились бы лучше. В 1956 году они основали Fair Isaac Corporation и начали вычислять кредитные рейтинги FICO.
Вскоре автоматическая оценка платежеспособности для получения кредита вошла в норму. Издание American Banker сообщало, что к 1999 году «ни один сотрудник не рассматривает просьбы о кредите на сумму в 50 тысяч долларов или меньше — все делает компьютер»[129]. Было подтверждено, что рейтинг FICO и его эквиваленты весьма надежно прогнозируют возврат кредита, а поскольку в последние годы увеличилось количество и разнообразие цифровой информации о людях, эти большие данные стали использоваться для улучшения и расширения кредитных рейтингов.
Их разработчики должны быть осторожны, чтобы не перейти «красную черту» и не начать незаконно отказывать или ограничивать размер кредита людям по географическому, расовому или этническому признаку. Впрочем, в целом эти рейтинги полезны, поскольку дают возможность взять кредит большему количеству человек и позволяют заемщикам уверенно расширять свой бизнес. Есть фактические свидетельства того, что случаев пересечения «красной черты» стало действительно меньше, когда решения о выдаче кредитов стали приниматься преимущественно компьютерами. В 2007 году Федеральная резервная система сообщила, что модель кредитного рейтинга «ограничила возможность совершения незаконных дискриминирующих действий… [и] способна уменьшить вероятность того, что на решения о кредитах будут оказывать влияние личностные характеристики или другие факторы, запрещенные законом, включая расовую или национальную принадлежность»[130].
Сегодня можно увидеть массу примеров полезных, эффективных решений, стопроцентно принимаемых компьютерами. Amazon и другие площадки, занимающиеся торговлей в интернете, генерируют рекомендации для покупателя при каждом посещении сайта, и, хотя многие предложения не попадают в цель, некоторые оказываются вполне интересны. Amazon оценивает, что 35 процентов ее сделок становятся возможны в результате кросс-продажной деятельности, например после рекомендации других товаров[131]. Цены на авиабилеты и номера в гостиницах постоянно меняются, реагируя на предполагаемое развитие спроса и предложения. Такой подход к ценообразованию, известный как управление доходами, жизненно важен для несметного множества компаний (в главе 8 мы вернемся к этой теме), и очень редко при автоматическом генерировании цен их перепроверяет человек — если такое вообще бывает. Цены на физические товары сейчас тоже часто меняются автоматически. В 2015 году на следующий день после Дня благодарения Amazon и Walmart изменили цены на все товары в США на 16 и 13 процентов соответственно[132].
Сегодня столько решений целиком принимается компьютерами, что экономист Брайан Артур использует понятие «невидимой экономики»[133], имея в виду процесс, при котором сделки происходят без человеческого участия — «масштабно, негласно, комплексно, невидимо и независимо от нас». Постепенно эта автоматическая вторая экономика вторгается в традиционную, в которой есть люди-посредники, и алгоритмы берут на себя то, что делали эксперты и лица, принимающие решения. Поскольку все больше и больше информации переходит в цифровую форму, мир представляет собой изобилие данных, помогающих улучшить принятие решений там, где интуицию можно заменить алгоритмом.
Рекламные агентства уже давно помогают клиентам не только в творческой работе над созданием роликов, но и в определении того, когда и где их нужно показывать, — во время каких телепрограмм, на каких рынках и в какое время они будут лучше соответствовать целям и бюджету рекламы. Для этой работы уже не одно десятилетие используются данные и технологии. Так, агентство в популярном телесериале «Безумцы» (Mad Men) в 1969 году применяет свой первый компьютер, IBM System/360, чтобы эффективнее размещать рекламу (и производить впечатление на клиентов)[134], но все-таки в основном опирается на суждения и решения людей.
Будучи старшим аналитиком во время второй успешной избирательной кампании Барака Обамы в 2012 году, Дэн Вагнер видел, насколько большей точности можно добиться в работе и насколько это выгодно. Вагнер с коллегами составили реестр американских избирателей. С помощью машинного обучения, которое мы обсудим в следующей главе, аналитики создали три индивидуальные оценки для каждого избирателя в реестре: оценку поддержки, прогнозировавшую, насколько вероятна поддержка человеком Обамы (по сравнению с его противником Миттом Ромни); оценку явки, прогнозировавшую вероятность, с которой человек придет на выборы и проголосует в ноябре; оценку убежденности, или прогноз вероятности того, что он будет более благожелательно относиться к Обаме после его выступления[135].
За долгие годы накопились социально-демографические данные по каждой телепередаче — например, сколько мужчин в районе Денвера в возрасте от 18 до 24 лет смотрят повторы анимационного ситкома «Гриффины» по вторникам в 22:00. Специалисты и компании, покупающие эфирное время для рекламы, традиционно опираются на эту информацию в принятии решений. Если бы у кампании Обамы в 2012 году было намерение донести его обращение до мужчин в возрасте от 18 до 24 лет, живущих в Колорадо, множество компаний и людей посоветовали бы запускать рекламу вечером во вторник во время повтора «Гриффинов».
Подобно большинству других специалистов по закупке рекламного времени, люди в команде Обамы знали, что на такие социально-демографические данные лучше не полагаться, так как они очень неточны. Не исключено, что рекламу увидели бы преимущественно сторонники Ромни или же люди, которые уже приняли решение голосовать за Обаму (что тоже было неподходящим вариантом, поскольку средства расходовались впустую). Опираться на демографию — все равно что полагаться на суждения и оценки, которые на деле немногим лучше догадок. Кто сказал, что к мужчинам в возрасте от 18 до 24 лет можно обращаться как к единой группе или что зрители «Гриффинов» (либо мультфильмов в целом) более восприимчивы к выступлениям Обамы?
Вагнер и его коллеги поняли, что, составив всеобъемлющий реестр избирателей, они уже прошли полпути к более эффективной покупке эфирного времени. С его помощью можно было бы вычислить людей, находящихся в тех двух группах, до которых желательнее всего достучаться: сторонников Обамы, не собирающихся идти голосовать, и колеблющихся избирателей, которых нужно уговорить поддержать Обаму. Первая группа получила название «идите голосовать» (GOTV, get out the vote), вторая — «поддающиеся убеждению». Команда аналитиков обнаружила, что участники этих групп принадлежат к самым разным категориям, поэтому выбор телепередач только на основе демографических сведений не позволил бы обратиться к целевой аудитории. Команда также узнала из более ранних экспериментов, что эти две группы реагируют на разные