С технологической точки зрения единственный термин, который вам следует запомнить на данный момент, – это «машинное обучение». Оно представляет собой современную версию экспертных систем, которую сейчас интенсивно финансируют, разрабатывают и применяют в самых различных областях. Но прежде чем я опишу (разумеется, в упрощенной форме), что такое машинное обучение, нам нужно понять, что представляют собой все остальные силы, участвующие в текущем компьютерном прорыве, и почему на этот раз для искусственного интеллекта все может сложиться по-другому. На мой взгляд, в области ИИ сейчас действуют четыре основные движущие силы.
Роль больших данных
Первой из движущих сил, породившей огромный интерес и создавшей высочайшую активность в области искусственного интеллекта, является колоссальный объем данных, доступных в современном мире. Специалисты называют разные цифры, но все они сходятся на том, что объем данных, генерируемых человечеством, удваивается каждые два года. Это означает, например, что в 2022 году будет создано (или скопировано) 88 зетабайт (то есть 88 трлн гигабайт) данных. Для нашей темы это исключительно важно, потому что большая часть технологий искусственного интеллекта подпитывается массовыми данными – без них искусственный интеллект был бы бесполезен, как электростанция без топлива.
Чтобы обучить систему искусственного интеллекта (например, нейронную сеть) с той или иной степенью точности, требуются миллионы примеров, и чем сложнее модель, тем больше примеров необходимо. Вот почему крупные интернет-компании и социальные сети, такие как Google и Facebook, настолько активны в сфере искусственного интеллекта – именно у них в первую очередь достаточно данных для такой работы. Поиски, выполняемые с помощью Google, создают около 3,5 млрд запросов в день, а публикации в «Фейсбуке» ежедневно обновляют 421 млрд статусов, загружают 350 млн фотографий и генерируют почти 6 трлн «лайков» – так вот и возникает топливо для этих систем. Один только Facebook формирует около 4 млн гигабайт данных каждые 24 часа.
Этот огромный объем данных используется искусственным