Искусственный интеллект (ИИ, AI) — это класс технологий, способный выполнять задачи, обычно требующие человеческого интеллекта, такие как анализ и синтез информации, рассуждение, решение проблем и принятие решений. Такие системы обучаются на данных, распознают образы, принимают решения, а также генерируют новый контент без прямого управления человеком.
По сей день ведутся споры насчет термина и критериев отнесения того или иного алгоритма к искусственному интеллекту. Граница между «просто программой» и «интеллектом» размыта и часто зависит от контекста. На протяжении десятилетия мы своими глазами наблюдаем, как работает так называемый «эффект ИИ», при котором каждое новое достижение в области ИИ обесценивается, а планка отнесения системы к ИИ растет: «Это не ИИ, это статистика» или «это поиск по дереву решений».
Поэтому в статье мы опираемся на практический критерий: если система решает задачу, которая обычно требует человеческого участия, и делает это автономно, то мы относим её к классу ИИ-решений.
ИИ, нейросеть, машинное обучение, LLM: в чем разница, как не запутаться
В новостях перечисленные понятия нередко используются в качестве синонимов. Чтобы разобраться, нужно выстроить иерархию от общего к частному.
УРОВЕНЬ 1. ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ (ЦЕЛЬ) Если вы назовете любой из популярных инструментов искусственным интеллектом, будь то умный чат-бот или сервис по генерации изображений, то не ошибетесь. Как было обозначено ранее, критерием отнесения системы к ИИ является нетривиальность решаемой задачи. Калькулятор не является искусственным интеллектом, потому что выполняет строго заданные арифметические операции. Программа, распознающая рукописный текст на фотографии, является ИИ, так как она интерпретирует нечеткие данные.
К ИИ относятся не только самообучающиеся системы. Детерминированные алгоритмы, имитирующие принятие решений (шахматные движки, тактические боты в видеоиграх, экспертные системы) тоже часть области.
УРОВЕНЬ 2. МАШИННОЕ ОБУЧЕНИЕ (МЕТОД) Машинное обучение (Machine Learning или ML) — это подраздел искусственного интеллекта и самый распространенный способ создания интеллектуальных систем сегодня. В ML программа не получает готовый алгоритм решения от разработчика. Вместо этого ей дают данные и позволяют самой найти закономерности.
ML как метод реализации ИИ-систем демонстрирует лучшие результаты и отлично масштабируется, но взамен требует огромного количества данных и, как следствие, вычислительных ресурсов. Именно из-за экспоненциального роста цифровых данных и доступности вычислительных мощностей мы наблюдаем прорыв отрасли, хотя ML-технологии существуют уже десятилетия.
Для понимания масштаба, Stable Diffusion, запустивший эпоху генерации изображений, обучался на датасете LAION-5B, содержащем 5,85 миллиарда пар «изображение-текст». GPT-4 от OpenAI обучался приблизительно на 13 триллионах токенов (ориентировочно 300 миллиардов слов или несколько миллионов книг).
Сравнение объёмов текста: от классического романа до обучающего датасета GPT-4. Столбик «Война и мир» масштабирован, реальная высота составила бы доли пикселя.
УРОВЕНЬ 3. НЕЙРОННЫЕ СЕТИ (ИНСТРУМЕНТ) Нейронная сеть или нейросеть — это архитектура внутри машинного обучения. Она состоит из слоев математических узлов, функционально имитирующих нейроны мозга. Сигнал проходит через слои, трансформируется и выдает результат.
Каждое соединение между нейронами имеет числовой параметр — вес. Вес определяет, насколько сильно один нейрон влияет на другой. При обучении сеть получает примеры и постепенно корректирует миллионы (или миллиарды) этих весов, чтобы минимизировать ошибки.
Глубокое обучение (Deep Learning) использует много слоев таких нейронов. Это позволяет обрабатывать очень сложные данные. Именно нейросети стоят за распознаванием речи, переводом текстов и созданием изображений.
УРОВЕНЬ 4. ПРИЛОЖЕНИЯ И ПРОДУКТЫ На этом уровне технологии превращаются в понятные пользователю сервисы. Здесь формируются основные типы искусственного интеллекта, с которыми мы сталкиваемся.
☑︎ Генеративный ИИ (Generative AI): создаёт новый контент. Большие языковые модели (LLM) пишут тексты, код и отвечают на вопросы. Диффузионные модели рисуют картинки по описанию. Примеры: GPT-4, Midjourney, Kandinsky. Основная задача — творчество и синтез информации.
☑︎Аналитический ИИ: работает с цифрами и структурированными данными. Прогнозирует спрос, оценивает риски, выявляет мошенничество. Часто использует классические алгоритмы машинного обучения, а не только нейросети. Пример: скоринг в банковском приложении.
☑︎Системы восприятия: преобразуют сигналы реального мира в данные. Компьютерное зрение видит объекты на видео. Распознавание речи переводит голос в текст. Биометрия узнает человека по лицу.
☑︎AI-агенты: новый класс систем, отличающийся высокой автономностью. В отличие от чат-бота, который просто отвечает текстом, агент умеет действовать. Он может сам открыть браузер, найти информацию, заполнить форму и отправить письмо. Агент использует искусственный интеллект для планирования цепочки действий и решения задач без участия человека.
Эта схема была сгенерирована ИИ на основе содержания статьи. Хороший пример интеллектуальной задачи.
FAQ от эксперта
Является ли нейросеть синонимом искусственного интеллекта? Формально нет. Нейросеть это один из методов построения ИИ. Существуют другие подходы, например, экспертные системы или эволюционные алгоритмы. Но сейчас нейросети доминируют в сложных задачах.
В чем разница между чат-ботом и ИИ-агентом? Чат-бот ограничивается диалогом и выдачей информации. Агент способен выполнять действия во внешних системах: отправлять запросы, управлять файлами, совершать транзакции по плану.
Генерация изображений считается искусственным интеллектом? Да. Это применение генеративного ИИ на базе нейросетей. Система не копирует картинки из базы, а создает новые пиксели на основе обученных закономерностей.
Может ли искусственный интеллект работать без интернета? Да. Модели можно запускать локально на мощном компьютере или сервере. Многие промышленные системы работают в изолированных сетях ради безопасности данных.
Почему ИИ иногда ошибается? Современные модели работают с вероятностями, а не с жесткой логикой. Они предсказывают ответ на основе паттернов в данных. Если паттерн редкий или данные были «шумными», вероятность ошибки возрастает.
Другой причиной является ограничение контекстного окна, которое исчисляется в токенах. У каждой модели есть лимит на объём информации, которую она помнит в рамках диалога или даже одного запроса: если вы загружаете длинный документ или сложный промпт (запрос), часть текста обрезается. Модель делает выводы на основе усечённых данных, что ведёт к неточностям.