Нейронная сеть (neural network) — это математическая модель, вдохновлённая принципами работы биологического мозга. Она состоит из множества связанных между собой узлов (нейронов), организованных в слои. Нейронные сети способны обучаться на данных, выявляя сложные закономерности, которые практически невозможно запрограммировать вручную.
Базовая структура нейронной сети включает три типа слоёв: входной (принимает данные), скрытые (обрабатывают информацию) и выходной (формирует результат). Каждая связь между нейронами имеет числовой вес, определяющий силу влияния. В процессе обучения сеть корректирует эти веса, минимизируя ошибку предсказания — этот процесс называется обратным распространением ошибки (backpropagation). Когда скрытых слоёв много, говорят о глубоком обучении (deep learning).
Существуют различные архитектуры нейронных сетей, каждая оптимизированная для своих задач. Свёрточные сети (CNN) эффективны для обработки изображений. Рекуррентные сети (RNN) были разработаны для последовательных данных — текста и временных рядов. Трансформеры — наиболее современная архитектура — стали основой языковых моделей и генеративного ИИ. Генеративно-состязательные сети (GAN) создают реалистичные изображения через соревнование двух моделей.
Нейронные сети применяются повсеместно: распознавание лиц, голосовые помощники, медицинская диагностика, автопилоты, рекомендательные системы, перевод, генерация контента, обнаружение мошенничества и многое другое.
Нейронные сети — фундамент современного искусственного интеллекта. Все прорывы последних лет — от ChatGPT до Stable Diffusion — стали возможны благодаря развитию нейросетевых архитектур и росту доступных вычислительных мощностей.