Продолжаем неделю нейронных сетей. В этом посте вы узнаете о нейронных сетях на примерах математических моделей. Говоря проще, вы узнаете о том, как представить нейронные сети с помощью математических уравнений. Дата-сайентисту или исследователю машинного обучения было бы неплохо получить представление о том, как нейронные сети могут быть преобразованы в кучу математических уравнений, для вычисления различных значений. Хорошее понимание представления выходных данных функции активации различных вычислительных блоков (узлов, нейронов) в разных слоях может помочь быстрее и лучше понять алгоритм обратного распространения.
Под катом простое и краткое введение в математическое представление нейронных сетей для интересующихся теорией практиков: от перцептрона до сети с двумя скрытыми слоями.
Однослойная нейронная сеть (перцептрон)
Вот как выглядит однослойная нейронная сеть. А вот тут можно почитать, как эта сеть объяснена с помощью примера на Python.
Перцептрон однослойная нейронная сеть
Вот как могло бы выглядеть математическое уравнение для получения значения
a1
(выходной узел) в качестве функции входных
x1, x2, x3
.В приведенном выше уравнении верхний индекс веса представляет слой, а нижний индекс весов представляет вес соединения между входным и выходным узлами. Таким образом, представляет вес первого уровня между узлом 1 в следующем слое и узлом 2 в текущем слое.
Нейронная сеть с одним скрытым слоем
Ниже нейронная сеть с одним скрытым слоем, имеющим три нейрона, входным слоем с тремя входными нейронами и выходным слоем с одним нейроном.
Нейронная сеть с входным, скрытым и выходным слоями
Вот так может выглядеть математическое уравнение для получения значения
a1, a2 и a3
в слое 2 в качестве функции
входных x1, x2, x3
. Кроме того, значение
a1
в слое 3 представлено как функция значений
a1, a2 и a3
в слое 2.Сначала давайте представим выходные значения, обработанные в трех скрытых нейронах скрытого слоя. Входной слой представлен как слой 1, скрытый слой как слой 2 и выходной слой это слой 3.
Определим выходное значение узла в выходном слое. Значение представляется как функция от
a1, a2
и a3
в предыдущих узлах, которые могут быть представлены как значения
x1, x2
и x3
во входном слое.Нейронная сеть с одним скрытым слоем (3 нейрона) и выходным слоем (2 нейрона)
Ниже представлена нейронная сеть с одним скрытым слоем, имеющим три нейрона, входным слоем с двумя входными нейронами, а также выходным слоем с двумя нейронами.
Трехслойная нейронная сеть
Вот так может выглядеть математическое уравнение для получения значения
a1, a2, a3
в слое 2 в качестве функции
входных значений x1, x2
. Кроме того, значение
a1, a2
в слое 3 представлено как функция значений
a1, a2, a3
в слое 2.Сначала давайте представим выходные значения, обработанные в трех скрытых нейронах скрытого слоя. Входной слой представлен как слой 1, скрытый слой как слой 2 и выходной слой это слой 3.
Определим выходное значение узлов в выходном слое. Значение представляется как функция от
a1, a2, a3
в предыдущих
узлах, которые могут быть представлены как значения x1, x2,
x3
во входном слое.Сети глубокого обучения с двумя скрытыми слоями
Наконец, давайте посмотрим, как выходные значения узлов
a1
в выходном слое могут быть выражены в виде
математических вычислений как функция входных сигналов x1,
x2
. Вот схема сети глубокого обучения, имеющей два скрытых
слоя, один из которых имеет три узла, а другой два узла. Затем
имеется входной уровень с двумя входными узлами, и выходной слой с
одним выходным узлом. Вот схема упрощенной сети глубокого
обучения.Нейронная сеть глубокого обучения
Значения в слое 2 (
a1, a2, a3
) и слое 3 (a1,
a2
) останутся такими же, как в предыдущем разделе. Давайте
представим значение 1 в выходном слое как функцию значений a1 и a2
в предыдущем слое (слой 3).Заключение
Ниже краткое изложение того, что вы узнали в этом посте о представления нейронных сетей в виде математических моделей:
- Важно понимать обозначения, в которых вы будете представлять нейронную сеть как уравнение.
- Первому или входному слою можно назначить номер 1, скрытому номер 2, а выходному 3.
- Весам между входным узлом в одном слое и узлом в следующем слое назначается верхний индекс значение слоя, состоящего из входного узла. Нижний индекс веса состоит из двух чисел числа, представляющего узел в следующем слое и номера входного узла.
В посте показана лишь верхушка айсберга, который из себя представляют нейронные сети. Если пост заинтриговал вас приходите к нам, расскажем больше. А промокод HABR даст вам получить дополнительные 10% к скидке указанной на баннере.
- Онлайн-буткемп по Data Science
- Обучение профессии Data Analyst с нуля
- Онлайн-буткемп по Data Analytics
- Обучение профессии Data Science с нуля
- Курс Python для веб-разработки
- Курс по аналитике данных
- Курс по DevOps
- Профессия Веб-разработчик
- Профессия iOS-разработчик с нуля
- Профессия Android-разработчик с нуля
- Профессия Java-разработчик с нуля
- Курс по JavaScript
- Курс по Machine Learning
- Курс Математика и Machine Learning для Data Science
- Продвинутый курс Machine Learning Pro + Deep Learning