filmov
tv
Основные понятия машинного обучения - лекция 4
Показать описание
Цикл онлайн лекций «Основные понятия машинного обучения» профессора Арменака Оганесовича Бабаяна из Национального политехнического университета Армении.
В рамках курса изучены основные понятия машинного обучения и необходимые для этого математические вопросы. Рассматривается задача распознавания рукописных цифр, и этот основной пример является базовым для описания общего метода «обучения на примерах». Вводятся необходимые понятия: персептроны, нейронные сети, целевая функция, которые позволяют приближенно решить поставленную задачу. Подробно разбираются методы спуска для определения экстремума функции многих переменных, трудности их реализации в пространствах высокой размерности и их модификация для определения экстремума целевой функции специального вида, соответствующей построенной нейронной сети (распространение назад (backpropagation)). Далее разбираются основные особенности построенного метода и связанные с ними необходимые математические понятия: теория интерполяции, метод наименьших квадратов, байесовский подход к определению параметров распределения по случайной выборке. В заключение, используя полученную информацию, намечаются пути модификации полученных нейронных сетей (сверточные нейронные сети (convolution neural network), остаточные сети (residual network)), а также показывается необходимость модификации целевой функции (регуляризация).
Данный курс лекций прочитан в рамках недавно созданной лаборатории при Центре под названием «Стохастические методы и искусственный интеллект», руководитель лаборатории – проф. И.В. Павлов, научный руководитель лаборатории – академик А.Н. Ширяев.
В рамках курса изучены основные понятия машинного обучения и необходимые для этого математические вопросы. Рассматривается задача распознавания рукописных цифр, и этот основной пример является базовым для описания общего метода «обучения на примерах». Вводятся необходимые понятия: персептроны, нейронные сети, целевая функция, которые позволяют приближенно решить поставленную задачу. Подробно разбираются методы спуска для определения экстремума функции многих переменных, трудности их реализации в пространствах высокой размерности и их модификация для определения экстремума целевой функции специального вида, соответствующей построенной нейронной сети (распространение назад (backpropagation)). Далее разбираются основные особенности построенного метода и связанные с ними необходимые математические понятия: теория интерполяции, метод наименьших квадратов, байесовский подход к определению параметров распределения по случайной выборке. В заключение, используя полученную информацию, намечаются пути модификации полученных нейронных сетей (сверточные нейронные сети (convolution neural network), остаточные сети (residual network)), а также показывается необходимость модификации целевой функции (регуляризация).
Данный курс лекций прочитан в рамках недавно созданной лаборатории при Центре под названием «Стохастические методы и искусственный интеллект», руководитель лаборатории – проф. И.В. Павлов, научный руководитель лаборатории – академик А.Н. Ширяев.