Лекция 9. Временные ряды. Открытый курс OpenDataScience по машинному обучению mlcourse.ai

preview_player
Показать описание


На 9-ой лекции обсудим различные методы работы с временными рядами: какие этапы подготовки данных необходимы для моделей, как получать краткосрочные и долгосрочные прогнозы. Пройдемся по различным типам моделей, начиная от простых скользящих средних и заканчивая градиентным бустингом. Также посмотрим на способы поиска аномалий во временных рядах и поговорим о достоинствах и недостатках этих способов.
Рекомендации по теме
Комментарии
Автор

Спасибо за лекцию, но слушать сложно из-за крайне неудачного микрофона. Эхо раздаётся как металлом по стеклу. Восприятие информации затруднено при таких посторонних шумах.

konstantinshirokov
Автор

Лекция хорошая, много полезного. Звук серьёзно подкачал.

LazySnake
Автор

Благодарю за это видео и курс в целом!
Возник следующий вопрос: на моменте 1:18:20 функция code_mean считает среднее по таргету по всей обучающей выборке. Данные для ряда мы "нарезаем" из обучающей выборки, предсказывая значение ряда после определенного лага. Получается, что таргет относительно ряда находиться в будущем, но мы добавляем информацию о среднем, суммируя по всей обучающей выборке. В том числе в среднее попадет таргет, который мы хотим предсказать для ряда. Не является ли это ликом? Может быть, нужно считать среднее для каждого ряда до последней временной точки ряда, чтобы не заглядывать в будущее?
Спасибо!

fhoidhm
Автор

57:20 Почему в seasonal order и P, и Q - одно число param[3] ? по идее должно же быть P=param[2] и Q=param[3]

martins
Автор

спасибо за видео!
а где данный ноутбук с данными лежит?

sharkzeeh
Автор

а нет ещё более улучшенной версии звука? или просто другой записи?

shandi
Автор

Кроссвалидация временных рядов - это большая ошибка, так как ее параметры будут меняться с изменением рынка и она не гарантирует стабильного результата. В любой момент все может поменяться и качество предсказания резко упадет. График соответственно также ничего не гарантирует.
Чем больше параметров, тем выше шанс разбалансировки модели в будущем при изменении условий ряда.

pbpznvm
Автор

6:23 подправьте видео в редакторе. "Неможко" правильно пишется.

pbpznvm
Автор

Вот тут лекция здорового человека есть)
Хотя я бы с удовольствием послушал эту лекцию и от Юрия

boriswithrazor