Монте Карло на Python. Генерация случайных величин. Моделированние данных.Теория вероятностей для ML

preview_player
Показать описание
00:00:00 Введение в моделирование данных

• Теория вероятности важна для моделирования данных и метода Монте-Карло.

• Подключение библиотек pandas и numpy для визуализации и генерации данных.

• Использование библиотеки numpy для моделирования случайных величин.

00:00:44 Проблемы с подключением и настройка

• Проблемы с подключением к интернету по телефону.

• Настройка подключения по кабелю для стабильной работы.

• Подключение библиотек и настройка визуализации с помощью pandas и seaborn.

00:03:09 Генерация случайных величин

• Использование библиотеки numpy для генерации случайных величин.

• Пример генерации кубика и его подкидывания.

• Объяснение работы генераторов и метода shuffle для перемешивания данных.

00:04:41 Воспроизведение результатов

• Объяснение необходимости задания seed для воспроизводимости результатов.

• Пример использования метода shuffle для перемешивания данных.

• Проблемы с воспроизводимостью результатов без задания seed.

00:07:32 Выборка данных

• Объяснение выборки без повторений и с повторением.

• Пример выборки с повторением и его влияние на результаты.

00:10:07 Применение seed для воспроизводимости

• Использование seed для фиксации результатов эксперимента.

• Пример записи seed для воспроизводимости данных.

• Рекомендации по записи или запоминанию seed для различных целей.

00:12:15 Задача с подбрасыванием монет

• Задача о подбрасывании симметричных монет двумя игроками.

• Определение вероятности одинакового числа гербов после десяти подбрасываний.

• Моделирование эксперимента и расчет вероятности с помощью формулы полной группы событий.

00:13:43 Объем испытаний

• Объем испытаний обычно начинается с 10 тысяч.

• Для Монте-Карло лучше использовать более 100 тысяч экспериментов.

• Если данных немного, можно использовать более 100 тысяч.

00:14:41 Счетчик благоприятствующих случаев

• Счетчик обновляется в цикле.

• Задаем начальную установку счетчика.

• Моделируем данные и создаем модель.

00:15:41 Создание монетки
00:18:05 Эксперимент с монеткой

• Подбрасываем монетку 10 раз.

• Создаем еще одну монетку для сравнения.

• Находим вероятность совпадения числа гербов.

00:19:30 Вероятность совпадения

• Считаем количество совпадений.

• Используем конструкцию "и плюс равно один".

• Рассчитываем относительную частоту событий.

00:23:49 Монте-Карло

• Моделирование случайных величин.

• Метод Монте-Карло включает генерацию случайных чисел.

• Используем библиотеку random для генерации чисел.

00:26:05 Генерация монетки

• Генерируем монетку с помощью панд.

• Используем функцию sample для получения данных.

• Применяем Pandas для работы с данными.

00:27:12 Введение в выборку

• Выборка - это выбор одного элемента из списка.

• Пример с пандами: выборка из списка панд.

• Преобразование объекта в число с помощью метода .values.

00:29:06 Генерация монеты с помощью панд

• Генерация монеты с помощью панд.

• Использование метода .sample для генерации монеты.

• Преобразование объекта в число для дальнейших операций.

00:30:01 Выборка с повторением
00:31:29 Биномиальное распределение
00:33:58 Моделирование объектов
00:35:31 Использование numpy для моделирования
00:37:12 Генерация случайных чисел
00:39:16 Заключение
00:40:20 Формула Байеса

• Формула Байеса проверяет, какая гипотеза повлияла на событие.

• Полная вероятность гипотезы используется для пересчета вероятности.

• Пример с монеткой и биномиальным распределением.

00:41:27 Эксперименты с монеткой

• Создание функций для подбрасывания монетки.

• Сравнение результатов с использованием биномиального распределения и пандесов.

• Важность понимания работы алгоритмов для аналитиков данных.

00:43:26 Генерация случайных чисел

• Создание минималистичной функции для генерации случайных чисел.

• Эксперименты с подбрасыванием монетки 10 раз.

• Использование метода сэмпла с повторением.

00:46:35 Работа с кубиком

• Увеличение количества граней кубика до 10.

• Удаление индекса элемента и выдача общего индекса.

• Подбрасывание кубика 10 тысяч раз и расчет вероятности выпадения каждой грани.

00:49:32 Закон больших чисел

• Увеличение выборки приводит к приближению среднего значения к теоретическому.

• Чем больше выборка, тем ближе среднее значение к истинному.

💰 Стать спонсором :

(USDT TRC20) TPWP9kuqqetDNPeLjAe51F1i2jPxwYYBDu

(USDT BEP20) 0xf3db7ce90a55d1d25b7a6d1ded811fb2a7523f3d

#математика #datascience #machinelearning

математика с нуля,

математика для дата сайнс,

математика для машинного обучения,

математика для data science,

математика для дата аналитика
Рекомендации по теме