Третья Среда Программиста. Награда за любопытство. Как Reinforcement Learning меняет мир?

preview_player
Показать описание
Третья Среда Программиста в мае расскажет о технологии будущего – обучении с подкреплением, или Reinforcement Learning. Даже если ты пока не знаком/а с RL, но интересуешься AI, ждем тебя на встрече

Вместе с Александром Гедрановичем, Head of DS&ML Dept SoftTeco, мы обсудим:

🔹 Что такое обучение с подкреплением, или Reinforcement Learning
🔹 Как алгоритмы RL учатся на основе взаимодействия с окружающей средой
🔹 Основные различия между RL и другими подходами к машинному обучению
🔹 Путь AlphaGo – компьютерной программы, которая смогла победить чемпиона по игре в Го
🔹 Перспективы AI и новейшие разработки в области языковых моделей

ТАЙМКОДЫ
0.00 Вступление
2:30 Знакомство со спикером
4:26 Что такое reinforcement learning
10:27 Отличие RL от Deep Learning и Machine Learning
12:11 Какие ресурсы нужны для обучения с подкреплением
16:20 Недостаток вычислительных мощностей проблема ли для использование метода RL
19:32 Игра в GO и проект AlphaGO
29:02 Как учился СhatGPT и Alpha Zero
32:37 Какие проблемы может решить тенология RL в бизнес
36:37 Подслушивают ли нас смартфоны
44:07 Как СhatGPT изменит сферу рекрутмента
47:25 Кейс по использованию RL при участии Ильи Грозова
57:48 Что почитать по теле RL (советы от Ильи)
1:01:02 Применение AI в различных доменах
1:04:19 Про Prompt engineering
1:07:27 Какие профессии в IT заменит AI
1:07:27 Следующий прорыв в AI

#ТретьяСредаПрограммиста #AI #RL #ReinforcementLearning #онлайнмитап #ITмитап #SeniorDeveloper #appdeveloper #Middle #Junior #IT #ивент #нейронныесети #machinelearning #ML #стрим #машинноеобучение #chatgpt #AlphaGo #языковыемодели #айти #datascientist #dataanalytics #
Рекомендации по теме
Комментарии
Автор

Александра слушать приятно, а ведущий просто никакой. Необязательные англицизмы и жаргон начинают раздражать уже через 5 минут. Вы уж тогда на английском подкаст запишите.

famesoff
welcome to shbcf.ru