Параллельные и распределенные вычисления 4. Скорость и синхронизация GPU-вычислений

preview_player
Показать описание
Дата лекции: 03.10.2023 г.
Лектор: Ахтямов Павел Ибрагимович

00:00:00 -- как замерять время работы в CUDA
00:11:05 -- разбор примера
00:14:00 -- подсчет кол-ва операций
00:21:00 -- расчет пропускной способности
00:29:15 -- способы ускорить вычисления
00:31:55 -- иерархия памяти
00:44:45 -- иерархия памяти ЦПУ
00:47:25 -- сравнение иерархии CPU и GPU
00:48:00 -- типы памяти
00:50:50 -- разделяемая (shared) память
00:56:00 -- необходимость синхронизации
00:56:55 -- примитив синхронизации
00:58:45 -- доступ к данным
01:02:10 -- поток управления
01:06:05 -- особенности синхронизации
01:10:45 -- информация по регистрам
01:12:30 -- итоги

Съёмка: Вашкевич Егор
Монтаж: Стешенко Александр
Рекомендации по теме
Комментарии
Автор

а можно ссылку на весь плейлист? при наличии оного

iskanderfakhrutdinov