2. Введение в OpenCL. Архитектура видеокарты

preview_player
Показать описание

Лекция №2 курса «Вычисления на видеокартах» (осень 2021).
Преподаватель — Николай Полярный
Рекомендации по теме
Комментарии
Автор

Крутой лектор, крутая подача и крутой материал!

lesgrossman
Автор

Есть ли возможность как-то получить доступ к прикладным материалам, на которых основывается практика по этим лекциям?

shurmurray
Автор

17:00 - Возможны проблемы с версиями, пользователь сохранил файл в одной версии программы, а считал в другой версии программы

yoticc
Автор

Если SM имеет 32 рабочих треда, то почему мы выделяем рабочую группу 128? Логичней выделить рабочую группу из 32 элементов. Разве нет? Так синхронизация должна быть быстрей

Если выделить рабочую группу из 256 элементов, получается в 2 раза ещё больше будет переключений контекстов при выполнении рабочей группы. Это ведь сильней должно влиять на производительность. Видел что в opencv часто используют 32х8 рабочую группу. Там через cuda kernels это реализовано. Есть ли какой сакральный смысл за этим? Может оптимальней делать 32х4 группу?

skrp
Автор

на мой взгляд это бредовая идея — преподавать программирование в формате видеолекций.

darkalienfox