Сбор и работа данных для Computer Vision. Выбор подходов, оптимизация сбора.

preview_player
Показать описание


00:00:00 - Интро
00:00:46 - Пара слов о том что делает Mallenom Systems
00:03:18 - В двух словах, как получать данные?
00:04:35 - Много ли претрейненных моделей?
00:05:16 - И даже трансформеров претрейненных нет?!
00:06:13 - Поиск единичных и уникальных изображений. Фреймворк для работы с данными
00:08:48 - Балансировка датасета
00:12:05 - Нужен ли запас данных для разметки?
00:14:20 - Какая используется структура хранения данных?
00:15:14 - Anomaly Detection подходы
00:16:49 - Разметка. Свои инструменты vs существующие
00:18:00 - От пилота для Production, как устроен трек
00:24:25 - Хранение данных, формирование датасетов
00:28:30 - Тест/Валидация/Трейн, нужна ли одинаковая метрика?
00:30:55 - Разметка, пред-лейблинг
00:32:02 - Главная проблема современных разработчиков
00:32:28 - Предразметка внутри CVAT
00:33:00 - Аугментация
00:35:45 - Предразметка жирной сеткой
00:36:35 - Hardware
00:37:50 - Inference servers?
00:41:21 - Контроль подвеса камеры
Рекомендации по теме
Комментарии
Автор

Спасибо за ролик Антону, Евгению.
Успехов.

GambTProdaction
Автор

Антон, спасибо за подробный разбор, очень интересно было узнать опыт реальных промышленных решений :)
Не планируется ли какое-то вводное видео в промышленный cv для энтузиастов? Мне, как BE очень сложно увидеть всю картину целиком)
Спасибо

kekuskekus
Автор

Спасибо за интересное интервью!

Антон, вы упомянули новые сервисы хранения/разметки данных для CV, можете скинуть несколько примеров?

Gavreliano
Автор

Антон, спасибо за интересный разбор! В видео обсуждались как готовые сервера типа triton, так и варианты собственных наработок для продакшн-систем видеоаналитики. Можно узнать ваше мнение, в каких случаях разумно использовать самостоятельно написанные системы для аналитики с камер, а в каких случаях имеет смысл отдать предпочтение разворачиванию системы на deepstream sdk?

kristinalifirenko
Автор

Все это конечно только начало, в итоге будет внутри любых смарт очков. Если Apple наконец выкатит свои Reality Pro glasses 👓, там все будут сканить друг друга. В каком-то роде смерть privacy, последние годы приватности, с machine learning не только идентификация лица за секунду, но и психопрофиль по движениям (криминал будет рад, политики будут не очень ведь вся их ложь будет видна, хотя технологии вранья по речи очень старые и их никто не юзает сегодня, у той же Yamaha целая плата на речь давно продаётся).
Поразительно как machine learning уже в дешёвых детской китайской платформе Lilygo, OpenMV Arduino доступна всем. Как бы сейчас государство первым оседлало, но когда коммерция возьмёт себе это на вооружение от рекламы до охраны...и эта технология ретроактивна (влияние будущего на прошлое), тоесть этими смарт очками взглянув на старые видео можно будет узнать гораздо больше чем во время выхода видео, выступления человека.

fontenbleau