Авито Автозагрузка: как качать миллионы фотографий в сутки / Евгений Толмачев (Авито)

preview_player
Показать описание
Приглашаем на конференцию HighLoad++ 2024, которая пройдет 2 и 3 декабря в Москве!
--------
Профессиональная конференция разработчиков высоконагруженных систем Saint HighLoad++ 2023

Презентация и тезисы:

Авито Автозагрузка — продукт, через который каждый час проходят десятки миллионов объявлений. За сутки мы скачиваем миллионы фотографий с хостингов самого разного качества и стабильности.
...

Рекомендации по теме
Комментарии
Автор

Мрак... Мир авито, в котором не придумали MQ брокер.

Я-то думал, там будут подходы к низкоуровневой оптимизации сетевого взаимодействия, к объединению и сортировке задач по сетевому отпечатку, про сайкл брейкеры...

А тут какой-то колхоз с семафорами

ins
Автор

Пук-среньк, мы не думали про кафку, не смотрели... интересная идея... надо подумать...

ivangovnov
Автор

Так и не понял зачем читать из очереди и сохранять в бд данные для загрузки
+ потом бд используется как очередь.

Почему нельзя использовать только очередь для загрузки/ретраев и тд? А бд как последний слой для сбора данных

DTorange
Автор

Это благодаря этой автозагрузке сотня фотографий одного и того же продавца?

Leonidasful
Автор

Странно, что Авито всё-еще работает))

askk
Автор

а рейт лимитер в виде liquid бакет неизвестен? в котором все О(1)
Почему не использовать подобие cdn? и хранить фотки просто в каком-то хранилище типа s3.

SlavaVy
Автор

На блок схеме выглядит сложнее чем на самом деле

loadmore
Автор

Разумно было бы сказать звенья, а не слои.

SlavaVy
Автор

Слава Богу что хоть тут селектела нет, любой канал в черный список из-за этого дна

ihelperone
Автор

Автозагрузка в Авито самая дерьмовая которая может быть

NikKlay