Парсинг сайта Avito с помощью Python (с нуля)

preview_player
Показать описание
В этом видео я покажу основы парсинга HTML с помощью Python. Парсинг это выкачивание нужной нам информации с сайтов. Он применяется когда у нужного вам сайта нет публичного API. Для этого видео я выбрал вытягивание некоторой информации из объявлений на Авито: название, цена, дата размещения и ссылка. Работает с любым разделом сайта. Весь код написан на Python 3 с нуля.

Полезные ссылки из видео:

#python #parsing #ityoutubersru
Рекомендации по теме
Комментарии
Автор

Смотря видео, которые ты выпускаешь последними, замечаю, на сколько ты вырос! А так, видео и контент на уровне! Подписка и лайк под каждым видео, который смотрю происходит в первой половине видео!
Хорош! Продолжай!!!

ghostpanda
Автор

не зря сотку скидывал, спасибо за ролик.

zakhargryaznov
Автор

Подскажите, почему у меня вместо ParseResult выходит ParseResultsBytes?
И в коде вместо параметров везде b. Вот выход:
ParseResultBytes(scheme=b'', netloc=b'', path=b'', params=b'', query=b'', fragment=b'')

GROBIK
Автор

Увы, на момент 2022 года. Данный способ не работает, сервак выдает код 403(шлет короче без api). Поэтому Selenium в помощь)

qvxpnpg
Автор

Классное видео! Спасибо
В Телеграмм канале нет кода ((((

annapopova
Автор

А как можно реализовать оповещение о новых объявлениях в заданном разделе?
Просто сравнивать количество объявлений в прошлом запросе и текущем не получится, потому что объявления могут еще и удалять.

iviv
Автор

Не нашел код в репозитории. Скинь если остался.

rlzftkx
Автор

в именах классов появились приставки в виде _fG54x - не понятно когда он поменяется, наверно с какой то периодичностью и в итоге парсер будет постоянно устаревать, заметил если запустить раза 2-3 то выходит предупреждение :/

IZHGTUmekhanik
Автор

Только начал смотреть. Так что, нам не расскажут как собирать телефонную базу с сайтов?))

Dmitriy_Sentinel
Автор

Здравствуйте! Видео и код просто класс!! Скиньте пожалуйста этот код или ссылку на Git

vladlogunov
Автор

Бро все классно, но не могу понять, там получается надо распарсить еще год ? потому что ругается на ValueError: time data '2019' does not match format '%H:%M'

denisdred
Автор

Не работает ссылка на код под видео в Telegram-канале. Скиньте, пожалуйста, этот код или ссылку на Git

zkixdgx
Автор

А как парсят объявления, которые еще не прошли модерацию?

qdniinn
Автор

what a great soup you have !! ) help me with opening the initial code plz !

vbvrumy
Автор

не получается теперь так. Как не пытаюсь спарсить Avito (практики ради) не получается. уже и selenium пробовал, не получить код страницы, и всё тут. Какая-то белибирда в виде словарей с байтами чтоли приходит. Думаю защита какая то.

gzycviy
Автор

ССылки на код обновите! или скиньте куда-нибудь - плиз!)

vliafto
Автор

Есть ли смысл переучиваться писать парсеры с использоваонием ООП(сейчас пишу только с использованием функций)? Есть ли какие-нибудь преймущесва?

seserere
Автор

Почему не работает? При попытке реквеста авито выдаёт страницу с инфой "Доступ с вашего IP-адреса временно ограничен" потому что "Мы обнаружили на нём подозрительную активность, нарушающую работоспособность Авито." Лавочка прикрылась? Авито больше не парсится?(

artemvishnevskii
Автор

А почему ты используешь select, вместо find_all?

sergeys
Автор

Привет хотел бы спросить у тебя. Вот я выучил основу питона(базу). Рано ли мне писать что то на подобие этого?

wluighw