filmov
tv
Парсинг Динамических Сайтов в Python | Парсер OZON
Показать описание
Сейчас ты узнаешь: Как парсить динамические сайты при помощи Python на примере парсинга маркетплейса OZON. Научимся пользоваться веб-драйвером совместно с Selenium. Рассмотрим как обходить защиту от ботов, используя модуль selenium_stealth. Изучим модуль BeautifulSoup для анализа HTML-кода, Узнаем, как отправлять HTTP GET запросы через модуль curl_cffi, используя инструмент CURL.
В конце видео у нас будет готовый парсер маркетплейса Озон. У нас будет функционал парсинга главной страницы, на которой контент генерируется случайно, а так же функционал парсинга товаров через поиск.
Привет! Меня зовут Игорь. На моём канале ты сможешь найти уроки по нейронным сетям, языку программирования Python и программированию в целом.
Моя цель - сделать программирование более доступным и понятным. Для просмотра моих видео вам не нужно высшее образование по Computer science. Все непонятные темы и термины я стараюсь разъяснять и показывать на примерах.
Оставайся с нами, и чтобы не пропустить ни одного видео - подписывайся на канал и нажимай на колокольчик!
Тайм-коды:
00:00 - Отличие парсинга статических и динамических сайтов
02:03 - Парсинг динамических сайтов при помощи HTTP запросов
02:48 - Особенности HTTP GET запросов
03:25 - Особенности HTTP POST запросов
04:26 - Парсинг динамических сайтов при помощи WebDriver
05:55 - Установка Chrome WebDriver
06:28 - Особенности парсинга маркетплейса Озон
06:48 - Обход защиты от скрапинга при помощи selenium_stealth
07:41 - Автоматическая прокрутка страницы
08:24 - Анализ HTML сайта Озон
09:50 - Поиск карточек товаров на главной странице
13:26 - Сохранение подробной информации о товарах
15:58 - Парсинг поисковой страницы Озон
18:12 - Что со всем этим делать?
► Ссылки из видео:
Комментарии