Парсинг Динамических Сайтов в Python | Парсер OZON

preview_player
Показать описание

Сейчас ты узнаешь: Как парсить динамические сайты при помощи Python на примере парсинга маркетплейса OZON. Научимся пользоваться веб-драйвером совместно с Selenium. Рассмотрим как обходить защиту от ботов, используя модуль selenium_stealth. Изучим модуль BeautifulSoup для анализа HTML-кода, Узнаем, как отправлять HTTP GET запросы через модуль curl_cffi, используя инструмент CURL.
В конце видео у нас будет готовый парсер маркетплейса Озон. У нас будет функционал парсинга главной страницы, на которой контент генерируется случайно, а так же функционал парсинга товаров через поиск.

Привет! Меня зовут Игорь. На моём канале ты сможешь найти уроки по нейронным сетям, языку программирования Python и программированию в целом.
Моя цель - сделать программирование более доступным и понятным. Для просмотра моих видео вам не нужно высшее образование по Computer science. Все непонятные темы и термины я стараюсь разъяснять и показывать на примерах.
Оставайся с нами, и чтобы не пропустить ни одного видео - подписывайся на канал и нажимай на колокольчик!

Тайм-коды:
00:00 - Отличие парсинга статических и динамических сайтов
02:03 - Парсинг динамических сайтов при помощи HTTP запросов
02:48 - Особенности HTTP GET запросов
03:25 - Особенности HTTP POST запросов
04:26 - Парсинг динамических сайтов при помощи WebDriver
05:55 - Установка Chrome WebDriver
06:28 - Особенности парсинга маркетплейса Озон
06:48 - Обход защиты от скрапинга при помощи selenium_stealth
07:41 - Автоматическая прокрутка страницы
08:24 - Анализ HTML сайта Озон
09:50 - Поиск карточек товаров на главной странице
13:26 - Сохранение подробной информации о товарах
15:58 - Парсинг поисковой страницы Озон
18:12 - Что со всем этим делать?

► Ссылки из видео:

Рекомендации по теме
Комментарии
Автор

Лучшая поддержка канала - поддержка копеечкой 🥺

PseudoDev
Автор

Учусь по твоим видосам парсить, офигел от такого малого каличества просмотров и комментов, спасибо за такую подачу и вообще ролики.

CaptainBab
Автор

Можешь использовать undetected_chromedriver для парсинга?

justmrr
Автор

омг...в слове tcp ошибку сделал...в слове из 3 букв..

andreymudrakov
Автор

Так вот из-за кого у нас на складе перебои, гребанные парсиры))

Lisan._.