Python парсинг сайтов с JavaScript | Инструмент для рендеринга JS

preview_player
Показать описание

Парсинг сайтов с JavaScript используя requests-html.

В данном видео мы научимся парсить сайты с JS, обрабатывать скрипты на этих страницах и получать валидный ответ от сервера. Мы научимся без bs4 извлекать элементы из страницы, и также находить нужные нам совпадения в тексте без использования регулярных выражений.

Инструмент умеет не только рендерить JS на странице HTML, а также и позволяет рендерить его напрямую из скрипта Python, вы можете написать свой JS скрипт в Python скрипте, и прямо оттуда его выполнить. Инструмент очень мощный и он 100% поможет вам более легко собирать данные с сайтов.

Рекомендации по теме
Комментарии
Автор

Если вы знаете другие полезные инструменты,
не забудьте оставить их в комментариях, я попробую найти
им применение и сделаю видео на эту тему 🙂
Всем спасибо

zproger
Автор

Дружище, ты даже не представляешь как ты меня выручил. Написал огромный парсер для сайта с сотнями тысяч ссылок, работающий в многопотоке. Часть информации скрапил Селениумом, часть - LXML-ем, но куча открытых селениумом браузеров в режиме многопотока просто ложили сервак. Эта библиотека Requests-HTML просто в корне все меняет. Спасибо тебе огромное!

sergeidb
Автор

Тор, спасибо, от тебя узнаю больше чем от 99% других каналов

goshaposhlyy
Автор

Как ты угадал, что я хочу узнать про парсинг?))) Спасибо за ролик, пушка!

avax
Автор

Спасибо большое за видео! чудесный инструмент, желаю вам процветания и успехов!!!

Dreamer_
Автор

Круто! Как всегда на уровне, спасибо!

RNikSan
Автор

Спасибо за информацию о библиотеке, она решила мою проблему! :-)

donpatron
Автор

Ещё бы по больше про асинхронность, многопоточность и моного ядерность 😁

kozsv
Автор

Ты ж мое золото) Столкнулся с JS при парсинге, не знал что делать, уже руки опустил

Happy-rjom
Автор

Спасибо!! Этот способ мне на много больше понравился

supreltd
Автор

Бомба вообще ) до этого думал какой библиотекой можно работать кроме selenium, теперь знаю.

SkveerBoy
Автор

Слушай, спасибо тебе огромное!!! Я в восторге! Не мог несколько дней побороть скрипты на сайте, уже начал джаву учить, а тут всё настолько просто. Максимальное уважение, лайк, однозначно!

night_niker
Автор

Очень полезная инфа, продолжайте в том же духе! подписчиков мало но это временно уверен! скоро будем 10000 лайков собирать :)

ktopogizni
Автор

Как только я наткнулся на твой ролик, мой мир разделился на до и после

crutoboy
Автор

Это просто невероятно, спасибо я теперь не овощ

Shlapoklapik
Автор

Спасибо за ваше видео по парсингу. Очень полезно. Мне кажется было бы более наглядно если бы вы смогли на примере какого то сайта показать преимущества этой библиотеки по сравнению с bs4

shustriy
Автор

Спасибо большое, очень полезно! Насчёт return надо произносить так "ритёрн"

rokot
Автор

М-да.. Ты забыл упомянуть, что это библа использует также selenium, даже в документации написано, что она также будет использовать двигло chromium. Так что не думаю, что это библа как-то быстрее будет рендерить js... Из альтернатив могу посоветовать requestium - это библа так-же под капотом держит открытым selenium.

hesuscristomg
Автор

супер мега топ, завтра проверю. если это работает, то я счастлив

efamir
Автор

Огромное спасибо, теперь надобность в bs4 отпадает) У тебя очень крутой канал!

cccombobreaker