Скрейпинг сайтов с помощью библиотеки Scrapy

Показать описание

ДАННОЕ СООБЩЕНИЕ (МАТЕРИАЛ) СОЗДАНО И (ИЛИ) РАСПРОСТРАНЕНО ИНОСТРАННЫМ СРЕДСТВОМ МАССОВОЙ ИНФОРМАЦИИ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА, И (ИЛИ) РОССИЙСКИМ ЮРИДИЧЕСКИМ ЛИЦОМ, ВЫПОЛНЯЮЩИМ ФУНКЦИИ ИНОСТРАННОГО АГЕНТА
____________
❗❗❗Так называемое Министерство юстиции РФ признало «Важные истории» «нежелательной организацией». Так что репост этого и любого другого нашего видео может караться штрафом, а повторный репост — уголовным делом.

Но никто не может запретить вам смотреть и думать. Поэтому подписывайтесь на наш канал, просите подписаться своих друзей и оставайтесь с нами — в это темное время выжить мы сможем только вместе.
____________

Как скрейпить данные с помощью библиотеки Scrapy? Учимся на примере сайта книжного магазина.

🔹Туториал по Scrapy

🔹 Текстовая версия

🔹Подписаться на рассылку Мастерской «Важных историй»:

🔹Telegram-канал Мастерской

Рекомендации по теме

Комментарии

❗❗❗Так называемое Министерство юстиции РФ признало «Важные истории» «нежелательной организацией». Так что репост этого и любого другого нашего видео может караться штрафом, а повторный репост — уголовным делом.

Но никто не может запретить вам смотреть и думать. Поэтому подписывайтесь на наш канал, просите подписаться своих друзей и оставайтесь с нами — в это темное время выжить мы сможем только вместе.

istories_workshop

"yield - это ключевое слово в scrapy, которое позволяет выполнить разные действия" - это, конечно, мощно

Amigun_yo

Никогда бы не подумал, что исчерпывающую информацию по python библиотеке я получу на ютюб канале СМИ, которое признано инагентом :) Удачи вам!

den-rad

Здравствуйте. Спасибо вам за работу и видео. Очень подробное объяснение, такое редко встретишь на YouTube. Ещё раз спасибо.

nurlansalkinbayev

Хочу отметить, что подача материала очень легкая. Несомненный плюс, что вы обучаете предметно. Материал запоминается проще и есть желание искать доп. информацию самостоятельно. Молодцы, что тут сказать. Видно, что любите свою работу и делитесь знаниями бесплатно.

MrFerting

вы большие молодцы, что ведёте эти серии. прям совсем молодцы

lostinchineseroom

Спасибо за паука🕷️, и с возвращением!

oldlipton

Очень хорошая подача, всё наглядно и понятно

Crwbsko

Спасибо, очень доступно и понятно, так держать!!!!

vdnmmxc

Спасибо большое за весь ваш материал на Youtube !!!

aleksey

Цена этому уроку "yield - ключевое слово в скрэппи".
Думайте

slavpetrovich

Можно просто scrapy shell "<ссылка на сайт>" - минуя fetch... Хорошее видео!

vladimirantonov

Здравствуйте! Можно ли Scrapy использовать в Jupiter notebook? Пытаюсь найти ответ в интернете, безрезультатно.

talgatmustafin

капец. Без знания основ синтаксиса, напоровшись на значение класса написанное с пробелом, можно всю схему завалить. Чуть башка не лопнула, пока пытался догадаться, как выкрутиться или в чём ошибся.. И о чудо.. этот моментик, решён в следующем ролике. Скрапи-2.
Ваще жесть. Сколько ещё таких подножек я поймаю в будущем )))

ctxverq

День добрый! На 8:40, вы показываете название класса, которое нужно вставить в response, что бы найти ссылку, а когда проверяете в scrapy shell название класса совсем другое, это как? По названию видно, что наверное вы тянули ссылку на изображение

genylivnev

Пробую отправить response, но в ответ приходит пустой список, пробовал и за id зацепиться и пробелы заменил на точки - не выходит. Сайт не динамический. В чем можем быть проблема?

akim

У меня после запуска паука, такая вот краказябра в логах: ignoring response 520 http status code is not handled or not allowed.
В итоге файл создаётся, но он пустой(

kdzcbpt

Здравствуйте! Что за ошибка raise KeyError(f"Spider not found: {spider_name}")?

talgatmustafin

Можете подсказать как не нарваться на капчу или обойти её?

hlclnlw

Разве в приведенном примере кода мы не соберём первую страницу раздела дважды?

markhavidzer

Скрейпинг сайтов с помощью библиотеки Scrapy

Скрейпинг сайтов с помощью библиотеки Selenium

Скрейпинг сайтов с помощью библиотек Beautifulsoup и Requests на Python...

Скрейпинг сайтов с помощью библиотеки Scrapy

Веб-скрейпинг с помощью библиотек Selenium и Beautifulsoup

Обучение парсингу на Python #1 | Парсинг сайтов | Разбираем методы библиотеки Beautifulsoup...

Секреты парсинга на Python | Как зарабатывать больше на фрилансе | Парсинг сайтов...

Собираем информацию с любого сайта в Excel таблицу без разработки: No-Code парсер за 15 минут...

Скрапинг с Goutte (crawler). Парсинг сайтов с использованием библиотеки Goutte....

Как спарсить товары с любого сайта и выгрузить в эксель | Парсер на python | BeautifulSoup4...

Скрапинг Сайта Авито За ПАРУ МИНУТ С Помощью Python

Веб-скрейпинг (Парсинг) Python Selenium. Как парсить сайт Питон и Селениум?...

SCRAPY — парсинг на PYTHON

1. Парсинг сайта на Python. Библиотека Scrapy

ПАРСИМ ФИЛЬМЫ на PYTHON | Requests | BeautifulSoup

Парсинг простых сайтов на Python: BeautifulSoup, requests

Принципы работы парсера WebScraper на примере Авито

Что такое веб-скрейпинг и парсинг Python (Питон) - уроки для начинающих...

NODE.JS SCRAPER 🚀 [ Парсинг данных с сайта на nodejs, puppeteer и cheerio ]...

Обучение парсингу на Python | Парсинг без обнаружения | Парсинг CloudFlare | Selenium, CloudFlare...

Скрейпинг сайтов с помощью Scrapy. Часть 2 | Crawl Spider

Парсинг на Python, Selenium и BS4 | Выполняем заказ на фрилансе | Парсинг динамического сайта...

🐍 Пишем парсер сайтов на Python: Откройте дверь к морю данных! 🌊🔍 #PYTHON #shorts #парсинг...

Обучение парсингу на Python #6 | Как собрать информацию с любого сайта | Requests BS4 Selenium...

Парсер на Python со Scrapy