filmov
tv
Как создать парсер сайтов на языке Python [GeekBrains]
Показать описание
Парсинг - это процесс поиска определенной информации в большом фрагменте текста, а также разбиение полученных данных на смысловые части. Под парсером же подразумевается скрипт, используемый для автоматического сбора информации со страниц сайта и предоставления ее пользователю в структурированном виде.
Создание парсера актуально в тех случаях, когда стоит задача извлечь и структурировать данные из большого количества страниц, когда ручная обработка данных практически невозможна или требует колоссальных затрат человеческих ресурсов. Также парсеры очень полезны, когда данные необходимо извлекать часто и оперативно. Примером таких данных являются курсы валют и погода.
На этом вебинаре вы научитесь создавать простой, но мощный парсер на языке Python при помощи встроенной библиотеки urllib и сторонней cssselect.
Ваш парсер будет обходить страницы сайта, извлекая нужную информацию из html-кода сайта по css-пути и выводить ее для пользователя в удобном структурированном виде в Excel-файл.
В программе вебинара:
- Создание типовой Python-программы и получение входных данных из консоли;
- Создание виртуального окружения Python (venv);
- Установка библиотек в виртуальное окружение;
- Последовательный обход и загрузка страниц и изображений при помощи urllib;
- Вывод полученных данных в Excel-файл.
#парсерсайтов #pythonпрограммы #программированиеpython #geekbrains #программирование #курсыпрограммирования
Комментарии