5.2. Загрузка и первичная обработка исходных данных

preview_player
Показать описание
В настоящем видео речь пойдет о предобработке данных датасета Titanic с использованием библиотеки pandas.

Учебное видео из программы бесплатного курса «Основы языка Python для анализа данных и решения задач машинного обучения»

Данный бесплатный проект «Школы Python» не возможен без Вашей поддержки, Ваши подписки на Наш канал и "лайки & комментарии" в социальных сетях дают нашим преподавателям обратную связь и уверенность в необходимости продолжения работы по выпуску новых видео и материалов.

Курс ориентирован на ИТ-специалистов (администраторы, аналитики и инженеры данных), которые отвечают за администрирование, сопровождение и разработку систем хранения и подготовки больших данных для задач аналитики и решения задач машинного обучения с использованием языка Python.

Курс FUNP «Основы языка Python для анализа данных и решения задач машинного обучения» позволяет в короткие сроки получить необходимую базовую подготовку по теории и практический опыт работы с необходимыми библиотеками. Наша цель – не изучать фундаментальные основы программирования на Python в теории, а подготовить специалистов, использующих большие данные, для использования библиотек, которые поддерживают быстрые вычисления и научные расчеты, работу с табличными данными, работу с текстовыми данными и визуализацию результатов исследований. Именно поэтому наши преподаватели, в большей степени, не преподаватели Python, а практикующие специалисты по Data Science и инженеры данных, использующие Python для решения прикладных задач подготовки данных и применения методов машинного обучения и построения нейронных сетей. Они на практике знают все нюансы применения Python и «то, что именно нужно» для успешного усвоения материала.

Курс рассчитан на мотивированных студентов, умеющих пользоваться справочной литературой и материалами, включая видео-лекции и практические материалы лабораторного кода для выполнения в среде Google Colab для самостоятельного обучения.

Для корпоративных слушателей и участников программы обучения «другие 48 часов» предусмотрен платный вариант прохождения курса в формате вебинара или в классе под руководством преподавателя с полной поддержкой в ходе обучения. Подробнее смотрите наше предложение «Другие 48 часов» FUNP+DPREP

Курс является вводным и обязательным для подготовки специалистов по работе с распределенными MPP-системами, NoSQL СУБД, Apache Hadoop, Kafka, Spark, но не имеющими навыков программирования на Python или любом другом языке (Java, Scala и др.) для прохождения специализированных курсов:

DPREP: Подготовка данных для Data Mining на Python
PYML: Введение в машинное обучение на Python
PYNN: Введение в Нейронные сети на Python
ПРЕДВАРИТЕЛЬНЫЙ УРОВЕНЬ ПОДГОТОВКИ:
Опыт работы в Unix (от 1 года)
Знание основ статистики

По вопросам обучения на курсах машинного обучения приглашаем в нашу "Школу Больших Данных" г. Москва

По вопросам обучения на курсах машинного обучения приглашаем в нашу «Школа Больших Данных»

Обращаться по телефону:
+7 (495) 41-41-121
+7 (995) 100-45-63

Чтобы не пропустить информацию о новых курсах, акциях и других событиях Школы Больших Данных, рекомендуем подписаться на нас в социальных сетях:

Рекомендации по теме