DATALEARN | DE - 101 | МОДУЛЬ 4 | ПАВЕЛ НОВИЧКОВ | PENTAHO DI | ЧАСТЬ 2 - ОСНОВЫ

preview_player
Показать описание
Продолжаем нашу серию видеоуроков по Pentaho DI
В этом видео мы:

📌 Познакомимся с графическим интерфейсом Spoon
📌 Рассмотрим строительные блоки любого проекта: Steps и Hops
📌 Узнаем про виды проектов в Pentaho: Jobs и Transformations. В чем их отличия и когда что использовать.
📌 Познакомимся с наиболее распространенными форматами данных в ETL
📌 Потренируемся работе с форматами txt, csv, xls, json, xml
📌 Построим несколько джобов и трансформаций
📌 Научимся запускать проекты по расписанию

Работа с api в Pentaho на примере hh:

⚠️Для эффективного прохождения курса рекомендуем зарегистрироваться в Slack (наш чат) и читать учебник на Github, в котором рассказывается про последовательность уроков, лабораторные работы и домашнее задание.⚠️

🔔 Подписывайтесь на канал "Datalearn" чтобы не пропустить остальные части и ставьте лайки!

📕 Записывайтесь и проходите курс Инженера Данных.
⚠️ КУРС БЕСПЛАТНЫЙ!
🔗 Записаться вы можете на нашем портале

👍🏻 Запись на курс даст вам возможность не только просматривать видео, но и получить доступ к закрытым материалам, а также возможность выполнять домашние задания, отдавать их на проверку и получить сертификат прохождения курса.
Рекомендации по теме
Комментарии
Автор

отличный формат. автору респект и поклон

rolxytp
Автор

Очень понятное и подробное видео. Благодарю за материал!

nikhinelez
Автор

круто, спасибо, что настолько подробно)

ЕвгенийВоробьев-пэ
Автор

Очень полезное видео! Огромное Вам спасибо!

alexandr_sk
Автор

Видео очень классное! Спасибо Вам за него большое 🙏

englishbro
Автор

Спасибо большое за видео! А нет ли видео работы pentaho с БД ?

arhangel
Автор

Теперь неплохо, спасибо. Было бы круто по работе с hdfs (hadoop). Буду ждать, если сделаете такой под модуль.

PROGame_aisetinski_channel
Автор

почему он путает местами буквы? returns называет "ретрунс", лучше бы конечно ближе к английскому "ретёнс"
простите что придираюсь. Видео очень полезное.

Serrenium
Автор

Спасибо за видео! Скажите пожалуйста, можно ли подключить к Pentaho базу расположенную на ClickНouse в режиме DirectQuery,
чтобы обработка запросов осталась на ClickНouse?

Алексей-гех
Автор

Filter Others как создать? Что прописовать в Value?

doniyordjon_pro
Автор

Как пожелание. Было бы здорово узнать как запускать джобы и трансформации через сервер запускаемый carte.bat и как настроить шедулинг запуска заданий

АндрейТоропов-зы
Автор

Здравствуйте! Как записаться к вам на курс pentaho. Ссылка на портал не рабочая

ИванСоловьёв-че
Автор

Спасибо большое за подробное видео, изучаю по нему Pentaho. У меня не все получилось как у Вас. Проблема при чтении csv файла - у Вас разделитель разрядов десятичная точка, поэтому у меня в русском EXCEL при просмотре samplestore-general.csv вместо чисел получаются строковые значения или даты, например 7.98 выводится как июль 1998 года. Как в скрипте задать разделитель разрядов в формируемом csv файле - запятая, а не точка? Какую опцию использовать?

fpd
Автор

Может кто знает, почему при настройке Text File Input -> Fields (Get Fields) в поле Currency у меня подставляется "руб.", а у автора "$"? Как сделать чтобы у меня тоже в это поле подставлялось "$"?

sergg
Автор

Было бы круто пример как вытягивать данные по api например Google ads или Яндекс Директ

ДмитрийАладьев
Автор

машина i7 на 16 ГБ PDI выдал ошибку памяти при обработке двух файлов Ексель по 75 K строк каждый (загрузка CPU 99%) по одному читает, но тяжело, в чем может быть причина, и как побороть? Knime без проблем переварил 6 таких файлов за раз.

АнтонМировщиков
Автор

Где взять озвученные файлы, тексты скриптов?

СергейЧайкин-йр
Автор

У кого import.sh на маке не работает? Нашли решение?

b_nkita
Автор

Самая большая проблема пентахи как по мне это полный отстой в плане потоковой работы - в ней нельзя по человечески ничего зациклить. Например нужно прочитать строки из файла, далее создать файлы, в размере количества строк с названиями как в прочтенных строках. Это жесть переменные по человечески не передать, не изменить, не зациклить....

Wfrden