Методология моделирования данных для хранилища Data Vault

preview_player
Показать описание
🗃 Заглянем в бездонный судук Data Vault и изучим, что там внутри

В новом прямом эфире проекта «Где дата, Зин?» знакомимся с методологией и эволюцией современных аналитических баз данных.

В программе:
- Разберёмся, что такое Data Vault и как он связан с ER (entity-relationship) моделированием.
- Изучим составные части Data Vault: Hub, Link, Satelite.
- Ответим на практические вопросы по Data Vault: размер сателита, сателит на лике, выбор ключей.
- Обсудим нюансы реализации Data Vault в разных СУБД: что где использовать, а что лучше избегать.

Ведущий: Ильяс Сабуров
Докладчик: Николай Голов, Head of Data Platform в ManyChat

🎞 Подключайтесь к нам в прямом эфире на youtube, обязательно задавайте вопросы в чате и участвуйте в обсуждении. Будет жарко!

📅 Четверг, 21.09 в 19:00 (по МСК)

До встречи в прямом эфире!
Рекомендации по теме
Комментарии
Автор

Интересный выпуск. Плюсую Сергею (нужно было еще спросить как обновлять витрину на примере 46:01). В споре рождается истина и авторитет тут может быть ни при чем. Не нужно рассказывать чем лучше Кимбал/Инмон/DV/AM/AS между собой без контекста, без входящих условий. Так же нужно учитывать, что методология <> техника моделирования. Рекомендую подготовить вопросы, т.к. вопросов возникло больше чем ответов в этом выпуске и с нетерпением ждем продолжения.

alexanderlazutkin
Автор

Я не понял почему столько времени было уделено сравнению DV и Dimensional modeling. Николай сам подчеркнул что DV это альтернатива проектированию ODS слоя Инмона, а не подходу Кимбала. Из того что я понял преимущество DV в том, что проектирование становится Agile, именно проектирование. Хотелось бы услышать есть ли какие-то преимущества, если они есть, в операционной работе хранилища, уже построенного на DV и Inmon ODS, опуская за скобки вопросы создания и развития модели, здесь все понятно. По ходу дискуссии сложилось впечатление, что сравнивалось красное с квадратным)

faibichandrei
Автор

Жаркий стрим, надеюсь будет продолжение )

max_zrn
Автор

Улыбнуло.
"Кто сходу из вас может рассказать про 3ю нормальную форму?" - никто 😂

СергейМолоковских-шш
Автор

Если член измерения не приехал, то факт по нему, попадет в "Нераспределено", а член измерения останется "Неизвестен", а когда приедет, то все станет на свои места... Эта проблема давно известна, и каким-то образом решаема.

saraantuayal
Автор

24:30
Link to Link. Не делайте так никогда! Это очень плохая идея. В этом кейсе создается новый линк между 3мя хабами или рефакторинг старого (если еще не поздно).
Сергею спасибо, в споре рождается истина.

_INDATAWETRUST_
Автор

Не база, а СУБД ё-моё. Что интересно, только в СНГ путают БД и СУБД. Это совсем разные вещи. Прямо вообще не синонимичны.

MelvinStudios
Автор

Это что, агитация за нормальные формы?.. как в нулевые вернулся. где там моя зачитанная "Ведение в базы данных" Дейта?.. )) .Мущина "переигрывает лицом" лучше просто слушать без портрета.... Дослушал половину. Сколько пафоса. Пойду лучше старые книжки перечитаю.

АристархМышьякович
Автор

😂 после DV нужен слой представления данных, а это в 99% звезда-снежинка. DV был придуман и работает только как слой ХРАНЕНИЯ данных. Да и не все там так просто, называется три сущности, а их гораздо больше, и на сложных св, язяхх ты в DV огребешь проблем по самое нехочу. Ну а коллизии на хеш ключах я ловил и не один раз. Теоретики... сразу видно, толком в жизни ни одно ХД не построил.

sergeysukharev