Мок-собеседование на middle+ Data Engineer S1E4 | rzv_de | Jul 2024

preview_player
Показать описание
Погружаемся в роли интервьюера и кандидата на час, плотная получасовая обратная связь уже выложена на бусти.

Я не представляю компанию из интервью, вакансия выбрана кандидатом для тренировки.

Послушал про опыт кандидата, глубоко копнули в теоретические вопросы по Python, DWH, базам данных. Также проверил лайвкодинг на SQL и python.

Делись с заинтересованными, если понравилось и хочешь ещё. Пиши, если чего-то не хватило и что-то нужно доработать.

00:00 Формат, бусти
00:52 Начало
01:48 Про опыт
08:16 dbt vs хранимки
09:03 Отладка PL/SQL
10:04 Орг. процесс интеграции
11:32 С каким объёмом работал
12:25 На чём DWH был
13:10 OLAP vs OLTP
14:16 Зачем нужен DWH
15:05 ACID
16:35 Уровни изоляций, SR
17:53 Проблемы уровня RC
18:27 На что влиять в OLAP, CH
19:50 Вред индексов в OLAP
21:47 Партиции для DE
23:12 I/O в CH на кластере
24:49 Python: GIL
26:41 Контекстный оператор
27:42 Генераторы
29:01 Copy, deepcopy
30:28 Профилирование в DE
31:53 O(n) в SQL
32:05 Поиск по индексу в БД
32:25 Фуллскан vs индекс
34:47 Практика: SQL
48:48 Практика: Python
55:34 Финал

Задачи из собеса:
Рекомендации по теме
Комментарии
Автор

Поддержи лайком, комментарием, полным просмотром и после этого приходи участвовать от первого лица

rzv_de
Автор

чел почти сходу озвучил идеальное решение с сортировкой
class Solution:
def majorityElement(self, nums: List[int]) -> int:
return sorted(nums)[len(nums)//2]

evgends
Автор

Добрый день.
На какую ЗП смог бы рассчитывать кандидат с подобными знаниями?

dmitriyobidin
Автор

Это миддл «Вот» разработчик
Слушать невозможно

Chotamkaktam
Автор

В практике на кликхаус же можно было решить через:
select s.product_id
, argMin(s.year, s.year) as first_year
, argMin(s.quantity, s.year)
, argMin(s.price, s.year)
from Sales s
group by s.product_id
?

ОлегВоронов-эц