Mechanistic Interpretability — Никита Балаганский, Т-Банк

preview_player
Показать описание
Сейчас, во многом благодаря исследованиям антропика и дипмайнд, мы, наконец, можем говорить о том, что с помощью интерпретируемости можем не только понимать как работают трансформеры, но и изменять их поведение в нужном для нас направлении. В докладе Никита рассказал, чем его группа занимается прямо сейчас в направлении механистик интерпретабилити.

#nlp #ml #тбанк
welcome to shbcf.ru