Как разбить русский текст на токены | Обработка естественного языка

preview_player
Показать описание
Библиотеки для токенизации текста на Python

00:00 - Токенизация теста
01:56 - Токенизация с NLTK
03:03 - Токенизация с TensorFlow
05:44 - Токенизация со spaCy

Библиотеки для токенизации текста:

Проект реализуется победителем Конкурса на предоставление грантов преподавателям магистратуры благотворительной программы "Стипендиальная программа Владимира Потанина" Благотворительного фонда Владимира Потанина"

Рекомендации по теме
Комментарии
Автор

Андрей, большое спасибо за предоставление информации в четком и доступном для понимания формате) Перешла на Ваш канал по рекомендациям в комментариях другого канала, и вот уже в течение пары часов изучаю подготовленный Вами материал. Я считаю, Вам просто необходимо оформить спонсорскую подписку, потому что Ваш труд огромен, и хочется выразить свою благодарность не только в обычном «спасибо»

drozdolet
Автор

Андрей, здравствуйте! Обучаюсь на разработчика по госпрограмме. Ваши курсы и отдельные уроки очень расширяют и углубляют мои знания. По первому образованию я - филолог, мне тема обработки естественного языка крайне интересна. Большое Вам спасибо за возможность бесплатного доступа. На этапе обучения это очень поддерживает. Так хочется, чтобы возможности обработка русского текста не уступали возможностям работы с английским.

vdfbrnt
Автор

Большое спасибо, отлично организованный урок!

chessketeer
Автор

Благодарю вас, можно вашу консультацию

stihcul
Автор

Класс! Как раз решал, какой токенизатор использовать из популярных. Вопрос по смежной теме: а что есть по восстановлению пунктуации, когда ее нет вообще?

olegpopov