Инструментарий естественного языка - Natural Language Toolkit
Автор (ы) оригинала | Стивен Берд, Эдвард Лопер, Юэн Кляйн |
---|---|
Разработчики) | Команда НЛТК |
Первый выпуск | 2001 |
Стабильный выпуск | 3.6.1 / 7 апреля 2021 г .
|
Репозиторий | |
Написано в | Python |
Тип | Обработка естественного языка |
Лицензия | Apache 2.0 |
Веб-сайт | www |
Инструментарий естественного языка , или чаще NLTK , представляет собой набор библиотек и программ для символьной и статистической обработки естественного языка (NLP) для английского языка, написанных на языке программирования Python . Он был разработан Стивеном Бердом и Эдвардом Лопером с факультета компьютерных и информационных наук Пенсильванского университета . NLTK включает графические демонстрации и образцы данных. К нему прилагается книга, в которой объясняются основные концепции задач языковой обработки, поддерживаемые набором инструментов, а также кулинарная книга.
NLTK предназначен для поддержки исследований и обучения в области НЛП или тесно связанных областей, включая эмпирическую лингвистику , когнитивную науку , искусственный интеллект , поиск информации и машинное обучение . NLTK успешно использовался как инструмент обучения, как инструмент индивидуального обучения, а также как платформа для создания прототипов и создания исследовательских систем. 32 университета в США и 25 странах используют NLTK в своих курсах. NLTK поддерживает функции классификации, токенизации, выделения корней, тегов, синтаксического анализа и семантического обоснования.
Основные моменты библиотеки
- Лексический анализ : токенизатор слов и текста
- n-грамм и словосочетания
- Тегер части речи
- Модель дерева и фрагмент текста для захвата
- Признание именной организации