NLTK корпус: получить список общих стоп-слов на разных языках в Python

Последнее обновление 29 июня 2019 10:46:30 (UTC / GMT +8 часов)

script1adsense2code

script1adsense3code

NLTK корпус : упражнение-2 с решением

Напишите программу на языке Python NLTK, чтобы получить список распространенных стоп-слов на разных языках в Python.

Пример решения :

Код Python:

from nltk.corpus import stopwords
print (stopwords.fileids())

Пример вывода:

 ['арабский', 'азербайджанский', 'датский', 'голландский', 'английский', 'финский', 'французский', 'немецкий', 'греческий', 'венгерский', 'индонезийский', 'итальянский', '' казахский, непальский, норвежский, португальский, румынский, русский, испанский, шведский, турецкий

Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.

Предыдущий: Напишите программу Python NLTK, чтобы перечислить все имена корпусов.
Далее: Напишите программу на Python NLTK, чтобы проверить список стоп-слов на разных языках.