кодесурса
«Python

NLTK корпус: проверьте список стоп-слов на разных языках

script1adsense2code
script1adsense3code

NLTK корпус: упражнение-3 с решением

Напишите программу Python NLTK, чтобы проверить список стоп-слов на разных языках.

Из Википедии:
В вычислениях стоп-слова - это слова, которые отфильтровываются до или после обработки данных на естественном языке (текста). Хотя «стоп-слова» обычно относятся к наиболее распространенным словам в языке, не существует единого универсального списка стоп-слов, используемого всеми инструментами обработки естественного языка, и, действительно, не все инструменты даже используют такой список. Некоторые инструменты специально избегают удаления этих стоп-слов для поддержки поиска по фразе.
Любая группа слов может быть выбрана в качестве стоп-слов для данной цели. Для некоторых поисковых систем это некоторые из наиболее распространенных коротких функциональных слов, таких как, is, at, which и on. В этом случае стоп-слова могут вызвать проблемы при поиске фраз, которые включают их, особенно в таких именах, как «Кто», «The» или «Take That». Другие поисковые системы удаляют из запроса некоторые наиболее распространенные слова, в том числе лексические, такие как «хочу», для повышения производительности.

Пример решения :

Код Python:

import nltk
from nltk.corpus import stopwords
result = set(stopwords.words('english'))
print("List of stopwords in English:")
print(result)
print("\nList of stopwords in Arabic:")
result = set(stopwords.words('arabic'))
print(result)
print("\nList of stopwords in Azerbaijani:")
result = set(stopwords.words('azerbaijani'))
print(result)
print("\nList of stopwords in Danish:")
result = set(stopwords.words('danish'))
print(result)
print("\nList of stopwords in Dutch:")
result = set(stopwords.words('dutch'))
print(result)
print("\nList of stopwords in Finnish:")
result = set(stopwords.words('finnish'))
print(result)
print("\nList of stopwords in French:")
result = set(stopwords.words('french'))
print(result)
print("\nList of stopwords in German:")
result = set(stopwords.words('german'))
print(result)
print("\nList of stopwords in Greek:")
result = set(stopwords.words('greek'))
print(result)
print("\nList of stopwords in Hungarian:")
result = set(stopwords.words('hungarian'))
print(result)
print("\nList of stopwords in Indonesian:")
result = set(stopwords.words('indonesian'))
print(result)
print("\nList of stopwords in Italian:")
result = set(stopwords.words('italian'))
print(result)
print("\nList of stopwords in Kazakh:")
result = set(stopwords.words('kazakh'))
print(result)
print("\nList of stopwords in Nepali:")
result = set(stopwords.words('nepali'))
print(result)
print("\nList of stopwords in Norwegian:")
result = set(stopwords.words('norwegian'))
print(result)
print("\nList of stopwords in Portuguese:")
result = set(stopwords.words('portuguese'))
print(result)
print("\nList of stopwords in Romanian:")
result = set(stopwords.words('romanian'))
print(result)
print("\nList of stopwords in Russian:")
result = set(stopwords.words('russian'))
print(result)
print("\nList of stopwords in Spanish:")
result = set(stopwords.words('spanish'))
print(result)
print("\nList of stopwords in Swedish:")
result = set(stopwords.words('swedish'))
print(result)
print("\nList of stopwords in Turkish:")
result = set(stopwords.words('turkish'))
print(result)

Пример вывода:

 Список стоп-слов на английском языке:
{'себя', 'не', 'будет', 'не должен', 'есть', 'не должен', 'hasn', 'был', 't', 'hasn', 'почему', ' между ',' ты ',' из ',' не будет ',' только ',' но ',' не имел ',' мог бы ',' нет ',' не ',' имеет ',' через ',' разве ',' не имею ',' ты ',' не ',' в ',' сам ',' каждый ',' должен ',' у ',' аин ',' я ' , «он», «и», «вне», «свой», «наш», «не может», «очень», «есть», «делает», «я», «быть», «те», « эти ',' здесь ',' любой ',' существо ',' наш ',' она ',' под ',' имел ',' до ',' над ',' s ',' все ',' не мог ' t ", 'm', 'do', 'under', 'yours', 'on', 'were', 'he', 'd', 'should't', 'it', 'not' ' , 'до', 'не должен', 'не будет', 'ре', 'против', 'если', 'их', 'кому', 'сама', 'мой', 'вверх', 'ты' ve "," вы бы "," оба "," делать "," вы "," о "," такие "," был "," по "," может "," большинство "," не " t "," их "," мы "," немногие "," потому что "," не "," их "," его "," тогда "," не "," не "," другие " , «должен был», «она», «где», «когда», «как», «ее», «для», «во время», «ма», «а», «что», «мы сами» , «не должен», «они», «с», «это», «а с ',' некоторые ',' вы ',' убежище ',' в ',' само ',' дальше ',' просто ',' не может ',' не был ',' ваш ',' к ',' в ',' выше ',' o ',' didn ',' from ',' need't ',' off ',' there ',' didn ',' isn ',' that will ',' have ' , 'кто', 'вы', 'больше', 'шань', 'пока', 'i', 'то же самое', 'll', 'вниз', 'выиграл', 'или', 'am', ' что ',' после ',' это ',' которое ',' снова ',' имея ',' сейчас ',' не ',' однажды ',' так ',' ее ',' ее ',' don ',' has has ',' ve ',' aren ',' the ',' nor ',' than ',' an ',' too ',' did ',' needn '}
Список стоп-слов на арабском языке:
{'ولو', 'بخ', 'أنتن', 'كي', 'إنا', 'هن', 'نحن', 'كلما', 'أنتما', 'هذه', 'اللتان', 'لها', ' هاك ',' إنما ',' وإذ ',' أو ',' وإن ',' أي ',' بنا ',' هاتين ',' ألا ',' كأن ',' ذواتي ',' أف ',' لهما ' , 'نعم', 'على', 'غير', 'والذي', 'ولكن', 'لست', 'ذاك', 'أكثر', 'دون', 'كأين', 'كليهما', 'حيثما', ' إذن ',' اللذان ',' اللذين ',' لئن ',' ليسوا ',' حين ',' ذلكما ',' كيت ',' مما ',' هي ',' يا ',' لستم ',' تلم ',' تلم , 'أنا', 'حاشا', 'هل', 'عليك', 'هم', 'إليكن', 'إلى', 'أولئك,' إليك ',' ذلكم ',' سوى ',' لن ',' هاتان ',' لك ',' هاته ',' ذوا ',' خلا ',' هؤلاء ',' هما ',' ذواتا ',' هذا ',' ريث ',' لسن ',' لنا ',' لكن ',' لكن ' , ''ل', 'بما', 'لستما', 'ذات', 'كلا', 'أنى', 'كلاهما', 'ما', 'إليكم', 'كما', 'لكما', 'ثمة', 'ثمة', ' عسى ',' كليكما ',' لستن ', 'لهم', 'لكيلا', 'آه', 'أينما', 'لاسيما', 'تي', 'هناك', 'لسنا', 'عليه', 'قد', 'ذانك', 'لم', 'أنم ',' ماذا ',' لي ',' هيا ',' عن ',' بلى ',' أما ',' عل ',' فيم ',' كل ',' هلا ',' منه ',' ذا ', 'شتان', 'كلتا', 'مع', 'لما', 'عند', 'هيت', 'إن', 'تين', 'إيه', 'بعض', 'إي', 'به', 'بل ',' لا ',' اللائي ',' ها ',' هو ',' فيه ',' والذين ',' حيث ',' ممن ',' تلكم ',' أيها ',' بهما ',' الذي ',' الذي ',' 'بين', 'إذما', 'ليت', 'بكما', 'لهن', 'ليسا', 'هذان', 'بس', 'ثم', 'حبذا', 'ليس', 'مه', 'أن ',' إليكما ',' فإذا ',' لو ',' فإن ',' كذلك ',' بها ',' ذان ',' منذ ',' مذ ',' هذين ',' عما ',' اللاتي ', 'هنا', 'أم', 'بعد', 'كأنما', 'ذين', 'منها', 'تينك', 'حتى', 'تلك', 'هاتي', 'سوف', 'إذا', 'لكم ',' اللواتي ',' الذين ',' في ',' فيها ',' مهما ',' وما ',' أي ن ',' بهم ',' إذ ',' فمن ',' بمن ',' كم ',' هاهنا ',' بهن ',' آها ',' ليست ',' أولاء ',' هذي ',' أوه ' , 'إلا', 'لكي', 'عدا', 'لدى', 'بكم', 'إنه', 'بك', 'ذو', 'ذينك', 'لوما', 'هيهات', 'كيفما', ' اللتين ',' وإذا ',' التي ',' ذلكن ',' كيف ',' ليستا ',' لكنما ',' هنالك ',' ومن ',' لعل ',' أنت ',' وهو ',' وهو ', و , 'ذي', 'بي', 'ته', 'فيما', 'متى', 'فلا', 'اللتيا', 'كأي', 'له', 'ذه', 'هكذا', 'بيد', ' لولا ',' نحو ',' آي ',' ذلك ',' من ',' إما ',' كذا ',' ولا ',' بماذا '}
Список стоп-слов на азербайджанском языке:
{'lap', 'saat', 'biri', 'əlbəttə', 'çox', 'xanım', 'of', 'bilər', 'siz', 'olar', 'biz', 'əlli', ' amma ',' bir ',' görə ',' xeyr ',' həmin ',' indi ',' biraz ',' in ',' dörd ',' idi ',' haqqında ',' qədər ',' məhz ' , 'ona', 'səkkiz', 'birşey', 'etmək', 'olur', 'onlardan', 'bəzən', 'ilə', 'nəhayət', 'olan', 'da', 'gilə', ' bütün ',' sonra ',' olmadı ',' lakin ',' mirşey ',' həmişə ',' et ',' olaraq ',' düz ',' buna ',' ü ',' bundan ',' ildə ' , 'olmuşdur', 'yüz', 'üçün', 'on', 'səhv', 'ad', 'ən', 'dən', 'yox', 'ay', 'niyə', 'edir', ' isə ',' qarşı ',' ya ',' xan ',' faiz ',' lslində ',' hə ',' kimi ',' mənə ',' bizim ',' doqsan ',' etmə ',' oradan ' , 'də', 'mən', 'həm', 'kimə', 'ondan', 'yeddi', 'dir', 'onların', 'yoxsa', 'artıq', 'özü', 'cü', ' yoxdur ',' sən ',' istifadə ',' iki ',' əgər ',' az ',' qırx ',' arasında ',' elə ',' obirisi ',' olmaz ',' və ',' etdi ' , 'iyirmi', 'onu', 'sizlər', 'saniyə', 'a', 'beş', 'heç', 'bu', 'bizlər', 'olsun', 'bunların', 'doqquz', 'öz', 'deyil', 'ilk', 'sadəcə', 'ha', 'cu', 'il', 'ki', 'üç', 'Yetmiş', 'cı', 'daha', 'var ',' altmış ',' onsuzda ',' o ',' yəni ',' bəy ',' kim ',' belə ',' otuz ',' zaman ',' bunu ',' təəssüf ',' bunun ', 'buradan', 'dedi', 'onlar', 'sənin', 'hər', 'ə', 'yaxşı', 'səksən', 'altı', 'yalnız', 'bəlkə', 'dəqiqə', 'olduğu ',' oldu ',' edən ',' bəli ',' dək ',' onun ',' ci ',' çünki ',' harada ',' ı ',' bəzi ',' nə ',' yenə ', 'sənə', 'bax', 'sizin'}
Список стоп-слов на датском:
{'dog', 'være', 'ham', 'vil', 'sine', 'kunne', 'der', 'som', 'sig', 'disp', 'jo', 'anden', ' ind ',' hvad ',' vor ',' med ',' fra ',' dig ',' ikke ',' mine ',' er ',' min ',' mange ',' hvor ',' den ' , 'det', 'når', 'blev', 'selv', 'noget', 'en', 'sådan', 'da', 'meget', 'de', 'under', 'han', ' над ',' et ',' havde ',' ad ',' skulle ',' deres ',' bliver ',' og ',' sit ',' ned ',' mit ',' op ',' jer ' , 'hvis', 'men', 'ville', 'til', 'hans', 'du', 'om', 'hos', 'for', 'efter', 'din', 'os', ' denne ',' var ',' at ',' jeg ',' man ',' end ',' hendes ',' sin ',' hun ',' eller ',' nu ',' på ',' have ' , 'ud', 'hende', 'i', 'af', 'mig', 'også', 'dette', 'vi', 'her', 'har', 'alt', 'thi', ' mod ',' blive ',' skal ',' nogle ',' alle ',' været ',' dem '}
Список стоп-слов на голландском языке:
{'niets', 'wezen', 'is', 'kan', 'zelf', 'uw', 'zich', 'of', 'zo', 'der', 'hem', 'mij', ' встретил ',' dus ',' andere ',' omdat ',' eens ',' toch ',' in ',' er ',' kunnen ',' zou ',' door ',' geen ',' me ' , 'uit', 'veel', 'wordt', 'en', 'de', 'bij', 'als', 'had', 'over', 'van', 'aan', 'alles', ' die ',' naar ',' niet ',' geweest ',' hebben ',' reeds ',' doch ',' was ',' zonder ',' mijn ',' op ',' waren ',' dan ' , 'hij', 'men', 'ons', 'voor', 'hoe', 'ja', 'het', 'dat', 'om', 'nog', 'ge', 'want', ' hier ',' een ',' dit ',' ik ',' al ',' haar ',' maar ',' kon ',' je ',' ook ',' daar ',' iemand ',' zijn ' , 'doen', 'te', 'u', 'toen', 'zal', 'wat', 'hun', 'nu', 'na', 'ben', 'tot', 'tegen', ' meer ',' werd ',' moet ',' ze ',' onder ',' heb ',' worden ',' wie ',' altijd ',' deze ',' iets ',' heeft ',' zij ' , 'wil'}
Список стоп-слов на финском языке:
{'tälle', 'niille', 'keneltä', 'häneltä', 'sinut', 'olisi', 'hänessä', 'siksi', 'olen', 'vaikka', 'sillä', 'kuka', ' tuon ',' teitä ',' joille ',' olin ',' sille ',' jota ',' ette ',' teidän ',' minulta ',' keinä ',' jolta ',' hänestä ',' meihin ' , 'sinä', 'joita', 'noihin', 'niin', 'näillä', 'niillä', 'tuo', 'me', 'keiksi', 'noiden', 'näissä', 'mitä', ' se ',' niitä ',' minun ',' kenet ',' minä ',' en ',' niissä ',' noille ',' olisivat ',' mutta ',' kenelle ',' meille ',' näinä ' , 'niinä', 'et', 'sinun', 'niihin', 'hänellä', 'olleet', 'keihin', 'on', 'he', 'tuolla', 'miksi', 'niiltä', ' jossa ',' keiltä ',' jonka ',' mukaan ',' joista ',' ole ',' millä ',' teihin ',' hänen ',' tuona ',' minussa ',' olet ',' kanssa ' , 'meidät', 'teistä', 'tästä', 'täksi', 'mistä', 'eivät', 'mihin', 'joilla', 'meiltä', 'noita', 'minusta', 'heitä', ' sinulla ',' tässä ',' tallä ',' keneksi ',' olisin ',' tämä ',' kenen ',' niiden ',' koska ',' oli ',' minuun ',' olette ',' minut ' , «сен», «мейля», «секя», «я», 'josta', 'minulla', 'vai', 'olimme', 'jona', 'hänelle', 'heissä', 'näiltä', 'miltä', 'olemme', 'olisit', 'joiksi', 'ketä ',' olit ',' olisimme ',' itse ',' joissa ',' joka ',' kun ',' ollut ',' ovat ',' tätä ',' niiksi ',' heiltä ',' minulle ', «sinulta», «keneen», «nuo», «noina», «tuolta», «mitkä», «tuosta», «ketkä», «johon», «vaan», «mille», «keistä», «jolla» ',' heihin ',' meistä ',' heidät ',' missä ',' jolle ',' kenestä ',' tuolle ',' siihen ',' te ',' noista ',' tai ',' sinuun ', «heille», «noiksi», «näiksi», «teillä», «joilta», «että», «olisitte», «minua», «keiden», «häneen», «sinusta», «hän», «hänet» ',' teille ',' tähän ',' sitä ',' teissä ',' siltä ',' heistä ',' näihin ',' noissa ',' keissä ',' jotka ',' nyt ',' ei ', 'sinua', 'kenenä', 'keillä', 'joiden', 'minkä', 'jos', 'näiden', 'joihin', 'noilta', 'olla', 'teidät', 'noilla', 'tuoksi ',' ne ',' keitä ',' tuossa ',' meidän ',' mikä ',' joina ',' olivat ',' meitä ',' tänä ',' nämä ',' tuohon ',' poikki ', 'siitä', 'yli', 'meissä', ' olitte ',' heidän ',' kenessä ',' kenellä ',' kuin ',' joksi ',' näille ',' keille ',' teiltä ',' tämän ',' niistä ',' siinä ',' tältä ' , 'häntä', 'näistä', 'noin', 'emme', 'heillä', 'sinulle', 'sinussa', 'näitä', 'tuotä'}
Список стоп-слов на французском языке:
{'étés', 'soyons', 't', 'auras', 'notre', 'étée', 'ce', 'ayante', 'eus', 'que', 'auraient', 'aurons', '' eue ',' lui ',' seras ',' étante ',' mais ',' tes ',' ton ',' n ',' des ',' y ',' me ',' aies ',' ait ' , 'est', 'se', 'qui', 'en', 'ou', 'avons', 'eûmes', 'ai', 'eussent', 'de', 'leur', 's', ' eûtes ',' et ',' suis ',' soit ',' m ',' ayez ',' fusse ',' eusses ',' on ',' d ',' serai ',' été ',' ses ' , 'aux', 'nous', 'sont', 'ont', 'elle', 'serons', 'pour', 'eut', 'son', 'étiez', 'avaient', 'fussent', ' aie ',' qu ',' l ',' moi ',' êtes ',' mon ',' serais ',' avec ',' fussions ',' serez ',' une ',' nos ',' ayants ' , 'du', 'le', 'aurais', 'c', 'eurent', 'était', 'ma', 'dans', 'seraient', 'sa', 'seront', 'eût', ' as ',' aurait ',' vos ',' il ',' etais ',' fusses ',' eteées ',' auriez ',' eux ',' soyez ',' ayant ',' eues ',' avez ' , 'fut', 'fûmes', 'pas', 'je', 'ayons', 'j', 'fus', 'vous', 'à', 'par', 'étaient', 'es', ' aient ',' eussions ',' étantes ',' serions ',' seriez ',' te ',' étants ',' furent ',' un ',' eu ',' étions ',' mes ' , 'ces', 'avait', 'toi', 'aurez', 'fût', 'fussiez', 'eusse', 'ne', 'serait', 'aurions', 'sommes', 'sera', ' même ',' sur ',' ta ',' tu ',' étant ',' avais ',' la ',' fûtes ',' eussiez ',' aviez ',' aurai ',' auront ',' ayantes ' , 'au', 'votre', 'soient', 'avions', 'sois', 'aura'}
Список стоп-слов на немецком языке:
{'dich', 'andern', 'oder', 'unsere', 'unseres', 'eurem', 'will', 'demselben', 'für', 'jeden', 'uns', 'dein', '' dort ',' ohne ',' von ',' diesem ',' denn ',' der ',' bei ',' zum ',' allen ',' sonst ',' bis ',' wollen ',' andere ' , 'jeder', 'werden', 'dieselbe', 'keinem', 'vor', 'soll', 'euren', 'deinem', 'ihn', 'er', 'in', 'hab', ' ist ',' im ',' weg ',' den ',' des ',' anderm ',' dazu ',' eines ',' keiner ',' manche ',' sondern ',' zu ',' nun ' , 'hat', 'welches', 'würde', 'machen', 'da', 'aber', 'jenes', 'über', 'ihm', 'seine', 'auch', 'kein', ' während ',' als ',' manchen ',' nichts ',' warst ',' ein ',' welche ',' diesen ',' wieder ',' ich ',' einen ',' seiner ',' habe ' , 'ihren', 'einig', 'sollte', 'unser', 'manches', 'bist', 'ihr', 'einigem', 'wo', 'meinen', 'einigen', 'sich', ' solchen ',' zwar ',' zwischen ',' um ',' alles ',' sie ',' die ',' keinen ',' meines ',' meiner ',' keine ',' ihre ',' meinem ' , 'anderem', 'doch', 'jede', 'keines', 'was', 'gewesen', 'aller', 'einige', 'denselben', 'vom', 'dir', 'unter', ' дас ',' мир ',' мит ' , 'einiges', 'waren', 'dessen', 'too', 'meine', 'muss', 'haben', 'allem', 'solche', 'noch', 'anderes', 'gegen', ' du ',' wollte ',' seinen ',' würden ',' sein ',' diese ',' ihrem ',' ob ',' werde ',' aus ',' hatte ',' anderr ',' musste ' , 'sehr', 'anderen', 'durch', 'indem', 'welchen', 'weiter', 'können', 'hier', 'wird', 'anderer', 'anders', 'hin', ' desselben ',' eine ',' zur ',' dieses ',' derselben ',' jetzt ',' mein ',' dieser ',' jener ',' seinem ',' war ',' hatten ',' könnte ' , 'jedem', 'nicht', 'deines', 'es', 'man', 'manchem', 'ihnen', 'nach', 'dann', 'euch', 'einmal', 'welchem', ' derer ',' bin ',' einer ',' einiger ',' jene ',' wir ',' hinter ',' jenem ',' eure ',' unseren ',' mich ',' jenen ',' und ' , 'derselbe', 'eurer', 'deiner', 'unserem', 'etwas', 'auf', 'mancher', 'seines', 'deine', 'selbst', 'solchem', 'wenn', ' solches ',' am ',' ins ',' solcher ',' damit ',' weil ',' welcher ',' deinen ',' dies ',' wirst ',' so ',' jedes ',' dieselben ' , 'ihrer', 'wie', 'eures', 'kann', 'viel', 'sind', 'einem', 'dasselbe', 'alle', 'nu r ',' ander ',' an ',' ihres ',' daß ',' dem ',' euer '}
Список стоп-слов по-гречески:
{'γὰρ', 'αλλα', 'ισωσ', 'εἰς', 'σύν', 'σὺ', 'ἡ', 'ὅδε', 'ταῖς', 'καὶ', 'ὥστε', 'τοι', '' οὕτως ',' αἱ ',' επι ',' σύ ',' ὅσ ',' ὥς ',' περί ',' οὓς ',' να ',' ἐστι ',' μην ',' οὐδεὶς ',' εκεινα ' , 'ποιοι', 'εκεινη', 'εισαι', 'καίτοι', 'αν', 'μήτε', 'εἴμι', 'ἀλλὰ', 'αὖ', 'ὑπέρ', 'ὑπό', 'μετὰ', 'μετὰ', 'μετὰ', ' ἄλλοσ ',' οὐδέ ',' τὰς ',' τά ',' αὐτὸς ',' για ',' αυτα ',' γα ^ ',' ἃ ',' αυτουσ ',' ενω ',' ὅ ',' τὸν ',' ἀλλ '', 'εκεινοι', 'εκεινοσ', 'γε', 'οὐχὶ', 'εκεινουσ', 'ἔτι', 'τήν', 'δὲ', 'ποιουσ', 'ττίςί', 'τίς', 'ε, ίς,', ε , 'ειστε', 'οὕτω', 'ὡσ', 'ποιων', 'οὐδείσ', 'δαὶ', 'ὅπερ', 'ἣ', 'την', 'ἐπεὶ', 'πωσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πρόσ', 'πωό' οὐδ ',' ὅτι ',' οσο ',' ποτε ',' εἴτε ',' ὅτε ',' αἵ ',' ὡς ',' μη ',' ομωσ ',' μα ',' ει αστε ',' μετα ',' ἐάν ',' τοιοῦτος ',' δαίσ ',' οὖν ',' σόσ ',' πρὸς ',' τινα ',' ἄρα ',' και ',' οὗτοσ ',' ἤ ' , 'κἀν', 'κατά', 'κατὰ', 'αυτο', 'αυτη', 'τοῖς', 'ἐν', 'ὑπὸ', 'τον', 'τότε', 'τῶν', 'ὃςὃς', ' προ ',' τὸ ',' του ',' ἐμόσ ',' ποια ',' ἢ ',' ἄν ',' τὴν ',' εἰμὶ ',' παρὰ ',' ἥ ',' οἳ ',' ὑπ ' , 'παρ', 'αντι', 'τῆσ', 'εαν', 'ἀλλ' ',' γοῦν ',' εἴ ',' τούσ ',' ὁ ',' ειμαι ',' εκεινεσ ',' τα ',' τα ', 'αμα', "δι '', 'οὐχ', 'δ' ',' ἐμὸς ',' ὐὐ ',' ἐπὶ ',' οὔτε ',' τοῦ ',' καί ',' τίσ ',' ποιεσ ', 'δέ', 'οἷς', 'ωσ', 'κατα', 'ὦ', 'ᾧ', 'κ', 'περὶ', 'ποιοσ', 'διὰ', 'οὐδὲ', 'ἀφ', 'τοί ',' στην ',' καθ ',' τοὺς ',' που ',' στη ',' οπωσ ',' ἄλλος ',' αυτεσ ',' εἰσ ',' τις ',' δαί ',' με ', 'ἐκ', 'δὴ', 'αὐτόσ', 'ὅστ , ',' μετά ',' τί ',' μέν ',' ἂν ',' μή ',' τῆς ',' δή ',' ποῦ ',' ἐφ ',' μὲν ',' μὴν ',' ἀπὸ ' , 'σὸς', 'δε', 'αἳ', 'ἐξ', 'ἐπί', 'ἐὰν', 'ποιο', 'το', 'αυτων', 'στο', 'εκεινων', 'μεθ', ' , ',' ὃ ',' οὗτος ',' σε ',' των ',' κατ ',' γάρ ',' πως ',' τι ',' ὃν ',' ἀλλά ',' τό ',' δεν ' , 'δαὶς', 'ττι', 'επ', 'προσ', 'οὕτωσ', "δ '', 'τόν', 'θα', 'οὗ', 'οἱ', 'τε', 'τησ', 'τισ', 'ὑπὲρ', 'η', 'παρα', 'ἵνα', 'αυτοι', 'εκεινο', 'οὐκ', 'παρά', 'ἑαυτοῦ', 'ἐγώ', 'τῇ', 'ττ', 'ττ ',' αυτοσ ',' εἰ ',' πρὸ ',' οι ',' τὰ ',' γα ',' ὑμόσ ',' τοιοῦτοσ ',' σὺν ',' μἐν ',' ειναι ',' ο ',' ο ', 'ἧς', 'ἀπ', 'κι', 'οὐδὲν', 'ἐγὼ', 'απο', 'ἀπό', 'μετ', 'στον', 'τοτε', 'τῷ', 'ὅθεν', 'μὴ ',' διά ',' κἂν '}
Список стоп-слов на венгерском языке:
{'csak', 'annak', 'utána', 'lehet', 'mely', 'vele', 'sok', 'keressünk', 'abban', 'arra', 'azért', 'nagyobb', ' való ',' nélkül ',' jó ',' tovább ',' amit ',' amolyan ',' melyek ',' mindenki ',' mint ',' vagyok ',' ahol ',' azonban ',' sokkal ' , 'ezt', 'bár', 'valami', 'azt', 'el', 'elõtt', 'e', 'ill', 'lenne', 'teljes', 'ellen', 'nincs', ' volna ',' azzal ',' egyes ',' maga ',' keresztül ',' több ',' általában ',' mindig ',' kell ',' be ',' de ',' ez ',' ekkor ' , 'lehetett', 'amelynek', 'saját', 'úgy', 'cikkek', 's', 'alt', 'valamint', 'van', 'mintha', 'õ', 'igen', ' továbbá ',' én ',' illetve ',' belül ',' egyetlen ',' ison ',' nem ',' elõ ',' ezen ',' akik ',' lesz ',' újra ',' között ' , 'amíg', 'nekem', 'minden', 'amikor', 'neki', 'amely', 'vissza', 'most', 'mit', 'voltak', 'amelyeket', 'mellett', ' ennek ',' hogy ',' kellett ',' ezért ',' már ',' még ',
'volt', 'legyen', 'az', 'voltam', 'rá', 'más', 'aztán', 'és', 'itt', 'mindent', 'ott', 'a', 'ehhez ',' majd ',' össze ',' szinte ',' utolsó ',' eddig ',' hogyan ',' alatt ',' ahhoz ',' ezzel ',' néha ',' ugyanis ',' olyan ', 'vannak', 'hiszen', 'vagyis', 'ki', 'ezek', 'miért', 'vagy', 'mikor', 'pedig', 'semmi', 'ilyenkor', 'akkor', 'egy ',' hanem ',' sem ',' magát ',' õk ',' cikk ',' után ',' egyik ',' legalább ',' egyre ',' nagyon ',' fel ',' néhány ', 'nagy', 'ill.', 'elég', 'elõször', 'jobban', 'másik', 'persze', 'milyen', 'azok', 'emilyen', 'elsõ', 'cikkeket', ' viszont ',' éppen ',' voltunk ',' mi ','új', 'egész', 'szemben', 'sokat', 'ebben', 'amelyek', 'tehát', 'ne', 'lenni' , 'aki', 'közül', 'újabb', 'meg', 'ilyen', 'õket', 'azután', 'egyéb', 'mivel', 'ahogy', 'amelyekben', 'ismét', ' míg, 'erre', 'arról', 'számára', 'benne', 'ami', 'jól', 'szerint', 'amelyet', 'így', 'valaki', 'talán', 'át' , 'mert', 'azon', 'lett', 'kívül', 'felé'} Список стоп-слов на индонезийском языке: Lis t из ключевых слов на итальянском языке: {'del', 'agli', 'dall', 'tutto', 'avreste', 'квест','uesti ',' avendo ',' facevo ',' facevate ',' staranno ' , 'sue', 'dallo', 'avesti', 'abbiamo', 'nei', 'avevo', 'avrebbero', 'fai', 'tuoi', 'Questo', 'avute', 'stavate', ' ebbe ',' dagli ',' sui ',' vostro ',' sta ',' hanno ',' stessi ',' stesse ',' avuti ',' stareste ',' che ',' sia ',' facevano ' , 'ero', 'lui', 'stiamo', 'starebbe', 'in', 'e', 'sulle', 'abbia', 'fossero', 'nelle', 'vostre', 'siete', ' non ',' starò ',' avevamo ',' abbiano ',' vostra ',' fummo ',' dell ',' tuo ',' loro ',' gli ',' nella ',' eravamo ',' steste ' , 'stanno', 'tua', 'se', 'ed', 'avevate', 'avrò', 'con', 'voi', 'da', 'facemmo', 'una', 'ai', ' quanti ',' avrà ',' sarò ',' saranno ',' farai ',' facevi ',' tue ',' siate ',' getsti ',' avremmo ',' aveste ',' degl ',' all ' , 'saresti', 'quanta', 'delle', 'avessero', 'tari', 'facciamo', 'sugli', 'ebbi', 'ad', 'stava', 'eri', 'avrete', ' farà ',' stavano ',' hai ',' sono ',' ho ',' starei ',' miei ','teste', 'faceva', 'fanno', ' faranno ',' nostro ',' facciate ',' quale ',' stemmo ',' starai ',' staresti ',' eravate ',' sarebbe ',' avrai ',' suo ',' mio ',' l ' , 'essendo','Tramo ',' negl ',' quelli ',' sarei ',' furono ',' più ',' avrei ',' avresti ',' uno ',' saremmo ',' nostre ',' facendo ',' noi ',' avessimo ',' tarbbero ',' starebbero ',' alla ',' le ',' ebbero ',' stavi ',' c ',' anche ',' sull ',' degli ' , 'fosti', 'tarmmo', 'ma', 'a', 'stiate', 'nello', 'stavo', 'avevi', 'facciano', 'quello', 'dalle', 'avranno', '' faccia ',' sto ',' li ',' stette ',' dei ',' farebbe ',' dov ',' stia ',' ha ',' stai ',' al ',' staremmo ',' nel ' , 'agl', 'sugl', 'nostri', 'il', 'sullo', 'quante', 'sei', 'lo', 'siano', 'quella', 'sua', 'sarai', ' чи ',' facesero ',' o ',' per ',' stavamo ',' sarebbero ',' sarete ',' facevamo ',' stando ',' erano ',' perché ',' fossimo ',' siamo ' , 'avemmo', 'avuta', 'fu', 'fosse', 'saremo', 'allo', 'farò', 'stiano', 'abbiate', 'sareste', 'un', 'contro', ' aveva ',' avesse ',' è ',' come ',' lei ',' quelle ',' nell ',' dagl ',' mia ',' nostra ',' su ',' de llo ',' io ',' dove ',' quanto ',' sulla ',' cui ',' avete ',' avrebbe ',' si ',' sul ',' mi ',' i ',' fecero ' , Facets, Stessimo, Далла, Востри, Квеста, Суои, Trateste, Stettero, Ne, SARA, VI, Avevano, Avevano Starà ',' di ',' dal ',' avuto ',' foste ',' facessimo ',' tra ',' avessi ',' facete ',' stessero ',' stesti ',' fui ',' tu ' , 'ci', 'staremo', 'feci', 'facese', 'starete', 'fece', 'faccio', 'dai', 'stetti', 'ti', 'la', 'tutti', ' avremo ',' della ',' alle ',' era ',' mie ',' fossi ',' negli ',' col ',' coi ',' facessi '} Список стоп-слов на казахском языке: {' кейбір ', «олардың», «бұрын», «арбаң-арбаң», «әйтпесе», «шейін», «таңқ», «күллі», «біреу», «қап», «туралы», «ғұрлым», «өзінің», 'шек', 'ыңқ', 'сенімен', 'таяу', 'кәні', 'ірк', 'оларға', 'себебі', 'жаракімалла', 'әркім', 'өзіме', 'астапыралла', 'түге ',' сізге ',' әйткенмен ',' қаңқ-құң қ ',' ал ',' е ',' ей ',' соң ',' маңқ ',' бірдеме ',' өзім ',' алайда ',' мынау ',' біз ',' менің ',' бұндай ' , 'ой', 'ешкім', 'сіздерге', 'әлденеше', 'сондай', 'пішту', 'бізбен', 'бізден', 'барша', 'әукім', 'бойымен', 'оһо', ' митың-митың ',' осылай ',' алақай ',' желп ',' ешқайсы ',' өй ',' күрт ',' сенің ',' кәнеки ',' олармен ',' одан ',' бүкіл ',' олар ',' жалп ',' біздердің ',' эх ',' біздерден ',' өзге ',' шамалы ',' үшін ',' ә ',' болп ',' сияқты ',' оның ',' қорс ' , 'әлдене', 'салым', 'сарт', 'өзімнің', 'сіздің', 'маған', 'тегттегенай', 'әйда', 'құрау-құрау', 'өзі', 'салаң-сұлаң', ' жоқ ',' ешқандай ',' біздің ',' дүрс ',' әншейін ',' паһ-паһ ',' мұндай ',' аһа ',' шақты ', 'морт', 'әлдекім', 'қош-қош', 'шәйт', 'тағы', 'қызараң-қызараң', 'қана', 'ура', 'ырқ', 'дүңк', 'шаңқ', 'жалт -жалт ',' қатар ',' кейін ',' тарбаң-тарбаң ',' осы ',' мына ',' уау ',' құр ',' ешбір ',' ғұрлы ',' тарс-тұрс ',' мышы ',' пырс ',' өзіне ',' қаңқ-қаңқ ',' ана ',' моһ ',' былп ',' уа ',' сондықтан ',' бірнеше ',' ойпырмай ',' осындай ',' дейін ',' ыржың-тыржың ',' оған ',' тарта ',' өзің ',' олардан ',' тағыда ',' сіз ',' ешқашан ',' тек ',' барқ ',' далаң-далаң ', 'кейбіреу', 'ау', 'менен', 'бойы', 'борт', 'бізге', 'ох', 'дәнеңе', 'бәрекелді', 'құрау', 'бүгжең-бүгжең', 'қыңқ', 'қоса', 'алатау', 'қаралы', 'әрине', 'гүрс', 'біздерге', 'жуық', 'шырт', 'қайқ ң-құйқаң ',' біздер ',' уай ',' пай ',' қалт-құлт ',' дегенмен ',' тыңқ ',' ырс ',' кәне ',' барлық ',' өйткені ',' өз ' , 'алдақашан', 'кәһ', 'сарт-сұрт', 'еш', 'қалт-қалт', 'арс', 'ештеме', 'бірақ', 'сонау', 'сізден', 'сенен / tonan' , 'мен', 'бәрі', 'сенен', 'анау', 'бүйт', 'сіздер', 'бері', 'ах', 'әлдеқалай', 'кә', 'әрбір', 'мәссаған', ' қарай ',' кірт ',' сен ',' онымен ',' сорап ',' о ',' тарс ',' пай-пай ',' солай ',' қолп ',' шаңқ-шаңқ ',' батыр- бұтыр ',' тәк ',' айтпақшы ',' япырмай ',' бетер ',' саған ',' бұл ',' сол ',' әрқайсы ',' бірге ',' шаңқ-шұңқ ',' арнайы ',' менімен ',' әлдеқайдан ',' ол ',' біздермен ',' күшім ',' сонымен ',' міне ',' пішә ',' әлдеқашан ',' а ',' әттең ',' ербелең-ербелең ',' үйт ',' қайсыбір ',' әттеген-ай ',' шіркін ',' әні ',' күңк ',' түгел ',' саңқ ',' емес ', 'сіздерден', 'я', 'шіңк', 'ие', 'гөрі', 'тырс', 'па', 'сіздердің', 'сіздермен', 'бар', 'беу', 'масқарай', 'әрқалай ',' таман ',' әй ',' жалт-жұлт ',' арқылы ',' сыңқ ',' сізбен ',' сона ',' арсалаң-арсалаң ',' эй ',' осынау ',' мыңқ ', 'онда', 'сенде', 'сайын', 'арс-ұрс', 'қаңғыр-күңгір', 'пфша', 'ғана', 'әрне', 'менде'} Список стоп-слов в непальском: {'कतै' , 'बिरुद्ध', 'देखि', 'दुई', 'फेरी', 'देखियो', 'वास्तवमा', 'छ', 'पूर्व', 'बाहेक', 'औं', 'गर्नुपर्छ', 'तिनी', ' , ',' गर्छ ',' गर्नु ',' जस्त ',' मा ',' यस ',' यी ',' त्सपछि ',' थिएन ',' निम्ति ',' पछिल्लो ',' बारे ',' गर्न ',' कहाँबाट ',' छू ',' भर ', 'प्रति', 'भए', 'पाँच', 'देखेर', 'पक्का', 'चाहिए', 'पहिलो', 'उदाहरण', 'बरु', 'सबै', 'मेरो', 'उनले', 'अर्थात ',' हुन् ',' किन ',' तिनिहरुलाई ',' उहालाई ',' जो ',' एकदम ',' यो ',' नौ ',' एउटै ',' जस्तोसुकै ',' आफूलाई ',' जसको ', 'भन', 'शायद', 'गरेर', 'जुन', 'अन्यथा', 'सारा', 'रूप', 'सट्टा', 'गरि', 'तपाईको', 'त', 'अन्य', 'तिमी ',' धेरै ',' यति ',' जसलाई ',' सम्भव ',' तिनीहरू ',' अक्सर ',' क्रमशः ',' जताततै ',' ठीक ' , 'आफ्नो', 'जस्तै', 'बाहिर', 'राम्रो', 'गरौं', 'हुन्छ', 'संगै', 'कहिलेकाहीं', 'छन्', 'भन्दा', 'हुने', 'त्यहाँ', ' , ',' तिर ',' देखे ',' कुनै ',' पर्छ ',' भित्र ',' यद्यपि ',' दिए ',' अलग ',' र ',' बीच ',' आदि ',' दिनुभएको ' , 'यदि', 'लागि', 'कुरा', 'पक्कै', 'या', 'तपाई', 'राख्छ', 'का', 'यसपछि', 'निम्नानुसार', 'कम से कम', 'लगभग' , 'साथ', 'गरेका', 'अन्तर्गत', 'यहाँ', 'जे', 'आफू', 'के', 'त्सैले', 'कि', 'आए', 'पनि', 'संग', ' , ',' भने ',' गर्छु ',' भएको ',' तथा ',' अन्यत्र ',' आत्म ',' गरी ',' पहिल्यै ',' , ',' म ',' जहाँ ',' जब ',' तेस्रो ',' हुन ',' कृपया ',' जाहिर ',' साथै ',' कसै ',' तुरुन्तै ',' पाँचौं ',' यसरी ' , 'भन्', 'कोही', 'आफ्नै', 'तेस्कारण', 'हो', 'समय', 'पटक', 'हरेक', 'थियो', 'जान', 'छौं', 'चार', ' , ',' को ',' जबकि ',' भन्छन् ',' जसबाट ',' जसले ',' सक्छ ',' जसमा ',' उनको ',' साँच्चै ',' तल ',' गयौ ',' नजिकै ' , 'गए', 'रही', 'यसो', 'कसरी', 'दिनुहुन्छ', 'न', 'अर्को', 'बिशेष', 'अझै', 'रहेको', 'तिनीहरुको', 'तीन', ' , ',' यस्तो ',' केही ',' प्रतेक ',' राखे ',' सधै ',' उप ',' आजको ',' अरुलाई ',' थिए ',' मात , ',' पर्याप्त ',' ओठ ',' छैन ',' तापनी ',' माथि ',' चाले ',' प्लस ',' यसको ',' कसैले ',' यहाँसम्म ',' मुख्य ',' तदनुसार ' , 'सबैलाई', 'भन्छु', 'लाई', 'चाहन्छु', 'एक', 'भन्नुभयो', 'मलाई', 'सो', 'अरु', 'गरेको', 'पछि', 'पहिले', ' , ',' अर्थात् ',' नि ',' वरीपरी ',' किनभने ',' अगाडी ',' चाहनुहुन्छ ',' निर्दिष्ट ',' दोस्रो ',' गर्दै ',' नयाँ ',' सही ',' नत्र ' , 'नै', 'आयो', 'तत्काल', 'तर', 'गैर', 'सायद', 'त्यो', 'बने', 'अनुसार', 'सम्म', 'अब', 'सात', ' , ',' यसबाहेक ',' ती ',' गर्ने ',' स्पष्ट ',' देखेको ',' भ त्री ',' छु ',' ले ',' पर्थ्यो '} Список стоп-слов на норвежском языке: {' være ',' dere ',' kan ',' vil ',' sine ',' hvordan ',' ditt ', 'vært', 'kva', 'kunne', 'hennes', 'der', 'mot', 'inni', 'elles', 'som', 'disp', 'ingen', 'no', 'før ',' kom ',' vere ',' nokor ',' sia ',' kven ',' med ',' fra ',' ikke ',' mine ',' er ',' så ',' vors ', «min», «verte», «mange», «inkje», «kvarhelst», «hvor», «den», «det», «opp», «når», «me», «noe», «selv» ',' en ',' da ',' meget ',' hvem ',' de ',' oss ',' siden ',' han ',' over ',' hvorfor ',' et ',' ein ', 'korso', 'sånn', 'å', 'ingi', 'hver', 'deira', 'skulle', 'eitt', 'noko', 'um', 'deim', 'deres', 'ho ',' medan ',' mitt ',' og ',' seg ',' ned ',' blir ',' slik ',' dykkar ',' hvis ',' ett ',' men ',' ville ', 'somt', 'til', 'vart', 'hans', 'blei', 'hoe', 'du', 'ja', 'honom', 'mellom', 'om', 'nå', 'for ',' ved ',' somme ',' korleis ',' inn ',' din ',' dei ',' hennar ',' ha ',' sitt ',' hoss ',' denne ',' var ', 'kvar', 'ut', 'hadde', 'ikkje', 'begge', 'blitt', 'vår', 'eit', ' deires ',' at ',' upp ',' nokre ',' kvi ',' varte ',' hjå ',' jeg ',' man ',' både ',' samme ',' sin ',' uten ' , 'sjøl', 'hun', 'hva', 'eller', 'kun', 'på', 'hvilken', 'kvifor', 'henne', 'si', 'i', 'mi', ' dykk ',' då ',' noka ',' også ',' nokon ',' dette ',' fordi ',' vore ',' ble ',' meg ',' etter ',' hvilke ',' vi ' , 'eg', 'her', 'di', 'har', 'so', 'sidan', 'noen', 'bare', 'hossen', 'bli', 'deg', 'mykje', ' skal ',' båe ',' alle ',' enn ',' av ',' vort ',' dem '} Список ключевых слов на португальском языке: {' tenho ',' quem ',' pelo ',' estejamos ', «seríamos», «numa», «são», «dos», «por», «uma», «estivera», «estas», «estivessem», «esteve», «tenha», «que», «muito» ',' eles ',' no ',' somos ',' ao ',' dele ',' pela ',' forem ',' vocês ',' tenham ',' até ',' houverem ',' elas ', 'foi', 'lhes', 'estejam', 'minha', 'e', 'houveram', 'mais', 'houvera', 'tiver', 'aos', 'nós', 'para', 'suas ',' me ',' qual ',' esta ',' aquilo ',' estiver ',' tua ',' essa ',' se ',' houvessem ',' seremos ',' estivermos ',' ou ', 'да', 'tivemos', 'sejam', 'estivéssemos', ' de ',' teria ',' houvermos ',' tinha ',' tive ',' houveríamos ',' houver ',' terá ',' do ',' aqueles ',' tivera ',' sejamos ',' em ' , 'teus', 'terão', 'aquela', 'houveria', 'nosso', 'nem', 'estávamos', 'deles', 'terei', 'hão', 'um', 'esses', ' estou, 'teremos', 'sou', 'tem', 'tuas', 'fora', 'teve', 'estive', 'dela', 'houvéramos', 'tem', 'está', 'também' , 'houverei', 'houverão', 'houveriam', 'delas', 'ela', 'tivesse', 'entre', 'hei', 'das', 'só', 'fomos', 'pelos', ' хаджам, 'nos', 'estiverem', 'éramos', 'houveremos', 'tenhamos', 'lhe', 'houvesse', 'com', 'fossem', 'houverá', 'for', 'nossos' , 'a', 'estivéramos', 'teríamos', 'nossa', 'estão', 'seja', 'estava', 'meu', 'as', 'num', 'haja', 'formos', ' vos ',' os ',' há ',' teriam ',' este ',' pelas ',' sua ',' sem ',' nas ',' tivéramos ',' o ',' a ',' depois ' , 'estivemos', 'fôssemos', 'aquele', 'seriam', 'temos', 'nossas', 'tivermos', 'serei', 'te', 'fosse', 'houvéssemos', 'mas', ' aquelas ',' eu ',' houve ',' isto ',' já ',' mesmo ',' na ',' foram ',' t iverem ',' como ',' estes ',' seu ',' você ',' será ',' tiveram ',' quando ',' havemos ',' meus ',' eram ',' ele ',' seria ' , 'estivesse', 'tivéssemos', 'tivessem', 'estavam', 'tinham', 'fui', 'tu', 'serão', 'estiveram', 'minhas', 'tínhamos', 'esteja', '' houvemos ',' essas ',' hajamos ',' era ',' teu ',' isso ',' seus ',' fôramos ',' estamos ',' às ',' não ',' esse '} Список стоп-слов на румынском: {'aţi', 'ba', 'dă', 'mulţi', 'îl', 'desi', 'alta', 'nimeni', 'altceva', 'toti', 'deci', 'cărui ',' el ',' mine ',' unu ',' prin ',' ar ',' oricînd ',' aş ',' dau ',' careia ',' are ',' voi ',' ului ', 'dintr', 'atitia', 'ăstea', 'tocmai', 'zi', 'deşi', 'm','ăta ',' foarte ',' despre ',' caruia ',' fie ',' deja ',' îi ',' incit ',' atita ',' patru ',' fiu ',' vom ',' în ',' până ',' unui ',' cind ',' citiva ',' să ', «noi», «unor», «oricît», «le», «dat», «îmi», «aveţi», «acelasi», «aceştia», «dar», «mei», «abia», «iar» ',' ţi ',' aici ',' căci ',' alti ',' il ',' care ',' astea ',' o ',' acela ',' ălea ',' cîte ',' un ', «чума», 'oricine', 'pot', 'insa', 'doilea', 'si', 'tot', 'acei', 'aceasta', 'alte', 'inapoi', 'oricare', 'inca', 'această ',' putini ',' ti ',' îţi ',' era ',' fi ',' fost ',' orice ',' dintr- ',' atatea ',' ale ',' t ',' daca ' , 'aibă', 'totusi', 'cand', 'dintre', 'acestia', 'cumva', 'cit', 'in', 'e', 'acest', 'mult', 'noastre', ' de ',' oricând ',' alea ',' pe ',' lor ',' asupra ',' unde ',' atatia ',' cât ',' treilea ',' seve ',' suntem ',' v ' , 'ca', 'ăla', 'unora', 'mea', 'undeva', 'cei', 'chiar', 'deasupra', 'unii', 'a', 'li', 'mîine', ' meu ',' as ',' oricum ',' sunteţi ',' sint ',' tuturor ',' tine ',' cite ',' este ',' noastră ',' acea ',' pentru ',' primul ' , 'cărei', 'unul', 'ni', 'sale', 'fel', 'cita', 'mele', 'cel', 'parca', 'nostru', 'mi', 'avem', ' mă ',' ele ',' vreo ',' multa ',' or ',' sub ',' am ',' adica ',' atata ',' avea ',' puţină ',' decit ',' ta ' , 'totuşi', 'ci', 'oriunde', 'mod', 'altii', 'prea', 'toata', 'au', 'vouă', 'acele', 'toată', 'cea', ' dupa ',' ce ',' cîtva ',' dacă ',' aia ',' atat ',' fii ',' dou ',' toate ',' unei ',' multe ',' către ',' acestui ',' drept ',' da ',' una ',' ai ',' uneia ',' aceste ',' noua ', 'totul', 'niste', 'anume','ăştia ',' sunt ',' numai ',' intr ',' altfel ',' acestea ',' pina ',' citi ',' ia ',' prima ',' sus ',' printr- ',' doi ',' apoi ',' toţi ',' vostru ',' vă ',' uneori ',' voştri ',' ma ',' sa ',' oricât ' , 'ceva', 'imi', 'treia', 'dată', 'cît', 'ati', 'sau', 'al', 'vreun', 'tau;', 'mai', 'câtva', ' ea ',' face ',' nouă ',' cîţi ',' u ',' iti ',' tale ',' fiecare ',' eu ',' atitea ',' celor ',' noştri ',' carora ' , 'ei', 'i', 'ori', 'vi', 'tăi', 'ala', 'nici', 'fata', 'sai', 'sa-ti', 'la', 'ceilalti' , 'altul', 'atit', 'spate', 'unele', 'multi', 'mâine', 'puţin', 'fim', 'simplyu', 'vor', 'câte', 'lui', ' după ',' căror ',' ţie ',' avut ',' se ',' zice ',' sa-mi ',' aceeasi ',' câţi ',' asta ',' şi ',' aceşti ',' nou ',' ceea ',' aceea ',' isi ',' cineva ',' cine ',' cînd ',' atunci ',' puţina ',' acestei ',' acelea ',' pînă ',' altcineva ' , 'din', 'nimic', 'pai', 'unuia', 'nişte', 'doar', ' cu ',' nostri ',' fără ',' ii ',' voastră ',' asa ',' pic ',' că ',' ul ',' acel ',' fara ',' inainte ',' cum ' , 'intre', 'spre', 'te', 'trei', 'lîngă', 'nu', 'va', 'voastre', 'cui', 'eşti', 'sintem', 'eram', ' cele ',' ne ',' multă ',' cat ',' aceia ',' fiţi ',' alt ',' acesta ',' săi ',' patra ',' lângă ',' tu ',' citeva ' , 'astfel', 'poate', 'catre', 'cam', 'mie', 'atare'} Список стоп-слов на русском языке: {'потому', 'нельзя', 'или', 'него', 'тут ',' под ',' зачем ',' моя ',' сейчас ',' только ',' так ',' ли ',' куда ',' чего ',' там ',' впрочем ',' вот ', 'все', 'ни', 'ей', 'можно', 'ж', 'был', 'конечно', 'была', 'того', 'когда', 'тоже', 'ничего', 'ну ',' ней ',' об ',' какой ',' нас ',' этот ',' ним ',' может ',' потом ',' нибудь ',' будто ',' вам ',' при ', 'более', 'не', 'чем', 'были', 'вдруг', 'разве', 'есть', 'опять', 'как ая ',' то ',' свою ',' этого ',' это ',' что ',' было ',' на ',' быть ',' лучше ',' тебя ',' уже ',' этой ' , 'себя', 'всегда', 'мы', 'ты', 'больше', 'ему', 'мой', 'его', 'их', 'между', 'три', 'всю', ' много ',' вы ',' тем ',' от ',' наконец ',' такой ',' у ',' кто ',' эти ',' нет ',' совсем ',' бы ',' в ' , 'всего', 'никогда', 'сам', 'во', 'меня', 'чтоб', 'раз', 'хоть', 'один', 'и', 'хорошо', 'чтобы', ' всех ',' без ',' почти ',' том ',' над ',' же ',' через ',' эту ',' но ',' со ',' тогда ',' они ',' нее ' , 'с', 'из', 'теперь', 'здесь', 'два', 'о', 'мне', 'другой', 'перед', 'она', 'уж', 'после', ' еще ',' будет ',' да ',' им ',' а ',' надо ',' тот ',' по ',' за ',' ее ',' них ',' я ',' как ' , 'до', 'ведь', 'для', 'себе', 'иногда ',' если ',' даже ',' про ',' где ',' чуть ',' к ',' вас ',' он '} Список ключевых слов на испанском языке: {' hemos ',' les ',' seríamos ',' hayas ',' estuviera ',' míos ',' mío ',' hayamos ',' mías ',' has ',' algo ',' soy ',' estuvieses ',' habían ',' tuvimos ' , 'el', 'estéis', 'estés', 'para', 'habré', 'suyo', 'mucho', 'estar', 'seremos', 'con', 'las', 'sobre', ' tuvierais ',' fuiste ',' tuvieran ',' tuvieseis ',' fuéramos ',' hasta ',' sentidos ',' estuvimos ',' tenidas ',' había ',' fuimos ',' hubiesen ',' erais ' , 'algunos', 'otras', 'tuvisteis', 'estarán', 'habías', 'le', 'hubisteis', 'habrías', 'ante', 'estado', 'hubieses', 'tuviesen', ' poco ',' fue ',' estuvieran ',' nuestra ',' tengáis ',' vuestra ',' o ', tenderríais,' siente ',' es ',' cual ',' eran ',' desde ' , 'sin', 'un', 'hubieseis', 'están', 'tenidos', 'estarías', 'fuesen', 'tenido', 'nosotros', 'hayáis', 'Estaba', 'estada', ' fui ',' estuvieseis ',' habría ',' tus ',' sentido ',' ti ',' sentid ',' era ',' estuviesen ',' del ',' fueras ',' porque ' , 'vuestro', 'tuve', 'tendrás', 'yo', 'tenías', 'fuerais', 'quien', 'tuyos', 'todo', 'ese', 'fuisteis', 'e', ' estaremos ',' seáis ',' pero ',' vosostros ',' y ',' habrán ',' Estabais ',' estaríais ',' algunas ',' de ',' habéis ',' fueron ',' teniendo ' , 'tuyas', 'estoy', 'serás', 'esto', 'eres', 'estén', 'ellas', 'oro', 'mí', 'estadas', 'ella', 'ya', ' estuvierais ',' tenderrían ',' uno ',' esté ',' nos ',' contra ',' muy ',' más ',' mía ',' estaréis ',' vuestros ',' hubieras ',' a ' , 'serán', 'estarás', 'tanto', 'qué', 'quebe', 'tengas', 'seríais', 'os', 'este', 'habríais', 'hayan', 'hube', ' estábamos ',' fueran ',' sería ',' estuvo ',' hubiéramos ',' nosotras ',' esos ',' tienes ',' estos ',' nuestro ',' ni ',' tuvo ',' seas ' , tenré, eso, fueseis, tenéis, mi, tenida, tenían, tuviéramos, estemos, estuvisteis, antes, estuviese, esas ',' fueses ',' nuestros ',' vosostras ',' por ',' habremos ',' hay ',' tuvieras ',' habrían ',' somos ',' tened ',' mis ',' estaré ' , 'habríamos', 'tiene »,« тендриамос »,« тендра »,« тенго »,« эн »,« тендран »,« уна »,« эстуве »,« хубераис »,« хан »,« сентидас »,« хубизе »,« тения », 'habidas', 'suyos', 'estuvieras', 'he', 'todos', 'serían', 'hubieran', 'tuviésemos', 'habíamos', 'estará', 'seamos', 'sus', 'entre ',' instas ',' estad ',' suyas ',' tú ',' habidos ',' habiendo ',' ha ',' al ',' sentida ',' hubieron ',' seré ',' tenderrías ', 'instan', 'habrás', 'teníamos', 'haya', 'cuando', 'estuviéramos', 'sea', 'tuvieses', 'eras', 'su', 'habido', 'será', 'habréis ',' hubiera ',' nada ',' durante ',' los ',' la ',' unos ',' fuésemos ',' hubiésemos ',' estuvieron ',' tengamos ',' estados ',' estas ', 'que', 'no', 'hubiste', 'tuya', 'tenga', 'también', 'me', 'esta', 'se', 'nuestras', 'otros', 'estáis', 'habida »,« tenremos »,« hubimos »,« estuviste »,« tuviste »,« tuviera »,« hubo »,« teníais »,« él »,« tuyo »,« son »,« serías »,« está », 'sí', 'esa', 'vuestras', 'tenderría', 'éramos', 'tuvieron', 'tenemos', 'tengan', 'estás', 'lo', 'suya', 'sean', 'seréis ',' habíais, 'estaríamos', 'habrá', 'tienen', 'sintiendo', 'te', 'quienes', 'fuera', 'tuviese', 'como', 'donde', 'tendréis', 'ellos' , 'muchos', 'estando', 'otra', 'estaría', 'tu', 'estarían', 'estuviésemos', 'estamos', 'sois'} Список стоп-слов на шведском языке: {'kan', 'ditt vilka, sådant, kunde, dina, hennes, mot, som, sig, detta, ingen, varför, att, 'för', 'vem', 'vårt', 'där', 'med', 'dig', 'vid', 'så', 'er', 'vara', 'min', 'mellan', 'allt ',' den ',' det ',' till ',' sitta ',' icke ',' ju ',' mycket ',' vilkas ',' blev ',' en ',' från ',' sådan ', 'de', 'oss', 'under', 'utan', 'han', 'skulle', 'våra', 'blivit', 'något', 'sedan', 'några', 'mitt', 'denna ',' blir ',' vilken ',' inte ',' själv ',' varje ',' ett ',' men ',' här ',' åt ',' vart ',' hans ',' alla ', 'du', 'honom', 'när', 'ert', 'någon', 'om', 'jag', 'efter', 'din', 'än', 'sina', 'hon', 'ej ',' ха ',' över ',' varit ',' var ',' ut ',' hade ',' vår ',' upp ',' inom ',' deras ',' man ',' ni ', 'мина', 'грех', 'ар', 'де ssa ',' eller ',' nu ',' på ',' vad ',' henne ',' i ',' hur ',' då ',' och ',' mig ',' dess ',' vi ' , 'har', 'sådana', 'bli', 'samma', 'era', 'vilket', 'av', 'dem', 'vars'} Список стоп-слов на турецком языке: {'de', 'veya ',' az ',' biri ',' defa ',' bazı ',' mı ',' mu ',' diye ',' hiç ',' gibi ','şey', 'bu', 'yani', 'aslında', 'hem', 'çünkü', 'neden', 'siz', 'ne', 'birkaç', 'nerde', 'biz', 'niye', 'ya', 'eğer', 'çok ',' белки ',' ее ',' ки ',' тюм ',' даха ',' нереде ',' исе ',' санки ',' иль ',' акаба ',' насыл ',' о ', 'şu', 'birşey', 've', 'hep', 'nereye', 'kim', 'kez', 'ama', 'hepsi', 'mü', 'niçin', 'en', 'da ',' için '} 

Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.

Предыдущий: Напишите программу Python NLTK, чтобы получить список общих стоп-слов на разных языках в Python.
Далее: Напишите программу Python NLTK для удаления стоп-слов из заданного текста.

Каков уровень сложности этого упражнения?

Новый контент: Composer: менеджер зависимостей для PHP , R программирования


script1adsense4code
script1adsense5code
disqus2code
script1adsense6code
script1adsense7code
script1adsense8code
buysellads2code