кодесурса
«Python

NLTK корпус: найдите количество мужских и женских имен в корпусе имен

script1adsense2code
script1adsense3code

NLTK корпус: упражнение-11 с решением

Напишите программу Python NLTK, чтобы найти количество мужских и женских имен в корпусе имен. Напечатайте первые 10 мужских и женских имен.

Примечание. Корпус имен содержит в общей сложности около 2943 мужских (male.txt) и 5001 женских (female.txt) имен. Это составлено Kantrowitz, Росс.

Пример решения :

Код Python:

from nltk.corpus import names 
print("\nNumber of male names:")
print (len(names.words('male.txt')))
print("\nNumber of female names:")
print (len(names.words('female.txt')))
male_names = names.words('male.txt')
female_names = names.words('female.txt')
print("\nFirst 10 male names:")
print (male_names[0:15])
print("\nFirst 10 female names:")
print (female_names[0:15])

Пример вывода:

 Количество мужских имен:
2943
Количество женских имен:
5001
Первые 10 мужских имен:
[«Аамир», «Аарон», «Аббатство», «Аббатство», «Аббат», «Аббот», «Абби», «Абдель», «Абдул», «Абдулкарим», «Абдулла», «Абэ», « Абель ',' Абеляр ',' Абнер ']
Первые 10 женских имен:
['Abagael', 'Abagail', 'Abbe', 'Abbey', 'Abbi', 'Abbie', 'Abby', 'Abigael', 'Abigail', 'Abigale', 'Abra', 'Acacia', ' Ада, Ада, Адалин

Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.

Предыдущий: Напишите программу Python NLTK, чтобы сравнить сходство двух данных глаголов.
Далее: Напишите программу Python NLTK для печати первых 15 случайных сочетаний имен мужских и женских имен из корпуса имен.

Каков уровень сложности этого упражнения?

Новый контент: Composer: менеджер зависимостей для PHP , R программирования


script1adsense4code
script1adsense5code
disqus2code
script1adsense6code
script1adsense7code
script1adsense8code
buysellads2code