NLTK корпус: найдите количество мужских и женских имен в корпусе имен
NLTK корпус: упражнение-11 с решением
Напишите программу Python NLTK, чтобы найти количество мужских и женских имен в корпусе имен. Напечатайте первые 10 мужских и женских имен.
Примечание. Корпус имен содержит в общей сложности около 2943 мужских (male.txt) и 5001 женских (female.txt) имен. Это составлено Kantrowitz, Росс.
Пример решения :
Код Python:
from nltk.corpus import names
print("\nNumber of male names:")
print (len(names.words('male.txt')))
print("\nNumber of female names:")
print (len(names.words('female.txt')))
male_names = names.words('male.txt')
female_names = names.words('female.txt')
print("\nFirst 10 male names:")
print (male_names[0:15])
print("\nFirst 10 female names:")
print (female_names[0:15])
Пример вывода:
Количество мужских имен: 2943 Количество женских имен: 5001 Первые 10 мужских имен: [«Аамир», «Аарон», «Аббатство», «Аббатство», «Аббат», «Аббот», «Абби», «Абдель», «Абдул», «Абдулкарим», «Абдулла», «Абэ», « Абель ',' Абеляр ',' Абнер '] Первые 10 женских имен: ['Abagael', 'Abagail', 'Abbe', 'Abbey', 'Abbi', 'Abbie', 'Abby', 'Abigael', 'Abigail', 'Abigale', 'Abra', 'Acacia', ' Ада, Ада, Адалин
Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.
Предыдущий: Напишите программу Python NLTK, чтобы сравнить сходство двух данных глаголов.
Далее: Напишите программу Python NLTK для печати первых 15 случайных сочетаний имен мужских и женских имен из корпуса имен.
Каков уровень сложности этого упражнения?
Новый контент: Composer: менеджер зависимостей для PHP , R программирования