NLTK корпус: распечатайте первые 15 случайных сочетаний, помеченных мужскими и женскими именами из имен корпусов
NLTK корпус: упражнение-12 с решением
Напишите программу Python NLTK для печати первых 15 случайных сочетаний с именами мужских и женских имен из корпуса имен.
Пример решения :
Код Python:
from nltk.corpus import names
import random
male_names = names.words('male.txt')
female_names = names.words('female.txt')
labeled_male_names = [(str(name), 'male') for name in male_names]
labeled_female_names = [(str(name), 'female') for name in female_names]
# combine labeled male and labeled female names
labeled_all_names = labeled_male_names + labeled_female_names
# shuffle the labeled names array
random.shuffle(labeled_all_names)
print("First 15 random labeled combined names:")
print (labeled_all_names[:15])
Пример вывода:
Первые 15 случайно помеченных комбинированных имен: [(«Эринна», «женщина»), («Рикка», «женщина»), («Линделл», «женщина»), («Кларетта», «женщина»), («Эсмеральда», «женщина») , ('Куинн', 'мужчина'), ('Патриция', 'женщина'), ('Стэнли', 'мужчина'), ('Кэндис', 'женщина'), ('Блэр', 'мужчина') , («Любовь», «женщина»), («Руди», «мужчина»), («Ринальдо», «мужчина»), («Винни», «мужчина»), («Агги», «женщина») ]
Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.
Предыдущий: Напишите программу Python NLTK, чтобы найти количество мужских и женских имен в корпусе имен. Напечатайте первые 10 мужских и женских имен.
Далее: Напишите программу Python NLTK, чтобы извлечь последнюю букву из всех помеченных имен и создать новый массив с последней буквой каждого имени и соответствующей меткой.
Каков уровень сложности этого упражнения?
Новый контент: Composer: менеджер зависимостей для PHP , R программирования
disqus2code