NLTK корпус: извлечь последнюю букву из всех помеченных имен и создать новый массив с последней буквой каждого имени
NLTK корпус: упражнение 13 с решением
Напишите программу Python NLTK, чтобы извлечь последнюю букву из всех помеченных имен и создать новый массив с последней буквой каждого имени и соответствующей меткой.
Пример решения :
Код Python:
from nltk.corpus import names
import random
male_names = names.words('male.txt')
female_names = names.words('female.txt')
labeled_male_names = [(str(name), 'male') for name in male_names]
labeled_female_names = [(str(name), 'female') for name in female_names]
# combine labeled male and labeled female names
all_labeled_names = labeled_male_names + labeled_female_names
feature_set = [(name[-1], gender) for (name, gender) in all_labeled_names]
print("\nFirst 15 labeled names:")
print((all_labeled_names[:15]))
print("\nLast letter of all the labeled names with the associated label:")
print((feature_set[:15]))
Пример вывода:
Первые 15 названных имен: [(«Аамир», «мужчина»), («Аарон», «мужчина»), («Аббатство», «мужчина»), («Абби», «мужчина»), («Аббат», «мужчина») , («Эбботт», «мужчина»), («Эбби», «мужчина»), («Абдель», «мужчина»), («Абдул», «мужчина»), («Абдулкарим», «мужчина») , («Абдулла», «мужчина»), («Абэ», «мужчина»), («Авель», «мужчина»), («Абеляр», «мужчина»), («Абнер», «мужчина») ] Последняя буква всех помеченных имен со связанной меткой: [('r', 'male'), ('n', 'male'), ('y', 'male'), ('e', 'male'), ('t', 'male') , ('t', 'male'), ('y', 'male'), ('l', 'male'), ('l', 'male'), ('m', 'male') , («h», «мужчина»), («e», «мужчина»), («l», «мужчина»), («d», «мужчина»), («r», «мужчина») ]
Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.
Каков уровень сложности этого упражнения?
Новый контент: Composer: менеджер зависимостей для PHP , R программирования
disqus2code