NLTK корпус: извлечь последнюю букву из всех помеченных имен и создать новый массив с последней буквой каждого имени

Последнее обновление 29 июня 2019 10:46:33 (UTC / GMT +8 часов)

script1adsense2code

script1adsense3code

NLTK корпус: упражнение 13 с решением

Напишите программу Python NLTK, чтобы извлечь последнюю букву из всех помеченных имен и создать новый массив с последней буквой каждого имени и соответствующей меткой.

Пример решения :

Код Python:

from nltk.corpus import names 
import random  
male_names = names.words('male.txt')
female_names = names.words('female.txt') 
labeled_male_names = [(str(name), 'male') for name in male_names]
labeled_female_names = [(str(name), 'female') for name in female_names]
# combine labeled male and labeled female names
all_labeled_names = labeled_male_names + labeled_female_names 
feature_set = [(name[-1], gender) for (name, gender) in all_labeled_names]
print("\nFirst 15 labeled names:") 
print((all_labeled_names[:15]))
print("\nLast letter of all the labeled names with the associated label:")
print((feature_set[:15]))

Пример вывода:

 Первые 15 названных имен:
[(«Аамир», «мужчина»), («Аарон», «мужчина»), («Аббатство», «мужчина»), («Абби», «мужчина»), («Аббат», «мужчина») , («Эбботт», «мужчина»), («Эбби», «мужчина»), («Абдель», «мужчина»), («Абдул», «мужчина»), («Абдулкарим», «мужчина») , («Абдулла», «мужчина»), («Абэ», «мужчина»), («Авель», «мужчина»), («Абеляр», «мужчина»), («Абнер», «мужчина») ]
Последняя буква всех помеченных имен со связанной меткой:
[('r', 'male'), ('n', 'male'), ('y', 'male'), ('e', 'male'), ('t', 'male') , ('t', 'male'), ('y', 'male'), ('l', 'male'), ('l', 'male'), ('m', 'male') , («h», «мужчина»), («e», «мужчина»), («l», «мужчина»), («d», «мужчина»), («r», «мужчина») ]

Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.

Предыдущий: Напишите программу Python NLTK для печати первых 15 случайных сочетаний имен мужских и женских имен из корпуса имен.