Pandas Practice Set-1: считывание алмаза DataFrame и обнаружение дублирующего цвета
Практика Панд Set-1: Упражнение 64 с решением
Напишите программу Pandas для чтения бриллиантов DataFrame и определения дублирующего цвета.
Примечание: функция duplicated () возвращает логическую серию, обозначающую дублирующиеся строки, опционально только с учетом определенных столбцов.
Пример решения :
Код Python:
import pandas as pd
diamonds = pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/diamonds.csv')
print("Original Dataframe:")
print(diamonds.shape)
print("\nCount the duplicate items:")
print(diamonds.clarity.duplicated().sum())
Пример вывода:
Исходный кадр данных: (53940, 10) Подсчитайте дубликаты: 53932
Редактор кода Python:
Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.
Предыдущий: Напишите программу Pandas, чтобы получить образец 75% строк в DataFrame с бриллиантами без замены и сохранить оставшиеся 25% строк в другом DataFrame.
Далее: Напишите программу Pandas для подсчета повторяющихся строк алмазов в DataFrame.
Каков уровень сложности этого упражнения?
Новый контент: Composer: менеджер зависимостей для PHP , R программирования