кодесурса
«Python

Pandas Practice Set-1: считывание алмаза DataFrame и обнаружение дублирующего цвета

script1adsense2code
script1adsense3code

Практика Панд Set-1: Упражнение 64 с решением

Напишите программу Pandas для чтения бриллиантов DataFrame и определения дублирующего цвета.

Примечание: функция duplicated () возвращает логическую серию, обозначающую дублирующиеся строки, опционально только с учетом определенных столбцов.

Пример решения :

Код Python:

import pandas as pd
diamonds = pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/diamonds.csv')
print("Original Dataframe:")
print(diamonds.shape)
print("\nCount the duplicate items:")
print(diamonds.clarity.duplicated().sum())

Пример вывода:

 Исходный кадр данных:
(53940, 10)
Подсчитайте дубликаты:
53932

Редактор кода Python:


Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.

Предыдущий: Напишите программу Pandas, чтобы получить образец 75% строк в DataFrame с бриллиантами без замены и сохранить оставшиеся 25% строк в другом DataFrame.
Далее: Напишите программу Pandas для подсчета повторяющихся строк алмазов в DataFrame.

Каков уровень сложности этого упражнения?

Новый контент: Composer: менеджер зависимостей для PHP , R программирования


script1adsense4code
script1adsense5code
disqus2code
script1adsense6code
script1adsense7code
script1adsense8code
buysellads2code