Панды: Создайте промежуточный итог «Рабочих часов» против идентификатора MSHA из данных Excel
Панды: Excel Exercise-9 с решением
Напишите программу Pandas для создания промежуточного итога «Рабочие часы» по идентификатору MSHA на основе данных Excel (coalpublic2013.xls). Перейти к данным Excel
Пример решения:
Код Python:
import pandas as pd
import numpy as np
df = pd.read_excel('E:\coalpublic2013.xlsx')
df_sub=df[["MSHA ID","Labor_Hours"]].groupby('MSHA ID').sum()
df_sub
Пример вывода:
Labor_Hours MSHA ID 100329 144002 100347 215295 100759 474784 100851 1001809 101247 1551141 101362 116914 101401 2464719 102901 1249811 102976 38021 102996 164093 103155 79990 103172 119542 103179 63745 103180 196963 103182 87314 103195 17411 103246 29193 103285 90584 103303 164388 103321 76366 103323 46381 103332 61394 103342 115123 103358 161805 103364 14324 103370 621 103372 32401 103375 1900 103376 176499 103380 14023 103381 22392 103389 84966 103404 28447 103410 158591 103419 107469 103422 140250 103423 9162 103432 220 103433 47195 103436 77190 103437 70926 103451 46393 103467 30539 201195 1015333 1519322 3108 5000030 286079
Данные Excel:
coalpublic2013.xlsx:
Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.
Предыдущий: Написать программу Pandas для импорта данных в формате Excel (coalpublic2013.xlsx) в кадр данных Pandas и отобразить последние десять строк.
Далее: Напишите программу Pandas для импорта данных в формате Excel (coalpublic2013.xls) в фрейм данных и найдите конкретный идентификатор MSHA.
Каков уровень сложности этого упражнения?
Новый контент: Composer: менеджер зависимостей для PHP , R программирования