База данных персонала Pandas: отображение идентификатора тех сотрудников, которые выполняли две или более работы в прошлом
Запросы к базе данных Pandas HR: упражнение 21 с решением
Напишите программу Pandas для отображения идентификатора тех сотрудников, которые выполняли две или более работы в прошлом.
Пример решения :
Код Python:
import pandas as pd
employees = pd.read_csv(r"EMPLOYEES.csv")
departments = pd.read_csv(r"DEPARTMENTS.csv")
job_history = pd.read_csv(r"JOB_HISTORY.csv")
jobs = pd.read_csv(r"JOBS.csv")
countries = pd.read_csv(r"COUNTRIES.csv")
regions = pd.read_csv(r"REGIONS.csv")
locations = pd.read_csv(r"LOCATIONS.csv")
result = job_history.groupby(['employee_id'])
print(result.filter(lambda x: len(x) > 1).groupby('employee_id').size().sort_values(ascending=False))
Пример вывода:
employee_id 200 2 176 2 101 2 dtype: int64
Эквивалентный синтаксис SQL:
SELECT employee_id FROM job_history GROUP BY employee_id СЧЕТЧИК (*)> = 2;
Нажмите, чтобы просмотреть таблицу, содержащую:
Редактор кода Python:
Структура базы данных персонала :
Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.
Предыдущий: Напишите программу Pandas для отображения имени, идентификатора работы, зарплаты и отдела для тех сотрудников, которые не работают в отделах 50, 30 и 80.
Далее: Напишите программу Pandas для расчета минимальной, максимальной и средней зарплаты из файла сотрудников.
Каков уровень сложности этого упражнения?
Новый контент: Composer: менеджер зависимостей для PHP , R программирования