[파이썬(Python)]
pivot_table() 함수를 이용한 집단별 기술통계량
- 2021-10-29 의견나누기 0
# 패키지 로딩하기
import numpy as np
import pandas as pd
# 분석 데이터 읽어오기
diamonds = pd.read_excel(io = "d:/customs/diamonds.xlsx",
sheet_name = 0,
header = 0)
# 범주형 자료 : cut, color, clarity
# 수치형 자료 : carat, depth, table, price, x, y, z
# 판다스(panas)에서 제공하는 pivot_table() 함수의 사용법
# pd.pivot_table(data = ,
# values = "기술통계량을 구하고 싶은 수치형 자료",
# index = "행에 들어갈 범주형 자료",
# columns = "열에 들어갈 범주형 자료",
# aggfunc = {기술통계량을 위한 함수명})
# cut별 carat에 대한 데이터의 개수, 평균, 표준편차 구하기
pd.pivot_table(data = diamonds,
values = "carat",
index = "cut",
aggfunc = {len, np.mean, np.std})
#파이썬
#집단별기술통계량
#pandas
#pivot_table()
Comment 0