인사이트마이닝

[파이썬(Python)]

pivot_table() 함수를 이용한 집단별 기술통계량

# 패키지 로딩하기

import numpy as np

import pandas as pd

# 분석 데이터 읽어오기

diamonds = pd.read_excel(io = "d:/customs/diamonds.xlsx",
sheet_name = 0,
header = 0)

# 범주형 자료 : cut, color, clarity

# 수치형 자료 : carat, depth, table, price, x, y, z

# 판다스(panas)에서 제공하는 pivot_table() 함수의 사용법

# pd.pivot_table(data = ,
# values = "기술통계량을 구하고 싶은 수치형 자료",

# index = "행에 들어갈 범주형 자료",

# columns = "열에 들어갈 범주형 자료",
# aggfunc = {기술통계량을 위한 함수명})

# cut별 carat에 대한 데이터의 개수, 평균, 표준편차 구하기

pd.pivot_table(data = diamonds,

values = "carat",

index = "cut",

aggfunc = {len, np.mean, np.std})

#파이썬

#집단별기술통계량

#pandas

#pivot_table()

Comment 0

접기 펼치기

(주)인사이트 마이닝