본문 바로가기
데이터분석/공공데이터를 활용한 데이터분석

(완강 후 정리2 Group by) 공공데이터를 활용한 데이터분석 포트폴리오 만들기[데이터분석]_메타코드 강의 후기

by 해봄544 2024. 6. 2.

Group by 실행하기

 

1. 발생장소_구 별로 gruopby하여 확인

2. 이중 그룹화

 

더보기

dataFrame 을 통해 정돈된 출력물을 보고 싶다면

df_double에 다시 한번 저장하여 출력

 

 


index
각 행을 고유하게 식별, 접근
주민등록번호와 같이 중복된 번호가 없어야 함

1. reset_index()

인덱스를 열로 변환해주는 작업

df_double과 같이 groupby를 해주면 인덱스를 통한 작업이 번거로워지기 때문에 

reset 함수를 사용해준다.

 reset 이전

발생장소_시 와 발생장소_구 = 인덱스
번호 = 인덱스

reset 이후

발생장소_시, 발생장소_구, 번호를 컬럼으로 가지고
0 ~ 262번까지의 인덱스를 가지게 됨

더보기

rename 컬럼 이름 변경

df = df.rename(cloums={'번호': '사고발생건수'})


Pivot_table()

데이터 프레임의 열을 행 인덱스, 열 인덱스 그리고 데이터 값으로 "재구성" 테이블 형태의 데이터를 만들어줌

피벗테이블은 데이터를 행과 열을 기준으로 그룹화 한것과 똑같은 결과를 출력할 수 있다.

index =[ '행 인덱스로 사용할 열'], addfuc=

aggfunc
각 그룹에 대해 적용할 집계 함수를 지정해주는 파라미터