본문 바로가기
데이터분석/공공데이터를 활용한 데이터분석

공공데이터를 활용한 데이터분석 포트폴리오 만들기[데이터분석]_메타코드 강의 후기 5강

by 해봄544 2024. 5. 28.

5강에서는 본격적인 시각화를 배웁니다.

matplotlib는 다양한 종류의 그래프를 그릴 수 있고 모양, 스타일도 자세하게 조정이 가능하여 간단하게 그래프를 그릴때 주로 사용이 됩니다.

seaborn은 matplotlib의 심화버전으로 좀 더 간단하고 직관적이고 통계적 시각화에 특화 되어있습니다.

 

pip install matplotib seaborn 

을 이용하여 손 쉽게 설치 가능합니다. 

1셀에 모든 라이브러리를 기재해 두면 그 부분만 봐도 프로젝트에서 무엇을 했는지 짐작이 가기 때문에 

1셀에 적어두는것이 좋습니다!

또한 한글은 그냥 사용하면 깨지기 때문에 mac은 applegothic , 윈도우는 맑은 고딕으로 폰트를 변경해 주어야 합니다.

barplot 함수를 이용하여 막대그래프를 나타낼 수 있습니다. 
data를 지정해준 후 x축과 y축의 컬럼을 지정해 주어야 합니다.

plt.figure을 통해 그래프의 사이즈를 결정하여 가독성을 높이고 hue 를 통해 색상을 변경 할 수 있습니다.


boxplot과 데이터 핸들링

데이터 출동일시, 신고일시를 이용하여 출동까지 소요되는 시간을 알아 볼 수 있습니다.

이 과정을 통해 데이터처리와 분석, 시각화가 어떻게 유기적으로 연결 되는지 확인할 수 있습니다.

1.출동일시에서 신고일시를 빼서 출동소요시간을 칼럼을 추가해 줍니다.
2. 단위를 초단위로 변경해주어 가독성을 높여줍니다.

좋은 데이터분석을 하기 위해선 위와 같이 잘못된 데이터를 잘처리하는 것이 중요합니다.

이번 강의에선 잘못된 데이터들을 삭제하고 넘어가지만 

데이터 하나하나가 귀중한 자원이기 때문에 현업에선 데이터를 최대한 살리고 고는 것을 지향 한다는 점을 알아야 합니다. 

평균과 표준편차를 구해준 뒤 기준을 잡고 이상치를 판단해 줍니다.

여기서 다시 한번 barplot을 사용해주면 그래프를 통해 구별 평균 소요시간을 한눈에 볼 수 있습니다.

 


강의에서 지도를 만드는 방법도 알려주시고 더 상세히 설명해주시

꼭 수강해보시는걸 추천합니다!!

https://mcode.co.kr/mypage/lecture_view?wm_id=19237&lecture_id=100&lecture_sub=512&lecture_num=5

 

메타코드M

빅데이터 , AI 강의 플랫폼 & IT 현직자 모임 플랫폼ㅣ메타코드 커뮤니티 일원이 되시기 바랍니다.

mcode.co.kr