본문 바로가기

데이터분석/공공데이터를 활용한 데이터분석8

(완강 후 정리3 시각화) 공공데이터를 활용한 데이터분석 포트폴리오 만들기[데이터분석]_메타코드 강의 후기 데이터 시각화matplotlib : 파이선에서 가장 기본으로 사용되는 라이브러리seaborn : matplotlib  기반으로 한 심화버전 간단하고, 직관적, 통계적, 시각화에 특화됨1. 막대그래프sns.barplotx축으로 지정한 카테고리 별로 y축 숫자값을 막대그래프로 출력 까만 선은 95% 신뢰구간을 나타냄신뢰할 수 있는 평균값을 시각적으로 확인 함으로써 데이터의 변동성, 불확실성 확인 1) 그래프 크기 조정 figure(figsize=(가로,세로)hue('발생장소_시') >> 발생장소_시 별로 각기 다른 색상의 그래프 표 더보기3. 범례 박스(legend) 없애기ax.legend.remove()4. 폰트 줄이기ax.legand(fontsize='xx-small')  2. 라인 그래프lineplot.. 2024. 6. 7.
(완강 후 정리2 Group by) 공공데이터를 활용한 데이터분석 포트폴리오 만들기[데이터분석]_메타코드 강의 후기 Group by 실행하기 1. 발생장소_구 별로 gruopby하여 확인2. 이중 그룹화 더보기dataFrame 을 통해 정돈된 출력물을 보고 싶다면df_double에 다시 한번 저장하여 출력  index각 행을 고유하게 식별, 접근주민등록번호와 같이 중복된 번호가 없어야 함1. reset_index()인덱스를 열로 변환해주는 작업df_double과 같이 groupby를 해주면 인덱스를 통한 작업이 번거로워지기 때문에 reset 함수를 사용해준다. reset 이전발생장소_시 와 발생장소_구 = 인덱스번호 = 인덱스reset 이후발생장소_시, 발생장소_구, 번호를 컬럼으로 가지고0 ~ 262번까지의 인덱스를 가지게 됨더보기rename 컬럼 이름 변경df = df.rename(cloums={'번호': '사고발.. 2024. 6. 2.
(완강 후 정리) 공공데이터를 활용한 데이터분석 포트폴리오 만들기[데이터분석]_메타코드 강의 후기 라이브러리란? 다양한 기능과 도구를 모아둔 코드의 집합.이미 실력자들이 코딩에 도움이 되는 함수 모듈등을 많이 만들어둠# 그중 데이터조작, 분석을 위한 pandas 사용 표 형식의 데이터를 다루는데 효과적웹개발시엔 numpy, flaks,django 사용하며 상황에 맞는 라이브러리를 사용하면 좋음pandas에서 다루는 데이터 > DataFrame(자료 구조중 하나 엑셀에서 흔히 보는 데이터를 의미)1. 라이브러리 설치 !pip install pandas2.라이브러리 가져오기 (import)import pandas as pd특정 함수나 클래스만 가져오고 싶을from module_name import function_name, class_name3. csv파일 불러오기df = pd.read_csv('경로').. 2024. 6. 2.
공공데이터를 활용한 데이터분석 포트폴리오 만들기[데이터분석]_메타코드 강의 후기 5강 5강에서는 본격적인 시각화를 배웁니다.matplotlib는 다양한 종류의 그래프를 그릴 수 있고 모양, 스타일도 자세하게 조정이 가능하여 간단하게 그래프를 그릴때 주로 사용이 됩니다.seaborn은 matplotlib의 심화버전으로 좀 더 간단하고 직관적이고 통계적 시각화에 특화 되어있습니다. pip install matplotib seaborn 을 이용하여 손 쉽게 설치 가능합니다. 1셀에 모든 라이브러리를 기재해 두면 그 부분만 봐도 프로젝트에서 무엇을 했는지 짐작이 가기 때문에 1셀에 적어두는것이 좋습니다!또한 한글은 그냥 사용하면 깨지기 때문에 mac은 applegothic , 윈도우는 맑은 고딕으로 폰트를 변경해 주어야 합니다.barplot 함수를 이용하여 막대그래프를 나타낼 수 있습니다. da.. 2024. 5. 28.