seaborn은 matplotlib로 바로 그린 그래프보다 가독성이 좋고, 폭 넓은 커스터마이징이 가능해서 애용하는 시각화 라이브러리다. set_theme()를 통해 배경, 폰트와 같은 기본 설정을 할 수 있고, set_palette()를 통해 그래프 컬러 조합을 선택할 수 있다.
seaborn palette 예시
# 시각화 환경 세팅
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
sns.set_theme(style='whitegrid', font_scale=1.5)
sns.set_palette('Set2', n_colors=10)
plt.rc('font', family='malgun gothic')
plt.rc('axes', unicode_minus=False)
df = pd.read_pickle('data/03_seoul_accident_full.pkl')
df.head()
사고번호 사고년도 사고월 사고일 사고시각 사고요일 시군구_대범주 시군구_소범주 사고내용 사망자수 ... 피해운전자차종 피해운전자남성여부 피해운전자연령 피해운전자상해정도 주말여부 대형사고여부 고속국도사고여부 음주사고여부 무면허사고여부 뺑소니사고여부
0 A2019010100100001 2019 1 1 0.000000 1 강서구 강서구 방화동 경상사고 0 ... 보행자 True 40 경상 False 0.0 0.0 0.0 0.0 0.0
1 A2019010100100002 2019 1 1 0.000000 1 구로구 구로구 고척동 경상사고 0 ... 승용 True 71 경상 False 0.0 0.0 0.0 0.0 0.0
2 A2019010100100003 2019 1 1 0.000000 1 서초구 서초구 서초동 경상사고 0 ... 화물 True 51 경상 False 0.0 0.0 0.0 0.0 0.0
3 A2019010100100019 2019 1 1 0.041667 1 중구 중구 회현동2가 경상사고 0 ... 승용 True 62 경상 False 0.0 0.0 0.0 0.0 0.0
4 A2019010100100020 2019 1 1 0.041667 1 성동구 성동구 행당동 경상사고 0 ... 보행자 True 32 경상 False 0.0 0.0 0.0 0.0 0.0
Countplot()
countplot()은 기본적으로 bar 그래프의 형태를 띄고 있으며, 범주형 변수의 count 수를 표기하기 위해 사용한다. 그렇기 때문에 인자로 주는 x축의 기준이 되는 컬럼은 범주형 변수를 지정해주어야하며, y축은 자동으로 count가 지정된다.
plt.figure(figsize=(15,10))
sns.countplot(x='사고내용', data=df);
hue 값에 다른 범주형 변수를 추가해주면 hue 값에 선언된 컬럼을 기준으로 세분화된 그래프를 그려준다.
plt.figure(figsize=(15,10))
sns.countplot(x='뺑소니사고여부', data=df, hue='가해운전자남성여부');
'빅데이터분석👨💻' 카테고리의 다른 글
[Python] 분포 확인 그래프 (1) - displot() (1) | 2023.12.28 |
---|---|
[Python] 수치형 변수의 시각화 - Barplot() (1) | 2023.12.27 |
[Python] 빅데이터분석 시각화 - 그래프 그리기 (Matplotlib 활용) (2) | 2023.12.21 |
[Python] 빅데이터분석 시각화 - 그래프 그리기 (Matplotlib) (0) | 2023.12.20 |
[Python] 빅데이터 분석 기초 - 객체 병합 함수 (concat, join, merge) (0) | 2023.12.18 |