기본 라이브러리 import
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
plt.rcParams['font.family'] = 'Malgun Gothic'
1. 데이터 불러오기
df = pd.read_csv('./data/도로교통공단_시군구별 월별 교통사고 통계_20211231.csv',encoding='cp949')
encoding의 경우에 cp949 외에도 euc-kr, utf-8을 쓰기도 한다.
2. 데이터 내용 미리보기: head(), tail()
헤더 제외 5줄을 보여준다.
df.head()
df.head() # 기본 5줄
df.head(10) # 10줄 보여줌. 0~9까지
df.tail()
df.tail()
3. 행,열 확인
df.shape
4. 데이터 타입 확인
df.info()
5. 기초통계량 파악
# 수치형에 대해서만 기초통계량 계산해줌
df.describe()
6. 데이터 개수 세기
df.count()
7. 결측치 확인
# NA 확인
df.isna().sum()
8. 컬럼명 확인
# 컬럼명
df.columns
9.
10.
수정중
'Python' 카테고리의 다른 글
[Python] tqdm (0) | 2022.11.28 |
---|---|
[Python] Groupby로 묶은 df 다시 되돌리기 (0) | 2022.11.22 |
[Python] 판다스 pandas 열 이름 변경 (0) | 2022.10.31 |
[Python] pie chart (0) | 2022.10.25 |
[Python] Colab seaborn 한글 인코딩 깨짐 (0) | 2022.07.04 |