두부너겟
두부너겟 저장소
두부너겟
전체 방문자
오늘
어제
  • 분류 전체보기 (43)
    • 일상 (3)
      • 취준 (3)
    • 통계학 (1)
    • 삽질기록 (3)
    • Python (10)
      • Pandas (0)
    • SQL (3)
      • HackerRank (2)
    • Cloud (3)
      • AWS (3)
    • Algorithm (11)
      • 이코테 (1)
      • 백준 (0)
      • 프로그래머스 (10)
    • Qgis (7)
    • JAVA (0)
      • Spring (0)
    • 책 (0)
      • 파이썬 라이브러리를 활용한 머신러닝 (0)
    • Web (0)
    • 네트워크 (0)
    • R (1)
    • 기타 (1)
    • k8s (0)
      • 따배쿠 (0)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 공공데이터포털
  • 공공데이터API
  • AWS SAA
  • HSK IBT
  • pie chart
  • Groupby
  • python
  • HSK
  • tqdm
  • HSK4급
  • OSMnx
  • Python pie chart
  • QGIS
  • hackerrank
  • pandas
  • 시각화
  • AWS #aws #Datasync #storageGateway
  • 기초통계
  • jupyter lab 아이콘 에러
  • 통계학

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
두부너겟

두부너겟 저장소

Pandas 기초 EDA
Python

Pandas 기초 EDA

2022. 11. 14. 21:02

기본 라이브러리 import

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

import seaborn as sns
plt.rcParams['font.family'] = 'Malgun Gothic'

 

 

1. 데이터 불러오기

df = pd.read_csv('./data/도로교통공단_시군구별 월별 교통사고 통계_20211231.csv',encoding='cp949')

encoding의 경우에 cp949 외에도 euc-kr, utf-8을 쓰기도 한다.

 

 

2. 데이터 내용 미리보기: head(), tail()

헤더 제외 5줄을 보여준다.

 

df.head()

df.head() # 기본 5줄
df.head(10) # 10줄 보여줌. 0~9까지

 

 

df.tail()

df.tail()

3. 행,열 확인

df.shape

4. 데이터 타입 확인

df.info()

 

5. 기초통계량 파악

# 수치형에 대해서만 기초통계량 계산해줌
df.describe()

 

6. 데이터 개수 세기

df.count()

 

 

7. 결측치 확인

# NA 확인
df.isna().sum()

 

8. 컬럼명 확인

# 컬럼명
df.columns

9.

10.

 

수정중

'Python' 카테고리의 다른 글

[Python] tqdm  (0) 2022.11.28
[Python] Groupby로 묶은 df 다시 되돌리기  (0) 2022.11.22
[Python] 판다스 pandas 열 이름 변경  (0) 2022.10.31
[Python] pie chart  (0) 2022.10.25
[Python] Colab seaborn 한글 인코딩 깨짐  (0) 2022.07.04
    'Python' 카테고리의 다른 글
    • [Python] tqdm
    • [Python] Groupby로 묶은 df 다시 되돌리기
    • [Python] 판다스 pandas 열 이름 변경
    • [Python] pie chart
    두부너겟
    두부너겟

    티스토리툴바