Python
[Seaborn] legend 위치 옮기기
seaborn.move_legend 사용하기 https://seaborn.pydata.org/generated/seaborn.move_legend.html seaborn.move_legend — seaborn 0.12.2 documentation seaborn.move_legend seaborn.move_legend(obj, loc, **kwargs) Recreate a plot’s legend at a new location. The name is a slight misnomer. Matplotlib legends do not expose public control over their position parameters. So this function creates a new legend, seabor..
공공데이터포털 Open API를 JSON으로 불러오기
공공데이터를 분석하다보면 csv형식으로 제공되지 않는 데이터가 많다. API로 제공되는 데이터는 따로 파싱해주어야 하는데 매번 쓰면서도 정리를 안 해둬서 이번 기회에 정리하기로 했다. 한번 배워두면 다른 곳에도 응용이 가능해서 유용하다 목표는 파이썬을 활용해서 공공데이터 포털의 Open API를 신청하고 데이터를 가져오는 실습을 진행하고 불러온 데이터는 pandas를 이용해서 데이터프레임으로 바꿔서 CSV파일로 만들기! 실습 데이터 https://www.data.go.kr/tcs/dss/selectApiDataDetailView.do?publicDataPk=15056633 환경부 국립환경과학원_생활계 물사용량 정보제공서비스 매년 전국 광역지자체(17개). 기초지자체(230개)에서 제출한 자료를 바탕으로 ..
OSMnx 설치하기
우선 Geopandas는 설치되어있는 상태였어서 에러는 안났다. 설치하기 - 공식 문서 https://osmnx.readthedocs.io/en/stable/ OSMnx 1.2.3 — OSMnx 1.2.3 documentation OSMnx 1.2.3 OSMnx is a Python package that lets you download geospatial data from OpenStreetMap and model, project, visualize, and analyze real-world street networks and any other geospatial geometries. You can download and model walkable, drivable, or bik osmnx.readth..
[Geopandas] 기초 시각화, geojson 사용하기
파이썬으로 지오코딩을 해서 QGIS 에서 시각화 할 일이 많은데 파이썬으로는 안해본것 같다. 그러고 분석 공모전을 가끔 보면 파이썬만 사용해야 하는 경우가 있다. 그래서 정리하는 geopandas 사용방법 정확히는,, geopandas를 이용해서 csv파일에 존재하는 위경도의 좌표계를 변환하고 geojson 위에(shp데이터 역할) csv로 받은 데이터를 나타내는 방법(위경도 존재해야 함!) -> csv파일에 위경도가 없을 경우, 카카오 api나 구글 api를 써서 geocoding으로 위경도를 얻어야 한다. 사용 데이터셋 1. 전국 시군구 경계 geojson 파일 https://github.com/vuski/admdongkor 2. 서울시 마포구 (안심이) CCTV 설치 현황 http://data.se..
[Python] tqdm
파이썬 진행률 프로세스바 from tqdm import tqdm from tqdm import notebook # 주피터노트북 전용 - range 등 tqdm()으로 요소들을 감싸서 사용가능
[Python] Groupby로 묶은 df 다시 되돌리기
파이썬에서 groupby를 자주 사용하곤 하는데 groupby로 묶은 df는 groupby('대상') 대상 값이 index로 변경된다 df1 = df.groupby('시군구') df1 = df.reset_index() 하면 원래대로 돌아온다.
Pandas 기초 EDA
기본 라이브러리 import import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns plt.rcParams['font.family'] = 'Malgun Gothic' 1. 데이터 불러오기 df = pd.read_csv('./data/도로교통공단_시군구별 월별 교통사고 통계_20211231.csv',encoding='cp949') encoding의 경우에 cp949 외에도 euc-kr, utf-8을 쓰기도 한다. 2. 데이터 내용 미리보기: head(), tail() 헤더 제외 5줄을 보여준다. df.head() df.head() # 기본 5줄 df.head(10..
[Python] 판다스 pandas 열 이름 변경
- 데이터프레임의 열 이름 확인 df.columns 1. 리스트를 사용하는 방법 - 반드시 모든 열 수만큼 리스트 객체를 만들어 줘야 한다 2. 딕셔너리를 이용하는 방법 - 열 수만큼 만들어줄 필요 없음 # 전체 변경 시 df.columns = ['열이름','열이름','열이름'] # 하나씩 변경 시 # inplace : 기존 객체에 적용 df.columns ={'열':'변경','열':'변경','열':'변경', inplace=True} # 혹은 df = df.columns ={'열':'변경','열':'변경','열':'변경'}
[Python] pie chart
colors : 색상 지정 textprops : 폰트 옵션 지정 startangle: 각도 조절(그래프가 얼만큼 돈 상태에서 시작하는지 여부) shadow: 그림자 여부 autopct: 파이 조각별로 값 표시 #labels = df15['지역구분'].value_counts().index.tolist() ratio = df15['지역구분'].value_counts().values.tolist() explode = [0, 0.05, 0, 0.2, 0.7, 0.4] colors = ['#ff9999','#66b3ff','#99ff99','#ffcc99','#f5316c','#ffb8f9'] plt.pie(ratio, explode=explode, autopct='%1.2f%%', shadow=False, te..
[Python] Colab seaborn 한글 인코딩 깨짐
!sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf plt.rc('font', family='NanumBarunGothic')