일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 기흥반려견놀이터
- 용인중앙시장
- 10월와인장터
- 별빛마당
- 이마트와인
- 용인중앙시장야시장
- 반려견놀이터
- 생와사비
- 와인장터
- 강아지간식
- gs25
- 와인특가
- 초밥
- 10월장터
- mysql1267
- 와인초특가
- 와사비
- 스시
- 용인강아지놀이터
- gs25맵탱
- 주비푸드
- 고추냉이
- 이마트와인장터
- 이마트
- 자연에서갈아만든생와사비
- 샘표계란이맛있어지는간장
- 삼양맵탱
- 와인할인
- 10월와인
- 용인야시장
- Today
- Total
기억의 기록
[전처리] 엑셀에서 병합된 셀 처리하기 본문
pandas 를 이용하지 않고 파이썬으로 데이터를 전처리를 하고 최종 데이터를 가지고 분석 할 수 있게 준비합니다.
pandas 의 멀티 인덱스를 이용할 수도 있으나 파이선 자체적으로 해결하려 할때 사용하면 됩니다.
이럴경우 멀티 인덱스를 사용하지 않고 그냥 쌩으로 처리하고 싶다면.
load_workbook 을 이용해서 불러오고 Workbook 으로 새로운 파일을 저장해서 사용하면 됩니다.
from openpyxl import load_workbook from openpyxl import Workbook wb = load_workbook() ws = wb[] wb_new = Workbook() ws_new = wb_new.active index_cnt = 0 before_sido = '' for i in ws: if index_cnt > 0:
sido = i[0].value if sido: before_sido = sido else: sido = before_sido
ws_new.cell(column=1, row=index_cnt, value=sido) ws_new.cell(column=2, row=index_cnt, value=i[2].value) ws_new.cell(column=3, row=index_cnt, value=i[3].value) ws_new.cell(column=4, row=index_cnt, value=i[4].value) index_cnt = index_cnt + 1
wb_new.save('sample.xlsx') |
저런경우가 아닌 nan_value keep_default_na 로 처리하지 않고 복잡한 초기값이 필요하다면 사용할 수 있습니다.
'데이터 분석 > 데이터 수집' 카테고리의 다른 글
[API] Google Map API 설정 (0) | 2018.07.06 |
---|