기억의 기록

[전처리] 엑셀에서 병합된 셀 처리하기 본문

데이터 분석/데이터 수집

[전처리] 엑셀에서 병합된 셀 처리하기

nethunter 2018. 7. 4. 18:35
반응형

pandas 를 이용하지 않고 파이썬으로 데이터를 전처리를 하고 최종 데이터를 가지고 분석 할 수 있게 준비합니다.


pandas 의 멀티 인덱스를 이용할 수도 있으나 파이선 자체적으로 해결하려 할때 사용하면 됩니다. 



이럴경우 멀티 인덱스를 사용하지 않고 그냥 쌩으로 처리하고 싶다면.


load_workbook 을 이용해서 불러오고 Workbook 으로 새로운 파일을 저장해서 사용하면 됩니다. 


from openpyxl import load_workbook

from openpyxl import Workbook


wb = load_workbook()

ws = wb[]


wb_new = Workbook()

ws_new = wb_new.active


index_cnt = 0   

before_sido = ''


for i in ws:

    if index_cnt > 0:  

        

        sido = i[0].value


        if sido:

            before_sido = sido

        else:

            sido = before_sido

            

        ws_new.cell(column=1, row=index_cnt, value=sido)

        ws_new.cell(column=2, row=index_cnt, value=i[2].value)

        ws_new.cell(column=3, row=index_cnt, value=i[3].value)

        ws_new.cell(column=4, row=index_cnt, value=i[4].value)

    index_cnt = index_cnt + 1

    


wb_new.save('sample.xlsx')  


저런경우가 아닌 nan_value  keep_default_na 로 처리하지 않고 복잡한 초기값이 필요하다면 사용할 수 있습니다.



 

반응형

'데이터 분석 > 데이터 수집' 카테고리의 다른 글

[API] Google Map API 설정  (0) 2018.07.06