일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 이마트와인장터
- 와인할인
- 강아지간식
- 삼양맵탱
- 자연에서갈아만든생와사비
- 용인중앙시장야시장
- 초밥
- 샘표계란이맛있어지는간장
- 용인중앙시장
- 와사비
- 와인특가
- mysql1267
- gs25맵탱
- 스시
- 별빛마당
- 주비푸드
- 10월장터
- gs25
- 이마트와인
- 용인야시장
- 와인장터
- 기흥반려견놀이터
- 고추냉이
- 10월와인
- 용인강아지놀이터
- 생와사비
- 반려견놀이터
- 와인초특가
- 10월와인장터
- 이마트
- Today
- Total
기억의 기록
파이썬 워드 클라우드 (python word cloud) 본문
파이썬을 이용하여 간단한 워드 클라우드 만들기
# 라이브러리를 호출합니다. import matplotlib.pyplot as plt from wordcloud import WordCloud, STOPWORDS %matplotlib inline # 텍스트를 넣습니다. # 아래 내용은 위키 백과사전 메인 페이지에서 복사했습니다. text = ''' 위키백과 설립자 지미 웨일스 위키백과 공동 창립자 래리 생어 이 부분의 본문은 위키백과의 역사입니다. 배경 위키백과 이전에도 온라인 백과사전을 운영하려는 여러 시도들이 있었으나 성공하지 못했다.[7] 위키백과 영어판은 전문가들이 작성했던 백과사전인 누피디아(지금은 없어짐)에서 비롯하였다.[3] 누피디아는 웹 포털 회사인 보미스가 2000년 3월 9일 개시하였다. 보미스의 CEO였던 지미 웨일스와 편집장 래리 생어는 누피디아의 글들을 오픈 콘텐츠로 제시하기로 하였고 리처드 스톨먼이 주도한 GNU 자유 문서 라이선스로 제공하였다.[8] 누피디아아는 그리 성공적이지 않았고, 지미 웨일스와 래리 생어는 누구나 참여할 수 있는 백과사전으로[9] 위키백과를 개설하였다.[10] 생어는 모두의 백과사전이라는 목표를 분명히 하기 위해 이름에 위키를 넣었다.[11] 2001년 1월 10일 생어는 누피디어 메일링 리스트를 통해 누피디어 프로젝트를 보완하기 위해 위키를 도입한다고 밝혔다.[12] 출범과 성장 위키백과는 2001년 1월 15일 서비스를 개시하였다. 도메인은 www.wikipedia.com을 사용하였고 사용 언어는 영어 하나뿐이었다.[13] 래리 생어는 위키백과의 출범 소식 역시 누피디어 메일링 리스트를 통하여 알렸다.[9] 위키백과가 시작된 지 한 달 안에 중립성 정책이 수립되었다.[14] 이후 몇 가지 정책이 수립되면서 위키백과는 누피디아와는 별개인 서비스가 되었다.[9] 애초에 보미스는 위키백과를 영리 목적으로 운영하려고 하였다.[15] 위키백과의 초기 편집자들은 누피디아, 슬래시닷, 그리고 웹 검색 엔진을 통해 유입되었다. 2001년 8월 8일 위키백과의 문서수는 약 8,000 개가 되었다.[16] 2001년 말이 되자 위키백과는 18개 언어판으로 늘었고, 문서 수는 2만여 개까지 늘어났다. 위키백과를 서비스 하는 언어는 2002년 말에는 26개, 2003년 말에는 46개, 2004년 말에는 161개로 늘어났다.[17] 누피디아는 위키백과와 병립하여 운영되다가 컨텐츠를 위키백과로 넘기고 2003년 서버를 다운시켜 마감하였다. 2002년 사용자 사이에서 위키백과의 광고 수주와 그에 따른 상업적 운용에 대한 우려가 커졌고, 이에 따라 스페인어 위키백과 사용자들은 위키백과 소스를 포크하여 별도의 위키백과인 엔시클로페디아 리브레(Enciclopedia Libre Universal en Español)를 개설하였다.[18] 이에 자극받은 지미 웨일스는 위키백과에 광고를 도입하지 않겠다고 선언하였고 도메인을 wikipedia.com에서 wikipedia.org로 변경하였다.[19] 영어 위키백과의 증대 속도는 2007년 초 정점을 찍었고, 2009년 8월 3백만 문서를 넘겼다.[20] 위키백과 전체의 문서수는 2006년 가장 빠르게 늘어 매일 약 1,800 개의 문서가 새로 생겨났다. 그 뒤로 문서 증가 속도는 둔화되어 2013년의 경우 연평균으로 보았을 때 매일 약 800개의 문서가 새로 생겨났다.[21] 위키백과의 성장 둔화 원인에 대해 팰로앨토 연구소는 프로젝트의 품질이 고급화 되면서 변화에 대한 저항이 있다고 분석한 바 있다.[22] 성장 둔화에 대한 다른 분석으로는 "낮은 가지에 달린 열매"처럼 주제나 가치가 분명하여 쉽게 만들 수 있는 문서는 이미 다 만들어졌기 때문이라는 설명이 있다.[23][24][25] 2009년 11월 스페인 마드리드의 후안 카를로스 국왕 대학교의 연구자는 2009년 1분기 동안 영어 위키백과가 49,000 여명의 기여자를 잃었다는 분석을 내놓았다. 2008년의 같은 기간에 줄어든 기여자 수가 4,900 여명이었던 것에 비해 열 배나 더 많은 수치였다.[26][27] 《월스트리트 저널》은 까다로워진 편집 지침의 증가가 이러한 경향을 이끌었다고 보도하였다.[28] 지미 웨일스는 이러한 연구가 잘못된 방법론에 의한 것이라며 분석 결과를 거부하였다.[29] 2년 뒤인 2011년 지미 웨일스는 한 인터뷰에서 기여자 감소를 인정하였지만, 2010년 6월의 "최소 36,000 명의 편집자"에서 2011년 6월 당시의 35,800 명의 편집자 사이의 격차는 그리 크지 않다고 주장하면서 위키백과 편집자의 수는 "안정적이고 지속적"이라고 말하였다.[30] 2013년 매사추세츠 공과대학교의 《테크놀로지 리뷰》에 실린 〈위키백과의 하락〉(The Decline of Wikipedia)은 지미 웨일스의 이러한 주장을 반박하고 있다. 이 글의 분석에 따르면 위키백과는 2007년 이후 위키백과 문서를 업데이트하고 교정하던 자원 편집자 가운데 3분의 1을 잃었으며, 편집자의 상당수는 사소한 편집만을 하는 것으로 나타났다.[31]《디 애틀랜틱》 2012년 7월호는 관리자의 수 역시 줄어들었다고 보도하였다.[32] 2013년 11월 25일 《뉴욕》의 캐서린 워드는 “여섯 번째로 많이 사용되는 웹싸이트인 위키백과가 내부 비판에 휩싸였다”는 기사를 내보냈다.[33]''' # 워드 클라우드를 설정합니다. 한글이 있기 때문에 폰트도 넣어 줍니다. wordcloud = WordCloud(max_font_size=200,font_path='C:\\WINDOWS\\Fonts\\NanumGothic.ttf',stopwords=STOPWORDS,background_color='#FFFFFF',width=1200,height=800).generate(text) #사이즈 등을 설정해 줍니다. plt.figure(figsize=(10,8)) plt.imshow(wordcloud) plt.tight_layout(pad=0) plt.axis('off') # 저장까지 해봅니다. plt.savefig('image_name.png', bbox_inches='tight') |
'개발 > Python' 카테고리의 다른 글
파이썬 데이터 프레임 그룹핑 (Python dataframe grouping) (0) | 2018.09.11 |
---|---|
파이썬 첨부파일 메일 보내기 ( python email attachment file) (0) | 2018.09.11 |
파이썬 메일 보내기 ( Python mail) (0) | 2018.09.11 |
파이썬 스케줄 (Python Schedule) (0) | 2018.09.11 |