Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python을 사용하여 Word Cloud 만들기

<시간/>

이 문제에는 일부 텍스트가 포함된 파일이 있습니다. 우리는 그 텍스트와 하나의 마스킹 이미지에서 단어 구름을 만들어야 합니다. 프로그램은 단어 구름 이미지를 png로 저장합니다. 형식.

이 문제를 구현하려면 일부 파이썬 라이브러리를 사용해야 합니다. 라이브러리는 matplotlib, wordcloud, numpy, tkinter 및 PIL입니다.

이러한 라이브러리를 설치하려면 다음 명령을 따라야 합니다.

라이브러리 설정

$ sudo pip3 install matplotlib
$ sudo pip3 install wordcloud
$ sudo apt-get install python3-tk

이러한 라이브러리를 추가한 후 작업을 수행하는 Python 코드를 작성할 수 있습니다.

알고리즘

Step 1: Read the data from the file and store it into ‘dataset’. 
Step 2: Create pixel array from the mask image. 
Step 3: Create the word cloud from the dataset. Set the background color, mask, and stop-words. 
Step 4: Store the final image into the disk. 

입력:sampleWords.txt 파일

Python은 높은 수준의 해석된 대화형 객체 지향 스크립팅 언어입니다. Python은 가독성이 높도록 설계되었습니다. 다른 언어와 마찬가지로 구두점을 사용하는 영어 키워드를 자주 사용하며 다른 언어보다 구문 구조가 적습니다.

Python은 80년대 후반과 90년대 초반에 네덜란드 국립 수학 및 컴퓨터 과학 연구소에서 Guido van Rossum에 의해 개발되었습니다.

Python은 ABC, Modula-3, C, C++, Algol-68, SmallTalk, Unix 셸 및 기타 스크립팅 언어를 비롯한 많은 다른 언어에서 파생되었습니다.

파이썬은 저작권이 있습니다. Perl과 마찬가지로 Python 소스 코드는 이제 GNU GPL(일반 공중 사용 허가서)에 따라 사용할 수 있습니다.

Python은 현재 연구소의 핵심 개발 팀에서 유지 관리하고 있지만 Guido van Rossum은 여전히 ​​진행 상황을 이끄는 데 중요한 역할을 하고 있습니다.

또 다른 입력은 마스크 이미지(cloud.png)입니다. 최종 결과는 오른쪽에 있습니다.

Python을 사용하여 Word Cloud 만들기

예시 코드

import matplotlib.pyplot as pPlot
from wordcloud import WordCloud, STOPWORDS
import numpy as npy
from PIL import Image
dataset = open("sampleWords.txt", "r").read()
defcreate_word_cloud(string):
   maskArray = npy.array(Image.open("cloud.png"))
   cloud = WordCloud(background_color = "white", max_words = 200, mask = maskArray, stopwords = set(STOPWORDS))
   cloud.generate(string)
   cloud.to_file("wordCloud.png")
dataset = dataset.lower()
create_word_cloud(dataset)

출력

Python을 사용하여 Word Cloud 만들기