Matplotlib은 파이썬에서 2D 그래프를 그리는 데 사용되는 가장 기본적인 라이브러리입니다.
라인 플롯, 스캐터 플롯, 바 차트, 히스토그램, 파이 차트 등 다양한 차트와 플롯 스타일을 필요로 할때 사용합니다. 플롯 스타일링에 높은 유연성을 제공하기 때문에 많이 기본적으로 제일 많이 활용한다고 생각하시면 됩니다. 그렇기 때문에 다른 시각화 라이브러리들의 기반이 되는 라이브러리입니다.
Altair는 Vega와 Vega-Lite를 기반으로 한 Python 전용 선언적 통계 시각화 도구입니다.
Altair는(은) 그래픽 작업의 복잡성에서 벗어나 데이터의 핵심 내용에 중점을 둘 수 있도록 설계되었습니다. Altair의 주요 특징 중 하나는 Altair의 API입니다. 이는 Vega-Lite의 직관적이고 일관된 문법을 기반으로 하여 사용자가 빠르게 익힐 수 있습니다. 이러한 구조 덕분에 사용자는 복잡한 코드 없이도 데이터를 간결하고 심미성있게 시각화할 수 있습니다.
위 다섯가지는 시각화 라이브러리 중 대표적인 일부이며, 이외에도 다양한 라이브러리가 실시간으로 출시,발전하고 있습니다. 한 가지만을 사용하는 것이 아니라 다양한 시각화 라이브러리를 접목시켜 보다 직관적으로 데이터를 분석하는데에 활용하시면 좋을 것 같습니다.
다음은 이 라이브러리 중, 주제로 사용할 ‘워드클라우드’를 설명하겠습니다.
2. 워드클라우드(Word Cloud)란?
워드 클라우드는 텍스트 데이터 내에서 단어의 빈도수나 중요도에 따라 다른 크기로 표현하는 시각화 기법입니다. 단어의 빈도수가 높을수록 그 단어는 클라우드 내에서 더 크게 표현되기 때문에 굉장히 직관적이라고 말할 수 있습니다. 워드클라우드를 활용하여 한 눈에 어떤 단어나 주제가 텍스트에서 중요한지를 쉽게 파악할 수 있는 장점이 있습니다.
2.1. 타 시각화 라이브러리와의 차이점
위에 언급했었던 시각화 라이브러리들과 가장 큰 차이점에 있어서는 텍스트를 기반으로 한다는 것입니다.
앞서 소개한 라이브러리는 모두 정형화된 데이터(엑셀 등 이미 데이터셋의 형태를 갖춘 데이터)를 기반으로 하지만, 워드클라우드는 사용자들이 웹에 댓글, 글 등의 텍스트 데이터를 작성했을 때 그것들을 분석하고 분할하여 시각화를 할 수 있도록 도와줍니다.
네이버 지도의 점포별 메뉴데이터를 간편하게 크롤링하는 방법을 소개합니다. 해시스크래퍼의 네이버 지도 수집 크롤러를 통해 원하는 키워드와 최대 수집 개수를 설정한 후 수집된 상점들에대한 리스트 아이디인 SRID를 이용하여 손쉽게 메뉴 데이터를 얻어보세요. 몇 번의 클릭만으로 다양한 점포의 메뉴 정보를 확인할 수 있습니다.