1. 토픽 모델링이란..? 텍스트 마이닝에 또 자주 쓰이는 방법론으로 토픽 모델링이라는 것도 있습니다. 대규모의 텍스트 데이터의 집합에서 주요 주제를 발견하고, 구조화하는 방법인데요. 토픽 모델링에서의 가정은 단어별로 특정한 '주제'를 담고 있다고 가정합니다. 그래서 특정 단어들이 자주 발견되는 데이터 구조, 문장 구조들이 형성되어 있으면 그 단어들이 의미하는 주제를 담고 있다고 봅니다. 예를 들어, 야구에 대한 같은 온라인 커뮤니티에 다양한 글들이 있겠죠. 이런 글, 저런 글 모으다 보면 특정 글에서는 '이글스 파이팅'이라는 주제를 담고 있는 데이터 구조가 형성되어 있을 수 있고 '이글스 해체해라' 등의 비방글도 있을 수도 있겠죠 이러한 주제들을 일일이 하나하나 ..