프로젝트 & 과제/4학년

나노디그리 - 자연어 처리

qqlzzb 2022. 2. 11. 22:57

개요

프로그래밍 언어 : python

과제 수행 날짜 : 2021.07.05 - 2021.09.03

과제 개요 : 네이버 뉴스의 기사를 분석하여 자연어 처리.

 

코드

1) 전처리

- 불용어 제거

2) 1차 시각화

- 빈도 분석 결과를 빈도 그래프로 출력

- 결과

3) 2차 시각화

- 워드 클라우드로 빈도 기준 20개 단어 출력

- 결과

결과 분석

사회 분야의 기사 중 다가오는 추석에 관련한 기사를 찾아보았다. 추석이지만 코로나가 계속 유행하고 있는 상황이기 때문에 접종, 방역, 백신과 같은 키워드가 많이 등장한다는 것을 알 수 있다. 그리고 추석과 관련한 선물, 승차권, 예매, 열차 등의 키워드도 많이 등장했다. 

빈도 분석 결과, 일반적으로 '추석' 하면 떠오르는 키워드인 모임, 연휴 등의 키워드보다 접종이나 방역같은 키워드가 더 높은 빈도수를 보임을 알 수 있고, 이러한 결과를 바탕으로 코로나로 인해 이전의 추석과는 상황이 달라졌음을 알 수 있다.

 

 

'프로젝트 & 과제 > 4학년' 카테고리의 다른 글

[교양] 계량적 사고와 의사 결정  (0) 2022.02.15