개요
프로그래밍 언어 : python
과제 수행 날짜 : 2021.07.05 - 2021.09.03
과제 개요 : 네이버 뉴스의 기사를 분석하여 자연어 처리.
코드
1) 전처리
- 불용어 제거
2) 1차 시각화
- 빈도 분석 결과를 빈도 그래프로 출력
- 결과
3) 2차 시각화
- 워드 클라우드로 빈도 기준 20개 단어 출력
- 결과
결과 분석
사회 분야의 기사 중 다가오는 추석에 관련한 기사를 찾아보았다. 추석이지만 코로나가 계속 유행하고 있는 상황이기 때문에 접종, 방역, 백신과 같은 키워드가 많이 등장한다는 것을 알 수 있다. 그리고 추석과 관련한 선물, 승차권, 예매, 열차 등의 키워드도 많이 등장했다.
빈도 분석 결과, 일반적으로 '추석' 하면 떠오르는 키워드인 모임, 연휴 등의 키워드보다 접종이나 방역같은 키워드가 더 높은 빈도수를 보임을 알 수 있고, 이러한 결과를 바탕으로 코로나로 인해 이전의 추석과는 상황이 달라졌음을 알 수 있다.
'프로젝트 & 과제 > 4학년' 카테고리의 다른 글
[교양] 계량적 사고와 의사 결정 (0) | 2022.02.15 |
---|