word frequency analysis 3

BERT 감성 분석 - 2 | BERT Sentiment Analysis - 2 (13.04.2022.)

이전 포스트에서 나는 BERT 모델을 사용해 감성 예측을 하였고 고객 제품 리뷰에 1(긍정) 혹은 0(부정)의 라벨을 부여하였다. 이번 포스트에서는 감성 분석을 두 가지 방식으로 진행해보려 한다: 1) 성공한 제품 리뷰들과 성공하지 않은 제품 리뷰들에 대한 전반적인 분석, 2) 키워드 분석 (여기서 키워드란, 성공한 제품과 성공하지 않은 제품의 리뷰들을 합쳐서 단어 빈도 분석을 진행했을 때 가장 자주 언급되는 상위 10개의 단어들이라고 정의 내린다.) In the previous post, I used the BERT model for the sentiment prediction and labeled the customer product reviews 1(positive) or 0(negative). I..

단어 빈도 분석 | Word Frequency Analysis (24.02.2022.)

다음은 성공한 제품 리뷰와 성공하지 않은 제품 리뷰 각각으로 단어 빈도 분석 시 사용한 코드이다. The following are the steps and codes that I used for the word frequency analysis for each of the successful and unsuccessful product reviews. 1. Import necessary packages. import pandas as pd import matplotlib.pyplot as plt import re import nltk from nltk.corpus import stopwords from wordcloud import WordCloud 2. Download stopwords package...

선행 연구 -1 | Pilot Study - 1 (24.02.2022.)

내가 연구 주제를 정하는 것에 애를 먹고 있자, 교수님께서 나에게 일단 선행 연구를 해보라고 조언해주셨다. 그러면 그 선행 연구를 통해서 몇 가지 연구 아이디어가 떠오를 수도 있다고 하셨다. Since I was struggling to come up with a research topic, the professor told me to do a pilot study so that I could get some research ideas through it. 1. Dataset newly collected [brand, product, review, date] → [brand, product, review, date, rating, helpful] rating == review score == 별점(평점)..