전체 글 135

토픽 별 감성 분석 | Sentiment Analysis for Each Topic (30.03.2022.)

나는 토픽에 따라 감성이 어떻게 달라지는지 알고 싶었다. 게다가 이는 경영학적 적용의 가능성도 있기에 더 해당 분석을 진행해보고 싶었다. 내가 생각한 토픽별 감성 분석의 경영학적 적용은 다음과 같다: 성공한 제품 리뷰에서의 긍정적 감성이 강한 토픽은 벤치마킹할 필요가 있는 특징으로 간주할 수 있다. 반면에 부정적 감성이 강한 토픽과 연관된 특징은 연구 개발 과정을 더 거친 후 제품에 추가되어진다면 기존의 성공한 제품에서의 단점을 보완하는 격이기 때문에 더 독특하고 더 나은 가치를 창출할 수 있다. 성공하지 않은 제품 리뷰에서의 긍정적 감성이 강한 토픽에 해당하는 부분은 심지어 성공하지 않은 제품들에서조차 긍정적 평가를 받았던 부분이기에 새로운 마스카라 제품 개발 시 기본으로 가져야 하는 부분이다. 그러나..

선행 연구 - 2 | Pilot Study - 2 (16.03.2022.)

이전 포스트에 이어, 본 포스트에서도 선행 연구에 대해 계속 적어볼 것이다. 여기에서 나는 의미 연결망 분석, 토픽 모델링, 구 빈도 분석, 그리고 지도 학습을 통한 감성 분석의 결과에 대해 설명할 것이다. Following the previous post, this is the second part of the pilot study. Here, I'm going to explain the results of the semantic network analysis, topic modeling, phrase frequency analysis and supervised learning sentiment analysis. 1. Semantic network analysis Successful product re..

감성 분석 - 지도 학습 | Sentiment Analysis - Supervised Learning (16.03.2022.)

교수님께서 나에게 지도 학습을 통한 감성 분석을 진행해보라고 조언해주셨다. 하지만, 그 때 나는 지도 학습 방법에 대해 많이 알고 있지 않았고, 그래서 학습용 데이터셋을 구하거나 새로운 데이터 수집을 통해 만들었어야 했는데, 그러지 않았다. (학습용 데이터가 따로 필요한 줄 몰랐다.) 이미 수집해서 만들어놓고 분석에 계속 사용해오고 있는 성공한 제품들과 성공하지 않은 제품의 리뷰들로 구성된 데이터셋을 학습용으로도 사용하였다. 결론부터 얘기하자면, 이 분석은 완전히 실패했고 아무 의미가 없었다. 그래서 아래에 적혀 있는 그대로로 분석을 따라하지는 말길 바란다. 어쨌든, 다음은 내가 지도 학습을 통한 감성 분석 시 사용한 코드이다. * 이 분석에서, 실제 감성 라벨링의 기준을 변경하였따. 이전에 비지도 학습..

구 빈도 분석 | Phrase Frequency Analysis (16.03.2022.)

교수님께서 나에게 주신 피드백 중 하나는 단어 빈도 분석보다 두 세 단어를 묶은 구로 빈도 분석을 해보라는 것이었다. 예를 들어, 아래의 코드로 진행한 분석은 단어 'ever'가 아닌 구 'best ever'의 빈도를 보여준다. 이는 연구자로하여금 단어의 실제 사용 맥락, 즉 단어 사용 의미를 더 잘 이해할 수 있도록 돕는다. 다음은 두 단어를 하나로 묶은 구를 이용한 빈도 분석 시 사용한 코드이다. One of the pieces of feedback that the professor gave to me is to conduct a frequency analysis not with words but with phrases(groups of words). For example, this analysis ..

LDA 토픽 모델링 | Topic Modeling using LDA (16.03.2022.)

다음은 LDA 토픽 모델링 시 사용한 코드이다. The following are steps and codes for the topic modeling using LDA. 1. Import necessary packages. import pandas as pd import gensim import gensim.corpora as corpora from gensim.utils import simple_preprocess from gensim.models import CoherenceModel import spacy import pyLDAvis import matplotlib.pyplot as plt from nltk.corpus import stopwords 2. Import datasets. suc = p..

의미 연결망 분석 | Semantic Network Analysis (16.03.2022.)

다음은 의미 연결망 분석 시 사용한 코드이다. The following are the steps and codes for the semantic network analysis. 1. Import necessary packages. import pandas as pd from nltk.corpus import stopwords import numpy as np import matplotlib.pyplot as plt import re import networkx as nx import operator 2. Import datasets. suc = pd.read_csv('suc.csv') un = pd.read_csv('un.csv') 3. Define a function for the preprocessi..

[1] RSM 석사 프로그램 지원 여정 - 장학금 발표 | RSM Master's Program Application Journey - Scholarship

네덜란드 RSM에 장학금 지원 레터를 포함한 석사 지원 서류들을 처음 넣었을 때가 작년 10월 초쯤이었던 걸로 기억하는데, 한 2주 뒤 10월 중순이었나 말쯤에 조건부 합격증을 받았고, 그로부터 약 6개월 후인 오늘 드디어 장학금 수혜 여부 발표가 났다. * 여기서 조건부 합격이란, 입학 요건 중 일부가 미충족일 경우 받게 되는 합격증이다. 즉, 지원 당시 미충족인 요건들을 8월 31일까지 충족시킨다는 조건 하에 합격증을 부여하는 것이다. 나의 최종 합격 조건들을 학기 시작 전까지 충족시키지 못할 경우는 당연히 탈락인 것이다. 그렇기 때문에 조건부 합격증만 가지고는 완전히 합격했다고 말할 수 없다. I remember it was early October when I first submitted the ..

감성 분석 - 비지도 학습 | Sentiment Analysis - Unsupervised Learning (24.02.2022.)

다음은 비지도 학습을 통한 감성 분석 시 사용한 코드이다. The following are the steps and codes for sentiment analysis using the unsupervised learning method. 1. Import necessary packages. import pandas as pd import matplotlib.pyplot as plt import re import nltk from nltk.sentiment.vader import SentimentIntensityAnalyzer from sklearn.metrics import accuracy_score, confusion_matrix, precision_score from sklearn.metrics i..

단어 빈도 분석 | Word Frequency Analysis (24.02.2022.)

다음은 성공한 제품 리뷰와 성공하지 않은 제품 리뷰 각각으로 단어 빈도 분석 시 사용한 코드이다. The following are the steps and codes that I used for the word frequency analysis for each of the successful and unsuccessful product reviews. 1. Import necessary packages. import pandas as pd import matplotlib.pyplot as plt import re import nltk from nltk.corpus import stopwords from wordcloud import WordCloud 2. Download stopwords package...

세포라 리뷰 웹 크롤링 - 2 | Sephora Review Web Crawling - 2 (24.02.2022.)

리뷰 별점과 도움 수 데이터를 추가 수집하기 위해서 기존의 웹 크롤링 코드를 약간 수정하였다. Since I decided to collect rating and helpfulness data from the Sephora webpage, I slightly changed the web crawling code. 1. Import necessary packages. import time import openpyxl from openpyxl import Workbook import random from selenium import webdriver from selenium.webdriver.chrome.options import Options 2. Web crawling wb = Workbook(write..