3.4. Naive Bayes Classifier Application (Matlab Code) Review
+ Quiz
이 글은 공부를 위해 적는 것입니다.
모든 저작권은 KAIST 문일철 교수님과 Edwith에 있습니다.
강좌 URL : https://www.edwith.org/machinelearning1_17/lecture/10588/
PDF는 위 강좌 URL을 통해 무료로 다운받을 수 있습니다.
Image 파일 아래의 글들은 강의를 토대로 작성되었으며 저의 생각이 약간 감미된 경우 또한 있습니다.
배운점
- Naive Bayes를 적용하기 위한 Sentiment Reveiw Analysis
리뷰들을 모아 긍정적, 부정적인 의견들을 볼 수 있다. -> 너무 많음
인공지능이 Classification을 시행
cold 긍정적일 수도 부정적일 수도 있다.
상품에 따라서도 다를 수 있다.
어떤 카메라인지냐 어디에 사용하냐에 따라 다를 수 있다.
Sentiment Analysis
D라는 것을 찾아내야함
Bag of Words를 통해 벡터 형태로 분석 가능
그러나 길이가 길어질 것
200 서류에서 29717개의 유일한 단어들이 존재
class는 2개
given condition에 따른 Naive Bayes 가정을 적용 가능
개별 단어들에 다른 확률 값
prob, likelihood
matlab을 이용한 시각화는 영상을 통해...
이후 퀴즈는 본인의 실력을 키우기 위해 존재하는 것 입니다.
꼭 풀어보고 참조하시길 바랍니다.
1. 다음 설명 중 옳지 않은 것은?
답 : 1(이유 : 반대로 해석, 점선 분류의 Bayes risk가 더 크다)
답 : 2(Conditional Independence)
$P(Y=y)\cdot \prod_{1 \ge i \ge d} P(X_i = x_i | Y=y)$
$=P(Y=Yes)\times(P(Sky=Sunny|Y=Yes) \times P(Temp=Warm|Y=Yes)\times P(Humid=High|Y=Yes) \times P(Wind=Strong|Y=Yes) \times P(Water=Warm|Y=Yes) \times P(Forecast=Change|Y=Yes))$
$={3 \over 4}\times(1\times 1 \times{2\over 3}\times 1 \times {2\over 3} \times {1\over 3}) = {1 \over 9}$
3. P(Y=Yes) = 3/4
P(Sky=Sunny|Y=Yes)=3/3=1=P(Temp=Warm|Y=Yes)=P(Wind=Strong|Y=Yes)
P(Humid=High|Y=Yes)=2/3 = P(Water=Warm|Y=Yes) = P(Forecast=Same|Y=Yes)
P(Humid=Normal|Y=Yes)=1/3 = P(Water=Cool|Y=Yes) = P(Forecast=Change|Y=Yes)
P(Sky=Sunny|Y=Yes)=3/3=1=P(Temp=Warm|Y=Yes)=P(Wind=Strong|Y=Yes)
P(Humid=High|Y=Yes)=2/3 = P(Water=Warm|Y=Yes) = P(Forecast=Same|Y=Yes)
P(Humid=Normal|Y=Yes)=1/3 = P(Water=Cool|Y=Yes) = P(Forecast=Change|Y=Yes)
$P(Y=y)\cdot \prod_{1 \ge i \ge d} P(X_i = x_i | Y=y)$
$=P(Y=Yes)\times(P(Sky=Sunny|Y=Yes) \times P(Temp=Warm|Y=Yes)\times P(Humid=High|Y=Yes) \times P(Wind=Strong|Y=Yes) \times P(Water=Warm|Y=Yes) \times P(Forecast=Change|Y=Yes))$
$={3 \over 4}\times(1\times 1 \times{2\over 3}\times 1 \times {2\over 3} \times {1\over 3}) = {1 \over 9}$