Breaking

2019년 10월 9일 수요일

2.2. Introduction to Rule Based Algorithm Review

2.2. Introduction to Rule Based Algorithm Review

이 글은 공부를 위해 적는 것입니다.
모든 저작권은 KAIST 문일철 교수님과 Edwith에 있습니다.
강좌 URL : https://www.edwith.org/machinelearning1_17/lecture/10580/
PDF는 위 강좌 URL을 통해 무료로 다운받을 수 있습니다.
Image 파일 아래의 글들은 강의를 토대로 작성되었으며 저의 생각이 약간 감미된 경우 또한 있습니다.

배운점

  • Version Space
  • Candidate Elimination Algorithm
  • Noise나 Other Decision Factor를 고려해야하는 세상에서는 부합하지않음

S라는 알고리즘을 찾아보자.
Data에 들어있는 instance x가 양수라면 ~
Hypothesis
$h_0$ = null
$h_1$ 그대로 값을 넣고
$h_2$ Strong $\cup$ Light => Don't care $h_3,h_4 \cdots$
많은 가정들을 만족하는 알고리즘 구성이 가능하다.
범위를 찾아내는 방법으로 바꿔서 보아야한다. : Version Space VS
2가지 Boundary : General Boundary G, Specific Boundary S
$VS_{H.D} = {h \in H | \exists s \in S, \exists g \in G, g \ge h \ge s}$
VS를 알아보기 위해 Candid Elimination Algorithm을 적용해보자
G,S의 범위를 점점 좁혀나가는 것
S : Maximally specific h in H
G : Maximally general h in H
이렇게 하면 범주가 가장 넓게 펼쳐짐 그 다음 범위를 좁혀들어가는 것
2진 분류이므로 양 음으로 나누는 것
x > 0 : Generalize S
x < 0 : Specialize G Generate h : satisfies $\exists s \in S, \exists g \in G, g \ge h \ge s$


G를 Specify할 때 S가 ?일 때 즉 Don't care일 때는 손을 댈 수 없는 요소임 => 가설 설정 불가
G3:은 table 마지막에 위배되므로 G4에서는 삭제됨
새로운 Instance가 추가되면 더 잘 분류할 수 있게 될 것
G에는 만족하는데 S에는 만족하지 못한다면? 충분한 정보가 없어서 그런 것
Rule Based는 여러분야에서 잘 쓰이지 않는다.
완벽할 때만 잘 사용되는 것
어떻게 classify?
우리는 완벽한 세상에서 사는 것이 아니기 때문에 (Noise, Addition Decision factor 요소가 결정 방해 요인)
함부로 Yes or No를 예단할 수 없다.