Breaking

2019년 10월 5일 토요일

1.1 Motivations Review

1.1 Motivations Review

이 글은 공부를 위해 적는 것이고 모든 이미지에 대한 저작권은 이 강의를 해주신 KAIST 문일철 교수님과 Edwith에게 있습니다. 실질적으로는 교수님께 전부 있다고 보는 것이 맞습니다.

강좌 URL : https://www.edwith.org/machinelearning1_17/lecture/10574/


문익철 교수님의 메일 주소는 첫 Image 파일에 있으니 참고하시길 바랍니다.

PDF는 위 강좌 URL을 통해 무료로 다운받을 수 있습니다.

Image 파일 아래의 글들은 제가 강의를 들으면서 중요하다고 생각했던 내용과 저의 약간의 지식을 첨가하여 적어놓습니다. 


배운 것

  1. Machine Learning이 무엇인가 – 어디에 어떻게 사용되는가
  2. Machine Learning을 분류하는 3가지 방법
    1) Supervised Learning – Classification, Regression
    2) Unsupervised Learning – Clustering, Filtering
    3) Reinforcement Learning


  

 기계 학습, AI, Machine Learning들의 용어는 많은 산업에서 많은 용어를 사용합니다.

Text, Network, Image에 이르기까지 많은 데이터의 축적과 GPU 향상으로 인한 데이터 처리 능력, 그리고 그것을 활용할 수 있는 데이터들의 공개로 우리는 AI 분야를 발전시키는 데 큰 역할을 하고 있습니다.

머신 러닝의 활용도는 다양합니다.
대표적인 예로 문서의 분류, Spam Mail, 주식 시장의 예측, 자동차 번호판 인식, SNS 추천 시스템, 헬리콥터의 균형을 잡아주는 역할까지 우리 생활 곳곳에 퍼져있습니다.




예전에는 Spam Filtering만 되어있는 것을 볼 수 있었는데 요즘에는 Text Contents, Heading, Social 정보 등의 데이터를 합치면서 머신 러닝 기법들을 사용해 중요도 시스템을 만들어낸 것을 볼 수 있습니다.




2010년 천안함 사건의 사람들의 생각, 감정들을 Blog, SNS 등을 이용하여 데이터를 수집 Mining을 통해 어떤 주제가 있었고 어떻게 전파되어 가는지 요약해서 알아낼 수도 있었습니다.





뉴스를 비롯 다양한 정보를 통해 머신 러닝 기법을 활용해서 주식 시장에서의 상관 관계를 알아낼 수도 있었습니다.
우측 하단 swiss와 DJIA는 부정적 상관 관계를 가집니다.
DJIA의 부정적인 단어?가 뜨면 주식 투자를 안전 자산으로 옮길려고 하기 때문에 부정적 상관 관계를 가진다고 합니다.


Machine Learning은 크게 3가지로 분류하는데
1. Supervised Learning 지도 학습 Label 있는 답이 있는 학습 방법
2. Unsupervised Learning 비지도 학습 답이 없는 예들을 다루는 학습 방법




Label이 있는 Learning Method
대표적인 예 Spam : yes or no가 분명히 답이 있는 예시 데이터
아마존 네이버 쇼핑 모든 상품들이 카테고리에 들어가있는 것들을 자동 분류하는 역할
세분화 : Classification or Regression(Discrete vs Continuous Data)
Classification : Multi Class Ranking Assignment
Regression : Value Prediction




사람이 데이터를 많이 주기 어려울 때 사용
있는 데이터로 어떤 패턴이 있는지 찾아내는 Clustering 군집화
Cluster, latent factor 잠재적인 현상인 원인 요소 이유를 찾고자 할 때
신문 기사가 많을 때 주제를 10개로 요약할 때 Clustering
여러 사람의 얼굴을 모아 Cluster로 대표적인 latent image를 찾는 것
Noise Filtering을 통해 찾고자 하는 signal을 찾는 것