Skip to content

edwardcho/Data_Science_Repository

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

26 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Data_Science_Repository

데이터사이언스 자료 글

AI / Machine Learning / Deep Learning AI_ML_DL

 인공지능은 사람의 지능을 모방하여, 사람이 하는 것과 같이 복잡한 일을 할 수 있는 기계를 만드는 것.
 인공지능이 가장 넓은 개념이고, 인공지능을 구현하는 방법 중 중요한 방법이 머신러닝 (기계학습) 이다.
 딥러닝은 머신러닝의 여러방법 중 중요한 방법론이고, 인공신경망을 사용한다.
 
 인공지능이라는 용어는 1956년 존 매카시에 의해 만들어졌다.
 존 매카시는 인공지능은 '인텔리전트한 기계를 만드는 과학과 공학' 이라고 정의하였다.
 하지만 인텔리전트라는 용어가 모호해서 아직도 명확한 정의가 없다.
 
 머신러닝은 1998년 카네기 멜론 대학의 교수, 톰 미첼의 정의로 설명할 수 있다.
 머신러닝은 "컴퓨터가 명시적으로 프로그램 되지 않고도 학습할 수 있도록 하는 연구분야" 이다.
 
 딥러닝은 인간의 뇌 신경망을 모방한 인공신경망의 한 종류이다.

Machine Learning Category...

  1. Supervised Learning
    : [위키피디아 해석] 하나의 입력에서 하나의 출력으로의 맵 function 을 학습하는 machine learning
    (https://en.wikipedia.org/wiki/Supervised_learning)

  2. Unsupervised Learning
    : [위키피디아 해석] 기존 라벨이 없고 사람의 관여가 최소화된 상태에서,
    데이터셋에서 이전에 찾지 못했던 패턴을 찾는 Machine Learning
    (https://en.wikipedia.org/wiki/Unsupervised_learning)

  3. Semi-supervised Learning
    : [위키피디아 해석] 소수의 라벨된 데이터와 많은 수의 라벨되지 않은 데이터의 조합의 Machine Learning 접근 방법
    (https://en.wikipedia.org/wiki/Semi-supervised_learning)
    : 소수의 라벨된 데이터(A)로 training 하고, 이를 바탕으로 라벨되지 않은 데이터(B)의 label 을 predict 한다.
    : 전체 데이터(A + B)를 정제한 후 retrain 한다.

[참고] Reinforcement Learning (강화학습)
: 강화학습은 결과값(정답)대신 어떤 일을 잘 했을 때 보상(reward) 를 주는 방법으로 학습을 시킨다.
: 현재 상태에서 어떤 행동을 취하는 것이 최적인지를 학습한다.
: 행동을 취할 때마다 보상(reward)이 주어지는데, 이 보상을 최대화하는 방향으로 학습이 진행된다.

Machine Learning Tasks

1. Classification

    Classification is the problem of identifying to which of categories a new observation belongs,  
                   on the basis of a training set of data containing observations whose category is known.

    새로운 데이터에 대해서, 알려진 category 를 식별하는 문제의 타입 / Supervised Learning
    (feature vectors or image) 에 대해서 category 식별

2. Segmentation

3. Regression

    Regression is a type of problem where we need to predict and forcast for the continuous-response values.

    연속된 값에 대해서 예측하는 문제의 타입  / Supervised Learning
    feature vectors 에 대해서 예측

4. Clustering

    Clustering is a type of unsupervised learning problem where we group similar things together.

    유사한 것들끼리 grouping 하는 비지도 학습 문제의 타입 / Unsupervised Learning
    feature vector(s) list 에 대해서 clustering 

Clustering details..

5. Association

    An Association rule is where you would be discovering the exact rules that will describe the large portions of your data.

    데이터의 많은 부분을 설명하는 정확한 규칙을 발견하는 문제의 타입 / Unsupervised Learning

6. Image to Image Translation

7. Anomaly Detection

    정상 데이터와 비정상 데이터를 구별해 내는 문제. (Supervised / Unsupervised / ..)

Anomaly_Detection details..

About

데이터사이언스 자료 글

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published