Skip to content

Introduction

AI 란

John McCarthy (AI 용어 창안자. 미국의 인지심리학자.1927-2011) 에 따르면 Artificial Intelligence (AI)의 정의는 다음과 같음.

ref. : Basic Questions

Q. What is artificial intelligence?
A. It is the science and engineering of making intelligent machines, especially intelligent computer programs. It is related to the similar task of using computers to understand human intelligence, but AI does not have to confine itself to methods that are biologically observable.

AI라는 용어는 1956년 다트머스대학 컨퍼런스에서 최초로 등장했으며, 기계 혹은 시스템으로부터 만들어진 지능 또는 이와 같은 지능을 만들 수 있는 방법론 등을 연구하는 분야 를 가르킨다.

참고로, Machine Learning 이라는 용어를 1959년 만들어낸 Arthur Samuel도 다트머스대학 컨퍼런스에 참석함.

AI는 매우 다양한 분야의 학문과 연계됨.

  • 철학 : 지능이란? 인간의 인지, 학습, 기억, 추론이 어떻게 이루어지는지
  • 인지심리학 : 인간(혹은 동물)이 정보를 인지,저장,분석,처리 하는 메커니즘을 연구
  • 수학 : 대수학, 논리학, 확률 …
  • 컴퓨터 과학(공학 포함), 로봇공학 : 다른 분야의 연구 결과를 통해 실제 동작하는 구현물을 만들어냄.

AI 에 대한 구분.

Stuart Russell 및 Peter Norvig가 기재한 AI 연구의 선도적인 교과서 Artificial Intelligence: A Modern Approach, 4th US ed.에서 제시한 AI가 기존의 컴퓨터 시스템과 구분되는 4가지 잠재적 목표 (or 정의)는 다음과 같다(합리성사고 대 행동의 기준으로 분류).

  • 인간처럼 사고(생각)하는 시스템
  • 인간처럼 행동하는 시스템
  • 합리적으로 사고(생각)하는 시스템
  • 합리적으로 행동하는 시스템

현재 어떤 AI기술도 General AI(인간처럼 사고/행동)는 구현치 못했음. 하지만, Deep Learning을 통해 Computer Vision분야 등에서는 인간 이상의 성과를 보이는 Narrow AI (특정 작업에서 인간처럼 혹은 인간 이상으로 사고/행동)가 구현되기 시작했다. 대표적인 분야는 다음과 같음.

  • 체스, 바둑
  • 이미지 인식(일부)

Turing Test

Alan Turing은 "인간처럼 행동하는 시스템"의 범주에 속하는 정의를 제시했다.

Turing Test는 기계가 인간과 얼마나 비슷하게 대화할 수 있는지를 기준으로 기계에 지능이 있는지를 판별하는 것으로 "행동"을 "대화"로 생각하면 된다.
하지만, 인간처럼 대화하는 것이 지능이 있다는 기준인지에 대해서 논란이 있다.

Turing Test에서는 사람인 조사관이 블라인드 상태에서 컴퓨터와 5분간 채팅하여 상대가 컴퓨터인지 사람인지 판단한다. 여러 조사관들 중 상대가 사람일 것이라고 판단하는 조사관이 30% 이상 이면 해당 컴퓨터는 튜링 시험을 통과한다.

Turing, A.M., Computing machinery and intelligence, Mind, 59(236):433-460, 1950)

위의 경우는 좀 더 간소한된 것이며 작은 연결 통로로 물건을 주고받는 동작 시험 등이 포함된 전체 튜링 시험(total Turing test)도 있다 : 즉, "인간처럼 행동 하는 시스템" 이 Turing 이 생각한 AI였다.

Total Turing Test 통과를 위해서 AI에게 필요한 능력

  • Natural Language Processing :
    • 자연어를 통한 성공적 의사소통 위해
  • Knowledge Representation :
    • 알고있는 것과 들은 것을 저장하기 위해
  • Automated Reasoning :
    • 저장된 정보를 통해 질문에 답하고 새로운 결론을 도출하기 위해
  • Machine Learning :
    • 새로운 상황에 적응하고, 기존 알고 있는 패턴을 이용하여 extrapolation하기 위해.
    • Data로부터 스스로 Task를 해결하기 위한 방법을 학습.
  • Computer Vision :
    • 물체의 인식을 위해
  • Robotics Engineering :
    • 물체를 조작하고 이동하기 위해

Ref.

  1. ref. Wikipedia's Turing Test
  2. Pearson Series in Artificial Intelligence : Artificial Intelligence : A Modern Approach
  3. AI의 모든 것"이란? : Turing Test

Machine Learning 이란.

ML은 "AI를 구현하기 위한 구체적 접근 방식"에 해당한다.

ML은

  • 대량의 Data
  • 알고리즘(and optimization)등을 통해,
  • 컴퓨터가 작업수행방법스스로 학습 하도록 하는 것!

을 가르킨다.

참고로 Rule-based Algorithm의 경우, 개발자가 data를 분석하여 명시적으로 작업수행방법을 rule로서 제공해주기 때문에 ML에 속하지 않음.


ML을 위한 다양한 알고리즘 (or 기법)

ML을 위해 제안된 다양한 기법들이 있으며 대략적으로 나누어 보면 다음과 같다.

  • Tree계열 : Decision Tree, Random Forest등
  • Support Vector Machine (SVM)
  • Linear Regression
  • Clustering
  • ANN ( → Deep Learning)
  • Reinforcement Learning

Artificial Neural Network (ANN)이 현재 가장 높은 성능을 보이는 ML기법의 하나인 Deep Learning 을 가르킨다 (정확히는 많은 layer로 구성된 ANN이 바로 Deep Learning임).

  • 적은 수의 layer로 구성된 ANN을 가르켜 perceptron이라고 부르며 이는 ML에 속함.

Representative Learning **

입력에 대해 요구되는 출력(~expectation)을
가능한 범위 내에서 정확하게 산출할 수 있는 approximation model을 만들기 위해(Task를 잘 수행하는데 필요한)
유용한 representation (~embedding, feature vector)을 학습데이터를 기반으로 학습하여 산출 하는 것을 가르킴.

Generally speaking, a good representation is one that makes a subsequent learning task easier.


Deep Learning (DL) 이란. ***

엄격하게 애기하면 Deep LearningML의 한 종류이며, Representative Learning에 속한다.

보다 엄밀하게 애기하면, ML의 한 분야인 ANN에서 hidden layer를 여러 개 사용하는 방법을 Deep Learning이라고 한다.

  • 여러 layer를 쌓는 효과를 위해선 hidden layer의 activation이 non-linear를 만족해야함.
  • 만약 linear하다면 여러 layer를 쌓아도 single layer와 동일.

우수하고 효율적인 Machine Learning을 실현할 수 있는 기법이 Deep Learning이며, 이는 학습데이터로부터 최적의 hierarchy representation을 알아서 추출할 수 있다 는 장점에 기인한다.

다음의 Deep Learning의 정의를 살펴보라.

Deep learning is a particular kind of machine learning that achieves great power and flexibility by learning to represent the world as a nested hierarchy of concepts, with each concept defined in relation to simpler concepts, and more abstract representations computed in terms of less abstract ones.

http://www.cs.utoronto.ca/~rgrosse/cacm2011-cdbn.pdf

  • DL은 데이터로부터, 스스로 계층적인 representation을 추출해내는 능력을 가짐.
    • 이를 달리 말하면, DL은 non-linear dataset의 input vector들을 task에 맞추어진 linear separability를 가진 feature vector들로 transform해주는 일종의 function을 만들어 낸다. (+ dataset으로부터 알아서...)
    • DL은 기존의 feature engineering이 하던 일을 dataset으로부터 알아서 해준다.
    • DL은 kernel SVM에서 kernel trick으로 우회해서 처리하던 것을 dataset으로부터 lower level layer에서 학습하여 직접 처리한다.
  • ANN에서 layer를 여러 개 쌓을 경우, 이를 단일 layer로 처리하는 경우에 비해 적은 수의 neuron으로 같은 표현력을 가질 수 있으며, 보다 빨리 학습이 되고, noise에 영향을 덜 받는 것으로 알려져 있다.

실제로 logistic regression가 동일한 동작을 ANN (정확히는 SLP+sigmoid activation)으로 구현 가능하고, SVM은 hinge loss function과 Frobenius norm regularization을 사용하는 linear activation의 SLP라고 봐도 무방할 정도로 다른 ML 알고리즘들과 ANN은 많은 부분에서 공통점을 가지고 있다. 즉, DL도 ML의 한 분야에 불과하다.
하지만, 위에서 말한 알아서 최적의 representation을 여러 층으로 쌓인 non-linear activation function을 가지는 low layers를 통해 dataset으로부터 직접 얻어낸다는 점이 DL이 다른 ML 알고리즘과 비교할 수 없는 유용성을 가지게 해준 가장 큰 특징이다.

즉, 어떤 함수라도 근사할 수 있는 ANN (UAT참고)에 보다 효과적으로 학습되도록 hierarchical representative learning의 기능을 더한 것이 바로 DL이라고 생각해도 크게 틀리지 않다.


Summary : AI, Machine Learning, and Deep Learning

AI와, ML, 그리고 DL은 다음과 같은 관계를 보인다.

(Narrow) AI
특정 분야에서 인간처럼, 혹은 그 이상의 성능을 보이는 기술(or system)
  • Expert System (전문가 시스템)
  • Rule-based algorithm
ML
AI를 구현하기 위한 기술. 명시적 프로그래밍이 아닌 Data로부터 동작을 학습하는 기술
  • Decision Tree, SVM, Gradient Boosting and so on
DL
현재 가장 우수한 성능의 ML을 구현하는 기술로 많은 Layers로 구성된 ANN (Artificial Neural Network) 을 가르킴.
  • MLP, CNN, RNN, Transformer, GAN