통계학습 FAQ

모델, 모델링 그리고 기계학습의 관계

작성자
tkleen
작성일
2021-01-01 23:34
조회
607
모델은 현실 세계의 사물이나 시간의 본질적인 구조를 나타내는 모형이다. 현실 세계의 복잡한 현상을 추상화하고 단순화하여 모델로 표현한다. 그리고 모델을 만드는 작업을 모델링이라고 한다. 이를 위해 현실 세계를 적절한 수준으로 단순화시키는 것이 필요하나 단순화를 적게 하면 복잡해서 수학적으로 해결할 수 없게 되고, 반대로 지나치게 단순화시키면 해결한 문제가 현실과 동떨어진 것이라서 효용성이 없다. 따라서 가급적 현실을 제대로 표현하면서도 문제해결이 가능하도록 복잡도를 낮추는 것이 필요하다.
이와 관련하여 훌륭한 수학 모델의 목적은 실험과 무관한 복잡성을 배제하면서 중요한 특성은 모두 유지하는 것으로써 아인슈타인은 다음과 같이 언급했다.
"최대한 단순하게 만들어야 하지만 그보다 더 단순하면 안된다."

기계학습이란 훈련 데이터 집합을 잘 표현하는 모델을 만드는 작업이다. 즉, 모델의 틀을 설정하고 훈련 데이터 집합을 잘 표현하는 파라미터(매개변수) 값을 구하는 작업이다. 기계학습에서 특히 관심 있는 것은 입력과 출력 간의 함수 관계의 모델이다.
전통적인 기계학습 기법에서는 모델의 틀로써 수식을 주로 사용했다. 선형 함수 또는 간단한 비선형함수가 많이 쓰였다. 수식 모델은 독립변수, 종속변수, 파라미터 등으로 구성된 방정식이 일반적이다. 확률적인 현상을 모델링할 때는 확률함수를 사용한다.

인공 신경망 기법에서는 노드와 연결선으로 구성된 망구조를 모델의 틀로 사용한다. 주어진 망 구조에서 훈련 데이터 집한을 가장 잘 표현하는 파라미터 값을 구하는 것이 모델링이다. 단순한 수식을 사용하는 것보다 후훨훨씬 표현력이 좋다. 그래서 요즘 다양한 문제를 인공 신경망을 이용하여 해결하낟. 과거에는 망구조를 개발자의 경험과 직관에 의하여 미리 설정하는 것이 일반적이었으나 요즘은 적합한 망구조를 찾는 과정도 자동화되었다. 다양한 망구조와 파라미터 최적화를 시도한 후에 가장 바람직한 모델을 선택한하는 것이다. 오토엠엘(AutoML, Automted Machine Learning)이 이런 목적의 도구다.
모댈이 만들어지면 입력을 변화시켜가면서 출력의 변화를 관찰 수 있는데 이를 모의실험(Simulation)이라고 한다. 모의실험을 통해서 복잡한 현실의 현상을 이해하려고 한다. 실세계 구조나 개체의 행동 등을 컴퓨터 프로그램으로 구축한 것을 컴퓨터 모의실험 모델이라고 하고 이러한 모델로는 워게임 모델이나 온라이 게임이 대표적이다.
전체 0

error: Content is protected !!