Sep 1, 2008

이제 컴퓨터가 사람처럼 데이터의 고유 패턴을 찾아낸다!

KISTI 『글로벌동향브리핑(GTB)』 2008-08-29

사람들은 정보 다발에서 순서를 찾으려는 본능적인 성향을 가진다. 이것은 컴퓨터로 증명하기 어려운 기술이다. 큰 데이터 집합이 있을 때, 특정 구조 즉, 계층, 선형 순서, 군집합을 찾기 위하여 프로그래밍 되지 않으면, 컴퓨터는 어디에서부터 시작해야 할지 알지 못한다.

현재 인공지능 영역에 큰 영향을 줄 수 있는 진보로써, MIT에서 개발된 새로운 모델은 컴퓨터가 인간이 하는 방법과 동일하게 패턴을 인지하는 것을 도울 수 있다. 국립 과학 아카데미에서 발표된 이 모델은 데이터 집합을 분석하고, 어느 조직 구조의 형태가 그 데이터 집합에 가장 적합한지를 알아낼 수 있다.

“구조의 특이한 종류를 찾는 대신, 우리는 이러한 모든 구조를 찾을 수 있고 서로에게 불리하게 작용할 수 있는 더욱 광범위한 알고리즘을 찾아내었다”라고 MIT의 뇌 및 인지과학 부교수인 Josh Tenenbaum이 말하였다. 이 모델은 많은 데이터양을 분석하는 많은 영역에서 과학자에게 도움을 주었고, 또한 인간 뇌가 어떻게 패턴을 발견하는지에 대해 일조할 수 있었다. 컴퓨터 알고리즘은 최근 MIT 박사학위를 받은 Charles Kemp가 개발한 것이다. 그는 현재 카네기 멜로 대학교(Carnegie Mellon University) 심리학과의 조교수이다.

이 모델은 가능한 데이터 구조들 즉, 트리, 선형 순서(linear orders), 고리, 우성 계층(dominance hierarchies), 클러스터 등의 범위를 고려한다. 이 모델은 주어진 데이터 집합을 위한 각 유형에 최고로 잘 알맞은 구조를 찾은 후, 데이터를 가장 대표하는 구조 유형을 선택한다. 사람은 종종 무의식적으로 매일 똑같은 기술을 수행한다. 몇몇 과학적으로 획기적인 사건들은 데이터 안의 패턴을 찾는 인간의 기술로부터 나온 결과들이었다. 예를 들어, 화학 원소 주기율표의 개발 또는 트리 구조의 분류체계로부터 나온 생물학 종 조직 등이 그러하다.

아이들은 사회 네트워크가 파벌(clique)로 조직화될 수 있는 것과 단어가 중복 범주로써 들어맞는 것(예를 들어, 개, 포유류, 동물)을 배울 때, 그들은 어린 시절에 이러한 데이터 조직화 기술을 나타낸다. “우리는 아이들이 데이터 수집, 가설 수립 및 실험을 통한 가설 시험을 할까 생각한다. 그들은 어린 과학자과 같다. 지금 아이들이 기초가 되는 데이터 집합의 전역 구조를 어떻게 이해하는지에 대한 좋지 않은 계산 모델 없을 때까지”라고 Tenenbaum 교수가 말하였다.

본 연구는 James S. McDonnell Foundation Causal Learning Research Collaborative, Air Force Office of Scientific Research, NTT Communication Sciences Laboratory로부터 지원 받았다.

그림 1. MIT 부교수인 Josh Tenenbaum과 그의 학생이었던 Charles Kemp은 데이터 집합에 적합한 가장 좋은 구조 형태를 선택할 수 있는 컴퓨터 알고리즘을 개발하였다. 그림은 선형 순서, 고리, 군집합의 구조를 보여준다.