Jowon: 2019.07

Jul 10, 2019

뇌파 읽어주는 ‘언어해독기’ 개발

환자에게 적용 시 43% 언어 해독 가능해

뇌세포와 얼굴, 성대의 미세한 움직임을 분석해 말 못하는 사람의 말을 대신 표현해줄 수 있는 언어 해독기가 최초로 개발됐다. 25일 ‘가디언’, ‘사이언스 뉴스’, ‘네이처’ 등 주요 언론에 따르면 이 장비를 개발한 곳은 미국 샌프란시스코에 소재한 캘리포니아 대학 에드워드 창(Edward Chang) 교수가 이끄는 연구팀이다.

뇌신경학학자인 창 교수는 “그동안 연구를 통해 뇌 활동(Brain Activity)을 문장으로 언어화할 수 있는 장치를 세계 최초로 개발했으며, 이를 말 못하는 환자에게 적용해 치료에 활용할 수 있다”고 말했다.

‘무언의 소리’ 들을 수 있는 신형 BMI

그동안 과학자들은 다양한 방식을 통해 뇌세포와 기계를 연결해 말을 못하는 환자 뇌 속에서 무슨 생각을 하는지 뇌 활동을 해독할 수 있는 방안을 연구해왔다. 그리고 뇌파로 컴퓨터와 같은 기계를 조정할 수 있는 ‘뇌-기계 인터페이스(BMI: Brain Machine Interface)’를 개발해왔으나 대부분 실험 단계였다. 이 과정에서 해독 시간이 너무 걸리고, 언어해석 역시 불완전해 많은 환자들이 어려움을 겪어왔다. 루게릭 병으로 말을 하지 못했던 고 스티븐 호킹(Stephen William Hawking) 박사가 대표적인 경우. 호킹 박사가 사용한 해독기의 경우 눈과 얼굴 근육 움직임을 통해 1분에 8개 단어를 해독할 수 있었다. 정상적인 사람이 1분에 100~150개 단어를 사용하고 있는 것과 비교해 10분의 1도 안 되는 것이다. 또한 눈과 얼굴 근육 움직임을 통해 포현하고 있는 언어를 해석해야 하는 만큼 소통을 위해 전문적 이해가 필요했다. 하지만 이번에 개발한 BMI는 어느 때나 수시로 환자에게 적용할 수 있는 표준화된 장치로 첨단 기술을 통해 불편했던 점을 대폭 해소하고 있다.

뇌에 설치된 전극을 통해 뇌파 움직임을 분석하고, 영상 분석 시스템을 통해 혀와 입술, 후두, 턱 등의 움직임을 측정해 종합적으로 그 사람이 표현하고자 하는 언어를 빠른 시간에 해독하는 것이 가능하다. 연구팀은 뇌파와 입술 등의 언어 동작을 연계해 소리 없이 표현되고 있는 언어를 분석해낼 수 있는 이 BMI의 명칭을 ‘가상 성도(virtual vocal tract)’라 명명했다. 여기서 성도(聲道)란 성대에서 입술 또는 콧구멍에 이르는 통로를 뜻한다. 일상에서 이 성도 기능이 작동하지 않지만 새로 개발한 BMI를 통해 소리 없이 표현되고 있는 환자들의 언어를 파악할 수 있다는 의미로 해석된다.

머신러닝으로 뇌파‧신체 움직임 분석

연구팀은 또 사람의 성대 움직임을 모방해 환자가 표현하는 것을 실제 언어로 재현해냈다. 아마존의 ‘아마존 미캐니컬 터크(Amazon Mechanical Turk)’ 플랫폼을 통해 100개의 문장을 제시한 후 100명의 참가자들을 통해 어느 정도 그 문장들을 이해했는지 집계한 결과 43%의 언어를 해독할 수 있었다. 이번 연구 결과와 관련, 옥스퍼드 대학의 인지과학자 케이트 왓킨스(Kate Watkins) 교수는 “캘리포니아대 연구진을 통해 의료현장에서 적용이 가능한 BMI가 최초로 개발됐다”며, 큰 놀라움을 표시했다. 그는 또 이 기기를 의료장비화 함으로써 중풍, 알츠하이머, 인후암, 근위축측삭경화(증), 루게릭 병 등으로 인해 목소리를 잃은 환자들을 치료하는데 큰 도움을 줄 수 있을 것으로 기대했다.

관련 논문은 국제학술지 ‘네이처’ 지 24일자(현지 시간)에 게재됐다. 논문 제목은 ‘Speech synthesis from neural decoding of spoken sentences’이다. 이전까지 BMI에 관한 과학자들의 논문은 뇌파를 언어로 만드는 과정에 머물러 있었다. 뇌파를 분석하는 일이 그만큼 어려웠기 때문. 그러나 이번에 개발한 BMI는 혀와 입술, 턱, 인두 등의 움직임을 관장하는 뇌 활동을 종합적으로 분석하는 일이 가능하다.

논문 저자인 캘리포니아대 고팔라 아누만치팔리(Gopala Anumanchipalli) 교수는 “그동안 많은 과학자들이 BMI 개발에 노력을 기울여왔지만 신경망의 움직임이 매우 미묘하고, 복잡한데다 속도 역시 매우 빨라 어려움을 겪어왔다”고 설명했다. 연구팀은 이를 개발하기 위해 뇌 안에 삽입한 전극과 연결해 전기신호를 즉시 해독할 수 있는 기계학습 알고리듬(machine learning algorithm)을 개발했다. 이 알고리듬은 뇌파와 인간의 성대, 얼굴 표정, 입술과 혀 움직임 등의 상관관계를 면밀하게 분석해 환자가 어떤 내용의 언어를 표현하고 있는지 분석하는 일이 가능하게 했다.

BMI를 완성한 후에는 임상실험에 들어갔다. 실제 치료 현장에 적용하기 위해 수술을 앞두고 있는 뇌전증 환자 5명을 모집한 후 수술 과정에서 뇌 안에 전극을 삽입했다. 전극을 안전하게 삽입한 후에는 환자들과 큰 소리를 대화를 나누며 언어를 관장하는 뇌 안에서 어떤 일이 일어나는지 관찰했다. 그리고 뇌 안에서 발생한 전기 신호(electrical signals)가 사람의 언어 표현에 어떤 영향을 미치고 있는지 파악할 수 있었다. 이 과정에서 연구팀은 언어와 관련된 대량의 정보가 발생하고 있으며, 매우 정교하고 치밀하게 사람의 성대, 얼굴 표정, 입술과 혀 움직임 등에 영향을 미치고 있다는 사실을 발견할 수 있었다고 밝혔다.

왓킨스 교수는 “지금 상황에서 말을 못하는 환자의 언어 표현을 43%까지 확인할 수 있지만 추가 연구를 통해 그 정확도를 더 높여나가겠다”고 말했다. 뇌파로 언어를 주고받을 수 있는 시대가 다가오고 있는 중이다.

원문보기

미래 ICT의 핵심은 ‘의식기술’

미래의 ICT는 지금과 비교하여 얼마나 다른 모습을 하고 있을까? 이 같은 궁금증에 대한 답을 ‘M.A.G.I.C’이란 5개의 철자로 제시한 행사인 ‘2019 퓨처 ICT 포럼’이 지난 27일 웨스틴조선 호텔에서 개최되어 주목을 끌었다.
‘M.A.G.I.C’이란 이른바 ICT 분야의 게임 체인저(game changer)로 불리는 △모빌리티(Mobility) △인공지능(AI) △5세대 이동통신(5G) △사물인터넷(IoT) △클라우드(Cloud)의 철자를 따서 만든 조합어다. 현실 세상을 이들 ICT 분야가 마치 마술과도 같이 신비롭게 변화시킨다는 의미를 담고 있다.
과학기술정보통신부가 주최한 이번 행사는 다가오는 4차 산업혁명의 핵심 연결고리 이자, 21세기 초연결 시대를 이끌 ICT의 미래상을 전문가들과 함께 조망하면서 각자의 견해를 공유하기 위해 마련됐다.

인간과 지식이 연결된 네트워크가 힘이 되는 세상

올해로 10회째를 맞이하는 이번 포럼이 특히 화제가 된 것은 기조발제를 맡은 ‘제롬 글렌(Jerome Glenn)’ 박사의 유명세 때문이다. 미래학자들의 모임인 ‘밀레니엄 프로젝트(Millenium Project)’와 ‘세계미래연구기구협의회’ 회장을 맡고 있는 글렌 박사는 40여 년간 미래를 연구해 온 세계적 미래학자이다.
‘다음 세대는 의식기술(conscious technology)의 시대’라는 주제로 발표한 글렌 박사는 “정보화 시대를 넘어 의식기술의 시대가 다가오고 있다”라고 예측하면서 “산업혁명 시대에는 기계가, 정보화 시대에는 정보가 우선이 됐다면 의식기술 시대에는 모든 것이 연결되는 네트워킹이 가장 주요해질 것”이라고 전망했다.
글렌 박사의 설명에 따르면 의식기술의 시대는 디지털 기술이 신체와 융합하고, 통신을 통해 인간과 인간, 인간과 사물들이 다양하게 연결되는 시대를 의미한다. 다시 말해 인간과 지식이 연결된 네트워크가 힘이 되고, 돈이 되는 시대라는 것이다.
그는 “2030년쯤이 되면 인간은 로봇화되고, 주변 환경은 지능화되어서 인간과 주변 환경이 센서를 통해 네트워킹되는 의식기술의 시대가 올 것”이라고 주장했다.
의식기술 연구의 대표적 사례로는 페이스북이 추진하고 있는 ‘빌딩 8(Building 8)’ 프로젝트가 꼽힌다. 이 프로젝트는 페이스북이 구글의 비밀 연구조직인 구글 X와 미 고등방위연구계획국(DARPA)에 몸담았던 ‘레지나 듀건(Regina Dugan)’을 최고 책임자로 영입하면서 본격적으로 시작됐다.
그녀는 인터뷰에서 “뇌파로 말하고 피부로 듣는 시스템을 만들고 있다”라고 밝히면서 “이 외에도 초감각의 의식기술을 만날 수 있는 수많은 ‘BCI(Brain Computer Interface)’ 과제들을 추진할 예정”이라고 말한 바 있다.
뇌파를 통해 대화하는 페이스북의 프로젝트 명칭은 ‘사일런스 스피치(Silence Speech)’라고 알려져 있다. 해당 프로젝트를 추진하고 있는 팀은 뇌파를 이용하여 분당 100자 문자 메시지를 보내고, 피부로 듣는 방법을 통하여 인류에게 새로운 감각을 제공한다는 야심찬 목표를 갖고 있다.

범용 인공지능의 등장에 대비해야

글렌 박사는 의식기술의 발전을 인간 지능의 능력이 증강될 수 있는 기회로 보았다. 그는 스티브잡스와 빌게이츠가 1991년에 함께 찍었던 사진을 보여주면서 “대략 2030년에서 2050년 사이가 되면 수백만 명의 사람들이 스티브잡스와 빌게이츠처럼 증강된 천재가 될 수 있을 것”이라고 전망했다.
평범한 사람을 증강된 천재로 만들 수 있는 방법을 연구하고 있는 기업으로는 ‘뉴럴 링크(Neural Link)’를 들 수 있다. 테슬라 창업자인 일론 머스크 CEO가 설립한 이 회사는 인간의 뇌에 작은 전극을 심어 무선으로 컴퓨터와 연결한 뒤 생각을 공유하는 기술인 ‘뉴럴 레이스(Neural Lace)’를 개발하고 있다.
머스크 CEO가 뉴럴 링크를 설립한 이유는 인공지능을 대단히 위험한 존재로 보는 그의 근본적 인식 때문이다. 머스크는 수많은 인터뷰를 통해 인공지능의 위험성에 대해 경고하면서 “인공지능에 맞설 수 있는 유일한 길은 인간이 인공지능보다 더 똑똑해지는 것밖에 없다”라고 강조해 왔다.
그는 “디지털 시대를 사는 인간은 뇌에 입력되는 정보량에 비해 출력량이 못 따라가는 한계를 겪고 있다”라고 우려하며 “두뇌 속에 뉴럴 레이스를 삽입하면, 뇌에서 디지털 디바이스로 직접 정보를 전송할 수 있게 되므로 그런 한계를 해결할 수 있게 될 것”이라고 전망한 바 있다.
글렌 박사도 머스크 CEO의 이런 의견에 어느 정도는 동조하고 있다. 인공지능이 사람을 다스리는 것 같은 극단적 상황까지는 가지 않더라도, 일자리 등을 통해 생존을 위협할 가능성은 충분하다는 것이다.
글렌 박사는 “분명한 사실은 시간이 갈수록 인공지능이 사람을 대신하여 결정을 내리는 경우가 많아질 것이라는 점”이라고 전망하며 “당장 ‘좁은 의미의 인공지능(narrow AI)’은 전 세계적으로 실업과 관련된 문제를 야기하고 있다”라고 말했다.
바둑이나 번역 등 특정 분야에서만 능력을 발휘하는 인공지능을 ‘좁은 의미의 AI’라고 한다. 이는 ‘범용 인공지능(general AI)’과는 상반된 개념으로서 스스로 학습하고 목표를 설정할 줄 아는 범용 인공지능이 출현한다면, 일자리뿐만 아니라 사람 중심의 생태계에 근본적 변화를 미치게 된다는 것이 전문가들의 의견이다.
발표를 마무리하며 글렌 박사는 “한국은 ICT 기술이 고도화되었으면서도, 인간의 정신과 관련한 전통이 내려오는 거의 유일한 국가”라고 평가하며 “만약 한국이 인간의 지능을 높이는 기술에 관심을 갖고 집중적으로 연구한다면 미래의 위상은 지금과는 크게 달라질 것”이라고 기대했다.

원문보기

실사에 가까운 전신 이미지를 인공적으로 만들어낼 수 있는 기기학습 알고리즘의 탄생

일본계 스타트업의 연구진들은 최근 인위적으로 만들어진 사람들에 대한 실질적인 전신 이미지를 만들어낼 수 있는 기기학습 알고리즘을 개발한 것으로 나타나 기기학습 알고리즘의 활용 동향에 대해 살펴보고자 한다.

일본의 Kyoto University로부터 파생된 정보기술 스타트업인 DataGrid社는 최근 자신들이 개발한 기기학습 알고리즘 기술의 성능을 시연하기 위해 자신들의 웹사이트에 새롭게 개발한 알고리즘을 접목시킨 동영상을 공개하였다고 한다. 해당 내용을 살펴보면 이들이 개발한 도구를 통해 다채로운 의상들이 자연스럽게 접목된 모델들이 자유롭게 움직이며 각기 다른 의상을 입은 형태로 변환되는 영상을 볼 수 있다.
[출처]

연구진들에 의하면 해당 알고리즘은 이른바 '적대적 생성신경망(Generative Adversarial Network)'이라 불리우는 기술이 접목되어 진짜와 같은 허위모델을 생성해 이를 판별하는 모델이 상호 경쟁을 통해 진짜와 같은 가상의 이미지를 만들어내는 차세대 딥러닝 알고리즘을 활용하였다고 한다. 해당 기술은 현실 세계에 존재하는 무언가의 모방물을 만드는데 흔히 사용되는 기술로서 DataGrid社는 적대적 생성신경망 기술을 활용해 하연 배경에 고해상도의 자동적인 모델들의 이미지를 만들어냈으며, 지난 과거에도 얼굴 이미지를 생성하기 위해 유사한 도구들이 사용되었다.

하지만 인위적으로 생성된 사람의 얼굴과 머리결, 그리고 옷을 포함해 모든 알고리즘이 고정밀 수준의 전신 이미지화로 탄생한 것은 이번이 처음이라 볼 수 있어 산업계의 주목을 받고 있으며, 가상의 모델이 동작하는 범위를 확대시키기 위해 알고리즘을 보다 세분화하는 작업이 병행되고 있는 것으로 알려지고 있다.

연구진들이 개발한 알고리즘들은 최초 인간 모델의 실사 이미지를 통해 최초 훈련되었으며, 훈련 이후에는 각각의 알고리즘이 역할을 분담하여 한쪽은 반복적으로 인간 모델에 대한 이미지를 생산하고, 다른 한쪽은 가상의 이미지로부터 진짜 이미지를 구별하는 임무를 담당하게 되었다고 한다. 이후 최초의 알고리즘이 두번째 알고리즘이 만들어낸 실제 이미지와 인공지능이 생성한 이미지 간의 차이점을 구별해낼 수 없을때 까지 가짜 이미지를 개선하는 작업을 반복하게 된다고 한다.

상기 기술은 신제품을 전시하기 위한 사진제작이 필요한 모델을 촬영하기 위해 소요되는 인간 모델과 촬영비용에 소요되는 비용을 절약할 수 있을 것으로 기대되고 있으며, 이로 인해 패션업계나 광고업계에 활용될 것으로 예상되고 있다. 또한 전신 모델을 자동적으로 생성하기 위한 인공지능의 정확성이 보다 향상될 경우, 보다 다양한 분야에서 활용될 수 있는 가능성 또한 예상되고 있어 향후 보다 정교한 기술력의 도입에 관심이 집중되고 있는 시점이다.
[출처]

원문보기

감정을 인지하는 인공지능의 탄생이 멀지 않았다

최근 Computing IT Leaders Summit에 참가한 미래학자 Shivvy Jervis씨가 감정을 인지하는 인공지능의 탄생에 관한 언급을 한 것으로 나타나 인공지능의 미래기술에 대한 트렌드를 살펴보기로 한다.

스페인의 통신사업체인 Telefonica社의 임원이었던 Jervis씨는 현재 정부와 기업체들의 신기술 관련 자문위원이자 미래학자로 불리우고 있으며, 런던 시장을 위한 프로젝트에 참여해 향후 25년 뒤의 도시가 어떤 형태로 구성될 것인지를 규명하는 업무를 수행하고 있는 것으로 나타났다.

추진되고 있는 기술프로젝트들 중 하나는 대화형 상거래라 불리우며 사람과 기기 간의 상호작용에 대한 모든 장애물이 제거되어 마찰없이 상시 사용가능한 인터페이스를 유지하며 최종 목표에 도달하기 위해 가능한 단계를 최소화하여 낮은 비용으로 상거래를 개시 가능하게 해줄 수 있는 장점을 지니고 있다고 한다. 이러한 기술은 시초부터 사람의 필요에 의해 개발이 되어지고 있는 형국으로 변모해나가고 있다.

여기에 감정인식 인공지능이 주목받고 있으며, 대화형 상거래의 대중적 얼굴은 실사에 가까운 아바타 형태라 볼 수 있겠으며, 인공지능에서 파생된 외모 중 대중적인 접근을 위해 선택되었다 볼 수 있겠다. 향후 아바타는 인간이 다수의 기업 및 조직과 접촉할 수 있는 가장 우선적인 접근점이 될 것으로 예상되며, 채팅봇과 같이 자주묻는 질문들에 대한 응답 뿐 아니라 인간의 도움요청에 대한 지원 또한 해줄 수 있을 것으로 예상되고 있다 하겠다. 뿐만 아니라 스마트폰 카메라나 음성인식기술을 활용해 사용자의 감정에 따라 반응도를 조절할 수도 있을 것으로 예상되는데, 이를 통해 보다 자연스러운 대화가 가능해질 수 있을 것으로도 기대되고 있다.

상기 시스템은 Soul Machines社와 기타 업체들에 의해 이미 개발이 진행 중이며, 수주 내 미국의 주요 은행권을 비롯한 정부 부처의 대민지원서비스에서도 활용될 예정이며, 대시보드 장착형 카메라인 Veoneer와 같이 운전자의 얼굴을 모니터링하여 집중력 유무를 카메라가 판단하여 운전자에게 직접적인 경고를 보내는 감정적 스캐닝 기법으로도 활용될 예정이라고 한다.

위와 같은 시스템들이 다수의 트렌드와 같은 교차범위에서 점차 진화하고 있으며, 데이터 과학자들이 예측분석을 가능하게 만들어주는 방대한 데이터를 만들어내는 창구가 되고 있다고도 한다. 물론 대다수 기업 및 조직들은 데이터로부터 가치를 창출하기 위해 기본적인 구조물 조차도 활용하지 못하고 있기는 하지만, 향후 데이터에 기반을 둔 지능형 시스템이 주된 역할을 차지함에 따라 앞으로의 활용도와 범용성 또한 높아질 것으로 예상되고 있다.

이처럼 인간과 자동화된 봇들의 상호작용은 앞으로 보다 활발해질 것으로 예상되고 있으며, 새로운 가상 도우미가 인력으로 취급됨에 따라 기업의 정보에 대한 무결성을 취급하는 최고 신뢰담당자를 비롯, 인간과 봇의 상호작용을 상담해주는 카운셀러 등과 같은 새로운 역할에 대한 정의와 구현 또한 필요할 것으로 예상되는 시점이다.

원문보기