인간의 뇌는 언어를 처리할 때 복잡한 메커니즘을 사용하며, 최근 AI 기술 특히 대규모 언어 모델(LLM)은 이 과정을 연구하는 데 중요한 도구가 되고 있습니다. AI 모델은 브로카 영역과 같은 뇌의 특정 부위와 유사하게 작동하며, 예측 능력을 통해 언어를 처리하는 방식에서 인간 뇌와 닮아 있습니다. 이 연구는 뇌의 언어 처리 방식을 이해하고, 향후 AI와 뇌 연구의 융합을 통한 새로운 발견을 기대하게 합니다.
인간의 뇌는 언어를 처리하는 데 매우 복잡하고 정교한 메커니즘을 사용합니다. 이 메커니즘을 이해하려는 연구는 오랫동안 이어져 왔으며, 최근의 기술 발전 덕분에 우리는 그 비밀에 한 발짝 더 다가갈 수 있게 되었습니다. 특히, 대규모 언어 모델(LLM)과 같은 인공지능(AI) 기술은 뇌의 언어 처리 방식을 연구하는 데 새로운 도구를 제공하고 있습니다. 이러한 AI 모델들은 마치 전자 실험실 쥐처럼 활용되어, 인간에게는 불가능하거나 비윤리적인 방식으로 언어 처리 과정을 탐구할 수 있게 합니다. 이번 글에서는 AI와 뇌의 유사성을 중심으로 인간의 뇌가 언어를 처리하는 방식을 간단히 알아보겠습니다.
대규모 언어 모델은 놀랍게도 우리의 말과 글을 흉내 내는 데 능숙합니다. 이제 그들은 언어에 대한 전자 실험 쥐 역할을 하며 인류의 가장 중요한 능력 중 하나의 신비에 대한 통찰력을 제공합니다.
2018년 말, MIT의 신경과학자인 에벨리나 페도렌코는 실리콘 밸리의 AI 연구실에서 나오는 새로운 “대규모 언어 모델”(또는 LLM)에 대해 알게 되었습니다. 이 모델은 산문(이야기나 글)을 생성하고 이해할 수 있는 능력 덕분에 “생성 AI”라고도 불립니다. 페도렌코가 이 모델이 만들어낸 글을 보았을 때, 그녀는 정말 놀랐습니다. 글이 너무나 일관성 있고 자연스러워서 마치 사람이 쓴 것처럼 느껴졌기 때문입니다. 페도렌코는 “너무 완벽했습니다.”라고 말했습니다. 기계가 이렇게 자연스럽고 인간처럼 긴 글을 생성할 수 있다는 것이 믿기지 않았던 것입니다.
연구자들은 오랫동안 뇌가 브로카 영역과 같은 개별적인 좌반구 중심에서 언어를 처리한다는 것을 알고 있었습니다. 브로카 영역은 여러 fMRI 스캔을 기반으로 여기(빨간색)에 매핑되어 있습니다. 하지만 그들은 여전히 이러한 중심이 어떻게 작동하는지 완전히 이해하지 못합니다. LLM은 이제 과학자들에게 언어 처리 및 습득의 다양한 측면을 분석할 수 있는 새로운 도구를 제공했습니다. 이미지 출처: Science Source/ZEPHYR.
새로운 언어 모델들이 계속 개발되면서, 각각이 이전 모델보다 더 뛰어나게 되었습니다. MIT의 신경과학자인 에벨리나 페도렌코와 많은 언어 연구자들은 이 프로그램들이 실제로 대단하다는 것을 인정하게 되었습니다. 그녀는 “우리 생애 동안 상상할 수 없는 수준의 언어적 행동이었습니다!”라고 말했습니다.
2022년 말, ChatGPT라는 언어 모델이 출시되자 전 세계 미디어에서 큰 화제가 되었습니다. 언어 연구자들은 이 모델이 우리 뇌의 좌반구 언어 영역과 비슷한 방식으로 작동한다는 놀라운 사실을 발견했습니다. 즉, 이 모델은 뇌와 같은 원리로 언어를 처리한다는 것입니다.
이러한 AI와 뇌의 유사성이 나타나는 이유는 아직 논쟁의 여지가 있습니다. 하지만 이것은 뇌의 언어 영역이 어떻게 작동하는지를 이해하려는 신경과학자들에게 큰 기회를 제공합니다. 과거에는 언어가 인간에게만 고유한 기능이기 때문에 연구가 어려웠습니다. 다른 기능을 연구할 때처럼 동물 모델을 사용할 수 없었기 때문입니다. 하지만 이제 새로운 AI 모델이 마치 언어 연구를 위한 전자 실험용 쥐처럼 활용될 수 있게 되었습니다.
물론, 이 AI 모델이 모든 인지 기능을 포함하는 것은 아닙니다. 때로는 논리가 부족하거나 말이 안 되는 문장을 생성할 때도 있습니다. 하지만 이 모델은 뇌가 어떻게 단어의 흐름을 이해하는지에 대한 중요한 증거를 제공하고 있습니다. 또한 연구자들이 뇌의 언어 영역을 더 잘 이해할 수 있도록 도와줍니다. 스위스의 신경과학자인 마틴 슈림프는 “이것이 AI가 인간 언어 시스템의 완벽한 모델이라는 의미는 아닙니다.”라고 말했습니다. “하지만 현재의 데이터로 볼 때 정말 가깝습니다.”
언어의 패턴
의사와 뇌 연구자들은 19세기부터 뇌의 왼쪽 특정 부위가 언어를 이해하거나 사용하는 데 중요하다는 사실을 알고 있었습니다. 만약 이 부위에 손상이 생기면 언어 능력이 사라질 수 있습니다. 1990년대부터 신경 과학자들은 기능적 MRI(fMRI)를 사용하여 뇌의 다양한 부위가 어떻게 반응하는지 자세히 연구하기 시작했습니다. 이 연구에 따르면, 긴 대화를 나누거나 영화를 볼 때 뇌의 거의 모든 부위가 잠시 활성화됩니다. 그러나 왼쪽 부위는 언어에 의해 항상 활성화되는 유일한 부위입니다.
10년 전에 개발된 고급 fMRI 기술에 따르면, 이 시스템은 말하기, 쓰기, 수화 언어 등 모든 종류의 언어에 동일하게 반응합니다. 하지만 논리 퍼즐, 수학 문제 또는 음악 같은 언어가 아닌 것에는 반응하지 않습니다. 이는 언어가 뇌의 다른 기능들과는 분리되어 있음을 의미합니다. 하지만 언어 영역은 혼자서 모든 작업을 할 수 없습니다. 긴 이야기나 대화를 이해하려면 뇌의 다른 부위의 도움을 받아야 합니다. 예를 들어, 논리와 사회적 추론을 담당하는 영역과 함께 작동합니다.
하지만 fMRI 연구만으로는 뇌의 언어 영역이 어떻게 이러한 작업을 수행하는지 정확히 알기 어렵습니다. 여기서 대규모 언어 모델(LLM)이 새로운 통찰력을 제공할 수 있습니다. LLM은 언어를 처리하는 뇌의 방식을 이해하는 데 도움을 줄 수 있습니다.
고급 fMRI 기술에 따르면, 좌반구 언어 네트워크는 언어 이해와 생산을 위한 데이터 교환소 역할을 합니다.
AI와 뇌의 유사성
2014년에 MIT의 신경과학자 팀은 AI 모델과 뇌의 유사성에 대한 중요한 증거를 발견했습니다. 이들은 시각 영역에서 연구를 했는데, 연구자들은 뇌에서 영감을 받아 “신경망” 시각 모델을 사용했습니다. 신경망은 컴퓨터처럼 데이터를 단계별로 처리하지 않고, 우리 뇌의 뉴런처럼 복잡한 연결망을 통해 데이터를 처리합니다. 신경망은 훈련을 통해 프로그래밍됩니다. 예를 들어, 많은 이미지와 그 이미지가 무엇을 나타내는지(동물, 자동차 등)를 보여주고 신경망이 이를 학습하게 합니다. 반복적인 학습을 통해 신경망은 이미지를 정확하게 식별할 수 있게 됩니다.
MIT 팀은 또한 원숭이의 시각 피질에서 전극으로 뇌의 활동을 측정했습니다. 이 데이터를 신경망의 처리 활동과 비교했을 때, 두 시스템이 놀라울 정도로 유사하게 작동한다는 것을 발견했습니다. 이는 뇌와 AI가 비슷한 신경 알고리즘을 사용한다는 것을 의미했습니다.
언어와 AI 모델
에벨리나 페도렌코는 언어 모델에서도 유사한 현상을 발견했습니다. 연구자들은 43개의 서로 다른 언어 모델의 내부 활동을 인간 뇌의 활동과 비교했습니다. 여기에는 뇌의 활동을 측정하는 fMRI와 ECoG(전기피질도법) 데이터가 포함되었습니다. ECoG는 고해상도로 뇌의 전기적 활동을 측정할 수 있는 방법입니다. 연구 결과, 언어 모델의 활동이 인간 뇌의 언어 영역과 매우 유사하다는 것을 발견했습니다. 이는 AI 모델이 뇌와 같은 방식으로 언어를 처리할 수 있다는 것을 보여줍니다.
예측의 역할
AI 모델과 우리 뇌가 유사하다는 증거는 예측 능력에서 시작됩니다. 2017년에 Google 엔지니어들이 만든 “Transformer”라는 거대한 신경망이 있습니다. 이 신경망은 현재 많은 AI 언어 모델의 기반이 됩니다. 변환기는 “그녀는 ___로 돌았습니다”와 같은 빈칸 채우기 문제를 수백만 번 연습하며 훈련됩니다. AI는 누락된 단어를 예측하는 데 매우 능숙해질 때까지 학습합니다. ChatGPT도 비슷한 방식으로 학습되었으며, 위키피디아와 인터넷의 많은 부분을 이용해 영어에 대한 예측 모델을 만들었습니다.
암스테르담 대학교의 인지 과학자 미샤 하일브론은 예측이 뇌의 거의 모든 곳에서 중요한 역할을 한다고 말합니다. 뇌는 끊임없이 실제로 들어오는 정보와 예상되는 정보를 비교하여 정보를 처리합니다. 놀라운 일이 발생하면, 뇌는 이를 다음 번 예측을 개선할 기회로 사용합니다. 예를 들어, 대화 중에 뇌는 현재 상황과 세상에 대해 알고 있는 모든 것을 바탕으로 다음에 무슨 말을 할지 예측합니다.
이 방식은 트랜스포머 기반 AI 언어 모델이 훈련받는 방식과 매우 유사합니다. 여러 신경과학 연구실에서 독립적으로 AI 모델과 뇌의 유사성을 확인했습니다. 예를 들어, 프린스턴 대학교의 연구원들은 AI와 뇌가 예측을 중심으로 정보를 처리한다는 것을 발견했습니다.
하지만 예측이 AI와 뇌의 유사성을 만드는 유일한 요소인지는 아직 확실하지 않습니다. 독일 자르브뤼켄에 있는 연구소의 신경과학자 마리야 토네바는 AI 모델이 해리포터 책과 같은 긴 이야기를 요약할 때도 뇌와 잘 정렬된다는 것을 발견했습니다. 이는 장기적인 이야기 이해도 AI와 뇌의 유사성에 중요한 역할을 할 수 있음을 시사합니다.
결론적으로, AI와 뇌의 유사성은 예측 능력에서 비롯되지만, 이 외에도 여러 요소가 있을 수 있습니다. 이 유사성을 연구하는 것은 뇌의 언어 영역이 실제로 어떻게 작동하는지 더 많이 이해하는 데 도움이 됩니다.
전자 실험실 쥐
연구자들은 AI 모델을 실험실 쥐처럼 사용하여 인간에게는 불가능하거나 비윤리적인 방식으로 조작할 수 있습니다. 예를 들어, 모델의 특정 부분을 삭제하거나 모델이 이전 단어에만 집중하도록 만들 수 있습니다. 이러한 조작은 모델과 뇌의 유사성을 평가하는 데 도움이 됩니다.
뇌 스캔과 AI 모델의 비교
Fedorenko 연구실에서는 인간이 문장을 읽을 때 뇌 스캔을 기록하고, 동일한 문장을 AI 모델에 입력하여 반응을 비교했습니다. 연구 결과, 문장의 어순이 바뀌어도 뇌와 AI 모델의 반응은 크게 변하지 않았습니다. 이는 언어를 처리할 때 문법보다 개별 단어의 의미에 더 집중한다는 것을 의미합니다.
GPT-2 XL을 이용한 연구
MIT의 연구자들은 GPT-2 XL 모델을 사용하여 1,000개의 테스트 문장을 읽는 인간의 뇌 반응을 예측했습니다. 이 모델은 신경 활동을 높일 문장과 낮출 문장을 찾아냈습니다. 예를 들어, “그들은 발코니로 걸어 나갔다”와 같은 문장은 뇌 반응이 낮고, “나는 진보적이고 너는 옳다”와 같은 문장은 뇌 반응이 높았습니다.
향후 연구 방향
연구자들은 이 기술을 사용하여 뇌의 언어 영역을 더 자세히 연구하고, 뇌가 단어의 의미를 문장의 의미로 통합하는 위치와 시점을 파악하고자 합니다. 또한, 언어 모델과 다른 인지 기술의 AI 모델을 뇌와 일치시키는 연구도 진행 중입니다.
많은 연구자들은 이러한 제약 조건 하에서 학습하는 것이 실제로 신경망에 이점이 될 수 있으며, 이러한 AI가 극도로 컴팩트하고 효율적이며 아마도 생물학적으로 현실적인 세계를 모델링하는 방법을 생각해내도록 강제할 수 있다고 주장합니다.이는 페도렌코와 그 밖의 모든 이들을 앞으로 몇 년 동안 바쁘게 만들 것입니다. 그녀는 “저는 생각합니다.”라고 덧붙입니다. “재밌고 즐거운 10년이나 20년이 될 것 같습니다.”
https://www.pnas.org/doi/10.1073/pnas.2410196121
AI와 인간의 뇌가 언어를 처리하는 방식의 유사성은 우리에게 많은 것을 시사합니다. AI 모델을 통해 뇌의 언어 처리 과정을 더 잘 이해할 수 있으며, 이는 언어 학습과 관련된 신경 과정을 더욱 깊이 연구할 수 있게 합니다. 앞으로도 AI와 뇌 연구의 융합은 새로운 발견과 혁신을 이끌어낼 것입니다. 이 흥미로운 여정을 통해 우리는 뇌의 비밀을 더욱 밝히고, 언어와 관련된 다양한 신경 과정을 이해하는 데 큰 진전을 이룰 수 있을 것으로 생각합니다.