인간 뇌를 본떠… 엔비디아 능가 AI반도체 세계 최초 개발

기사입력 2024-03-06 19:27:28
기사수정 2024-03-06 21:04:25

KAIST ‘상보형·트랜스포머’ 첫 선

뇌 신경을 반도체로 구현한 기술
데이터 분석해 맥락과 의미 학습
초저전력·초고속으로 LLM 처리
0.4초 만에 챗GPT 모델 구동 가능
A100대비 전력소모 625배나 줄어

삼성전자 28나노 공정 통해 개발
AI반도체 시장 ‘게임 체인저’ 주목

오픈AI의 챗봇 챗GPT 운영에 엔비디아의 그래픽처리장치(GPU) ‘A100’ 1만여개가 사용된다. GPU 수만 개가 방대한 양의 연산을 빠르게 처리하기 위해서는 고전력, 고비용이 들어갈 수밖에 없다. 결국 인공지능(AI)이 모든 산업에서 성장동력으로 빠르게 적용되기 위해선 이런 비효율적인 반도체와 전력소모를 줄이는 게 관건이다. 이런 가운데 카이스트(한국과학기술원) 연구진이 세계 최초로 초저전력·초고속의 AI 반도체 ‘상보형-트랜스포머’ 개발에 성공하면서 업계의 관심이 쏠리고 있다.

사진=게티이미지뱅크

◆세계 최초 ‘상보형-트랜스포머’ 개발

과학기술정보통신부는 유회준 카이스트 인공지능 반도체 대학원 교수 연구팀과 카이스트 PIM 반도체 연구센터가 400밀리와트(㎽) 초저전력을 소모하면서 0.4초 만에 거대 언어 모델(LLM)을 처리할 수 있는 AI 반도체 ‘상보형-트랜스포머’를 세계 최초로 개발했다고 6일 밝혔다.

상보형 트랜스포머란 인간 뇌의 구조와 기능을 모방해 설계한 뉴로모픽 컴퓨팅 시스템의 일종인 ‘스파이킹 뉴럴 네트워크’(SNN·뇌의 뉴런이 스파이크라는 시간에 따른 신호를 사용해 정보를 처리하는 방식)와 ‘심층 인공신경망’(DNN·시각적 데이터 처리에 사용되는 딥러닝 모델)을 선택적으로 사용해 트랜스포머 기능을 구현하는 기술이다.

즉, 인간의 뇌 신경을 반도체로 구현해 AI 처리기능을 가능하게 한 것이다.

트랜스포머는 문장 속 단어와 같은 데이터 내부의 관계를 추적해 맥락과 의미를 학습하는 신경망으로 챗GPT의 원천 기술이다.

연구팀은 4.5㎜×4.5㎜ 크기의 작은 AI 반도체 한 개에서 초저전력만 소모하면서도 LLM을 초고속으로 구현하는 데 성공했다. 무엇보다 사람의 뇌를 본뜬 ‘상보형-트랜스포머’는 사람의 뇌처럼 데이터 입력값이 크면 전력을 많이 쓰고 작으면 전력을 적게 쓰는 고효율을 특징으로 하고 있다.

연구팀은 이러한 상보형 심층신경망 기술을 LLM에 적용해 초저전력·고성능의 AI구동이 가능하다는 것을 입증했다. 또 이론에만 머물렀던 연구 내용을 세계 최초로 AI반도체 형태로 구현했다고 과기정통부는 설명했다.

◆AI 반도체 시장 판도 바꾸나

지금까지 챗GPT에 들어가는 LLM은 다량의 GPU와 250W(와트)의 전력소모를 통해 구동해야 했다. 짧은 시간에 무수히 많은 연산을 해야 하는 초거대 모델 기반 생성 AI 운영엔 엄청난 수량의 고효율 반도체 칩셋이 필요했다. GPU는 애초 목적이 AI 연산이 아니었기 때문에 전력 효율과 면적, 수행시간 등에서 고비용으로 돌아왔고, 심지어 샘 올트먼 오픈AI 최고경영자(CEO)마저도 최근 “챗GPT 1회 사용에 몇 센트가 든다”고 적기도 했다.

국내 관련 업체들과 정부가 나서 AI 반도체 개발을 추진한 이유도 이런 고전력·고비용 문제에 있었다. AI 서비스가 더 확대되면 저전력 고효율 반도체의 수요가 폭발적으로 늘어날 가능성이 높기 때문이다.

상보형 트랜스포머를 사용하면 엔비디아의 GPU(A100) 대비 전력소모를 625배 줄일 수 있다. 과기정통부 관계자는 “파라미터(매개변수) 수 감소에 더해 초저전력 처리로 에너지 효율을 극대화했다는 점에서 획기적인 연구”라고 설명했다.

업계에선 이번 ‘상보형-트랜스포머’가 삼성전자의 28나노 공정을 통해 개발된 만큼 완성도를 높인 뒤 상용화에 나설 경우 새로운 AI 반도체 시장을 개척할 수 있을 것으로 보고 있다.

이번 연구 결과는 지난달 19∼23일 미국 샌프란시스코에서 열린 ‘반도체 설계 올림픽’ 국제고체회로설계학회(ISSCC)에서 발표·시연됐다. 연구팀은 향후 언어모델에 국한하지 않고 다양한 응용 분야로 연구 범위를 확장할 예정이다.

유회준 교수는 “뉴로모픽 컴퓨팅은 IBM, 인텔 같은 회사들도 구현하지 못한 기술로, 초저전력의 뉴로모픽 가속기를 갖고 거대모델을 돌린 것은 세계 최초라고 자부한다”며 “앞으로도 관련 연구를 지속할 것”이라고 말했다.