Chat GPT의 발전과 빠른 보급으로 일반 사용자는 물론 해당 기술을 활용하여 서비스를 만드는 기업들의 언어를 활용한 AI기술에 대한 관심이 날로 증폭되고 있다. 그 중 핵심 기술인 언어모델, 즉 LLM(Large Language Model) 형태의 발전과 다양화는 인공지능 서비스를 활용하는 모든 이들의 귀추를 주목시키고 있다.
초기 ‘거대 언어 모델’인 LLM으로만 분류되고 활용되던 것이 최근 들어 SLM(Small Language Model), sLLM(small Large Language Model) 등 그 용도에 따라 다양하게 분류되고 있다. 오늘은 언어모델의 세 분류인 SLM, sLLM, LLM의 특징과 차이점을 알아보는 시간을 가져보겠다.
가볍고 빠른 속도, SLM
먼저 SLM은 Small Language Model의 약자로 말 그대로 언어모델의 지표를 나타내는 파라미터가 가장 작은 언어 모델이다. 학습 데이터의 양은 파라미터 수백만개 정도로 학습양이 적다보니 가볍고 빠른편이다. 이런 장점 때문에 휴대폰 등 디바이스 안에 장착해 자체 AI로 활용하는 경우가 많다. 실 예로 삼성전자가 자체적으로 개발한 SLM ‘삼성 가우스’는 갤럭시 s24에 탑재되어 통역 및 맞춤법 교정 기능을 제공하고 있다. 이런 온디바이스 형 SLM은 네트워크가 없어도 기기 내에서 작동하기 때문에 편리하다.
하이브리드 모델, sLLM
sLLM은 SLM과 LLM의 중간 정도의 사양으로 하이브리드 모델이라고 이해하면 편하다. SLM에 비해 더 똑똑한 성능이지만, 그만큼 가볍지는 않다. 간단한 작업은 디바이스 내에서 처리하고, 어렵고 복잡한 작업은 프라이빗 클라우드에서 처리하는 형태다. 이때 활용하는 클라우드는 개인정보 등 보안이 중요한 데이터를 관리하기 위해 퍼블릭이 아닌 자체 클라우드 내에서 처리한다.
높은 성능, LLM
LLM은 우리가 일반적으로 알고 있는 Chat GPT, 제미니 등 자체로 네트워크 망을 통해 활용되고 있는 거대 언어모델이다. 거대 언어모델의 파라미터는 수천 개에서 수억 개로 매우 큰 규모이다. 따라서, 데이터 학습을 수행하는데 들어가는 서버 비용과 시간이 앞선 모델보다 훨씬 크다. 대신 다양한 데이터 연산 작업이나 추론이 가능하여 활용도가 다양하다.
다음은, 현재 빅테크 기업들이 내놓아 활용되고 있는 언어모델들이다.

앞으로도 더 다양한 업체의 다양한 SLM, sLLM, LLM 모델들이 등장하여 언어모델 업계의 판도를 바꿔놓을 것으로 보인다. 또한, 현재 세 형태로 분류되어 있는 언어모델의 종류도 더 다양하게 나누어져 활용될 가능성도 있다. AI 시장이 커지는 만큼 언어모델의 중요성과 활용도는 날로 증가할 것이다.