인공지능

노타, 업스테이지 '솔라' 메모리 사용량 73% 줄여…온디바이스 초대형 모델 가시화

윤영훈 기자

입력 2026.03.05 08:51

숏컷

독자적 MoE 양자화 기술로 성능 저하 없이 191.2GB→51.9GB 축소…로봇·모빌리티 등 피지컬 AI 적용 본격화

노타가 고사양 서버에서만 구동되던 1000억 개 매개변수(100B) 규모의 초대형 인공지능(AI) 모델을 로봇·자동차 등 기기 자체에서 구동할 수 있도록 만드는 메모리 압축 기술을 선보였다.

노타는 차세대 양자화 기술을 개발했다고 5일 밝혔다. 회사는 이 기술을 업스테이지의 대형언어모델(LLM) '솔라'에 적용해 모델 크기를 대폭 압축함으로써 추론 비용을 절감하고 처리 속도를 높이는 동시에, 원본 모델의 정확도를 그대로 유지했다.

노타는 1000억 개 파라미터를 가진 '솔라 오픈 100B' 모델에 이 기술을 적용한 결과, 191.2GB에 달하던 메모리 사용량을 51.9GB까지 줄여 약 72.8%의 메모리를 절감했다. 성능지표인 PPL(Perplexity·숫자가 낮을수록 우수)은 6.81을 기록했으며, 이는 원본 모델(6.06)과 유사한 수준이다. 일부 범용 양자화 기법이 성능을 5배 이상 저하시키는 것과 달리, 노타는 성능 손실을 최소화하면서 메모리 효율을 크게 개선했다. 노타는 해당 기술에 대한 특허를 출원했다.

이번 기술은 'MoE(Mixture of Experts·전문가 혼합 구조)'의 기술적 난제를 해결했다는 점에서 주목받는다. 기존 양자화 기법은 전문가 모델별 특성을 고려하지 않고 모델 전체를 일괄 압축했다. 노타는 이 한계를 극복하기 위해 독자 알고리즘인 '노타 MoE 양자화 방법론'을 개발했다. 이 기법은 양자화 왜곡을 최소화하도록 설계됐으며, 정밀도가 필요한 부분은 유지하고 상대적으로 덜 중요한 부분만 압축해 경량화를 구현한다.

이번 개발은 과학기술정보통신부가 주도하는 '독자 AI 파운데이션 모델 프로젝트'의 일환이다. 기업들은 이 기술을 통해 고사양 GPU 인프라 없이도 신속한 AI 서비스를 제공할 수 있어 운영 비용 절감이 가능하다. 대용량 LLM을 기기 자체에 탑재할 수 있는 만큼, 로봇이나 자동차 등 피지컬 AI(온디바이스 AI) 환경에서도 고성능 AI를 안정적으로 구동할 수 있다.

채명수 노타 대표는 "이번 성과는 한국형 AI 파운데이션 모델인 솔라 100B에 노타만의 양자화 기법을 적용해 메모리를 대폭 줄이면서도 성능을 유지했다는 점에서 의미가 크다"며 "디바이스에 대규모 모델을 구현해야 하는 수요가 커질수록, 노타의 경량화·최적화 기술이 고성능 AI를 실현하는 핵심적인 역할을 해나갈 것"이라고 말했다.

윤영훈 기자 jihyunengen@finance-scope.com

많이 본 기사

산일전기, ‘1조 원 캐파’ 로드맵 가동… 데이터센터 초고압 글로벌 고객 ‘퀄테스트’ 끝냈다

남지완 기자

2026.04.14

아이엘, 글로벌 휴머노이드 기업 '애지봇'과 피지컬AI 로봇 공동개발 및 양산 업무협약 체결

윤영훈 기자

2026.04.20

트럼프 美 대통령, 이란 전쟁발 유가 급등에 '국방물자생산법' 발동…에너지망 전폭 지원

남지완 기자

2026.04.21

유니온머티리얼, ‘중국산 공습’ 페라이트 대신 ‘세라믹’으로 활로 찾는다

남지완 기자

2026.04.15

리브스메드, 일본 LAD와 전략적 투자 계약…차세대 수술 로봇 '스타크' 영상 기술 확보

윤영훈 기자

2026.04.21

섹터 VIEW

반도체

산업부, 한·일 경제통상·투자 협력 방안 모색… 에너지·자원·AI 등서 공조 노력 강조

산업통상부(산업부)는 여한구 통상교섭본부장이 일본 도쿄를 방문해 한일 양국의 경제 협력을 강화하고 첨단 산업 분야의 투자를 이끌어내는 적극적

정치

트럼프 대통령, 이란과 '무기한 휴전' 전격 선언…협상 불발 속 확전 부담 작용

바이오

프리미엄 회원에게만 제공되는 기사입니다

이차전지

탑머티리얼, '무전구체 기반 LFP 합성 기술' 특허 등록 완료

에너지/원자재

최영훈 채비 대표 "급속충전 인프라 1위 굳힌다"..코스닥 상장

부동산/인프라

태웅로직스, 우즈베키스탄 ADM글로벌과 합작법인..중앙아시아 물류 거점 확보

IT/크립토

대동, 무인 자율작업 'AI트랙터' 출시…농업 로봇 시대 개막

금융

아이지넷, 글로벌 기업 원인피니티와 韓 맞춤형 가상자산 책임보험 도입 MOU

우주/방산

NASA '아르테미스 2호', 인류 역사상 지구서 가장 먼 우주 닿았다..아폴로 13호 기록 경신

라이프

에이피알 메디큐브, K-뷰티 최초 美 '코첼라' 공식 스폰서 참여

문화/엔터

K-콘텐츠, 매출 157조·수출 140억달러 돌파… 역대 최고 실적 경신

반도체

산업부, 한·일 경제통상·투자 협력 방안 모색… 에너지·자원·AI 등서 공조 노력 강조

정치