구글이 2025년 5월 20일 ‘Gemma 3n’의 미리보기를 공개했다. 이 모델은 스마트폰, 태블릿, 노트북 등 모바일 기기에서 실시간으로 작동할 수 있도록 설계된 경량형 고성능 AI 모델이다. Qualcomm, MediaTek, 삼성전자 시스템LSI 등 모바일 하드웨어 업체와의 협업을 통해 개발됐으며, 향후 Android 및 Chrome 등 주요 플랫폼에 확대 적용될 예정이다.
Gemma 3n은 구글이 기존 Gemma 3 및 Gemma 3 QAT 모델의 후속으로 선보인 최신 오픈소스 AI 모델로, 특히 기기 내에서 작동하는 ‘온디바이스 AI’를 위해 설계되었다. 이는 클라우드 기반 대형 AI 모델에 의존하던 기존 패러다임에서 벗어나, 모바일 기기 자체에서 빠르고 효율적으로 AI 기능을 수행하도록 하기 위한 전략의 일환이다. 배경에는 개인정보 보호 요구 증가, 인터넷 연결 불안정 상황에서의 신뢰성 강화, 그리고 실시간 대응 필요성 등이 자리 잡고 있다.
Gemma 3n의 핵심 기술적 특징은 메모리 효율성과 성능을 동시에 확보한 경량 구조다. 이 모델은 Google DeepMind가 개발한 ‘Per-Layer Embeddings’(PLE) 기술을 채택해, 실제 모델 크기는 5B 또는 8B 파라미터 수준임에도 불구하고 동적 메모리 사용량은 각각 2GB 및 3GB에 불과하다. 이는 기존 동급 모델 대비 RAM 사용량을 획기적으로 줄이면서도 성능은 유지하는 구조로, 중저가 모바일 기기에서도 활용 가능성을 크게 높였다.
Gemma 3n은 또 하나의 독창적 구조인 ‘Many-in-1’ 설계를 채택했다. 이 설계는 4B급 모델 안에 2B급 고성능 하위 모델을 포함하고 있어, 상황에 따라 성능과 지연시간을 조절할 수 있는 유연성을 제공한다. ‘MatFormer’ 훈련 기법을 통해 단일 모델 내에 다양한 조합이 가능한 ‘mix’n’match’ 기능을 구현함으로써, 동일한 기반 모델로도 다양한 목적에 맞는 경량 서브모델 생성이 가능하다.
프라이버시 측면에서도 Gemma 3n은 기기 내 실행 방식을 통해 인터넷 연결 없이도 작동하며, 사용자의 민감한 데이터가 외부로 전송되지 않도록 설계되었다. 이 같은 특성은 음성 인식, 텍스트 생성, 이미지 및 비디오 이해 등 다양한 분야에서 실시간 상호작용 기능을 구현하는 데 유리하다. 예컨대 Gemma 3n은 오디오, 이미지, 텍스트를 혼합해 처리할 수 있는 기능을 보유하고 있으며, 고품질 음성 인식 및 음성 번역까지 지원할 수 있다. 특히 향후 공개 예정인 영상 이해 기능은 차세대 멀티모달 AI 개발의 핵심으로 주목받는다.
다국어 지원 성능도 향상되었다. 일본어, 독일어, 한국어, 스페인어, 프랑스어 등 주요 언어에서 성능이 강화되었으며, WMT24++와 같은 멀티링구얼 벤치마크에서 50.1%(ChrF)의 정확도를 기록했다. 이는 글로벌 시장을 겨냥한 제품군의 필수조건인 다국어 이해 성능에서도 기술적 완성도를 입증한 결과다.
성능 지표에서도 Gemma 3n은 주목할 만하다. Chatbot Arena Elo 평가에서 상위권에 랭크되었으며, 이는 사용자 선호도가 높은 상용 모델과도 경쟁 가능한 성능을 의미한다. 또한 MMLU 벤치마크 상에서 모델 크기 대비 높은 정확도를 기록하며, 중소형 모델의 한계를 기술적으로 극복한 사례로 평가받는다.
한편, 구글은 Gemma 3n을 단순 기술 공개에 그치지 않고, 책임 있는 AI 개발의 일환으로 각종 안전성 평가, 데이터 거버넌스, 윤리적 정렬 과정을 병행했다고 밝혔다. 특히 오픈모델로서의 위험성을 고려한 지속적인 리스크 평가 및 정책 개선을 강조했다. 이는 최근 각국 규제기관과 기술 기업 간의 AI 안전성 논의가 활발해지는 가운데, 개발사의 자율규제 수준이 향후 정책 수립에 어떤 영향을 미칠지 주목된다.
개발자 접근성도 확보되었다. 현재 구글 AI Studio를 통해 클라우드 기반 실험이 가능하며, Google AI Edge를 활용한 온디바이스 통합 개발도 가능하다. 이는 구글 생태계에서의 통합성을 고려한 설계로, 향후 Gemini Nano 모델의 확장 및 구글 앱 전반으로의 적용 기반이 될 것으로 보인다.
이와 같은 설계는 최근 경쟁사들도 관심을 기울이고 있는 온디바이스 AI 기술 경쟁의 중심에서 구글의 입지를 강화할 것으로 예상된다. 애플이 M 시리즈 칩셋을 기반으로 한 로컬 AI 처리 기능을 고도화하고 있는 상황에서, Gemma 3n은 구글 진영의 모바일 AI 전략을 구체화하는 핵심 기술로 부상한다.
Gemma 3n은 향후 AI의 중심축이 클라우드에서 기기로 이동하는 전환점에서 중요한 시험대가 될 것으로 보인다. 2025년 하반기부터 Gemini Nano와 함께 Android 및 Chrome 플랫폼을 중심으로 광범위한 배포가 시작될 예정이며, 이를 통해 사용자는 더욱 개인화되고 즉각적인 AI 기능을 체감할 수 있을 전망이다.
구글의 전략은 오픈모델 생태계를 강화하고, 모바일 AI 시장을 선점하려는 장기적 구상과 맞닿아 있다. 규제 리스크와 경쟁 환경 속에서 Gemma 3n이 온디바이스 AI의 표준으로 자리매김할 수 있을지, 관련 기술의 상용화 및 지속적 성능 개선 여부가 관건이 될 것으로 분석된다.
기사 원문: https://developers.googleblog.com/en/introducing-gemma-3n/
차세대 온디바이스 AI 시대 여는 ‘Gemma 3n’ 미리보기 공개
박혜신 기자
|
2025.06.30
|
조회 12
모바일 기기 기반 실시간 AI 위한 경량 고성능 모델, 사용자 프라이버시 강화 및 다중 모달 처리 가능
박혜신 기자 | aipen.hyesin@gmail.com