기사 메일전송
카카오, ‘스스로 사고·검증하는’ 한국형 하이브리드 멀티모달 AI 공개
  • 기사등록 2026-01-06 10:12:32
기사수정

카카오는 5일 일상적인 대화부터 고난도 논리 추론까지 하나의 모델로 처리할 수 있는 하이브리드 멀티모달 언어모델 ‘Kanana-v-4b-hybrid’를 공개하고, 한국어에 최적화된 인공지능(AI) 기술 경쟁력을 제시했다.

 

이번에 공개된 ‘Kanana-v-4b-hybrid’는 지식 기반의 일반 대화 기능과 논리적 추론 기능을 단일 모델에 통합한 것이 특징이다. 단순한 질의응답을 넘어, 정보를 종합·계산하고 결과를 스스로 점검하는 자기 검증 과정을 거쳐 답변을 도출함으로써 인공지능의 한계로 지적돼 온 환각(hallucination) 현상을 최소화했다. 이를 통해 표, 영수증, 수학 문제 등 복합적인 조건이 포함된 과제에서 높은 정확도를 구현했다.

 카카오가 5일 일상 대화부터 고난도 추론까지 하나의 모델로 처리하는 하이브리드 멀티모달 언어모델 ‘Kanana-v-4b-hybrid’를 공개했다.

해당 모델은 지난해 오픈소스로 공개된 ‘Kanana-1.5-v-3b’를 기반으로 개발됐으며, ▲기초 학습 ▲장문 사고 사슬(Long Chain of Thought) 학습 ▲오프라인 강화학습 ▲온라인 강화학습으로 이어지는 4단계 고도화 학습 절차를 거쳤다. 카카오는 이와 같은 학습 구조가 복잡한 문제 해결 과정에서 조건 누락과 계산 오류를 줄이는 데 효과적이라고 설명했다.

 

한국어 이해와 논리 전개 능력에서도 경쟁력을 입증했다. 다수의 글로벌 AI 모델이 한국어 질문을 영어로 변환해 사고한 뒤 다시 번역하는 과정에서 맥락 손실을 겪는 반면, ‘Kanana-v-4b-hybrid’는 한국어 질문을 그대로 이해하고 추론하도록 설계됐다. 이를 바탕으로 대학수학능력시험 사회탐구와 수학 영역 등 한국어 조건 해석이 중요한 문제에서 높은 정답률을 기록했다.

 

특히 한국 교육 체계를 기반으로 한 AI 학력 평가 벤치마크인 KoNET(Korea National Educational Test Benchmark)에서 92.8점을 획득하며 한국어 이해·추론 역량을 객관적인 수치로 입증했다. 카카오는 과학·공학, 문서 이해, 일반 시각 질의응답(VQA) 등 다양한 영역에서도 국내외 유사 규모 모델 대비 우수한 성능을 보였다고 밝혔다.

 

카카오는 향후 사용자가 별도로 모델을 선택하지 않아도 AI가 질문의 복잡도를 판단해 일반 모드와 추론 모드를 자동으로 전환하는 방향으로 기술을 고도화할 계획이다. 이를 통해 하나의 대화 환경에서 단순 질의와 복잡한 분석 요청을 모두 처리하면서도 연산 자원을 효율적으로 활용하는 비용 효율적인 AI를 구현한다는 구상이다.

 

김병학 카나나 성과리더는 “Kanana-v-4b-hybrid는 한국어 환경에서 자연스럽고 정확한 사고와 응답이 가능한 모델”이라며 “일상적인 대화부터 복잡한 작업까지 하나의 AI로 수행할 수 있는 의미 있는 연구 성과”라고 밝혔다. 이어 “한국어에 특화된 자체 AI 모델을 통해 글로벌 경쟁력을 강화하고, 국내 AI 생태계 발전을 선도해 나가겠다”고 말했다.

 

한편 카카오는 멀티모달 언어모델 ‘Kanana-o’와 ‘Kanana-v-embedding’을 잇달아 공개한 데 이어, 에이전틱 AI 구현에 최적화된 ‘Kanana-2’를 오픈소스로 선보이는 등 AI 기술 고도화와 국내 AI 연구 생태계 활성화에 지속적으로 나서고 있다.


[경제엔미디어=김재호 기자]

기사수정
  • 기사등록 2026-01-06 10:12:32
인터넷신문윤리위원회
확대이미지 영역
  •  기사 이미지 도심 속 자연 생태계...월계화
  •  기사 이미지 도심 속 자연 생태계...대나무
  •  기사 이미지 도심 속 자연 생태계...겨울철새 ‘비오리’
최신뉴스더보기
한얼트로피
코리아아트가이드_테스트배너
정책브리핑_테스트배너
유니세프_테스트배너
국민신문고_테스트배너
정부24_테스트배너
모바일 버전 바로가기