카카오 Kanana 베타 테스터 지원!
카카오 Kanana 베타 테스터 활동을 시작했습니다.
신청하게 된 계기와 앞으로 뭘 해볼 건지에 대해 정리해봤습니다.
DocentAI와 한국어의 한계
DocentAI는 넷플릭스, 왓챠 같은 스트리밍 서비스에서 영상을 보다가 이해하기 어려운 자막이 나왔을 때,
클릭 한 번으로 AI가 설명해주는 크롬 확장프로그램입니다. (아직 정식 등록 전)
속어, 사투리, 사극 고어체, 신조어 같은 자막이 나오면 외국인뿐 아니라 한국인도 당황하는 경우가 있습니다.
DocentAI는 그 맥락을 AI가 해설해주는 서비스입니다.
이번 제미나이 해커톤에 참여하면서 Gemini 3 API를 적용했었는데요.
영어 콘텐츠나 글로벌 드라마에서는 무난했는데,
한국 드라마, 특히 사투리나 신조어가 밀집된 장면에서는 설명이 밋밋하거나 맥락이 빠진 답변이 나오는 경우가 많았습니다.
해커톤 데모영상 작품을 바꾼 이유
DocentAI의 해커톤 데모 영상을 만들 때, 처음에는 케데헌으로 준비했었습니다.
그런데 막상 Gemini 응답을 보니 “혼문” 같은 표현에서 어설픈 설명이 나왔고, 맥락을 제대로 짚지 못했습니다.
결국 기묘한 이야기로 교체했습니다. 영어 콘텐츠에서는 Gemini가 훨씬 안정적이었기 때문입니다.
데모는 잘 마무리됐지만, 한국어 콘텐츠에서의 한계는 숙제로 남았습니다.
Kanana 베타 테스터 지원
그러던 중 Kanana 베타 테스터로 지원했고, 카카오 테크 블로그에 따르면 Kanana가 멀티모달 언어모델로 한국어 지시 이행 능력과 문화적 뉘앙스 처리에서 경쟁 모델 대비 높은 성능을 보인다고 합니다. (오호!)
DocentAI가 풀려는 문제, 한국어 자막의 맥락과 뉘앙스 해설, 방향이 딱 맞았습니다.
베타테스터 선정 메시지를 받고, 퇴근 후 바로 발급된 API 키를 DocentAI에 연결하는 코드를 작성했습니다.
DocentAI는 이미 멀티 LLM 구조로 설계되어 있어서, 새 모델을 추가하는 게 어렵지 않았지만, 모델별로 주입하는 부분을 템플릿화하도록 설계를 바꿨습니다.
즉 기존 Gemini 클라이언트 옆에 Kanana 클라이언트를 나란히 붙이는 작업이었습니다. (코드 설명은 다음 포스트에서.)
앞으로 할 것들
베타테스터 활동으로 세 가지를 해볼 계획입니다.
1. DocentAI에 Kanana 통합 ← 완료
Gemini와 Kanana를 동시에 운영하는 멀티 LLM 구조로 전환했습니다.
2. 한국어 벤치마킹
속어·신조어, 사극·고어체, 방언·사투리 총 15개 테스트 케이스를 만들어 Gemini vs Kanana 응답 품질을 비교합니다.
채점은 Claude를 Judge로 사용합니다 (Gemini, Kanana 어느 쪽과도 이해관계 없는 제3자).
3. 결과 공개
채점 결과와 분석을 GitHub과 블로그에 공개할 예정입니다.
어떤 카테고리에서 어떤 모델이 강한지, 멀티 LLM 라우팅 전략이 의미 있는지를 실증 데이터로 확인해볼 것입니다.