코히어(Cohere), 오픈 다국어 경량 모델 ‘타이니 아야(Tiny Aya)’ 패밀리 출시

코히어(Cohere), 오픈 다국어 경량 모델 ‘타이니 아야(Tiny Aya)’ 패밀리 출시

70개 이상 언어 지원·스마트폰에서도 구동…글로벌 사우스 최초 AI 정상회담 ‘인도 AI 임팩트 서밋’ 현장 발표

ARR 2억 4천만 달러 돌파·분기 성장률 50% 유지…에이든 고메즈(Aidan Gomez) CEO “IPO 임박” 시사

캐나다 엔터프라이즈 AI 기업 코히어(Cohere)가 인도 뉴델리에서 열린 ‘인도-AI 임팩트 서밋 2026’ 현장에서 70개 이상의 언어를 지원하는 오픈 다국어 경량 모델 ‘타이니 아야(Tiny Aya)’ 패밀리를 공식 출시했다.

스마트폰에서도 구동 가능한 33억 5천만 파라미터 규모의 오픈웨이트(open-weight) 모델로, 아프리카·남아시아·아태 지역 특화 버전을 포함한 4개 모델 라인업을 구축했다. 연간 반복 매출(ARR) 2억 4천만 달러를 돌파하며 기업공개(IPO)를 예고한 코히어가 대형 모델 경쟁을 넘어 ‘경량화·다국어·온디바이스’ 영역으로 전선을 확장한 것으로, AI 접근성 민주화와 글로벌 사우스 시장 공략에 본격적인 신호탄을 솼다.

1. 발표 배경: 인도-AI 임팩트 서밋 2026

타이니 아야(Tiny Aya)가 발표된 ‘인도-AI 임팩트 서밋 2026(India–AI Impact Summit 2026)’은 2월 16~20일 뉴델리 바라트 만담(Bharat Mandapam)에서 개최된 글로벌 AI 정상회담이다. 2023년 영국 블레치리 파크, 2024년 한국 서울, 2025년 프랑스 파리에 이은 네 번째 국제 AI 정상회담이자, 글로벌 사우스(Global South)에서 개최된 최초의 AI 정상회담이라는 점에서 상징적 의미가 크다.

나렌드라 모디(Narendra Modi) 총리가 직접 주도한 이번 서밋에는 오픈AI(OpenAI)의 샘 올트만(Sam Altman), 구글(Google)의 순다르 피차이(Sundar Pichai) 등 글로벌 테크 기업 CEO들과 20개국 이상의 정상급 대표단이 참석했다. ‘모든 이의 복지, 모든 이의 행복(Sarvajana Hitaya, Sarvajana Sukhaya)’을 모토로 사람(People)·지구(Planet)·발전(Progress)의 3대 기본원칙 아래 AI의 실질적 영향력과 포용성에 초점을 맞치고 있다.

코히어(Cohere)가 이 서밋을 타이니 아야(Tiny Aya) 발표 무대로 선택한 것은 전략적 판단으로 보인다. 인도는 22개 공식어와 수백 개의 방언이 공존하는 세계 최대의 언어적 다양성 시장이자, 젠은 기술 친화적 소비자 기반과 풍부한 기술 인력을 보유한 핵심 AI 시장이기 때문이다.

2. 타이니 아야(Tiny Aya) 모델 상세

■ 33억 파라미터 베이스, 지역 특화 4개 모델 라인업

코히어(Cohere)의 연구 조직인 코히어 랩스(Cohere Labs)가 개발한 타이니 아야(Tiny Aya)의 베이스 모델은 33억 5천만(3.35B) 파라미터 규모다. 코히어 공식 블로그에 따르면 “스마트폰에서도 구동 가능한 수준”으로 설계되었으며, 용도와 지역에 따라 세분화된 4개 모델 라인업을 함께 선보였다.

모델명

대상 지역/언어권

특징

TinyAya-Global

전 세계 70개어 이상

사용자 명령 수행력 강화 파인튜닝 버전

TinyAya-Earth

아프리카 언어권

아프리카 지역 언어 특화 학습

TinyAya-Fire

남아시아 언어권

벵골어·힌디어·펀잡어·우르두어·구자라트어·타밀어·텔루구어·마라티어 등

TinyAya-Water

아태·서아시아·유럽

아시아태평양, 서아시아, 유럽 언어권 커버

▲ 타이니 아야(Tiny Aya) 모델 라인업 구성 [출처: 코히어(Cohere)]

코히어(Cohere) 측은 “이러한 접근 방식을 통해 각 모델이 더 강력한 언어적 기반과 문화적 뉴앙스를 학습할 수 있으며, 해당 커뮤니티에 보다 자연스럽고 신뢰할 수 있는 시스템을 제공할 수 있다”고 밝혔다. 모든 타이니 아야(Tiny Aya) 모델은 지역 특화와 동시에 광범위한 다국어 커버리지를 유지하고 있어, 추가 연구와 적응을 위한 유연한 출발점이 될 수 있다.

▲ 타이니 아야(Tiny Aya) 모바일 데모 화면 – 아랍어로 시 해석을 요청하는 사용 사례 [출처: 코히어 랩스(Cohere Labs)]

3. 기술 사양 및 접근성

■ 엔비디아(NVIDIA) H100 64기로 학습, 온디바이스 최적화

타이니 아야(Tiny Aya) 모델은 엔비디아(NVIDIA) H100 GPU 64기로 구성된 단일 클러스터에서 상대적으로 적은 컴퓨팅 자원을 활용해 학습됐다. 코히어(Cohere)는 온디바이스 실행에 최적화된 소프트웨어 아키텍처를 설계해, 동급 모델 대비 적은 연산 자원으로도 구동이 가능하도록 했다.

이는 인도와 같이 언어적 다양성이 높고 인터넷 접근성이 균일하지 않은 시장에서 특히 의미가 크다. 오프라인 번역, 로컬 언어 기반 앱 개발 등 상시 인터넷 연결이 어려운 환경에서도 다양한 활용 시나리오를 열어줄 수 있다.

■ 모델 배포 및 접근 채널

모델은 허깅페이스(HuggingFace), 캐글(Kaggle), 올라마(Ollama)를 통해 다운로드 가능하며, 코히어 플랫폼(Cohere Platform)에서도 이용할 수 있다. 학습 및 평가 데이터셋은 허깅페이스(HuggingFace)에서 공개 예정이며, 학습 방법론 기술 보고서도 추후 발표할 계획이다.

▲ 타이니 아야(Tiny Aya) 웹 채팅 인터페이스 – 스페인어·아랍어·스와힐리어·중국어·바스크어·펀잡어·웨일스어·태국어 등 다양한 언어 지원 예시 [출처: 코히어 랩스(Cohere Labs)]

4. 아야(Aya) 모델 계보: 2년간의 다국어 AI 연구

타이니 아야(Tiny Aya)는 코히어(Cohere)가 2년 이상 추진해온 다국어 AI 오픈 사이언스 이니셔티브의 최신 성과물이다. ‘아야(Aya)’는 가나 트위(Twi)어로 ‘양치식물’을 의미하며, 전 세계 3,000명 이상의 연구자와 250명의 언어 대사가 참여한 대규모 협업 프로젝트로 성장했다.

시기

모델명

지원 언어

주요 특징

2024.02

아야 101(Aya 101)

101개 언어

최초 오픈소스 다국어 LLM, 5.13억 데이터포인트

2024.05

아야 23(Aya 23)

23개 언어

8B/35B 파라미터, 깊이 우선 전략

2024.10

아야 익스팬스(Aya Expanse)

23개 언어

8B/32B, 합성 데이터 활용 SOTA 달성

2025.03

아야 비전(Aya Vision)

23개 언어

멀티모달(텍스트+이미지), 8B/32B

2026.02

타이니 아야(Tiny Aya)

70개 이상

3.35B 경량화, 온디바이스 구동, 지역 특화

▲ 코히어(Cohere) 아야(Aya) 모델 계보 [출처: 코히어 리서치, 테크크런치(TechCrunch), K-EnterTech Hub 정리]

주목할 점은 아야(Aya) 시리즈의 전략적 방향 전환이다. 초기 아야 101(Aya 101)이 101개 언어를 ‘넓게’ 커버하는 데 주력했다면, 아야 23(Aya 23)과 아야 익스팬스(Aya Expanse)는 23개 핵심 언어에 집중해 ‘깊이’를 추구했다. 이번 타이니 아야(Tiny Aya)는 다시 70개 이상으로 범위를 확장하면서도 경량화와 온디바이스 구동이라는 실용적 목표를 결합한 점이 차별화된다.

5. 코히어(Cohere) 기업 현황 및 IPO 전망

코히어(Cohere)는 구글(Google) 연구원 출신인 에이든 고메즈(Aidan Gomez)가 2019년 캐나다 토론토에 창업한 엔터프라이즈 AI 스타트업이다. 엔비디아(NVIDIA)·AMD·세일즈포스(Salesforce) 등으로부터 총 6억 달러의 투자를 유치했으며, 기업가치는 70억 달러에 달한다.

항목

내용

연간 반복 매출(ARR)

약 2억 4천만 달러 (2025년, 목표 2억 달러 대비 20% 초과 달성)

분기 성장률

2025년 연중 분기 대비(QoQ) 50% 이상 성장 지속

매출 총이익률

평균 70% (YoY 25bp 개선)

누적 투자 유치

총 6억 달러 (엔비디아·AMD·세일즈포스 등)

기업가치

70억 달러 (2024년 기준)

첨 CFO 영입

프랑수아 채드윅(Francois Chadwick), 우버(Uber) 행 CFO 출신

IPO 전망

고메즈(Gomez) CEO “조만간 상장” 시사 (2025.10), 2026년 내 상장 가능성

▲ 코히어(Cohere) 주요 재무 및 기업 현황 [출처: CNBC, 테크크런치(TechCrunch), 베타킷(BetaKit)]

코히어(Cohere)의 차별화 전략은 ‘자본 효율적 모델’이다. 오픈AI(OpenAI)나 앤스로픽(Anthropic)과 달리 자체 데이터센터를 건설하지 않고, 고객이 관리형 클라우드 서비스나 자체 하드웨어에서 직접 모델을 실행할 수 있도록 하여 인프라 비용을 절감한다. 이를 통해 고객 획득과 R&D에 더 공격적으로 투자할 수 있다는 것이 회사 측 설명이다.

한편, 코히어(Cohere)는 최근 마이크로소프트(Microsoft)·앤스로픽(Anthropic) 등과 함께 ‘신뢰할 수 있는 기술 얼라이언스(Trusted Tech Alliance)’에 창립 멤버로 참여했다. 투명한 기업 거버넌스, 안전한 개발, 독립적 평가 등의 원칙을 준수하겠다는 서약으로, IPO를 앞둔 신뢰성 구축 행보로 해석된다.

"AI 경쟁의 미래는 모델 성능만이 아니라, 얼마나 많은 사람에게 얼마나 자연스럽게 서비스할 수 있는가서 결정 — 문화 수출 산업에게 이것이야말로 가장 중요한 신호."

6. 산업적 시사점

■ 온디바이스 AI 경쟁 본격화

애플(Apple)의 온디바이스 AI, 구글(Google)의 제미나이 나노(Gemini Nano) 등 거대 기업들이 온디바이스 AI에 집중하는 가운데, 코히어(Cohere)가 3.35B 규모의 경량 모델로 오픈웨이트 응전에 나서면서, 특히 다국어 온디바이스 AI 영역에서 새로운 경쟁 구도가 형성될 수 있다.

■ 글로벌 사우스(Global South) 시장 공략 가속

인도·아프리카·동남아 등 비영어권 시장에서의 AI 접근성은 여전히 제한적이다. 코히어(Cohere)에 따르면 전 세계 인터넷 콘텐츠의 63.7%가 영어인 반면, 가정에서 영어를 사용하는 인구는 5%에 불과하다. 타이니 아야(Tiny Aya)와 같은 모델은 이러한 언어적 불균형을 해소하는 데 기여할 수 있다.

■ 엔터프라이즈 AI 시장 경쟁 심화

오픈AI(OpenAI)가 100만 개 이상의 기업 고객을, 앤스로픽(Anthropic)이 30만 개 이상의 기업 고객을 확보한 상황에서, 코히어(Cohere)는 ‘비용 효율성’과 ‘배포 유연성’을 무기로 차별화를 모색하고 있다. 특히 금융·헬스케어·공공 분야 등 데이터 보안이 중요한 규제 산업에서 온프레미스 배포가 가능한 모델에 대한 수요가 빠르게 성장하고 있다.

7. K-콘텐츠 글로벌 확장에 주는 6대 시사점

타이니 아야(Tiny Aya)와 같은 경량 오픈웨이트 다국어 모델의 등장은 단순한 기술 뉴스가 아니라, K-콘텐츠 유통의 ‘배포 인프라’ 이야기다. 로컬에서 배포하고, 지역별로 커스터마이징하며, 클라우드 의존 없이 운영할 수 있는 새로운 도구가 열리고 있다. 그 영향은 K-콘텐츠 밸류체인 전반에 걸쳐 있다.

■ 1) 자막·캡셔닝 대규모 자동화

K-드라마·K-팝 콘텐츠는 190개국 이상에서 소비되지만, 전문 자막 제작은 여전히 고비용·장시간 공정이다. 특히 스와힐리어·벵골어·타밀어 등 롱테일(long-tail) 언어는 전문 번역자 확보 자체가 어렵다. 온디바이스에서 구동하는 경량 다국어 모델은 수십 개 언어의 초볌 자막을 동시 생성할 수 있어, 로컬라이제이션 사이클을 수주에서 수시간으로 단축할 수 있다. 물론 최종 품질 보장을 위한 인간 검수는 필수이지만, AI 보조 초볌 작업만으로도 비용·시간 절감 효과는 상당하다.

■ 2) FAST 채널 메타데이터 및 콘텐츠 발견성 향상

글로벌 FAST(Free Ad-Supported Streaming TV) 시장은 2025년 58억 달러에서 2030년 106억 달러로 성장이 전망되며, K-콘텐츠의 핵심 유통 채널로 부상하고 있다. 그러나 FAST 플랫폼에서 콘텐츠 발견성은 정확한 다국어 메타데이터(제목·설명·장르 태그·검색 키워드)에 크게 의존한다. 온디바이스 다국어 모델을 활용하면 70개 이상 언어로 메타데이터를 자동 생성해, 수작업 메타데이터 제작이 병목이었던 비영어권 시장에서의 한국 콘텐츠 발견성을 크게 높일 수 있다.

■ 3) 번역을 넘어선 ‘문화적 로컬라이제이션’

진정한 로컬라이제이션은 단어 단위 번역을 넘어서 문화적 뉴앙스, 관용적 표현 적응, 문맥 인식 톤 조절을 필요로 한다. 타이니 아야(Tiny Aya)의 지역 특화 모델(아프리카용 Earth, 남아시아용 Fire, 아태·유럽용 Water)은 문화적으로 근거한(culturally grounded) AI를 향한 진전이다. K-콘텐츠 기업은 이를 활용해 지역별 마케팅 카피, SNS 게시물, 팬 소통 자료를 현지 문화에 맞게 조정할 수 있다. 특히 아시아태평양 언어권을 커버하는 TinyAya-Water는 동남아·중동 등 한류 핵심 시장과 직결된다.

■ 4) 신흥 시장 오프라인 팬 인게이지먼트

K-콘텐츠가 가장 빠르게 성장하는 시장인 인도·인도네시아·필리핀·나이지리아 등에서는 인터넷 연결이 불안정하다. 온디바이스 다국어 AI 모델은 클라우드 없이 구동하는 팬 앱, 인터랙티브 콘텐츠 가이드, K-드라마 연계 언어 학습 도구 등을 구현할 수 있어, 클라우드 기반 솔루션이 닿지 못하는 환경에서도 팬과의 접점을 만들어낼 수 있다.

■ 5) 오픈웨이트 생태계 활용 전략

코히어(Cohere)가 타이니 아야(Tiny Aya)를 오픈웨이트로 공개한 것은 생태계 전략이다. 전 세계 연구자·개발자가 모델을 파인튜닝하고 확장하도록 유도하는 것이다. K-콘텐츠 기업은 이 오픈 생태계를 활용해 한류 전문 어휘, K-콘텐츠 메타데이터 스키마, 엔터테인먼트 용어 등에 특화된 커스텀 모델을 라이선스 비용이나 벤더 종속 없이 구축할 수 있다. 이는 특히 중소 콘텐츠 기업에게 의미 있는 기회다.

■ 6) 한국어 지원 여부 모니터링

한국어는 타이니 아야(Tiny Aya)의 공식 하이라이트 언어 목록에 명시적으로 포함되지 않았다. 다만 TinyAya-Water가 아시아태평양 언어권을 커버하고 있으며, 이전 아야 익스팬스(Aya Expanse) 모델이 23개 언어 중 한국어를 지원한 점을 고려하면 70개어 이상의 타이니 아야에도 한국어가 포함되었을 가능성이 있다. 코히어(Cohere)가 허깅페이스(HuggingFace)에 공개 예정인 기술 보고서와 상세 언어 목록을 통해 확인이 필요하며, 한국어가 포함되지 않았을 경우에도 오픈웨이트 특성을 활용한 파인튜닝으로 대응할 수 있다.

활용 영역

K-콘텐츠 적용 시나리오

기대 효과

자막/캡셔닝

K-드라마·K-팝 롱테일 언어 초볌 자막 자동 생성

로컬라이제이션 사이클 수주→수시간 단축

FAST 채널

70개어 메타데이터(제목·설명·태그) 자동 생성

비영어권 콘텐츠 발견성 대폭 향상

문화적 로컬라이제이션

지역별 마케팅 카피·SNS·팬레터 문화 적응

현지 관객 공감도·전환율 제고

오프라인 팬 앱

인도·인니·나이지리아 등 오프라인 환경 팬 앱

인터넷 불안정 지역 팬 접점 확보

오픈 생태계 활용

한류 전문 어휘·메타데이터 스키마 특화 모델 구축

라이선스 비용 없이 커스텀 AI 구축

한국어 지원

TinyAya-Water 아태 언어권 커버, 기술보고서로 확인 필요

포함 시 직접 활용, 미포함 시 파인튜닝 대응

8. 결론: ‘경량화·다국어·온디바이스’ – AI 접근성 민주화의 신호탄

타이니 아야(Tiny Aya)의 출시는 단순한 신모델 발표를 넘어, AI 산업의 구조적 변화를 상징한다. 거대 파라미터 경쟁에 몰두했던 AI 업계가 이제 ‘누구에게, 어디서, 어떤 언어로 서비스할 것인가’라는 본질적 질문에 답하기 시작했다는 의미다.

코히어(Cohere)가 ARR 2억 4천만 달러의 성장 모멘텀과 IPO 준비를 동시에 추진하면서 경량 모델·다국어·온디바이스라는 세 가지 키워드를 동시에 공략한 것은, 단순한 기술 시연이 아니라 글로벌 사우스 시장을 겨냥한 전략적 포석이다.

특히 인도 AI 임팩트 서밋이라는 글로벌 무대를 활용한 점, 오픈웨이트로 공개해 연구자·개발자 커뮤니티의 생태계를 선점하려는 의도, 그리고 지역별 특화 모델을 통해 ‘문화적 뉴앙스’까지 고려한 접근은 주목할 만하다. 향후 AI 업계의 경쟁은 모델 성능만이 아니라, ‘얼마나 많은 사람에게 얼마나 자연스럽게 서비스할 수 있는가’라는 접근성과 포용성의 차원에서도 펼쳐질 것이다.

출처

[1] Ivan Mehta, “Cohere launches a family of open multilingual models,” TechCrunch, 2026.02.17

https://techcrunch.com/2026/02/17/cohere-launches-a-family-of-open-multilingual-models/

[2] CNBC, “Enterprise AI startup Cohere tops revenue target as momentum builds to IPO,” 2026.02.13

https://www.cnbc.com/2026/02/13/ai-startup-cohere-revenue-ipo.html

[3] 테크크런치(TechCrunch), “Cohere’s $240M year sets stage for IPO,” 2026.02.13

https://techcrunch.com/2026/02/13/coheres-240m-year-sets-stage-for-ipo/

[4] 코히어 랩스(Cohere Labs) 공식 블로그, “Tiny Aya, Making Multilingual AI Accessible,” 2026.02.17

https://cohere.com/blog/cohere-labs-tiny-aya

[5] 베타킷(BetaKit), “Cohere reportedly soars past revenue target, with $240M USD ARR,” 2026.02.13

https://betakit.com/cohere-reportedly-soars-past-revenue-target-with-240-million-usd-arr/

[6] 인도-AI 임팩트 서밋 2026(India–AI Impact Summit 2026) 공식 웹사이트

https://impact.indiaai.gov.in/

[7] CNBC, “Altman and Pichai among tech CEOs heading to India for major AI summit,” 2026.02.16

https://www.cnbc.com/2026/02/16/india-ai-impact-summit-tech-ceos-new-delhi.html

[8] 코히어(Cohere) 아야(Aya) 프로젝트 페이지

https://cohere.com/research/aya

Newsletter
디지털 시대, 새로운 정보를 받아보세요!
SHOP