구글이 2024년 8월 13일, 새로운 AI 음성비서 '제미나이 라이브(Gemini Live)'를 발표하며 음성 인터페이스의 혁신을 예고했습니다. 이번 발표는 구글의 '메이드 바이 구글 2024' 이벤트를 통해 이루어졌으며, 제미나이 라이브는 기존 제미나이 AI에 고급 음성 기능을 추가한 버전으로, 오픈AI의 GPT-4o '고급 음성 모드'와 직접적인 경쟁을 목표로 하고 있습니다.
1. 제미나이 라이브의 주요 기능과 장점
제미나이 라이브는 기존 제미나이 AI에 향상된 음성 엔진을 탑재해 사용자가 더 자연스럽고 현실적인 대화를 나눌 수 있도록 설계되었습니다. 구글은 이번 업그레이드를 통해 제미나이 라이브가 더 일관되고 감정적으로 표현력이 풍부한 대화를 제공한다고 주장했습니다. 이로 인해 사용자와의 대화에서 감정적 연관성을 더욱 강화할 수 있습니다.
제미나이 라이브의 주요 기능 중 하나는 사용자가 챗봇의 말을 자르고 즉각적으로 질문을 할 수 있다는 점입니다. 이는 실시간으로 사용자의 음성 패턴에 적응하며, 다양한 대화 상황에 능동적으로 대응할 수 있는 능력을 갖추고 있습니다. 또한, 사용자는 10가지의 다양한 음성 중에서 선택할 수 있어 더욱 개인화된 음성 비서를 경험할 수 있습니다.
위 버튼을 누르면 해당 영상 페이지로 안전하게 이동합니다.
2. 새로운 모델과 향상된 기억력
제미나이 라이브에는 '제미나이 1.5 플래시'라는 새로운 모델이 도입되었습니다. 이 모델은 기존 AI 모델에 비해 더 빠르고 고품질의 응답을 제공하며, 더 나은 기억력을 자랑합니다. 이는 GPT-4o의 고급 음성 모드와 비교했을 때 특히 두드러집니다.
구체적으로, GPT-4o의 컨텍스트 창이 12만8000토큰인 반면, 제미나이 1.5 플래시는 무려 100만 토큰을 지원합니다. 이로 인해 제미나이 라이브는 수시간에 달하는 긴 대화도 자연스럽게 처리할 수 있습니다. 다만, 현재로서는 멀티모달 기능이 탑재되지 않았으며, 구글은 올해 말쯤 멀티모달 입력 기능을 추가할 계획이라고 발표했습니다.
위 버튼을 누르면 해당 영상 페이지로 안전하게 이동합니다.
3. 제미나이 라이브의 사용 환경
제미나이 라이브는 다양한 환경에서 쉽게 사용될 수 있도록 설계되었습니다. 제미나이 앱을 통해 구동되며, 다른 앱을 사용하거나 휴대폰이 잠긴 상태에서도 계속해서 음성 대화를 이어갈 수 있습니다. 이는 언제든지 대화를 일시 중지하고 다시 시작할 수 있어, 사용자에게 유연한 사용성을 제공합니다.
또한, 제미나이 라이브는 현재 영어로만 제공되며, 구글은 몇 주 안에 추가 언어 지원을 확대할 계획입니다. iOS 사용자들도 올해 말쯤 제미나이 앱의 업그레이드 형태로 이 기능을 사용할 수 있게 될 예정입니다.
4. GPT-4o와의 차별화 및 가격 정책
제미나이 라이브는 GPT-4o의 고급 음성 모드에 비해 여러 차별점을 두고 있습니다. 특히 더 나은 기억력과 긴 대화 처리 능력에서 차별화됩니다. 그러나, 제미나이 라이브 역시 GPT-4o와 마찬가지로 월 20달러의 유료 서비스로 제공됩니다.
반면, 구글은 제미나이 라이브 출시와 함께 몇 주 내로 제미나이의 새로운 무료 기능도 추가할 계획입니다. 이 기능은 안드로이드 사용자들이 모든 앱 사용 중 제미나이를 불러와 화면에서 진행되는 것에 대해 질문할 수 있도록 지원합니다. 예를 들어, 유튜브 시청 중에 관련 질문을 던질 수 있는 기능을 통해 사용자는 더욱 직관적인 사용자 경험을 누릴 수 있습니다.
5. 제미나이 라이브와 구글의 전략적 방향
이번 제미나이 라이브 출시와 관련해, 구글 어시스턴트 부사장 시시 샤오는 "우리는 AI 기반 어시스턴트의 이점이 과제보다 훨씬 더 크다고 믿는 전환점에 도달했다"고 밝혔습니다. 그는 또한 "AI 기반 어시스턴트가 도움이 될 수 있는 모든 방법을 발견하는 초기 단계로, 제미나이는 계속 더 나아질 것"이라고 강조했습니다.
이는 단순한 음성 비서 이상의 역할을 수행할 수 있는 AI 비서의 중요성을 강조하는 구글의 전략을 반영합니다. 제미나이 라이브를 통해 구글은 사용자들에게 더욱 개인화되고, 강력한 AI 경험을 제공하고자 하는 목표를 명확히 하고 있습니다.
6. 향후 전망
제미나이 라이브는 구글의 새로운 픽셀 9 휴대폰 및 픽셀 워치 3 등 신제품 라인업에 깊이 통합되어 있으며, 이는 구글의 AI 기술이 하드웨어와 소프트웨어를 통합해 사용자에게 제공될 것임을 시사합니다. 구글이 발표한 제미나이 라이브의 향후 업데이트 계획에 따르면, 멀티모달 기능 및 추가 언어 지원이 예정되어 있어, AI 음성 비서 시장에서의 경쟁이 더욱 치열해질 것으로 예상됩니다.
앞으로 구글의 제미나이 라이브가 GPT-4o와 같은 경쟁 제품들과 어떤 차별화를 만들어낼지, 그리고 사용자들에게 어떤 가치를 제공할지 기대됩니다. 이와 같은 혁신적인 AI 음성 비서의 등장은 스마트폰 사용자들에게 더 나은 음성 인터페이스 경험을 제공할 것으로 보입니다.
'AI Insight News' 카테고리의 다른 글
구글, 이미지 생성 AI ‘이마젠3’ 출시… ‘달리3’와 경쟁 가속화 (0) | 2024.08.18 |
---|---|
GPT-5의 예고편인가? "스트로베리" 추론 기능 도입 가능성 (1) | 2024.08.16 |
구글과 오픈AI, 실리콘밸리 투자자, 카멀라 '해리스 지지' 선언 (0) | 2024.08.04 |
'프렌드' 대화하는 AI 목걸이 등장: 프렌드 2025년 1월 출시 예정 (0) | 2024.08.03 |
오픈AI '서치GPT' 실시간 검색 엔진 출시...구글 주가 3% 폭락: 서치GPT 접속 (0) | 2024.07.31 |