
구글은 인공지능 기술에서 주목할 만한 발전으로 우리의 일상과 디지털 경험에 계속 영향을 주고 있습니다. 이 글에서는 구글의 최신 AI 기술과 서비스를 자세히 살펴보고, 주목할 만한 특징들을 살펴보겠습니다.
구글 챗봇 AI의 진화: 바드에서 제미나이로
구글의 AI 발전 과정은 챗봇 기술에서 분명하게 드러납니다. 2023년 3월, 구글은 LaMDA(Language Model for Dialogue Applications) 기반의 '바드(Bard)'를 출시했습니다. 바드는 자연스러운 대화와 정보 제공에 초점을 맞추었으나, 멀티모달 기능은 다소 제한적이었습니다.

2023년 12월, 바드는 '제미나이(Gemini)'로 리브랜딩되었습니다. 제미나이는 단순한 이름 변경을 넘어서, 구글의 AI 기술 접근 방식의 근본적인 변화를 보여줬습니다. 제미나이는 다음과 같은 특징을 가지고 있습니다.
- 텍스트, 이미지, 오디오, 코드 등 다양한 형식의 데이터를 이해하고 처리할 수 있는 멀티모달 AI.
- '제미나이 울트라(Ultra)'와 '프로(Pro)' 등 다양한 버전이 있으며, 울트라는 프로보다 10배 이상 크고 복잡한 작업을 처리할 수 있습니다.
- 구글 어시스턴트와 통합되어 모바일 앱 등 다양한 기기에서 활용 가능하며, 구글 생태계(검색, 캘린더, 스마트홈 등)와의 연동성이 강화되었습니다.
이후 구글은 ‘Gemini Advanced with Ultra 1.0’이라는 고급 버전을 출시하여, 전문가 및 고급 사용자들에게 보다 강력한 AI 도구를 제공하기 시작했습니다. 이 모델은 구글이 개발한 가장 정교한 대규모 언어 모델 중 하나인 Ultra 1.0을 기반으로 하며, 복잡한 논리적 추론, 고급 코딩 지원, 다중 문서 간 정보 통합 등 일반 사용자용 제미나이보다 한층 진보된 기능을 포함하고 있습니다. Gemini Advanced는 특히 연구자, 크리에이터, 개발자 등 고도화된 작업 환경을 필요로 하는 사용자들을 대상으로 합니다.
딥마인드와 유튜브의 음악 AI 혁신 프로젝트
인공지능 연구 및 개발을 전문으로 하는 구글 산하 연구소 딥마인드(Deepmind)는 2016년 세계 바둑 챔피언 이세돌을 이긴 AI '알파고'를 개발한 곳으로 유명합니다. 딥마인드는 음악 생성 AI 분야에서도 주목할 만한 연구를 진행하고 있습니다.
Lyria: 고품질 음악 생성 모델
Lyria는 구글 딥마인드가 개발한 최첨단 음악 생성 AI 모델로, 텍스트 프롬프트만으로 멀티트랙과 보컬을 포함한 고품질 음악을 생성할 수 있습니다. 이 모델은 구글의 ‘MusicFX DJ’, ‘Music AI Sandbox’ 등 음악 창작 도구에 적용되어 있으며, 프로듀서나 일반 사용자 모두가 음악을 더 쉽게 제작할 수 있도록 지원합니다. Lyria는 음악 이론, 구조, 리듬을 학습하여 단순한 반복이 아닌 전문적인 음악 구성을 가능하게 하며, 사용자는 가사, 장르, 분위기 등을 간단히 입력하기만 하면 음악이 자동 생성됩니다.
구글은 사운드웨이브 프로젝트(Soundwave Project)를 통해 이 기술을 실험적으로 공개하고 있으며, 실제 뮤지션들과 협업하여 AI가 창작 도구로서 창의력을 어떻게 확장할 수 있는지를 연구 중입니다. 이러한 접근은 아마추어뿐 아니라 전문가에게도 AI의 창작 잠재력을 여는 기회가 되고 있습니다.

Dream Track: 아티스트 음성 기반 음악 생성
Dream Track은 유튜브 쇼츠 플랫폼에서 제한된 크리에이터를 대상으로 시범 운영 중인 프로젝트로, 사용자가 프롬프트를 입력하면 실제 아티스트의 목소리 스타일을 재현한 음악 클립을 자동으로 생성해줍니다. 이 기술은 Lyria를 기반으로 하면서도, 특정 아티스트의 음색, 발음 습관, 감정 표현 등을 정밀하게 모사할 수 있도록 특화되어 있습니다.
Dream Track은 찰리 푸스(Charlie Puth), 트로이 시반(Troye Sivan), 존 레전드(John Legend) 등 실제 아티스트들과의 협력을 통해 개발되었으며, 이들이 사전에 동의한 형태로 음성 데이터가 AI 학습에 활용됩니다. 라이선스 기반의 윤리적 생성 모델으로서 크리에이터가 팬 아트처럼 아티스트의 스타일을 빌려 창작할 수 있도록 설계되었습니다.
Orca: 미공개된 고급 음악 AI 도구
Orca는 딥마인드와 유튜브가 공동 개발한 비공개 고급 음악 AI 도구로, Dream Track과 Lyria보다 더 강력하고 직관적인 음악 생성 기능을 갖춘 것으로 알려져 있습니다. Orca는 멜로디, 하모니, 보컬 스타일까지 전체 음악을 자동 생성하고 편곡할 수 있는 능력을 갖추었으며, 프로 뮤지션들도 놀랄 정도의 자연스러운 음악 퀄리티를 구현했다고 합니다.
그러나 Orca는 아직까지 공개되지 않았는데, 그 이유는 저작권 문제 때문입니다. 아티스트의 음성 스타일을 모방하는 수준을 넘어, AI가 생성한 음악이 원저작물과 지나치게 유사하거나 법적 분쟁 소지가 있어, 구글 내부에서도 법적 및 윤리적 검토가 지속되고 있는 상황입니다.
NotebookLM: AI 기반 연구 및 노트 작성 도구

NotebookLM은 구글의 AI 기반 노트 작성 및 연구 도구로, Gemini 1.5 Pro 모델을 기반으로 합니다. 2023년 7월에 출시된 이 서비스는 다음과 같은 기능을 제공합니다.
- 사용자가 업로드한 문서(PDF, DOCX, TXT 등)를 AI가 분석
- 문서 기반 질문·답변, 자동 요약, 아이디어 탐색 기능
- 노트 작성·정리 등 연구 활동 지원
- 단순 키워드 검색이 아닌, 문맥을 이해한 답변 제공
- 웹페이지 URL을 입력해 내용을 가져오는 기능
또한, NotebookLM은 'Audio Overviews'라는 독특한 기능을 통해 문서 내용을 팟캐스트 스타일의 오디오로 요약해 들려줍니다. 이를 통해 바쁜 사용자들이 문서를 '듣기'로 빠르게 파악할 수 있습니다.
NotebookLM Plus는 이 서비스의 프리미엄 버전으로, 더 높은 사용 한도와 추가 기능(예: 더 많은 문서 업로드, 고급 분석 등)을 제공합니다. NotebookLM은 연구, 논문 분석, 보고서 작성, 강의자료 정리 등 다양한 분야에서 활용되고 있으며, 학습과 지식 관리에 혁신을 가져오고 있습니다.
AI Overviews: 구글 검색의 AI 요약 기능

구글은 검색 경험을 향상시키기 위해 AI Overviews라는 새로운 기능을 도입했습니다. 이 기능은 구글 검색 결과 상단에 AI가 생성한 요약 정보를 자동으로 제공합니다. 이를 통해 사용자는 긴 웹페이지나 여러 결과를 일일이 확인하지 않아도, 핵심 정보를 빠르게 파악할 수 있게 되었습니다.
또한, 구글은 'AI Mode'라는 기능도 테스트 중입니다. 이는 기존 'I'm Feeling Lucky' 버튼을 대체할 수 있는 새로운 기능으로, 챗봇 기반의 대화형 검색 경험을 제공합니다. 사용자가 질문을 입력하면, AI가 대화형으로 정보를 안내해주어 정보 검색의 효율성을 크게 높일 것으로 보입니다. 이러한 기능들은 구글이 검색 경험을 단순 키워드 기반 검색에서 벗어나 '의미 기반'의 정보 탐색이 되는 것을 추구하는 것으로 보입니다.
통합 서비스를 추구하는 구글 AI의 미래

구글의 AI 기술은 다양한 분야에서 발전을 거듭하며, 이러한 기술들이 서로 통합되는 양상을 보이고 있습니다. 특히 제미나이(Gemini) 모델을 중심으로 한 통합 전략은 구글의 AI 생태계를 더욱 강화하고 있습니다.
앞으로 구글은 멀티모달 AI 기술의 고도화, 더 자연스러운 대화형 인터페이스, 다양한 서비스와의 통합을 통해 사용자 경험을 지속적으로 개선해 나갈 것으로 예상됩니다. 특히 OpenAI, Perplexity 등의 강세로 최근 구글의 검색 엔진 점유율이 위협받고 있다는 우려도 나오고 있는 바, 이러한 문제를 해결해 나가기 위해 구글만의 서비스들을 통합 제공해 사용자를 유치하는 방향으로 전략을 취할 가능성이 있습니다. 또한 아직 대중에게 공개되진 않았지만 실험중인 음악 관련 AI 기술들은 향후 유튜브와 연동해 큰 역할을 수행할 것으로 보입니다.