Shin & Co.

지난 5월에 발표한 내용인데, 구글의 방향성을 살펴볼 수 있습니다. 그리고 순차적으로 서비스화되는것을 확인할 수 있습니다.

Gemini 2.5 Pro: LM Arena 리더보드에서 모든 카테고리 1위를 차지했으며 [00:11], LearnLM을 통합하여 학습 분야에서도 선두 모델이 되었습니다 [00:36]. 또한, DeepMind의 최신 연구를 활용하는 Deep Think라는 새로운 모드를 도입하여 사고 및 추론 능력을 향상시켰습니다 [01:15].
Google Beam: 최첨단 비디오 모델을 사용하여 2D 비디오 스트림을 사실적인 3D 경험으로 변환하는 새로운 AI 기반 화상 통신 플랫폼입니다 [01:32].
실시간 음성 번역: Google Meet에 실시간 음성 번역 기능이 직접 도입되었습니다 [01:53].
Project Mariner 및 에이전트 기능: 웹과 상호 작용하고 작업을 수행할 수 있는 에이전트인 Project Mariner의 기능이 Chrome 검색 및 Gemini 앱에 도입되기 시작했습니다 [02:02].
개인화된 스마트 답장: Gemini 모델은 사용자의 허가를 받아 Google 앱 전반의 관련 컨텍스트를 사용하여 사용자의 응답 스타일을 모방하는 개인화된 스마트 답장을 생성할 수 있습니다 [02:45].
Gemini Flash: Google의 가장 효율적인 작업 부하 모델이며, 추론, 코드 및 긴 컨텍스트에 대한 주요 벤치마크에서 개선되었습니다 [03:34].
Gemini Diffusion: 병렬 생성을 활용하여 매우 낮은 지연 시간을 달성하며, 기존 모델보다 5배 빠르게 이미지를 생성하는 최첨단 실험용 텍스트 확산 모델입니다 [03:49].
Project Astra: Gemini 앱을 범용 AI 비서로 전환하기 위한 궁극적인 비전으로, 음성 출력이 더욱 자연스러워지고 메모리가 향상되었으며 컴퓨터 제어 기능이 추가되었습니다 [04:04].
Google 검색의 AI 모드: AI 개요는 특정 유형의 쿼리에서 10% 이상의 성장을 주도하고 있으며 [04:28], AI 모드는 더욱 고급 추론 기능을 갖춘 검색의 전면적인 재구상입니다 [04:44]. 이 모드는 미국에서 출시되기 시작했으며 [04:53], 스포츠 및 금융 질문에 대한 복잡한 분석 및 데이터 시각화 기능이 올여름에 제공될 예정입니다 [05:31].
쇼핑 경험: Google 검색은 AI 모드를 통해 쇼핑에 새로운 수준의 인텔리전스를 제공하여 이미지와 쇼핑 가능한 제품의 탐색 가능한 모자이크를 동적으로 생성합니다 [06:03]. 또한, 의류가 인체에 어떻게 보이는지 이해하기 위해 패션에 특화된 맞춤형 이미지 생성 모델을 구축했습니다 [06:22].
Imagine 4: Gemini 앱에 Google의 최신 이미지 생성 모델인 Imagine 4가 도입되어 더욱 풍부하고 미묘한 색상과 세밀한 디테일을 가진 이미지를 제공합니다 [06:55].
VEO3: 음향 효과, 배경음 및 대화를 생성할 수 있는 기본 오디오 생성 기능을 제공하는 최첨단 모델입니다 [07:15].
SynthID: 생성된 미디어에 보이지 않는 워터마크를 삽입하는 기술로, 이제 이미지, 오디오 트랙, 텍스트 또는 비디오에 SynthID가 있는지 식별할 수 있는 새로운 감지기가 있습니다 [07:46].
Flow: 크리에이티브를 위한 새로운 AI 영화 제작 도구로, 사용자가 자신의 이미지를 업로드하고 클립을 확장하여 완벽한 엔딩을 만들 수 있습니다 [08:00].
Android XR: 이 플랫폼은 새로운 방식으로 AI 비서를 경험할 수 있도록 설계되었으며, Gentle Monster 및 Warby Parker가 Android XR 안경을 제작하는 최초의 안경 파트너가 될 것입니다 [08:25].

[AI Trend] 구글 I/O 2025