룰모아 노트

  • 홈
  • 태그
  • 방명록

SynthID 1

Gemini 3.1 Flash TTS 출시: 오디오 태그로 "감정까지" 제어하는 새 TTS 시대

Google가 2026년 4월 15일 공개한 Gemini 3.1 Flash TTS는 단순한 "읽어주는" 엔진을 넘어, 개발자가 문장 중간에 감정·호흡·속도를 직접 지시할 수 있는 차세대 음성 합성 모델입니다. Artificial Analysis의 TTS 블라인드 선호도 리더보드에서 Elo 1211점으로 전체 2위를 차지했고, OpenAI와 Amazon Polly 등 주요 상용 모델을 모두 앞섰습니다. 이번 글에서는 어떤 점이 달라졌고, 개발자가 실제로 어떻게 활용해야 하는지 정리합니다.1. 무엇이 새로워졌나Gemini 3.1 Flash TTS의 핵심은 크게 세 가지입니다. 첫째, 오디오 태그(audio tag)입니다. 기존 TTS가 "프롬프트 → 고정된 톤의 음성"을 만들었다면, 이번 모델은 대사 안에 ..

AI News 2026.04.21
이전
1
다음
더보기
프로필사진

룰모아 노트

rulmoa 님의 블로그 입니다.

  • 분류 전체보기 (20)
    • AI News (13)
    • AI Tips (7)

Tag

바이브코딩, 클로드, llm-wiki, AI코딩, 오픈소스, 개발자도구, Google Cloud Next 2026, graphify, Karpathy, claude, claudecode, AI에이전트, mcp, LLM, claude code, anthropic, OpenAI, Gemini, Skills, codex,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바