TTS

TTS(Text to Speech) κΈ°μˆ μ€ μž‘μ„±λœ ν…μŠ€νŠΈλ₯Ό ν•©μ„± μŒμ„±μœΌλ‘œ λ³€ν™˜ν•˜μ—¬ μ²­μ·¨ν•  수 있게 ν•΄μ£ΌλŠ” μ‹œμŠ€ν…œμž…λ‹ˆλ‹€. 이 κΈ°μˆ μ€ 가상 μ–΄μ‹œμŠ€ν„΄νŠΈ, μ˜€λ””μ˜€λΆ, μŒμ„± μ•ˆλ‚΄ μ‹œμŠ€ν…œ 등에 μ‚¬μš©λ˜μ–΄ μ‚¬μš©μžλ“€μ΄ ν…μŠ€νŠΈ 정보λ₯Ό λ“£λŠ” λ°©μ‹μœΌλ‘œ μ ‘κ·Όν•  수 있게 ν•΄μ€λ‹ˆλ‹€. TTSλŠ” 정보 접근성을 ν–₯μƒμ‹œν‚€κ³  λ‹€μ–‘ν•œ λ©€ν‹°λ―Έλ””μ–΄ μ½˜ν…μΈ λ₯Ό μ œμž‘ν•˜λŠ” 데에도 μœ μš©ν•˜κ²Œ ν™œμš©λ©λ‹ˆλ‹€.

지원 μ–Έμ–΄ : ν•œκ΅­μ–΄, μ˜μ–΄

Available Models

Model
Description

tts-240627

μžμ—°μŠ€λŸ½κ³  μœ μ°½ν•œ μŒμ„± 생성을 μ œκ³΅ν•©λ‹ˆλ‹€. λ‹€μ–‘ν•œ 언어와 얡양을 μ§€μ›ν•˜λ©°, κ³ ν’ˆμ§ˆμ˜ μŒμ„± 합성을 톡해 인간과 μœ μ‚¬ν•œ λ°œμŒμ„ κ΅¬ν˜„ν•©λ‹ˆλ‹€.

  • λͺ¨λΈμ„ 버전 정보 없이 μž…λ ₯ν•˜λŠ” 경우 μ΅œμ‹  λͺ¨λΈμ΄ 호좜 λ©λ‹ˆλ‹€.

Request

POSThttps://aiplatform-api.rest.univa.co.kr/rest/v1/audio/tts

Request Headers

Name
Value

Content-Type

application/json

x-api-key

UNIVA-API-KEY

curl -X POST 'https://aiplatform-api.rest.univa.co.kr/rest/v1/audio/tts' \
  -H 'Content-Type: application/json' \
  -H 'x-api-key: UNIVA-API-KEY' \ # API ν‚€λ₯Ό μž…λ ₯ν•˜μ„Έμš”.
  -d '{"data": "μ‚¬μš©μž μž…λ ₯ ν…μŠ€νŠΈ","model": "tts","options": {"stream": false,"speaker_id": "μˆ˜μ—°","speed": 1,"segment_gap": 0.05}}'
  #  버전 μ„€μ • 방법 : tts-{version}
  # speaker_id 선택 μ˜΅μ…˜ : λ―Όμ£Ό,μ„œν˜„,μˆ˜μ—°,μ§€ν›ˆ,μž¬μ›,μŠΉν˜„

Request Body(*required)

Name
Type
Description

data*

string

μ‚¬μš©μž μž…λ ₯ ν…μŠ€νŠΈ

options["stream"] (Default to false)

bool

μŒμ„±μ˜ 좜λ ₯ 방식을 κ²°μ •ν•˜λŠ” λ§€κ°œλ³€μˆ˜ true μ„€μ •ν•˜κ²Œ 되면 생성 λ˜λŠ” μŒμ„±νŒŒμΌμ„ 청크 λ‹¨μœ„λ‘œ 좜λ ₯ν•˜κ²Œ λ©λ‹ˆλ‹€.

options["speaker_id"] (Default to λ―Όμ£Ό)

object

생성 μŒμ„± λͺ©μ†Œλ¦¬ μ˜΅μ…˜ - μ—¬μ„± : λ―Όμ£Ό, μ„œν˜„, μˆ˜μ—° - 남성 : μ§€ν›ˆ, μž¬μ›, μŠΉν˜„

options["speed"] (Default to 1)

number

λͺ¨λΈμ΄ μƒμ„±ν•˜λŠ” μŒμ„±μ˜ μž¬μƒμ†λ„

options["segment_gap"] (Default to 0.05)

number

λͺ¨λΈμ΄ μƒμ„±ν•˜λŠ” μŒμ„±μ˜ λ°œν™” 간격

Response

# stream μ˜΅μ…˜μ— 따라 두 κ°€μ§€ 데이터 ν˜•μ‹μœΌλ‘œ 좜λ ₯ λ©λ‹ˆλ‹€.
*sample rate : 16000Hz

options["stream"] = false  
  - WAV ν˜•μ‹μ˜ binary data 

options["stream"] = true  
  - PCM ν˜•μ‹μ˜ binary data  

Voice choice options

Last updated