STT

STT(Speech to Text) κΈ°μˆ μ€ μ‚¬μš©μžμ˜ μŒμ„± 데이터λ₯Ό ν…μŠ€νŠΈλ‘œ λ³€ν™˜ν•˜λŠ” μŒμ„± 인식 μ‹œμŠ€ν…œμž…λ‹ˆλ‹€. 이 κΈ°μˆ μ€ μŒμ„± λͺ…λ Ή μž…λ ₯, μŒμ„± 기반 챗봇, μŒμ„± λ©”λͺ¨μ™€ 같은 μ—¬λŸ¬ μ‘μš© ν”„λ‘œκ·Έλž¨μ—μ„œ ν™œμš© 될 수 μžˆμ–΄, μŒμ„± 정보λ₯Ό ν…μŠ€νŠΈ ν˜•νƒœλ‘œ λ³€ν™˜ν•˜μ—¬ λ‹€μ–‘ν•œ μ„œλΉ„μŠ€μ™€ κΈ°λŠ₯에 적용 κ°€λŠ₯ν•©λ‹ˆλ‹€.

지원 μ–Έμ–΄ : ν•œκ΅­μ–΄, μ˜μ–΄, 쀑ꡭ어, 일본어

Available Models

Model
Description

stt-240927

높은 μ •ν™•λ„λ‘œ μŒμ„±μ„ ν…μŠ€νŠΈλ‘œ λ³€ν™˜ν•©λ‹ˆλ‹€. λ‹€μ–‘ν•œ 언어와 방언을 μ§€μ›ν•˜λ©°, λ°°κ²½ μ†ŒμŒ μ†μ—μ„œλ„ λ›°μ–΄λ‚œ 인식 λŠ₯λ ₯을 λ°œνœ˜ν•©λ‹ˆλ‹€.

Request

POST https://aiplatform-api.rest.univa.co.kr/rest/v1/audio/stt

Request Headers

Name
Value

Content-Type

application/json

x-api-key

UNIVA-API-KEY

curl -X POST 'https://aiplatform-api.rest.univa.co.kr/rest/v1/audio/stt' \
    -H 'x-api-key: UNIVA-API-KEY' \ # API ν‚€λ₯Ό μž…λ ₯ν•˜μ„Έμš”.
    -F "model=stt" \
    #  버전 μ„€μ • 방법 : stt-{version}
    -F 'file=@YOUR-FILE-PATH' # 파일 경둜λ₯Ό μž…λ ₯ν•˜μ„Έμš”.
    -F 'options={"language":"ko"}'
#  지원 파일 포맷 : .wav, .mp3, .opus, .acc, .flac

Request Body(*required)

Name
Type
Description

file*

object

audio format - .wav, .mp3, .opus, .acc, .flac

model (Default to latest model)

string

μ‚¬μš©ν•˜λŠ” OCR λͺ¨λΈ

language (Default to ko)

string

μ˜€λ””μ˜€μ—μ„œ μ‚¬μš©λœ μ–Έμ–΄ - ko, en, zh, ja

μ§€μ›ν•˜λŠ” 파일 포맷

.mp3, .opus, .acc, .flac, .wav

Response

{
    "success": true,
    "result": "λͺ¨λΈ 응닡 ν…μŠ€νŠΈ"
}

Deprecated Models

Model
Description

stt-240627

ν•΄λ‹Ή 버전은 2024-09-10에 μ‚¬μš© μ€‘μ§€λ˜μ—ˆμŠ΅λ‹ˆλ‹€.

stt-240910

ν•΄λ‹Ή 버전은 2024-09-27에 μ‚¬μš© μ€‘μ§€λ˜μ—ˆμŠ΅λ‹ˆλ‹€.

Last updated