STT
STT(Speech to Text) κΈ°μ μ μ¬μ©μμ μμ± λ°μ΄ν°λ₯Ό ν μ€νΈλ‘ λ³ννλ μμ± μΈμ μμ€ν μ λλ€. μ΄ κΈ°μ μ μμ± λͺ λ Ή μ λ ₯, μμ± κΈ°λ° μ±λ΄, μμ± λ©λͺ¨μ κ°μ μ¬λ¬ μμ© νλ‘κ·Έλ¨μμ νμ© λ μ μμ΄, μμ± μ 보λ₯Ό ν μ€νΈ ννλ‘ λ³ννμ¬ λ€μν μλΉμ€μ κΈ°λ₯μ μ μ© κ°λ₯ν©λλ€.
Available Models
stt-251021
λμ μ νλλ‘ μμ±μ ν μ€νΈλ‘ λ³νν©λλ€. λ€μν μΈμ΄μ λ°©μΈμ μ§μνλ©°, λ°°κ²½ μμ μμμλ λ°μ΄λ μΈμ λ₯λ ₯μ λ°νν©λλ€.
Request
post
https://aiplatform-api.rest.univa.co.kr/rest/v1/audio/stt
Request Headers
Content-Type
application/json
x-api-key
UNIVA-API-KEY
curl -X POST 'https://aiplatform-api.rest.univa.co.kr/rest/v1/audio/stt' \
-H 'x-api-key: UNIVA-API-KEY' \ # API ν€λ₯Ό μ
λ ₯νμΈμ.
-F "model=stt" \
# λ²μ μ€μ λ°©λ² : stt-{version}
-F 'file=@YOUR-FILE-PATH' # νμΌ κ²½λ‘λ₯Ό μ
λ ₯νμΈμ.
-F 'options={"language":"ko"}'
# μ§μ νμΌ ν¬λ§· : .wav, .mp3, .opus, .acc, .flacconst axios = require('axios')
const FormData = require('form-data')
const fs = require('fs')
// νμΌ κ²½λ‘μ API ν€λ₯Ό μ
λ ₯νμΈμ.
const filePath = 'YOUR-FILE-PATH"' // νμΌ κ²½λ‘λ₯Ό μ
λ ₯νμΈμ.
// μ§μ νμΌ ν¬λ§· : .wav, .mp3, .opus, .acc, .flac
const apiKey = 'UNIVA-API-KEY' // API ν€λ₯Ό μ
λ ₯νμΈμ.
const apiUrl = 'https://aiplatform-api.rest.univa.co.kr/rest/v1/audio/stt'
async function sttPostRequest() {
try {
// FormData μΈμ€ν΄μ€λ₯Ό μμ±νκ³ νμΌμ μΆκ°ν©λλ€.
const formData = new FormData()
formData.append('file', fs.createReadStream(filePath))
formData.append('model', 'stt', {
contentType: 'application/json',
})
// λ²μ μ€μ λ°©λ² : stt-{version}
formData.append('options',JSON.stringify({language: 'ko',
}),
{
contentType: 'application/json',
}
)
const response = await axios.post(apiUrl, formData, {
headers: {
'x-api-key': apiKey,
...formData.getHeaders(), // form dataμ ν€λλ₯Ό μΆκ°ν©λλ€.
},
})
// μλ΅ μ²λ¦¬
if (response.status === 200) {
console.log('μλ΅ λ°μ΄ν°:', response.data)
// response.dataλ₯Ό νμΌλ‘ μ μ₯νκ±°λ λ€λ₯Έ μμ
μ μνν μ μμ΅λλ€.
} else {
console.log('μμ² μ€ν¨:', response.statusText)
}
} catch (error) {
console.error('μλ¬ λ°μ:', error)
}
}
sttPostRequest()Request Body(*required)
file*
object
audio format
- .wav, .mp3, .opus, .acc, .flac
model
(Default to latest model)
string
μ¬μ©νλ OCR λͺ¨λΈ
language
(Default to ko)
string
μ€λμ€μμ μ¬μ©λ μΈμ΄
- ko, en, zh, ja
Response
API νΈμΆμμ λ°μνλ μ€λ₯λ API Error code νμ΄μ§λ₯Ό νμΈν΄μ£ΌμΈμ.
Deprecated Models
stt-240627
ν΄λΉ λ²μ μ 2024-09-10μ μ¬μ© μ€μ§λμμ΅λλ€.
stt-240910
ν΄λΉ λ²μ μ 2024-09-27μ μ¬μ© μ€μ§λμμ΅λλ€.
stt-240927
ν΄λΉ λ²μ μ 2025-10-21μ μ¬μ© μ€μ§λμμ΅λλ€.
Last updated