STT

STT(Speech to Text) 기술은 사용자의 음성 데이터를 텍스트로 변환하는 음성 인식 시스템입니다. 이 기술은 음성 명령 입력, 음성 기반 챗봇, 음성 메모와 같은 여러 응용 프로그램에서 활용 될 수 있어, 음성 정보를 텍스트 형태로 변환하여 다양한 서비스와 기능에 적용 가능합니다.

지원 언어 : 한국어, 영어, 중국어, 일본어

Available Models

Model

Description

stt-251021

높은 정확도로 음성을 텍스트로 변환합니다. 다양한 언어와 방언을 지원하며, 배경 소음 속에서도 뛰어난 인식 능력을 발휘합니다.

Request

Method

EndPoint

post

https://aiplatform-api.rest.univa.co.kr/rest/v1/audio/stt

Request Headers

Name

Value

Content-Type

application/json

x-api-key

UNIVA-API-KEY

curl -X POST 'https://aiplatform-api.rest.univa.co.kr/rest/v1/audio/stt' \
    -H 'x-api-key: UNIVA-API-KEY' \ # API 키를 입력하세요.
    -F "model=stt" \
    #  버전 설정 방법 : stt-{version}
    -F 'file=@YOUR-FILE-PATH' # 파일 경로를 입력하세요.
    -F 'options={"language":"ko"}'
#  지원 파일 포맷 : .wav, .mp3, .opus, .acc, .flac

const axios = require('axios')
const FormData = require('form-data')
const fs = require('fs')

// 파일 경로와 API 키를 입력하세요.
const filePath = 'YOUR-FILE-PATH"' // 파일 경로를 입력하세요.
// 지원 파일 포맷 : .wav, .mp3, .opus, .acc, .flac
const apiKey = 'UNIVA-API-KEY' // API 키를 입력하세요.
const apiUrl = 'https://aiplatform-api.rest.univa.co.kr/rest/v1/audio/stt'

async function sttPostRequest() {
  try {
    // FormData 인스턴스를 생성하고 파일을 추가합니다.
    const formData = new FormData()
    formData.append('file', fs.createReadStream(filePath))
    formData.append('model', 'stt', {
      contentType: 'application/json',
    })
    // 버전 설정 방법 : stt-{version}
    formData.append('options',JSON.stringify({language: 'ko',
      }),
      {
        contentType: 'application/json',
      }
    )
    

    const response = await axios.post(apiUrl, formData, {
      headers: {
        'x-api-key': apiKey,
        ...formData.getHeaders(), // form data의 헤더를 추가합니다.
      },
    })

    // 응답 처리
    if (response.status === 200) {
      console.log('응답 데이터:', response.data)
      // response.data를 파일로 저장하거나 다른 작업을 수행할 수 있습니다.
    } else {
      console.log('요청 실패:', response.statusText)
    }
  } catch (error) {
    console.error('에러 발생:', error)
  }
}

sttPostRequest()

import org.apache.http.HttpEntity;
import org.apache.http.HttpResponse;
import org.apache.http.client.methods.HttpPost;
import org.apache.http.entity.ContentType;
import org.apache.http.entity.mime.MultipartEntityBuilder;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;

import java.io.File;
import java.io.IOException;

public class STTPostExample {
    public static void main(String[] args) {
        String apiKey = "UNIVA-API-KEY"; // API 키를 입력하세요.
        String filePath = "YOUR-FILE-PATH"; // 파일 경로를 입력하세요.
        // 지원 파일 포맷 : .wav, .mp3, .opus, .acc, .flac
        String url = "https://aiplatform-api.rest.univa.co.kr/rest/v1/audio/stt";

        CloseableHttpClient httpClient = HttpClients.createDefault();
        HttpPost uploadFile = new HttpPost(url);
        uploadFile.addHeader("x-api-key", apiKey);

        MultipartEntityBuilder builder = MultipartEntityBuilder.create();
        builder.addBinaryBody("file", new File(filePath), ContentType.MULTIPART_FORM_DATA, "filename");
        builder.addTextBody("model", "stt", ContentType.APPLICATION_JSON);
        // 버전 설정 방법 : stt-{version}
        builder.addTextBody("options", "{\"language\": \"ko\"}", ContentType.APPLICATION_JSON);

        HttpEntity multipart = builder.build();
        uploadFile.setEntity(multipart);

        try {
            HttpResponse response = httpClient.execute(uploadFile);
            HttpEntity responseEntity = response.getEntity();
            String responseString = EntityUtils.toString(responseEntity, "UTF-8");
            System.out.println(responseString);
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                httpClient.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }
}

import requests

# 설정
url = 'https://aiplatform-api.rest.univa.co.kr/rest/v1/audio/stt'
api_key = "UNIVA-API-KEY" # API 키를 입력하세요.
file_path = 'YOUR-FILE-PATH' # 파일 경로를 입력하세요.
# 지원 파일 포맷 : .wav, .mp3, .opus, .acc, .flac

# 파일 업로드 및 API 호출
files = {'file': open(file_path, 'rb')
}
data = {
  "model": "stt",
  #  버전 설정 방법 : stt-{version}
  "options": '{"language":"ko"}'
}


headers = {'x-api-key': api_key
}

response = requests.post(url, headers=headers, files=files, data=data)

# API 호출 결과 확인
print(response.status_code)
if response.status_code == 200:
    result = response.json()

else:
    print("Error Code :", response.status_code)
    result = response.json()

result

Request Body(*required)

Name

Type

Description

file*

object

audio format - .wav, .mp3, .opus, .acc, .flac

model (Default to latest model)

string

사용하는 OCR 모델

language (Default to ko)

string

오디오에서 사용된 언어 - ko, en, zh, ja

지원하는 파일 포맷

.mp3, .opus, .acc, .flac, .wav

Response

{
    "success": true,
    "result": "모델 응답 텍스트"
}

API 호출에서 발생하는 오류는 API Error code 페이지를 확인해주세요.

Deprecated Models

Model

Description

stt-240627

해당 버전은 2024-09-10에 사용 중지되었습니다.

stt-240910

해당 버전은 2024-09-27에 사용 중지되었습니다.

stt-240927

해당 버전은 2025-10-21에 사용 중지되었습니다.

PreviousLLM-base(Think)NextTTS

Last updated 1 month ago