Price
TEXT
Komodo NLP(Natural Language Processing) κΈ°μ μ νμ©ν μ±ν μλΉμ€λ μ¬μ©μμ μ§λ¬Έμ΄λ μμ²μ μ€μκ°μΌλ‘ μ΄ν΄νκ³ λμνλ λνν μΈν°νμ΄μ€λ₯Ό μ 곡ν©λλ€. μ΄ μλΉμ€λ κ³ κ° μ§μ, κ΅μ‘, μν°ν μΈλ¨ΌνΈ λ± λ€μν λΆμΌμμ λ μ ννκ³ μ μ©ν λν κ²½νμ μ 곡ν©λλ€.
KOMODO-SMALL
0.0007β© / ν ν° (700β© / 1M ν ν°)
0.0007β© / ν ν° (700β© / 1M ν ν°)
KOMODO-LARGE
0.002β© / ν ν° (2,000β© / 1M ν ν°)
0.002β© / ν ν° (2,000β© / 1M ν ν°)
AUDIO
STT
STT(Speech to Text) κΈ°μ μ μ¬μ©μμ μμ± λ°μ΄ν°λ₯Ό ν μ€νΈλ‘ λ³ννλ μμ€ν μ λλ€. μ΄ κΈ°μ μ μμ± λͺ λ Ή μ λ ₯, μμ± κΈ°λ° μ±λ΄, μμ± λ©λͺ¨ λ± μ¬λ¬ μμ© νλ‘κ·Έλ¨μ νμ©λμ΄ λ€μν μλΉμ€μ κΈ°λ₯μ μ μ©ν μ μμ΅λλ€.
STT
0.3β© / μ΄ (18β© / λΆ)
TTS
TTS(Text to Speech) κΈ°μ μ μμ±λ ν μ€νΈλ₯Ό ν©μ± μμ±μΌλ‘ λ³ννμ¬ μ²μ·¨ν μ μκ² ν΄μ£Όλ μμ€ν μ λλ€. μ΄ κΈ°μ μ κ°μ μ΄μμ€ν΄νΈ, μ€λμ€λΆ, μμ± μλ΄ μμ€ν λ±μ μ¬μ©λμ΄ μ¬μ©μλ€μ΄ ν μ€νΈ μ 보λ₯Ό λ£λ λ°©μμΌλ‘ μ κ·Όν μ μκ² ν΄μ€λλ€.
TTS
0.06β© / κΈμ
IMAGE
OCR
OCR(Optical Character Recognition) κΈ°λ³Έ λͺ¨λΈμ μ΄λ―Έμ§μμ ν μ€νΈλ₯Ό μΈμνκ³ λμ§νΈ νμμΌλ‘ λ³ννλ κΈ°μ μ λλ€. μ΄ λͺ¨λΈμ λ¬Έμ μ€μΊ, μ¬μ§ μ κΈμ μΆμΆ, μλνλ λ°μ΄ν° μ λ ₯ λ±μ μ¬μ©λλ©°, λ¬Έμλ₯Ό μ ννκ² μΈμνμ¬ νΈμ§ κ°λ₯ν ν μ€νΈλ‘ λ³νν©λλ€. OCR κΈ°μ μ ν¨μ¨μ μΈ λ¬Έμ μ²λ¦¬μ λ°μ΄ν° κ΄λ¦¬λ₯Ό κ°λ₯νκ² νλ©°, λμ§νΈνλ νκ²½μμμ μ 보 μ κ·Όμ±μ λμ¬μ€λλ€.
OCR
25⩠/ 건
MULITMODAL
MARS
MARSλ κ°λ ₯ν LLMμ΄ κ²°ν©ν Vision Language Model μ λλ€. VQA(Vision Question Answering)μ λν κ°λ ₯ν μ±λ₯μΌλ‘ μ΄λ―Έμ§μ λν κ³ μ°¨μμ μΈ μΆλ‘ μ΄ κ°λ₯ν©λλ€. μκ°μ λ°μ΄ν°μ ν΄μ λ° λΆμμ΄ νμν λΆμΌμ νμ μ μΈ μ루μ μ μ 곡ν©λλ€.
MARS
0.0007β© / ν ν° (700β© / 1M ν ν°)
0.0672β© / μ¬λΌμ΄μ€
0.0007β© / ν ν° (700β© / 1M ν ν°)
Last updated