Introduction
Welcome to Documentation for UNIVA AI Platform!
UNIVA AI Platformμ λ€μν κ³³μμ νμ© κ°λ₯ν μΈκ³΅μ§λ₯ μ루μ μ μ 곡ν©λλ€. κ°μ₯ 첨λ¨μ μΈμ΄ λͺ¨λΈλΆν° μ΄λ―Έμ§ μΈμ, μμ± κ·Έλ¦¬κ³ OCRκ³Ό μμ± λͺ¨λΈκΉμ§, μ λΆμΌμ μΈκ³΅μ§λ₯ κΈ°μ μ μ΄μ©ν μ μμ΅λλ€. λΉμ¦λμ€μ ν¨μ¨μ λμ΄κ³ νμ μ μΈ μμ΄λμ΄λ₯Ό μ€νν μ μλ μΈκ³΅μ§λ₯μ κ²½νν΄ λ³΄μΈμ.
TEXT
UNIVA AI Platformμ ν μ€νΈ λ°μ΄ν°μ λ³νκ³Ό μνΈμμ©μ ν΅ν΄ λ€μν ν μ€νΈ μ²λ¦¬ κΈ°λ₯μ μ 곡ν©λλ€. μμ°μ΄ μ²λ¦¬(NLP), μλνλ μλ΅ μμ±, ν μ€νΈ μμ½ λ± λ€μν λΆκ° κΈ°λ₯μ ν¨κ» μ¬μ©ν μ μμ΅λλ€. ν μ€νΈ κΈ°λ°μ μ¬μ©μ μΈν°νμ΄μ€ μνΈμμ©μ μλ‘μ΄ μ°¨μμΌλ‘ λμ΄μ¬λ¦΄ μ μλ ν μ€νΈ λ³ν μ루μ μ λλ€.
KOMODO KOMODOλ λ€μν λΆμΌμ μ μ©ν μ μλ λ²μ©μ±κ³Ό νμ₯μ±μ΄ μ₯μ μΈ μΈμ΄ λͺ¨λΈμ λλ€. μΌμμνμ λ¬Όλ‘ , κ΅μ‘, νμ λ± λ€μν μ°μ μ λΆμΌμμ ν¨μ¨μ±κ³Ό μμ°μ±μ κ·Ήλνν μ μλ μ루μ μ μ 곡ν©λλ€.
Text Generation ν μ€νΈμ μλ―Έλ₯Ό μ΄ν΄νκ³ λ³΅μ‘ν μμ /μ§λ¬Έμ λν μ μ ν λ΅λ³μ μμ±ν©λλ€. μΈμ΄μ λν λ°μ΄λ μ΄ν΄λ ₯κ³Ό μμ± λ₯λ ₯μ ν΅ν΄ λν, λ¬Έμ₯ μμ±, μμ½, λ²μ λ± λ€μν μμ μ μνν μ μμ΅λλ€.
Fine-Tuning Fine-Tuningμ ν΅ν κ°μΈν λ° λ§μΆ€ν μλΉμ€λ₯Ό μ 곡ν μ μμ΅λλ€. Custom Data Fine-TuningμΌλ‘ λ λ€μνκ³ μΈλΆνλ λͺ©μ μ λ§λ λλ§μ μλΉμ€λ‘ νΉν ν μ μμ΅λλ€.
Accessibility / Usability μμ¬μ΄ μ κ·Όκ³Ό PipelineμΌλ‘ μ μλ λ°©λ²μΌλ‘, λꡬλ μ½κ² μλΉμ€λ₯Ό μ΄μ©ν μ μμ΅λλ€.
AUDIO
UNIVA AI Platformμ μμ±κ³Ό ν μ€νΈ κ°μ λ³νκ³Ό μνΈμμ©μ ν΅ν νμ©μ± λμ μμ±μΈμ μλΉμ€λ₯Ό μ 곡ν©λλ€. λ€μ€ νμ μΈμ, λͺ©μ리 μ ν, μΈμ΄ λ± λ€μν λΆκ° κΈ°λ₯μ ν¨κ» μ¬μ©ν μ μμ΅λλ€. ν μ€νΈμ μμ± κ°μ μλ°©ν₯ μ²λ¦¬λ‘ μ¬μ©μ μΈν°νμ΄μ€ μνΈμμ©μ νμ μ μΌλ‘ ν₯μμν¬ μ μλ μμ± λ° ν μ€νΈ λ³ν μ루μ μ λλ€.
STT(Speech To Text) ASR(Automatic Speech Recognition)μΌλ‘ μ λ ₯λλ μμ± λ°μ΄ν°λ₯Ό μ€μκ°μΌλ‘ μ²λ¦¬ν μ μμ΅λλ€. λμ§νΈ λΉμ, κΈ°λ‘ μλΉμ€ λ±μ λΆμΌμμ νμ©ν μ μμ΅λλ€.
TTS(Text To Speech) μμ± ν©μ±(Speech Synthesis) κΈ°μ λ‘ ν μ€νΈλ₯Ό μμ°μ€λ¬μ΄ μμ±μΌλ‘ λ³νν μ μμ΅λλ€. λ€μν λͺ©μ리μ ν€μ μ ν©λλ€. μν°ν μΈλ¨ΌνΈ λ° κ΅μ‘ μ½ν μΈ μ μ, μ€λμ€ λΆ λ±μ μλΉμ€μμ νμ©ν μ μμ΅λλ€.
MULTIMODAL
UNIVA AI Platformμ λ€μν Modalityλ₯Ό μ§μν©λλ€. Computer Vision κΈ°λ° μΆλ‘ μ ν΅ν΄, λ νμ₯λ μμμ μλΉμ€λ₯Ό μ 곡ν©λλ€.
MARS MARSλ κ°λ ₯ν LLMμ΄ κ²°ν©ν Vison Language Model μ λλ€. VQA(Vision Question Answering)μ λν κ°λ ₯ν μ±λ₯μΌλ‘ μ΄λ―Έμ§μ λν κ³ μ°¨μμ μΈ μΆλ‘ μ΄ κ°λ₯ν©λλ€. μκ°μ λ°μ΄ν°μ ν΄μ λ° λΆμμ΄ νμν λΆμΌμ νμ μ μΈ μ루μ μ μ 곡ν©λλ€.
Vision Question Answering LLMμ κΈ°λ°ν λμ μ±λ₯μΌλ‘ μκ°μ λ°μ΄ν°λ₯Ό μ΄ν΄νκ³ μ¬μ©μμ μ§λ¬Έμ λν λ΅λ³μ μ 곡ν©λλ€.
Image Captioning μκ°μ λ°μ΄ν°μ λν μ€λͺ μ μμ±ν©λλ€. μ ννκ³ κ°κ΄μ μΈ μ 보 μΆμΆμ ν΅ν΄ μμ , μλ£ κ·Έλ¦¬κ³ κ΅μ‘ λ± λ€μν λΆμΌμμ νμ©λ λμ μ±λ₯μ μ 곡ν©λλ€.
Last updated