llm을 활용한 실전ai 애플리케이션 개발
-
1.4 LLM의 미래: 인식과 행동의 확장LLM/LLM을 활용한 실전 AI 애플리케이션 개발 2025. 1. 12. 16:46
목차 1.4 LLM의 미래: 인식과 행동의 확장세 가지 큰 흐름멀티모달(multi modal) : LLM이 더 다양한 형식의 데이터(예, 이미지, 비디오, 오디오 등)을 입/출력으로 사용AI Agent: LLM이 텍스트 생성 능력을 사용해 계획을 세우거나 의사결정을 내리고 필요한 행동까지 수행새로운 아키텍처 : 트랜스포머 아키텍처를 새로운 아키텍처로 변경해 더 긴 입력을 효율적으로 처리하려는 연구 GPT-4o 는 뛰어난 이미지 및 음성 처리 능력을 보여줬고, 구글의 제미나이, Antrhopic의 Claude 같은 상업용 모델도 이미지를 함께 처리할 수 잇다. RAG 에서도 이미지와 텍스트를 함께 검색하는 멀티 모달 RAG에 대한 관심이 높아지고 있다. AI AgentAutoGPTSignificant G..