분류 전체보기
-
2장 LLM의 중추, 트랜스포머 아키텍처 살펴보기LLM/LLM을 활용한 실전 AI 애플리케이션 개발 2025. 1. 10. 09:22
2.1 트랜스포머 아키텍처란 2.1 2.2 squeeze 와 unsqueezesqueeze : 으깨서 없애기https://sanghyu.tistory.com/86 [PyTorch] squeeze, unsqueeze함수: 차원 삭제와 차원 삽입squeeze함수 squeeze함수는 차원이 1인 차원을 제거해준다. 따로 차원을 설정하지 않으면 1인 차원을 모두 제거한다. 그리고 차원을 설정해주면 그 차원만 제거한다. Python 코드 import torch x = torch.rand(3sanghyu.tistory.com 2.3 2.4 2.52.62.7 토큰화 예강남스타일 🎵 PSY의 공연이 LA에서 열렸다"강남스타일" (자주 사용되는 표현으로 하나의 토큰) "🎵" (이모티콘은 개별 토큰) "PSY..
-
1.2 언어 모델이 챗GPT가 되기까지LLM/LLM을 활용한 실전 AI 애플리케이션 개발 2025. 1. 9. 22:36
목차 2017년의 획기적인 사건이였던 트랜스포머 아키텍처 공개 1.2.1 RNN 에서 트랜스포머 아키텍처로텍스트는 단어가 연결된 문장 형태의 데이터 입니다. 작은 단위(단어)의 데이터가 연결되고, 그 길이가 다양한 데이터의 형태를 시퀀스 Sequence 라고 한다.예로, 텍스트, 오디오, 시계열과 같은 데이터가 시퀀스 데이터라고 할 수 있다 트랜스포머가 개발되기 전에는 RNN 을 활용해서 텍스트를 생성했다그림 1.12처럼 텍스트를 순차적으로 처리해서, 다음 단어를 예측한다RNN의 특징 : 모델이 하나의 잠재 상태(hidden state)에 지금까지의 입력 텍스트의 맥락을 압축한다는 점이다. 첫 번째 입력은 '검은'이 모델을 통과했을 때는 잠재 상태에 '검은'의 정보가 쌓이고,두 번째 입력인 '고양..
-
1장 LLM 지도 1.1 딥러닝과 언어모델LLM/LLM을 활용한 실전 AI 애플리케이션 개발 2025. 1. 3. 08:54
목차 딥러닝(deep learning)이란 인간의 두뇌에 영감을 받아 만들어진 신경망(neural network)데이터의 패턴을 학습하는 머신러닝(machine learning)의 한 분야다 텍스트와 이미지(비정형 데이터,unstructured data)에서도 뛰어난 패턴 인식 성능을 보여, AI 주류 모델이 됨자연어 처리(NLP, natural language processing)자연어 생성(NLG, natural language generating) LLM은 다음에 올 단어가 무엇일지 예측하면서 문장을 하나씩 만들어 가는 방식으로 텍스트를 생성이렇게 다음에 올 단어를 예측하는 모델을 언어 모델(Language Model) 이라고 함LLM 은 딥러닝 기반의 언어 모델이다. 3가지 주요 사건1. 워드..
-
책 - LLM을 활용한 실전 AI 애플리케이션 개발LLM/LLM을 활용한 실전 AI 애플리케이션 개발 2025. 1. 3. 08:38
Team Study 로 책, LLM을 활용한 실전 AI 애플리케이션 개발 을 함께 공부하기로 하였습니다https://ridibooks.com/books/3649000042 LLM을 활용한 실전 AI 애플리케이션 개발LLM을 활용한 실전 AI 애플리케이션 개발 작품소개: 트랜스포머 아키텍처부터 RAG 개발, 모델 학습, 배포, 최적화, 운영까지 라마인덱스와 LLM을 활용한 AI 애플리케이션 개발의 모든 것이 책에서는ridibooks.com 제목 : LLM을 활용한 실전 AI 애플리케이션 개발부제 : LLM의 기본부터 모델 학습, 임베딩, 벡터 데이터베이스로 만드는 RAG까지작가 : 허정준 핵심내용1. LLM의 핵심인 트랜스포머 아키텍처2. 챗GPT를 만드는 방법: 지도 미세 조정과 RLHF ( Reinfo..
-
ollama api 사용해 보기AI/Llama 2024. 9. 2. 10:16
offical docshttps://github.com/ollama/ollama/blob/main/docs/api.md ollama/docs/api.md at main · ollama/ollamaGet up and running with Llama 3.1, Mistral, Gemma 2, and other large language models. - ollama/ollamagithub.com running modelhttp://localhost:11434/api/ps List local modelshttp://localhost:11434/api/tags post /api/showcurl http://localhost:11434/api/show -d '{"name": "llama3.1"}' /api/ge..
-
Llama 3.1 사용해 보기AI/Llama 2024. 9. 1. 11:55
Ollama & open-webui 한번에 설치ollama 와 open-webui 를 따로 따로 띄웠더니, network 을 서로 못 찾는 듯 했다.그래서 open-webui git repo 를 clone 받아 intellij 로 띄웠다 https://github.com/open-webui/open-webui GitHub - open-webui/open-webui: User-friendly WebUI for LLMs (Formerly Ollama WebUI)User-friendly WebUI for LLMs (Formerly Ollama WebUI) - open-webui/open-webuigithub.com intellij 의 docker 기능을 사용한다그 전에 chrome browser 에서도 사용..
-
appProtocolKubernetes 2024. 8. 26. 09:03
아래 예제 처럼, grpc, websocket, http2 등의 application Protocol 을 따로 지정할 때 사용apiVersion: v1kind: Servicemetadata: name: my-grpc-servicespec: ports: - name: grpc port: 50051 targetPort: 50051 appProtocol: h2c selector: app: grpc-app grpcws websoketwss websocket over TLShpchttp2 clear text : http2 를 쓰지만 tls 는 사용하지 않음 official https://kubernetes.io/docs/concepts/services-networking/serv..
-
Java의 미래, Virtual Thread - 4월 우아한테크세미나Spring/Framework 2024. 4. 23. 18:29
4월 우아한 테크Java의 미래, Virtual Thread김태헌님https://www.youtube.com/@woowatech 우아한테크우아한형제들의 기술조직 이야기를 전하는 우아한테크입니다. 우아한형제들 https://www.woowahan.com/ 우아한테크 Facebook https://www.facebook.com/woowahanTech 우아한형제들 기술블로그 https://techblog.woowahan.comwww.youtube.comhttps://www.youtube.com/watch?v=BZMZIM-n4C0 발표자료 : https://drive.google.com/file/d/1GWMlgtKM8S4XcymK8fwCZLaQZ-K6P7Vq/view [우..