spring boot &amp; webflux &amp; devOps

Github Enterprise Server 3.14 release note

CI-CD/github 2025. 4. 14. 09:46

요약01. 2세대 가상 머신(vhdx) 사용 가능 3.14https://docs.github.com/ko/enterprise-server@3.14/admin/release-notes 3.14.0: 기능인스턴스 관리여러 개의 복제 노드가 있는 인스턴스에서 관리자는 단일 구성 실행에서 모든 노드에 대한 복제를 시작하거나 중지하기 위해 ghe-repl-start-all및 ghe-repl-stop-all명령을 사용할 수 있습니다.인스턴스 서비스관리자는 UEFI 모드 부팅을 지원하는 2세대 가상 머신(vhdx)을 사용하여 어플라이언스를 확장할 수 있습니다. 이를 위해서는 새 인스턴스를 배포하고 해당 인스턴스에 데이터를 복원해야 합니다. 2세대 가상 머신 사용을 참조하세요 .Nomad는 1.5.17로, Consu..

Github Enterprise Server 3.15 release note

CI-CD/github 2025. 4. 14. 08:34

요약01. 조직의 리포지토리에 대한 사용자 지정 속성 관리.02. 병합 대기열 큐와 끌어오기 요청 03. 200 -> 400 gb root disk 필요 / 원복04. vCPU, Memory 등 권장 Spec 변경 https://docs.github.com/ko/enterprise-server@3.15/admin/installing-your-enterprise-server/setting-up-a-github-enterprise-server-instance/installing-github-enterprise-server-on-hyper-v 3.15https://docs.github.com/ko/enterprise-server@3.15/admin/release-notes 3.15.0: 기능인스턴스 관리..

Clova Studio 를 활용한 RAG 구성

Clova Studio 2025. 4. 2. 15:27

Clova Studio 홈https://guide.ncloud-docs.com/docs/clovastudio-screen CLOVA Studio 홈 화면 guide.ncloud-docs.com https://clovastudio.ncloud.com/ [온라인 웨비나] CLOVA Studio를 활용한 RAG 구성 https://www.youtube.com/watch?v=Snft1gFbDmU 01. 플레이 그라운드 demo 유형별로 test / table / image 를 개별적으로 추출 중복 좌표 확인 및 정리? 임베딩 모델bge-m3 를 추천토큰수가 크고, 가장 좋음 vector db :postgre, opensearch?milvus, Qdrant : 대규모 데이터에 최적화, 실시간 데이..

Atlassian confluence jira 대응 제품

Alicloud 2025. 4. 2. 10:30

Alibaba Cloud DocsYuque https://www.alibabacloud.com/en/customers/yuque?_p_lc=1Alibaba Cloud Project Management WorkspaceYunxiao : https://www.alibabacloud.com/blog/managing-large-projects-with-alibaba-cloud-yunxiao_594292?spm=a2c65.11461478.0.0.5b6353551kilE6영어자료 부족 이런 제품들이 언급되나, 검색하여 찾을 수가 없음https://www.alibabacloud.com/help/en Alibaba Cloud Documentation-Alibaba Cloud Documentation Center-Al..

codeup - github 과 유사한 소스 형상 관리 툴

Alicloud/codeup 2025. 4. 2. 09:39

목차Official GuideCode Management - codeupAlibaba Cloud DevOps 의 포함 상품https://www.alibabacloud.com/help/en/yunxiao/user-guide/code-management-2/?spm=a2c63.p38356.help-menu-150040.d_1_2.6b68748es8raws Code Management - Alibaba Cloud DevOps - Alibaba Cloud Documentation CenterSearch Thank you! We've received your feedback.www.alibabacloud.comAuthentication permission and setting managementBasic host..

7.2 양자화로 모델 용량 줄이기 - 작성중

LLM/LLM을 활용한 실전 AI 애플리케이션 개발 2025. 2. 24. 22:36

7.2.1 비츠앤바이츠 예제 7.1 비츠앤바이츠 양자화 모델 불러오기from transformers import AutoModelForCausalLM, BitsAndBytesConfig# 8비트 양자화 모델 불러오기bnb_config_8bit = BitsAndBytesConfig(load_in_8bit=True)model_8bit = AutoModelForCausalLM.from_pretrained("facebook/opt-350m", quantization_config=bnb_config_8bit)# 4비트 양자화 모델 불러오기bnb_config_4bit = BitsAndBytesConfig(load_in_4bit=True, bnb_..

7.1 언어 모델 추론 이해하기 - 작성중

LLM/LLM을 활용한 실전 AI 애플리케이션 개발 2025. 2. 24. 22:07

7.1.1. 언어 모델이 언어를 생성하는 방법 7.2 언어 모델의 자기 회귀적 성질 7.3 언어 모델은 한 토큰씩 생성한다 7.1.2 중복 연산을 줄이는 kv 캐시 7.4 kv 캐시를 사용할 때와 사용하지 않을 때의 차이 7.5 kv 캐시를 사용하는 경우 gpu 메모리를 차지하는 데이터 7.1.3 gpu 구조와 최적의 배치 크기 7.1.4 kv 캐시 메모리 줄이기 책 출처 : https://ridibooks.com/books/3649000042 LLM을 활용한 실전 AI 애플리케이션 개발LLM을 활용한 실전 AI 애플리케이션 개발 작품소개: 트랜스포머 아키텍처부터 RAG 개발, 모델 학습, 배포, 최적화, 운영까지 라마인덱스와 LLM을 활용한 AI 애플리케..

6장 sLLM 학습하기

LLM/LLM을 활용한 실전 AI 애플리케이션 개발 2025. 2. 16. 22:10

목차1.실습 준비openai apiopenai api 결제 6장 실습 시 openai api 를 호출해야 한다.https://platform.openai.com/settings/organization/billing 에 접속해서 결제정보 추가하고, $10 결제하였다. https://platform.openai.com/docs/overview에 접속하여 sample api 를 호출해 본다 openai 모듈을 설치한다pip install openaipip show openai# Name: openai / # Version: 1.63.0 모델정보는 여기서 확인https://platform.openai.com/docs/guides/rate-limits?tier=free#how-do-these-rate-limits..

ABOUT ME

spring boot & webflux & devOps spring boot & webflux & devOps

티스토리툴바

ABOUT ME

전체 글

티스토리툴바