NoobAI-XL 사용자 매뉴얼 (WIP) : https://d0xb9r3fg5h.feishu.cn/docx/YpOQdtHTDoetcZxIO9fc33onnee
위 링크를 한글화해서 정리 요약한 내용입니다.
1. 소개
이 문서는 NoobAI-XL 모델에 대한 포괄적인 가이드를 제공합니다. NoobAI-XL은 Laxhar Dream Lab에서 개발하고 Lanyun이 후원하는 텍스트-이미지 확산 모델입니다. 이 모델은 SDXL 아키텍처를 기반으로 하며, fair-ai-public-license-1.0-sd를 계승하는 모델 인증서를 따릅니다(추가적인 제한 사항은 NoobAI-XL 모델 인증서를 참조하세요). 기본 모델은 Illustrious-xl-early-release-v0이며, **Danbooru 및 e621 데이터셋(약 1300만 개 이미지)**을 학습하여 뛰어난 성능을 제공합니다.
1.1 주요 특징
- 광범위한 지식 보유: 수만 개의 2D 캐릭터 및 아티스트 스타일을 재현 가능
- 다양한 예측 방식 지원:
- 노이즈 예측 (Epsilon-prediction): 창의적이고 다양한 이미지 생성
- V-예측 (V-prediction): 프롬프트를 더 충실히 반영하며 색상 및 조명 효과 향상
- 강력한 확장성: LoRA, ControlNet, IP-Adapter 등 다양한 확장 모델과 호환 가능
2. 빠른 시작
2.1 모델 다운로드
다음 사이트에서 NoobAI-XL을 다운로드할 수 있습니다:
2.2 모델 로딩
NoobAI-XL 모델은 두 가지 유형으로 나뉩니다:
- 노이즈 예측 (eps-pred) 모델: 일반적인 로딩 방법 사용 가능
- V-예측 (v-pred) 모델: 추가 설정이 필요함 (아래 참고)
2.2.1 V-예측 모델 로딩
V-예측 모델은 색상 범위와 조명 효과가 뛰어나지만, 일부 UI에서 기본적으로 지원되지 않습니다. UI별 설정 방법은 아래와 같습니다:
- Forge/reForge: V-예측 모델을 기본 지원. 설치 디렉토리에서 git pull 실행 후 재시작.
- ComfyUI: 추가 노드 사용 필요.
- WebUI (AUTOMATIC1111): git checkout dev 명령어를 실행하여 개발 브랜치로 전환해야 하나, 안정성이 떨어질 수 있음.
- Diffusers (Python 라이브러리):
import torch
from diffusers import StableDiffusionXLPipeline, EulerDiscreteScheduler
ckpt_path = "/path/to/model.safetensors"
pipe = StableDiffusionXLPipeline.from_single_file(ckpt_path, use_safetensors=True, torch_dtype=torch.float16)
pipe.scheduler = EulerDiscreteScheduler.from_config(pipe.scheduler.config, prediction_type="v_prediction", rescale_betas_zero_snr=True)
pipe.enable_xformers_memory_efficient_attention()
pipe = pipe.to("cuda")
2.3 모델 사용법
2.3.1 프롬프트 작성
NoobAI-XL은 태그 기반 프롬프트를 사용하며, 영어 단어 또는 구문을 쉼표(,)로 구분하여 입력합니다 (예: 1girl, solo, blue hair).
프롬프트 작성 팁:
- Danbooru/e621 태그를 직접 사용하는 것이 가장 효과적.
- 항상 very awa, masterpiece, best quality 태그 추가 권장.
- 캐릭터 & 스타일 프롬프트: 캐릭터 이름 (시리즈), 시리즈 이름 형식 사용.
- 잘못된 태그 사용 금지 (예: 밑줄 _ 대신 공백 사용).
2.3.2 추천 생성 파라미터
A. 기본 설정
모델 유형 | 유형샘플러 | CFG | 스케일스텝 |
노이즈 예측 | Euler A | 5-7 | 28-35 |
V-예측 1.0 | Euler | 3.5-5.5 | 32-40 |
V-예측 0.9r | Euler A | 3-5 | 28-40 |
B. 최적화된 V-예측 설정
- Rescale CFG (~0.7) 설정 추천.
- CFG Scale을 1~1.8 사이로 설정하면 최적의 색감 및 조명 효과 가능.
C. 추천 해상도
최상의 결과를 얻으려면 특정 해상도를 사용하세요:
비율 | 해상도 (W x H) |
9:16 | 768x1344 |
2:3 | 832x1216 |
3:4 | 896x1152 |
1:1 | 1024x1024 |
4:3 | 1152x896 |
3:2 | 1216x832 |
16:9 | 1344x768 |
2.3.3 기타 주의사항
- V-예측 모델은 프롬프트와 생성 파라미터에 민감함.
- CLIP skip 설정 불필요 (SDXL 모델의 기본 사양).
- 추가 VAE 모델 사용 필요 없음.
3. 고급 사용법
3.1 모델 버전
NoobAI-XL은 여러 버전이 존재합니다. 주요 버전은 다음과 같습니다:
3.1.1 기본 모델
버전 | 유형 | 특징 |
Epsilon-pred 1.0 | 노이즈 예측 | 안정적인 성능 및 균형 잡힌 결과 |
V-Pred 0.75s | V-예측 | 과포화 및 아티팩트 문제 해결 |
V-Pred 1.0 | V-예측 | 색감 및 성능 최적화 |
3.1.2 ControlNet 확장
다양한 ControlNet 프리프로세서를 지원합니다:
유형 | 프리프로세서 |
소프트 엣지 | hed soft edge |
라인아트 | lineart_anime |
깊이 맵 | depth_midas |
포즈 인식 | openpose |
3.2 프롬프트 가이드
3.2.1 프롬프트 작성법
- 올바른 형식으로 작성 (캐릭터 이름 (시리즈), 시리즈 이름).
- 괄호는 이스케이프 처리 (ganyu \(genshin impact\)).
- 무의미한 메타 태그 사용 금지 (commentary_request 등).
3.2.2 특수 태그
- 품질 태그: masterpiece, best quality
- 미적 태그: very awa (상위 5% 미적 평가)
- 안전성 태그: general, sensitive, nsfw, explicit
- 연도 태그: year 2024, newest
4. 결론
NoobAI-XL은 강력한 텍스트-이미지 생성 능력을 제공하며, 노이즈 예측 및 V-예측을 활용해 다양한 스타일의 고품질 이미지를 생성할 수 있습니다. ControlNet, LoRA 모델, 고급 프롬프트 기법 등을 적극 활용해보세요!
'[TIP] Stable Diffusion' 카테고리의 다른 글
🎬 초고화질 영상으로 부활시키자! Video2X 설치부터 실전 업스케일링까지 완벽 가이드 (2) | 2025.03.27 |
---|---|
고용량 ComfyUI 모델, 심볼릭 링크로 스마트하게 관리하는 법 (0) | 2025.03.17 |
Ultralyitcs 패키지 버전 점검 및 다운그레이드 방법: 암호화폐 채굴 코드 문제 해결하기 (0) | 2024.12.07 |
CivitAI로 나만의 LoRA 모델 만드는 방법: 단계별 가이드와 팁 (7) | 2024.11.08 |
AI 이미지 생성 최신 뉴스: Stable Diffusion 3.5 Large 출시와 Sana 모델, ComfyUI Desktop 버전 출시 (17) | 2024.10.23 |
댓글