NoobAI-XL 사용자 매뉴얼 (WIP) : https://d0xb9r3fg5h.feishu.cn/docx/YpOQdtHTDoetcZxIO9fc33onnee

위 링크를 한글화해서 정리 요약한 내용입니다.

1. 소개

이 문서는 NoobAI-XL 모델에 대한 포괄적인 가이드를 제공합니다. NoobAI-XL은 Laxhar Dream Lab에서 개발하고 Lanyun이 후원하는 텍스트-이미지 확산 모델입니다. 이 모델은 SDXL 아키텍처를 기반으로 하며, fair-ai-public-license-1.0-sd를 계승하는 모델 인증서를 따릅니다(추가적인 제한 사항은 NoobAI-XL 모델 인증서를 참조하세요). 기본 모델은 Illustrious-xl-early-release-v0이며, **Danbooru 및 e621 데이터셋(약 1300만 개 이미지)**을 학습하여 뛰어난 성능을 제공합니다.

1.1 주요 특징

광범위한 지식 보유: 수만 개의 2D 캐릭터 및 아티스트 스타일을 재현 가능
다양한 예측 방식 지원:
- 노이즈 예측 (Epsilon-prediction): 창의적이고 다양한 이미지 생성
- V-예측 (V-prediction): 프롬프트를 더 충실히 반영하며 색상 및 조명 효과 향상
강력한 확장성: LoRA, ControlNet, IP-Adapter 등 다양한 확장 모델과 호환 가능

2. 빠른 시작

2.1 모델 다운로드

다음 사이트에서 NoobAI-XL을 다운로드할 수 있습니다:

CivitAI
LiblibAI
Huggingface

2.2 모델 로딩

NoobAI-XL 모델은 두 가지 유형으로 나뉩니다:

노이즈 예측 (eps-pred) 모델: 일반적인 로딩 방법 사용 가능
V-예측 (v-pred) 모델: 추가 설정이 필요함 (아래 참고)

2.2.1 V-예측 모델 로딩

V-예측 모델은 색상 범위와 조명 효과가 뛰어나지만, 일부 UI에서 기본적으로 지원되지 않습니다. UI별 설정 방법은 아래와 같습니다:

Forge/reForge: V-예측 모델을 기본 지원. 설치 디렉토리에서 git pull 실행 후 재시작.
ComfyUI: 추가 노드 사용 필요.
WebUI (AUTOMATIC1111): git checkout dev 명령어를 실행하여 개발 브랜치로 전환해야 하나, 안정성이 떨어질 수 있음.
Diffusers (Python 라이브러리):

import torch
from diffusers import StableDiffusionXLPipeline, EulerDiscreteScheduler

ckpt_path = "/path/to/model.safetensors"
pipe = StableDiffusionXLPipeline.from_single_file(ckpt_path, use_safetensors=True, torch_dtype=torch.float16)
pipe.scheduler = EulerDiscreteScheduler.from_config(pipe.scheduler.config, prediction_type="v_prediction", rescale_betas_zero_snr=True)
pipe.enable_xformers_memory_efficient_attention()
pipe = pipe.to("cuda")

2.3 모델 사용법

2.3.1 프롬프트 작성

NoobAI-XL은 태그 기반 프롬프트를 사용하며, 영어 단어 또는 구문을 쉼표(,)로 구분하여 입력합니다 (예: 1girl, solo, blue hair).

프롬프트 작성 팁:

Danbooru/e621 태그를 직접 사용하는 것이 가장 효과적.
항상 very awa, masterpiece, best quality 태그 추가 권장.
캐릭터 & 스타일 프롬프트: 캐릭터 이름 (시리즈), 시리즈 이름 형식 사용.
잘못된 태그 사용 금지 (예: 밑줄 _ 대신 공백 사용).

2.3.2 추천 생성 파라미터

A. 기본 설정

모델 유형	유형샘플러	CFG	스케일스텝
노이즈 예측	Euler A	5-7	28-35
V-예측 1.0	Euler	3.5-5.5	32-40
V-예측 0.9r	Euler A	3-5	28-40

B. 최적화된 V-예측 설정

Rescale CFG (~0.7) 설정 추천.
CFG Scale을 1~1.8 사이로 설정하면 최적의 색감 및 조명 효과 가능.

C. 추천 해상도

최상의 결과를 얻으려면 특정 해상도를 사용하세요:

비율	해상도 (W x H)
9:16	768x1344
2:3	832x1216
3:4	896x1152
1:1	1024x1024
4:3	1152x896
3:2	1216x832
16:9	1344x768

2.3.3 기타 주의사항

V-예측 모델은 프롬프트와 생성 파라미터에 민감함.
CLIP skip 설정 불필요 (SDXL 모델의 기본 사양).
추가 VAE 모델 사용 필요 없음.

3. 고급 사용법

3.1 모델 버전

NoobAI-XL은 여러 버전이 존재합니다. 주요 버전은 다음과 같습니다:

3.1.1 기본 모델

버전	유형	특징
Epsilon-pred 1.0	노이즈 예측	안정적인 성능 및 균형 잡힌 결과
V-Pred 0.75s	V-예측	과포화 및 아티팩트 문제 해결
V-Pred 1.0	V-예측	색감 및 성능 최적화

3.1.2 ControlNet 확장

다양한 ControlNet 프리프로세서를 지원합니다:

유형	프리프로세서
소프트 엣지	hed soft edge
라인아트	lineart_anime
깊이 맵	depth_midas
포즈 인식	openpose

3.2 프롬프트 가이드

3.2.1 프롬프트 작성법

올바른 형식으로 작성 (캐릭터 이름 (시리즈), 시리즈 이름).
괄호는 이스케이프 처리 (ganyu \(genshin impact\)).
무의미한 메타 태그 사용 금지 (commentary_request 등).

3.2.2 특수 태그

품질 태그: masterpiece, best quality
미적 태그: very awa (상위 5% 미적 평가)
안전성 태그: general, sensitive, nsfw, explicit
연도 태그: year 2024, newest

4. 결론

NoobAI-XL은 강력한 텍스트-이미지 생성 능력을 제공하며, 노이즈 예측 및 V-예측을 활용해 다양한 스타일의 고품질 이미지를 생성할 수 있습니다. ControlNet, LoRA 모델, 고급 프롬프트 기법 등을 적극 활용해보세요!

저작자표시 (새창열림)

'[TIP] Stable Diffusion' 카테고리의 다른 글

🎬 초고화질 영상으로 부활시키자! Video2X 설치부터 실전 업스케일링까지 완벽 가이드 (2)	2025.03.27
고용량 ComfyUI 모델, 심볼릭 링크로 스마트하게 관리하는 법 (0)	2025.03.17
Ultralyitcs 패키지 버전 점검 및 다운그레이드 방법: 암호화폐 채굴 코드 문제 해결하기 (0)	2024.12.07
CivitAI로 나만의 LoRA 모델 만드는 방법: 단계별 가이드와 팁 (7)	2024.11.08
AI 이미지 생성 최신 뉴스: Stable Diffusion 3.5 Large 출시와 Sana 모델, ComfyUI Desktop 버전 출시 (17)	2024.10.23

doobam's story

텍스트-이미지 AI: NoobAI-XL 완벽 가이드 🚀

1. 소개

1.1 주요 특징

2. 빠른 시작

2.1 모델 다운로드