본문 바로가기
[TIP] Stable Diffusion

텍스트-이미지 AI: NoobAI-XL 완벽 가이드 🚀

by doobam 2025. 3. 17.
반응형

NoobAI-XL 사용자 매뉴얼 (WIP) : https://d0xb9r3fg5h.feishu.cn/docx/YpOQdtHTDoetcZxIO9fc33onnee

위 링크를 한글화해서 정리 요약한 내용입니다.

NoobAI-XL로 만든 이미지, 출처: civitai.com

1. 소개

이 문서는 NoobAI-XL 모델에 대한 포괄적인 가이드를 제공합니다. NoobAI-XL은 Laxhar Dream Lab에서 개발하고 Lanyun이 후원하는 텍스트-이미지 확산 모델입니다. 이 모델은 SDXL 아키텍처를 기반으로 하며, fair-ai-public-license-1.0-sd를 계승하는 모델 인증서를 따릅니다(추가적인 제한 사항은 NoobAI-XL 모델 인증서를 참조하세요). 기본 모델은 Illustrious-xl-early-release-v0이며, **Danbooru 및 e621 데이터셋(약 1300만 개 이미지)**을 학습하여 뛰어난 성능을 제공합니다.

1.1 주요 특징

  • 광범위한 지식 보유: 수만 개의 2D 캐릭터 및 아티스트 스타일을 재현 가능
  • 다양한 예측 방식 지원:
    • 노이즈 예측 (Epsilon-prediction): 창의적이고 다양한 이미지 생성
    • V-예측 (V-prediction): 프롬프트를 더 충실히 반영하며 색상 및 조명 효과 향상
  • 강력한 확장성: LoRA, ControlNet, IP-Adapter 등 다양한 확장 모델과 호환 가능

2. 빠른 시작

2.1 모델 다운로드

다음 사이트에서 NoobAI-XL을 다운로드할 수 있습니다:

2.2 모델 로딩

NoobAI-XL 모델은 두 가지 유형으로 나뉩니다:

  1. 노이즈 예측 (eps-pred) 모델: 일반적인 로딩 방법 사용 가능
  2. V-예측 (v-pred) 모델: 추가 설정이 필요함 (아래 참고)

2.2.1 V-예측 모델 로딩

V-예측 모델은 색상 범위와 조명 효과가 뛰어나지만, 일부 UI에서 기본적으로 지원되지 않습니다. UI별 설정 방법은 아래와 같습니다:

  • Forge/reForge: V-예측 모델을 기본 지원. 설치 디렉토리에서 git pull 실행 후 재시작.
  • ComfyUI: 추가 노드 사용 필요.
  • WebUI (AUTOMATIC1111): git checkout dev 명령어를 실행하여 개발 브랜치로 전환해야 하나, 안정성이 떨어질 수 있음.
  • Diffusers (Python 라이브러리):
import torch
from diffusers import StableDiffusionXLPipeline, EulerDiscreteScheduler

ckpt_path = "/path/to/model.safetensors"
pipe = StableDiffusionXLPipeline.from_single_file(ckpt_path, use_safetensors=True, torch_dtype=torch.float16)
pipe.scheduler = EulerDiscreteScheduler.from_config(pipe.scheduler.config, prediction_type="v_prediction", rescale_betas_zero_snr=True)
pipe.enable_xformers_memory_efficient_attention()
pipe = pipe.to("cuda")

2.3 모델 사용법

2.3.1 프롬프트 작성

NoobAI-XL은 태그 기반 프롬프트를 사용하며, 영어 단어 또는 구문을 쉼표(,)로 구분하여 입력합니다 (예: 1girl, solo, blue hair).

프롬프트 작성 팁:

  • Danbooru/e621 태그를 직접 사용하는 것이 가장 효과적.
  • 항상 very awa, masterpiece, best quality 태그 추가 권장.
  • 캐릭터 & 스타일 프롬프트: 캐릭터 이름 (시리즈), 시리즈 이름 형식 사용.
  • 잘못된 태그 사용 금지 (예: 밑줄 _ 대신 공백 사용).

2.3.2 추천 생성 파라미터

A. 기본 설정

모델 유형 유형샘플러 CFG  스케일스텝
노이즈 예측 Euler A 5-7 28-35
V-예측 1.0 Euler 3.5-5.5 32-40
V-예측 0.9r Euler A 3-5 28-40

B. 최적화된 V-예측 설정

  • Rescale CFG (~0.7) 설정 추천.
  • CFG Scale1~1.8 사이로 설정하면 최적의 색감 및 조명 효과 가능.

C. 추천 해상도

최상의 결과를 얻으려면 특정 해상도를 사용하세요:

비율 해상도 (W x H)
9:16 768x1344
2:3 832x1216
3:4 896x1152
1:1 1024x1024
4:3 1152x896
3:2 1216x832
16:9 1344x768

2.3.3 기타 주의사항

  • V-예측 모델은 프롬프트와 생성 파라미터에 민감함.
  • CLIP skip 설정 불필요 (SDXL 모델의 기본 사양).
  • 추가 VAE 모델 사용 필요 없음.

3. 고급 사용법

3.1 모델 버전

NoobAI-XL은 여러 버전이 존재합니다. 주요 버전은 다음과 같습니다:

3.1.1 기본 모델

버전 유형 특징
Epsilon-pred 1.0 노이즈 예측 안정적인 성능 및 균형 잡힌 결과
V-Pred 0.75s V-예측 과포화 및 아티팩트 문제 해결
V-Pred 1.0 V-예측 색감 및 성능 최적화

3.1.2 ControlNet 확장

다양한 ControlNet 프리프로세서를 지원합니다:

유형 프리프로세서
소프트 엣지 hed soft edge
라인아트 lineart_anime
깊이 맵 depth_midas
포즈 인식 openpose

3.2 프롬프트 가이드

3.2.1 프롬프트 작성법

  • 올바른 형식으로 작성 (캐릭터 이름 (시리즈), 시리즈 이름).
  • 괄호는 이스케이프 처리 (ganyu \(genshin impact\)).
  • 무의미한 메타 태그 사용 금지 (commentary_request 등).

3.2.2 특수 태그

  • 품질 태그: masterpiece, best quality
  • 미적 태그: very awa (상위 5% 미적 평가)
  • 안전성 태그: general, sensitive, nsfw, explicit
  • 연도 태그: year 2024, newest

4. 결론

NoobAI-XL은 강력한 텍스트-이미지 생성 능력을 제공하며, 노이즈 예측 및 V-예측을 활용해 다양한 스타일의 고품질 이미지를 생성할 수 있습니다. ControlNet, LoRA 모델, 고급 프롬프트 기법 등을 적극 활용해보세요!

반응형

댓글