스테이블 디퓨전에서 AI가 프롬프트 이해도를 높이는 방법을 설명 드리겠습니다.
같은 단어를 입력하더라도 초기 세팅으로 작업을 진행했을 경우 이해력이 떨어지는 경우가 있는데, 아마 이 부분을 조절하면 AI가 이전보다 훨씬 더 단어 이해력이 높아질 수 있습니다.
AI 프롬프트 이해도 높이는 방법
아래 이미지와 과정을 잘 참고하시면 쉽게 AI 프롬프트의
이해도를 높일 수 있습니다.
1. 스테이블 디퓨전 실행 후 Settings 클릭합니다
2. 왼쪽 탭에서 ‘Stable Diffusion’을 클릭합니다.
3. Clip skip 값을 ‘2’로 수정해줍니다.
대부분의 스테이블 디퓨전 모델이 학습될 때 Clip skip 값이 2로 설정되어있습니다.
따라서, 이 값을 ‘2’로 해주면 결과물 출력 시
눈에 띄게 퀄리티가 올라가기 때문에 반드시 설정해주는 것이 좋습니다.
4. Clip skip을 2로 수정 후 Apply Settings를 누릅니다.
5. Reload UI를 클릭 후 스테이블 디퓨전을 사용합니다.
이렇게 간단하게 Settings에서 값만 변경해주면
기존보다 조금 더 괜찮은 퀄리티의 사진을 생성해 낼 수 있습니다.
실제로 어느 정도 차이가 있는지 궁금해서
간단한 prompt만 입력 후 그 차이를 확인해보았습니다.
Clip skip이 ‘1’일 경우의 결과물
Positive Prompt : girl, eating pancake
CFG scale : 6
Sampling Method : DPM++ SDE Karras
Clip skip이 ‘2’일 경우 결과물
clip skip이 1일때와 비교하기 위해 동일한 샘플링 메소드,
CFG 스케일, positive prompt를 입력했습니다.
Positive Prompt : girl, eating pancake
CFG scale : 6
Sampling Method : DPM++ SDE Karras
Positive Prompt를 딱 두 개만 입력해서 결과물에 큰 차이가 나타나는 것 같진 않지만,
미세하게 ‘팬케익을 먹는다’ 라는 자연어의 해석을 Clip skip이 2일 경우 더 자연스럽게 하는 것 같습니다.
이상으로 스테이블 디퓨전 AI 프롬프트 이해도를 높이는 방법과 미세한 차이를 비교해보았습니다.
이번 포스팅이 스테이블 디퓨전을 통해 좋은 결과물을 생성하는데 도움이 되었으면 합니다.
다른 팁 들도 계속 공유할 예정이니 확인해주세요!
스테이블 디퓨전 VAE 쉽게 사용하는 방법 1분 정리
스테이블 디퓨전(txt-to-img) 기능 소개 및 설명 5분만에 이해하기