Како покренути стабилну дифузију локално са ГУИ-ом на Виндовс-у


Можете инсталирати Стабле Диффусион локално на рачунару, али типичан процес укључује доста рада са командном линијом за инсталирање и коришћење. На нашу срећу, заједница Стабле Диффусион је решила тај проблем. Ево како да инсталирате верзију Стабле Диффусион која ради локално са графичким корисничким интерфејсом!

Шта је стабилна дифузија?

Стабле Диффусион је АИ модел који може да генерише слике из текстуалних упита или да модификује постојеће слике текстуалним одзивом, слично као МидЈоурнеи или ДАЛЛ-Е 2. Први пут је објављен у августу 2022. од стране Стабилити.аи. Разуме хиљаде различитих речи и може се користити за креирање скоро сваке слике коју ваша машта може да дочара у скоро сваком стилу.

Међутим, постоје две критичне разлике које издвајају Стабле Диффусион од већине других популарних АИ генератора уметности:

  • Може се покренути локално на вашем рачунару
  • То је пројекат отвореног кода

Последња тачка је заиста важно питање овде. Традиционално, Стабле Диффусион се инсталира и покреће преко интерфејса командне линије. Ради, али може бити незграпно, неинтуитивно и представља значајну баријеру уласку за људе који би иначе били заинтересовани. Али, пошто је то пројекат отвореног кода, заједница је брзо креирала кориснички интерфејс за њега и почела да додаје сопствена проширења, укључујући оптимизације за минимизирање употребе видео рам-а (ВРАМ) и уградњу повећања и маскирања.

Шта вам је потребно да покренете ову верзију стабилне дифузије?

Ова верзија Стабле Диффусион је форк — изданак — главног спремишта (репо) који је креирао и одржава Стабилити.аи. Има графички кориснички интерфејс (ГУИ) – што га чини лакшим за коришћење од обичне Стабле Диффусион, која има само интерфејс командне линије – и инсталатер који ће аутоматски обрађивати већину подешавања.

Ова виљушка такође садржи различите оптимизације које би требало да му омогуће да ради на рачунарима са мање РАМ-а, уграђеним повећањем величине и могућностима лица користећи ГФПГАН, ЕСРГАН, РеалЕСРГАН и ЦодеФормер и маскирање. Маскирање је велика ствар — омогућава вам да селективно примените генерисање АИ слике на одређене делове слике без изобличења других делова, процес који се обично назива сликањем.

  • Минимално 10 гигабајта бесплатно на чврстом диску
  • НВИДИА ГПУ са 6 ГБ РАМ-а (иако ћете можда моћи да учините да 4 ГБ функционише)
  • Рачунар који користи Виндовс 11, Виндовс 10, Виндовс 8.1 или Виндовс 8
  • ВебУИ ГитХуб Репо, аутора АУТОМАТИЦ1111
  • Питхон 3.10.6 (и новије верзије и већина старијих верзија би такође требало да буду у реду)
  • Званичне контролне тачке стабилне дифузије (Пазите на контролне тачке в1.5!)
  • ГФПГАН <ем><стронг>в1.4 Контролне тачке
  • Све додатне ЕСРГАН моделе које желите. Можете користити колико год желите или неколико.

Како инсталирати стабилну дифузију са ГУИ

Процес инсталације је значајно поједностављен, али још увек постоји неколико корака које морате да урадите ручно пре него што се инсталатер може користити.

Прво инсталирајте Питхон

Прво што треба да урадите је да инсталирате верзију Питхон-а, 3.10.6, коју је препоручио аутор репо-а. Идите на ту везу, скролујте до дна странице и кликните на „Виндовс Инсталлер (64-бит)“.

Кликните на извршну датотеку коју сте преузели и прођите кроз упите. Ако већ имате инсталиран Питхон (а сигурно јесте), само кликните на „Надогради“. У супротном, пратите препоручена упутства.

Инсталирајте Гит и преузмите ГитХуб Репо

Морате да преузмете и инсталирате Гит на Виндовс пре него што се покрене инсталатер Стабле Диффусион. Само преузмите 64-битни Гит извршни фајл, покрените га и користите препоручена подешавања осим ако имате нешто специфично на уму.

Затим морате да преузмете датотеке из ГитХуб репо-а. Кликните на зелено дугме „Код“, а затим кликните на „Преузми ЗИП“ на дну менија.

Отворите ЗИП датотеку у Филе Екплорер-у или жељеном програму за архивирање датотека, а затим извуците садржај где год желите. Само имајте на уму да је фасцикла где ћете морати да одете да бисте покренули Стабле Диффусион. Овај пример их је издвојио у директоријум Ц:\, али то није неопходно.

Преузмите све контролне тачке

Постоји неколико контролних тачака које су вам потребне да би ово функционисало. Прве и најважније су контролне тачке стабилне дифузије. Морате да креирате налог да бисте преузели контролне тачке, али за налог није потребно много – све што им је потребно су име и адреса е-поште, и можете кренути.

Копирајте и налепите „сд-в1-4.цкпт“ у фасциклу „Ц:\стабле-диффусион-вебуи-мастер\моделс\Стабле-диффусион“, затим кликните десним тастером миша на „сд-в1-4.цкпт“ и притисните преименуј . Откуцајте „модел.цкпт“ у текстуално поље и притисните Ентер. Будите сигурни да је то „модел.цкпт“ — иначе ово неће функционисати.

Такође морате да преузмете ГФПГАН контролне тачке. Аутор репо-а који користимо позвао је ГФПГАН в1.4 контролне тачке. Померите страницу надоле, а затим кликните на „В1.4 модел“.

Поставите ту датотеку, „ГФПГАНв1.4.птх“, у директоријум „стабле-диффусион-вебуи-мастер“, али <стронг>немојте гапреименовати. Фасцикла „стабле-диффусион-вебуи-мастер“ сада треба да садржи ове датотеке:

Такође можете преузети онолико ЕСРГАН контролних тачака колико желите. Обично долазе упаковане као ЗИП датотеке. Након што преузмете једну, отворите ЗИП датотеку, а затим издвојите „.птх“ датотеку у фасциклу „моделс/ЕСРГАН“. Ево примера:

ЕСРГАН модели имају тенденцију да пружају специфичнију функционалност, па изаберите пар који вам се свиђа.

Сада само морате двапут да кликнете на датотеку „вебуи-усер.бат“, која се налази у примарној фасцикли „стабле-диффусион-вебуи-мастер“. Појавиће се прозор конзоле и почети да преузима све друге важне датотеке, прави Питхон окружење и подешава веб кориснички интерфејс. То ће изгледати овако:

Када се заврши, конзола ће приказати:

Running on local URL: http://127.0.0.1:7860
To create a public link, set `share=True` in `launch()`

Како генерисати слике користећи стабилну дифузију са ГУИ

У реду, инсталирали сте ВебУИ варијанту Стабле Диффусион и ваша конзола вас обавештава да „покреће на локалном УРЛ-у: хттп://127.0.0.1:7860.

Отворите претраживач, унесите „127.0.0.1:7860“ или „лоцалхост:7860“ у адресну траку и притисните Ентер. Видећете ово на картици ткт2имг:

Ако сте раније користили Стабле Диффусион, ова подешавања ће вам бити позната, али ево кратког прегледа шта значе најважније опције:

  • <стронг>Упит: Опис онога што желите да направите.
  • <стронг>Дугме Паинтер’с Паллете: Примењује насумични уметнички стил на ваш упит.
  • <стронг>Кораци узорковања: Колико пута ће слика бити прецизирана пре него што добијете излаз. Више је генерално боље, али има све мање приноса.
  • <стронг>Метода узорковања: Основна математика која управља начином на који се поступа са узорковањем. Можете користити било које од ових, али изгледа да су еулер_а и ПЛМС најпопуларније опције. Више о ПЛМС-у можете прочитати у овом раду.
  • <стронг>Врати лица: Користи ГФПГАН да покуша да поправи необична или изобличена лица.
  • <стронг>Број серија: Број слика које треба генерисати.
  • <стронг>Величина серије: Број „серијала“. <ем>Оставите ово на 1 осим ако немате огромну количину ВРАМ-а.
  • <стронг>ЦФГ скала: Колико ће пажљиво стабилна дифузија пратити упит који му дате. Већи бројеви значе да га прати веома пажљиво, док мањи бројеви дају више креативне слободе.
  • <стронг>Ширина: Ширина слике коју желите да генеришете.
  • <стронг>Висина: Ширина слике коју желите да генеришете.
  • <стронг>Сеед: Број који даје почетни улаз за генератор случајних бројева. Оставите на -1 да насумично генеришете ново семе.

Хајде да генеришемо пет слика на основу упутства: „планинска крава у магичној шуми, 35 мм филмска фотографија, оштра“ и видимо шта добијамо помоћу ПЛМС узоркивача, 50 корака узорковања и ЦФГ скале од 5.

Излазни прозор ће изгледати овако:

Слика на врху у средини је она коју ћемо користити да испробамо за маскирање мало касније. Не постоји разлог за овај специфичан избор осим личних преференција. Узмите било коју слику која вам се свиђа.

Изаберите га, а затим кликните на „Пошаљи у Инпаинт“.

Како да маскирате слике које креирате за цртање

Сликање је фантастична карактеристика. Нормално стабилна дифузија се користи за креирање целих слика из упита, али сликање вам омогућава да селективно генеришете (или регенеришете) делове слике. Овде постоје две критичне опције: инпаинт маскирана, инпаинт није маскирана.

Инпаинт маскед ће користити промпт за генерисање слика унутар области коју истакнете, док ће инпаинт која није маскирана учинити управо супротно – само област коју маскирате биће сачувана.

Прво ћемо покрити нешто о Инпаинт маскираном. Превуците мишем по слици држећи леви клик и приметићете бели слој који се појављује изнад ваше слике. Нацртајте облик области коју желите да замените и обавезно је попуните у потпуности. Не кружите око региона, ви се маскирате у целом региону.

Узмимо пример наше планинске краве и дајмо му куварски шешир. Замаскирајте регион у облику отприлике куварског шешира и обавезно подесите „Величина серије“ на више од 1. Вероватно ће вам требати више да бисте добили идеалан(и) резултат.

Поред тога, требало би да изаберете „Латентни шум“ уместо „Попуни“, „Оригинал“ или „Латентно ништа“. Има тенденцију да даје најбоље резултате када желите да генеришете потпуно нови објекат у сцени.

У реду - можда куварски шешир није прави избор за вашу планинску краву. Ваша планинска крава више воли вибрације раног 20. века, па хајде да му дамо шешир.

Како је позитивно.

Наравно, можете учинити и потпуно супротно са Инпаинт Нот Маскед. Концептуално је сличан, осим што су региони које дефинишете обрнути. Уместо да означите регион који желите да промените, ви означавате регионе које желите да сачувате. Често је корисно када желите да преместите мали објекат на другу позадину.

Како да поправите грешку „ЦУДА Оут Оф Мемори“

Што је већа слика коју направите, потребно је више видео меморије. Прва ствар коју треба да покушате је генерисање мањих слика. Стабилна дифузија даје добре — иако веома различите — слике при 256×256.

Ако жудите да направите веће слике на рачунару који нема проблема са сликама од 512×512 или наилазите на разне грешке „Недостаје меморије“, постоје неке промене у конфигурацији које би требало да помогну.

Отворите „вебуи-усер.бат“ у Нотепад-у или било ком другом уређивачу обичног текста који желите. Само кликните десним тастером миша на „вебуи-усер.бат“, кликните на „Уреди“, а затим изаберите Нотепад. Идентификујте ред који гласи сет ЦОММАНДЛИНЕ_АРГС=. Ту ћете поставити команде да бисте оптимизовали рад Стабилне дифузије.

Ако само желите да правите огромне слике или вам понестаје РАМ меморије на ГПУ-у серије ГТКС 10КСКС, прво испробајте --опт-сплит-аттентион . Изгледаће овако:

Затим кликните на Филе > Саве. Алтернативно, можете притиснути Цтрл+С на тастатури.

Ако и даље добијате грешке у меморији, покушајте да додате --медврам на листу аргумената командне линије (ЦОММАНДЛИНЕ_АРГС).

Можете да додате --алваис-батцх-цонд-унцонд да бисте покушали да решите додатне проблеме са меморијом ако претходне команде нису помогле. Постоји и алтернатива за --медврам која би могла још више смањити употребу ВРАМ-а, --ловврам, али не можемо потврдити да ли ће то заиста функционисати или не .

Додавање корисничког интерфејса је критичан корак напред у томе да овакви алати вођени вештачком интелигенцијом буду доступни свима. Могућности су готово бескрајне, а чак и брзи поглед на онлајн заједнице посвећене АИ уметности ће вам показати колико је моћна технологија, чак и док је у повојима. Наравно, ако немате рачунар за игре или не желите да бринете о подешавању, увек можете да користите један од онлајн АИ генератора уметности. Само имајте на уму да не можете претпоставити да су ваши уноси приватни.