В порядке набрасывания говна на вентилятор: как и обещал (https://bestweapon.net/forum_topic.php?id=1720&page=last#comment66116), делюсь своим опытом работы с ИИ. Сразу подчеркну, что не в части написания текста - это мой личный способ самоудовлетворения, и я никому не позволю заниматься этим вместо себя - а в иной области: в части рисования иллюстраций. Для литературного сайта иллюстрации являются, безусловно, желательным, но тем не менее - вспомогательным элементом, поэтому с ними можно позволить себе халтурить. В конце концов, есть текстовые читалки, есть ещё и сефан, на который почти все наши произведения перекочёвывают в виде чистого текста, поэтому текст должен быть самодостаточным в любом случае и излагать авторскую мысль без помощи иллюстраций. Создавать иллюстрации - это, скорее, небольшое дополнительное хобби, как вспомогательный способ самоудовлетворения.
Пост получается обширным - по сути, это статья. Поэтому разобью всю портянку на части для удобства дискуссии. Итоговый материал для обсуждения здесь:
https://bestweapon.net/post_118847
Для начала сразу зафиксирую тезисы, уже выдвинутые мной в предыдущей дискусии:
1. Творчество (в любой области) состоит из двух этапов:
1.1. Сотворение чего-то в виде мысли. Это может быть текст, музыка, образ, видеоряд, многое другое или их сочетания. Раньше этого не существовало, теперь оно существует. Но существует пока только в голове автора.
1.1.1. В сторону от дискуссии: чтобы сотворить, нужен талант и творческая школа. Школа - дело наживное, этому учатся. Но столь же необходимое, как и талант. Талант - увы, либо есть, либо нет, его можно лишь усугубить регулярным употреблением или, наоборот, задавить отсутствием такового. Именно этим произведения хорошо обученных, но бесталанных авторов отличаются от произведений талантливых:
Не всякий алмаз - чистой воды.
Не всякое золото звонко.
И весь "Кавалер Золотой Звезды"
Не стоит хвоста "Золотого Телёнка".
1.2. Выражение этой мысли на материальном носителе или среде передачи. Воздух между сказителем и слушателями, буквы на бумаге, битики в компьютере, краска на холсте, фотоплёнка, бронза, гранит, мрамор и т.п. Без этого автор не может передать своё произведение слушателям и зрителям.
1.2.1. Материализация мысли - процесс сугубо технический, ему можно научить, в принципе, кого угодно, в т.ч. и машину. Но если нет мысли, то и в материальной форме будет только пустышка. Наглядный пример - глюки ИИ, примеры которых я приводил ранее.
2. Невозможно научить машину творить. Машина может только генерировать что-то по образу и подобию того, что создано человеком. Иногда даже удачно. Иногда даже очень похоже. Но это не творчество: здесь нет мысли и нет процесса, в результате которого _ничто_ превращается в _нечто_.
3. ИИ, как и слушатель/зритель/etc, не может прочитать мысль автора напрямую из головы, чтобы выразить её непосредстенно в граните, на холсте и т.п. Удел машины - пересказывать мысль, созданную человеком. Причём мысль, уже единожды материализованную в форме текста - поскольку иного интерфейса между человеком и машиной нет, и едва ли будет. (Да, можно загрузить в неё референсную картинку или видео, но без текстового промпта к ним машина всё равно бесполезна.) Т.е. автор может, при достаточных навыках (это чисто технический процесс, п.1.2) описать свою мысль текстом, а машина по нему сгенерирует картинку, видео, чертежи великолепного здания вместе с его инженерным расчётом и т.п.
3.1. Результат может быть хорош или плох, но в любом случае не может быть лучше промпта, который машине написал автор. И в любом случае результат будет неидеален, потому что невозможно написать абсолютно исчёрпываюший промпт. Дальше уже приходится ориентироваться на экономическую целесообразность: готовы ли вы тратить бесконечное количество усилий, времени, денег и т.д., чтобы асимптотически приблизиться к идеалу? Конечно, нет, потому что всё это у вас в запасе - конечно. Поэтому рано или поздно надо сказать: хватит, за потраченные усилия - и так сойдёт. (Обложка для Стульчика, например.) Будет ли это на 70% идеала, или на 90, или на 99 - вопрос лишь торга.
3.2. ИИ может быть полезен (важно здесь не последнее слово, а два предыдущих) для преобразования текста в иные форматы материальных носителей. Но он бесполезен для тривиального преобразования текста в текст. Потому что для того, чтобы ИИ сгенерировал нужный текст, выражающий мысль автора - ему нужно сначала написать промпт не менее исчёрпывающий, чем желаемый текст. И потом он мысль из этого промпта донесёт, если сумеет, до текста на выходе. Т.е. автору надо сначала полностью выразить свою мысль в виде, как ни крути, текста. Машина перепишет его, м.б. даже более объёмно и детально, но мыслей в нём от этого не прибавится. В идеальном случае она лишь передаст мысль автора полностью, это максимум; в реальном - неизбежно что-то потеряет по дороге, больше или меньше.
Теперь о моём личном опыте. Как читатель может понять из моих рассказов, я немного занимаюсь фотографией, в т.ч. и вышеописанным творческим способом (есть и другие, например, репортажный - снимать то, что происходит не по воле фотографа, и так, как получится). Поэтому мне было не очень сложно облечь своё видение иллюстраций (п.1 выше) в форму текста (п.2) и скормить его ИИ (п.3). Получилось нечто вроде виртуальной фотосессии с вирутальной же моделью.
А дальше начинается, увы, интересное. Помимо собственно поста, специально выкладываю много сырого материала, не вошедшего в пост, чтобы желающие рассмотрели его подробно.
фотосессия "времена года" - https://postimg.cc/gallery/DZ6pqMk
фотосессия на озере - https://postimg.cc/gallery/9y7X0SG
фотосессия в чёрном - https://postimg.cc/gallery/KkqvPrM
фотосессия в зелёном - https://postimg.cc/gallery/YQW20Zw
фотосессия в жёлтом - https://postimg.cc/gallery/MZDvhkF
фотосессия в красном - https://postimg.cc/gallery/3T17sRq
Вероятно, некоторые из перечисленных ниже проблем специфичны для конкретных ИИ-моделей, с которыми я упражнялся. Но сути дела это не меняет: не одни, так другие ошибки подобного рода есть и будут у любых моделей, поскольку природа этих ошибок одна и та же.
1. Налицо все ошибки неопытных моделей (в данном пункте речь о моделях кожаных). Неестественные позы, почему-то считающиеся очень сексуальными в мордокнигах и прочих ин100граммах. Скованные, напряжённые фигуры, натянутые резиновые улыбки. Чего и следовало ожидать - ИИ был обучен на примитивных любительских фото и повторяет все их ошибки. (А обучение на хороших профессиональных фото - может влететь очень недёшево, когда будет создан прецедент судебного решения по авторским правам.) Но, по крайней мере, живую модель, даже неопытную, можно рассмешить, разговорить, чтобы привести её в естественное и расслабленное состояние (см. "Чёрная и серая"); можно указать ей на ошибки, с N-ого объяснения она их поймёт. А что делать с ИИ?
2. Налицо все проблемы неопытных или невезучих фотографов, например, с постановкой света. Сколько я ни пытался, но так и не смог, например, для летней фотосессии заказать высокое полуденное солнце. ИИ упорно рисует мне низкое предзакатное солнце и длинные глубокие тени - в т.ч. и на лицах, где их не должно быть категорически. Почему? Очевидно, потому, что он только на таких фотографиях и обучен.
3. ИИ следует многим другим неудачным примерам, на которых он обучен. Например, очень сложно заставить его нарисовать натуральную блондинку (а у меня большинство героинь именно такие). Он упорно рисует мне небрежно крашеных сучек с черными бровями, ресницами и уже отросшими тёмными корнями волос. Почему? Очевидно, в той среде, где снимались фото, на которых его потом обучали, "блондинкой" называется именно такое существо. И да, уточнение "натуральная" в этом контексте не значит ничего.
4. ИИ следует многим заложенным в него догмам, и его практически невозможно столкнуть с этих догм. Например, "женщины, в среднем, меньше ростом, чем мужчины". И классические средние пропорции тела, взятые из вековой художественной школы (у мужчин тело к ногам относится 1:1, у женщин 10:9.) А у меня, например, в "Альтернативной жене" существенно, что героиня выше мужчины, и ещё имеет нестандартные длинные ноги. И даже если я заранее придаю им нужный размер и потом скармливаю их ИИ с промптом "а вот теперь перерисуй эти персонажи более складно - позы, фон, свет, тени и т.п. [это он понимает неплохо], но не смей трогать размеры" - он всё равно меняет их до положенных пропорций.
4.1. А вот противоположная проблема: ноги. Частная, но показательная. ИИ (по крайней мере, те модели, с которыми я имел дело) не знает, что мужская и женская ступня отличаются по размеру, не говоря уж о форме. И упорно рисует мне девушек с лаптями размера 43-44. Обходить это я, в принципе, научился, но сильно задумаешься: сильно ли полезен такой инструмент, что на борьбу с ним приходится тратить усилия, соизмеримые с производительной работой?
4.2. Другая догма - "правило третей". Мне нужно разместить в кадре 2 героев, и ИИ упорно сажает их в левую нижнюю и в правую верхнюю точки на 1/3 кадра. Так положено, автор - не выйогивайся тут! А у меня по тексту важно, что высота между ними больше человеческого роста. Для обложки "Озера Девичьего" пришлось растаскивать их уже вручную, с соответствующей вознёй с фоном и т.п.
4.3. А попробуйте-ка получить от порно-ИИ картинку с необрезанным и/или не стоЯщим половым членом. Первое - ладно, опять же распространённая норма в той среде, на которой его обучали. А второе почему не?
4.4. Про опыт рисования русалок я уже писал в "Озере Девичьем", весьма наглядный пример. ИИ охотно и легко рисует русалок, но в его представлении "русалка" - это женщина, надевшая на ноги костюм в виде русалочьего хвоста. Т.е. он не просто не знает того, что хочет от него автор, но уже отравлен примерами не того, что нужно. И теперь требуются двойные усилия, чтобы заставить его сделать что-то вопреки его негативному обучению. И трудоёмкая доводка результата вручную.
5. Результаты неповторяемы и непредсказуемы. На одних промптах он может давать довольно неплохой процент удачных попаданий (см. фотосессии на озере и в чёрном), на других, с минимальными отличиями - совершенный мизер чего-то хоть как-то приемлемого (фотосессии в голубом, в зелёном). Персонаж описан идентично, отличия только в цвете одежды и в фоне.
5.1. Иногда бывают совершенно феноменальные результаты. Например, лучший из вариантов обложки для сказки "Водяная" ИИ сгенерировал с первой же попытки, дальше понадобилось всего лишь допилить руками кое-что по мелочи. Но повторить этот результат не удалось до сих пор ни на той же, ни на других моделях. Как можно всерьёз использовать такой инструмент, от которого неизвестно, что ждать и когда?
6. Все ИИ-модели узкоспециализированы - это и понятно, невозможно объять необъятное. Приличные и умные - шарахаются от любого, даже косвенного, намёка на нашу специфику. Заточенные на порнографию - не умеют рисовать простых житейских вещей, зато норовят нарисовать член в каждом месте, куда могут дотянуться, как третьеклассник, дорвавшийся до забора и куска мела. Комбинировать можно, конечно, но это тройные усилия и потеря качества...
7. ИИ относительно хорошо рисует то, что знает. Признаюсь, после первых нескольких попыток я уже собрался было плюнуть на это дело, как бесперспективное при тех затратах времени и проч., которые я был готов на него выделить. Но тут он, как опытный шулер, дал мне выиграть почти идеальную картинку по моему представлению, притом всего лишь со 2й или 3й попытки. Как ему так удалось? Засовываю эту картинку обратно в гугл, и он сразу выдаёт большой каталог фирмы, которая выпускает купальники и всякую прочую аэроэбическую одежду именно в такой расцветке. Значит, нашёл или ему это кто-то скормил.
8. ИИ не может нарисовать то, чего не знает. Например, православное кладбище с 6-конечными крестами и надгробными надписями кириллицей. Один раз из нескольких десятков попыток додумался до золочёных куполов на заднем плане, в остальном - сплошь католические 4-конечные и латиница. А попробуйте получить от него картинку русской бревенчатой избы, деревенского сортира или летнего душа на огороде...
Итого мои выводы, можете с ними соглашаться, можете не соглашаться:
— ИИ не может создать того, что не было бы создано ранее кем-то из людей. Точнее, не может создать что-то качественно новое. Может доделать количественно то, на что кожаным не хватило времени, внимания, усидчивости и т.п.: методично просчитать все ходы в шахматах, перепроверить большой программный код на предмет известных типов ошибок.
— Из всего созданного человеком, ИИ может повторить только то, что было в него загружено. Т.е. надо либо искать и подбирать модели, обученные на массиве данных, нужном конкретному автору для конкретной задачи, либо обучать свою собственную. Это уже труд, и труд немалый - сравнимый с созданием произведения другими способами. В том, чтобы без усилий получить желаемый результат - ИИ не помощник.
— ИИ хорошо делает технические, полностью алгоримизируемые задачи. Например, выставить чёрную/белую/серую точки изображения, чтобы получить наилучшее распределение яркостей. Но это ни в коем случае не творчество, это тупая техническая работа.
— ИИ может быть инструментом для творчества, но не может заменить само творчество. И как инструмент, он не идеален, он всегда будет выдавать неполный результат. По пути от мысли, сотворённой автором, до её физического воплощения будет неизбежно что-то теряться. Впрочем, это и у большинства других инструментов так.
— Чтобы пользоваться ИИ, нужно изначально точно понимать, что автор хочет от него получить, что не должен получить, и в каких пределах готов предоставить ему свободу и принять его случайный выбор. Для получения качественного результата - это труд, соизмеримый с созданием этого результата напрямую. Это приемлемо, если автор не имеет возможности самостоятельно материализовать свою мысль в конечном формате.
— ИИ не имеет иного интерфейса, кроме текстового (ещё раз вспомним Энгельса) и может только преобразовывать текстовое представление мысли в другие форматы её представления. С потерями, естественно - но в отсутствие другого инструмента с этим приходится смириться. Тривиальное преобразование из текста в текст возможно, но бессмысленно, поскольку не может дать ничего, кроме потери части выраженной мысли.
Теперь о моём личном опыте. Как читатель может понять из моих рассказов, я немного занимаюсь фотографией, в т.ч. и вышеописанным творческим способом (есть и другие, например, репортажный - снимать то, что происходит не по воле фотографа, и так, как получится). Поэтому мне было не очень сложно облечь своё видение иллюстраций (п.1 выше) в форму текста (п.2) и скормить его ИИ (п.3). Получилось нечто вроде виртуальной фотосессии с вирутальной же моделью.
А дальше начинается, увы, интересное. Помимо собственно поста, специально выкладываю много сырого материала, не вошедшего в пост, чтобы желающие рассмотрели его подробно.
фотосессия "времена года" - https://postimg.cc/gallery/DZ6pqMk
фотосессия на озере - https://postimg.cc/gallery/9y7X0SG
фотосессия в чёрном - https://postimg.cc/gallery/KkqvPrM
фотосессия в зелёном - https://postimg.cc/gallery/YQW20Zw
фотосессия в жёлтом - https://postimg.cc/gallery/MZDvhkF
фотосессия в красном - https://postimg.cc/gallery/3T17sRq
Вероятно, некоторые из перечисленных ниже проблем специфичны для конкретных ИИ-моделей, с которыми я упражнялся. Но сути дела это не меняет: не одни, так другие ошибки подобного рода есть и будут у любых моделей, поскольку природа этих ошибок одна и та же.
1. Налицо все ошибки неопытных моделей (в данном пункте речь о моделях кожаных). Неестественные позы, почему-то считающиеся очень сексуальными в мордокнигах и прочих ин100граммах. Скованные, напряжённые фигуры, натянутые резиновые улыбки. Чего и следовало ожидать - ИИ был обучен на примитивных любительских фото и повторяет все их ошибки. (А обучение на хороших профессиональных фото - может влететь очень недёшево, когда будет создан прецедент судебного решения по авторским правам.) Но, по крайней мере, живую модель, даже неопытную, можно рассмешить, разговорить, чтобы привести её в естественное и расслабленное состояние (см. "Чёрная и серая"); можно указать ей на ошибки, с N-ого объяснения она их поймёт. А что делать с ИИ?
2. Налицо все проблемы неопытных или невезучих фотографов, например, с постановкой света. Сколько я ни пытался, но так и не смог, например, для летней фотосессии заказать высокое полуденное солнце. ИИ упорно рисует мне низкое предзакатное солнце и длинные глубокие тени - в т.ч. и на лицах, где их не должно быть категорически. Почему? Очевидно, потому, что он только на таких фотографиях и обучен.
3. ИИ следует многим другим неудачным примерам, на которых он обучен. Например, очень сложно заставить его нарисовать натуральную блондинку (а у меня большинство героинь именно такие). Он упорно рисует мне небрежно крашеных сучек с черными бровями, ресницами и уже отросшими тёмными корнями волос. Почему? Очевидно, в той среде, где снимались фото, на которых его потом обучали, "блондинкой" называется именно такое существо. И да, уточнение "натуральная" в этом контексте не значит ничего.
4. ИИ следует многим заложенным в него догмам, и его практически невозможно столкнуть с этих догм. Например, "женщины, в среднем, меньше ростом, чем мужчины". И классические средние пропорции тела, взятые из вековой художественной школы (у мужчин тело к ногам относится 1:1, у женщин 10:9.) А у меня, например, в "Альтернативной жене" существенно, что героиня выше мужчины, и ещё имеет нестандартные длинные ноги. И даже если я заранее придаю им нужный размер и потом скармливаю их ИИ с промптом "а вот теперь перерисуй эти персонажи более складно - позы, фон, свет, тени и т.п. [это он понимает неплохо], но не смей трогать размеры" - он всё равно меняет их до положенных пропорций.
4.1. А вот противоположная проблема: ноги. Частная, но показательная. ИИ (по крайней мере, те модели, с которыми я имел дело) не знает, что мужская и женская ступня отличаются по размеру, не говоря уж о форме. И упорно рисует мне девушек с лаптями размера 43-44. Обходить это я, в принципе, научился, но сильно задумаешься: сильно ли полезен такой инструмент, что на борьбу с ним приходится тратить усилия, соизмеримые с производительной работой?
4.2. Другая догма - "правило третей". Мне нужно разместить в кадре 2 героев, и ИИ упорно сажает их в левую нижнюю и в правую верхнюю точки на 1/3 кадра. Так положено, автор - не выйогивайся тут! А у меня по тексту важно, что высота между ними больше человеческого роста. Для обложки "Озера Девичьего" пришлось растаскивать их уже вручную, с соответствующей вознёй с фоном и т.п.
4.3. А попробуйте-ка получить от порно-ИИ картинку с необрезанным и/или не стоЯщим половым членом. Первое - ладно, опять же распространённая норма в той среде, на которой его обучали. А второе почему не?
4.4. Про опыт рисования русалок я уже писал в "Озере Девичьем", весьма наглядный пример. ИИ охотно и легко рисует русалок, но в его представлении "русалка" - это женщина, надевшая на ноги костюм в виде русалочьего хвоста. Т.е. он не просто не знает того, что хочет от него автор, но уже отравлен примерами не того, что нужно. И теперь требуются двойные усилия, чтобы заставить его сделать что-то вопреки его негативному обучению. И трудоёмкая доводка результата вручную.
5. Результаты неповторяемы и непредсказуемы. На одних промптах он может давать довольно неплохой процент удачных попаданий (см. фотосессии на озере и в чёрном), на других, с минимальными отличиями - совершенный мизер чего-то хоть как-то приемлемого (фотосессии в голубом, в зелёном). Персонаж описан идентично, отличия только в цвете одежды и в фоне.
5.1. Иногда бывают совершенно феноменальные результаты. Например, лучший из вариантов обложки для сказки "Водяная" ИИ сгенерировал с первой же попытки, дальше понадобилось всего лишь допилить руками кое-что по мелочи. Но повторить этот результат не удалось до сих пор ни на той же, ни на других моделях. Как можно всерьёз использовать такой инструмент, от которого неизвестно, что ждать и когда?
6. Все ИИ-модели узкоспециализированы - это и понятно, невозможно объять необъятное. Приличные и умные - шарахаются от любого, даже косвенного, намёка на нашу специфику. Заточенные на порнографию - не умеют рисовать простых житейских вещей, зато норовят нарисовать член в каждом месте, куда могут дотянуться, как третьеклассник, дорвавшийся до забора и куска мела. Комбинировать можно, конечно, но это тройные усилия и потеря качества...
7. ИИ относительно хорошо рисует то, что знает. Признаюсь, после первых нескольких попыток я уже собрался было плюнуть на это дело, как бесперспективное при тех затратах времени и проч., которые я был готов на него выделить. Но тут он, как опытный шулер, дал мне выиграть почти идеальную картинку по моему представлению, притом всего лишь со 2й или 3й попытки. Как ему так удалось? Засовываю эту картинку обратно в гугл, и он сразу выдаёт большой каталог фирмы, которая выпускает купальники и всякую прочую аэроэбическую одежду именно в такой расцветке. Значит, нашёл или ему это кто-то скормил.
8. ИИ не может нарисовать то, чего не знает. Например, православное кладбище с 6-конечными крестами и надгробными надписями кириллицей. Один раз из нескольких десятков попыток додумался до золочёных куполов на заднем плане, в остальном - сплошь католические 4-конечные и латиница. А попробуйте получить от него картинку русской бревенчатой избы, деревенского сортира или летнего душа на огороде...
Прошу прощения, кто это там на стульчике меня в свой рассказ явно сунул?))) Я такого ещё не писала...
0
Оставлять комментарии могут только зарегистрированные пользователи