![]() |
![]() |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() ТворческийИИСпособны ли системы искусственного интеллекта выполнять творческие задачи? Исследование с глубоким погружением в историю.СодержаниеВведениеМы живем во времена, когда авторы научной фантастики изо всех сил стараются идти в ногу со временем. В последние годы наблюдается бурный рост исследований и экспериментов в сфере творчества и искусственного интеллекта. Почти каждую неделю появляется новый бот, который рисует, пишет истории, сочиняет музыку, проектирует объекты или строит дома. Системы искусственного интеллекта выполняют творческие задачи? В начале своего изучения мы решили побольше узнать об этом феномене и слегка с ним поэкспериментировать. В итоге получилось глубокое расследование, которое мы назвали «ТворческийИИ». Это вводная статья: мы рассмотрим историю ТворческогоИИ и определим терминологию, которая пригодится нам для дальнейшего изучения. Изначально мы предположили, что творчество (то есть создание нового) — это основной двигатель истории человечества и что в настоящее время оно развивается достаточно интересными путями. В этой статье мы структурируем наши знания о творчестве и технологиях. Мы также сделаем упор на развивающиеся в последнее время «паттерны создания нового» (в области разработки ПО используется термин «порождающие паттерны»): ассистированное творчество и генеративное творчество, а также докажем, что они ведут к демократизации и эскалации творчества. Цель этого проекта — определить набор основополагающих принципов, метафор и идей, на которых основывается развитие ТворческогоИИ, новых теорий, экспериментов и практических применений. Для начала рассмотрим историю и технологии, изложим все это в форме рассказа и сформируем видение того будущего, в котором ТворческийИИ помогает нам максимизировать человеческий потенциал.
Необходим сайт, мобильное приложение, услуги по SEO или контекстной рекламе?
Тендерная площадка WORKSPACE поможет выбрать оптимального исполнителя. База проекта насчитывает более 10 500 агентств. Сервис БЕСПЛАТЕН для заказчиков.
1
ТворчествоТворчество — центральный элемент человеческого существования и в повседневной жизни оно принимает множество разных форм. Тем не менее, дать определение творчеству достаточно сложно. В этом разделе мы выборочно коснемся тех исторических, теоретических и технологических метафор творчества, которые имеют значение для ТворческогоИИ. Представления древних людей (в том числе мыслителей Древней Греции, Китая и Индии [1]) о творчестве сильно отличались от современных. Они рассматривали творчество как форму открытия. Отказ от творчества в пользу открытий наблюдался в западной культуре вплоть до времен эпохи Возрождения. К 18 веку творчество упоминается все чаще, в тесной связи с таким понятием как "воображение«[2]. В конце 19 века теоретики — такие как Уоллес, Вертеймер, Гельмгольц и Пуанкаре — начали описывать и публиковать свои творческие процессы: именно они положили начало научному исследованию творчества. Научное исследование творчества в 20 веке породило множество теорий, моделей и систем: философских, социологических, исторических, технических и практических. И хотя дать объективное описание творчеству по-прежнему сложно, методичное изучение творчества и запускающих его факторов стимулирует новые творческие процессы в рекламе, архитектуре, дизайне, моде, кино и музыке. У науки, технологий и творчества — длинная, тесно переплетенная история. При исследовании творчества важно решить, какие метафоры изучать, а какие — нет. Мы изучим три метафоры: усиленное творчество, компьютерное творчество и творческие системы. Усиленное творчество
В своей статье «Как мы можем мыслить» Вэнивар Буш (Vannevar Bush, "As We May Think«,1949) описывает воображаемый «memex» — устройство наподобие стола, при помощи которого люди могут производить поиск по библиотеке статей посредством нажатия кнопок и переключения рычажков [4]. Хотя мемекс Буша полностью механический, он подразумевает использование гиперссылок, заметок и закладок для расширения возможностей человеческого мозга при исследовании и обработке информации: то есть по сути это интернет. Эта статья вдохновила молодого Дугласа Энгельбарта: он ушел с работы и поступил в аспирантуру в Калифорнийский университет Беркли [5]. Там В 1962 году он написал доклад на тему «Усиление человеческого интеллекта: концептуальный фрэймворк» (Augmenting Human Intellect: A Conceptual Framework). В этом докладе Энгельбарт — вдохновленный концепцией мемекса Буша — описал «пишущую машинку [которая] обеспечит нам новый процесс составления текстов (..) Мы сможем быстрее прорабатывать новые идеи, а значит чаще и интенсивнее задействовать творчество (..) Это, возможно, позволит нам разрабатывать и применять еще более сложные процессы, чтобы получить еще большую отдачу от своих способностей..» [6].
У Энгельбарта было не только видение взаимодействия человека с компьютерной системой, но и философия такого взаимодействия [7]. Он верил, что компьютеры можно использовать для расширения наших процессов мышления, представления и установления ассоциаций [8]. Энгельбарт хотел не просто автоматизировать процессы, а еще многократно увеличить возможности человека при помощи системы, которая усилит и дополнит наш интеллект, нашу натуру и наше творчество. Его целью было повышение человеческого потенциала [9].
Айвен Сазерленд — студент Клода Шеннона, который в свою очередь был студентом Вэнивара Буша. Уже в 1963 году Айвен, вдохновившись мемексом, разработал свою систему. Его диссертационный проект Sketchpad [10] считается прародителем современной системы автоматизированного проектирования (CAD — computer-aided design) программ [11]. Sketchpad продемонстрировал потенциал интерактивной компьютерной графики в области техники и творчества.
Простейший способ упростить процесс покупки или регистрации через мобильное устройство — «Мать всех демонстраций» (1968), Дуглас Энгельбарт и его команда из «Центра исследований роста» (Augmentation Research Center) в Менло парке. Уже через несколько лет в Стэнфордском «Центре исследований роста» (ARC — Augmentation Research Center), были изобретены несколько технологий, которые сохранились и до наших дней. В их числе — видео-конференция и компьютерная мышь [12]. В это же время Джон Маккарти основал Стэнфордскую лабораторию искусственного интеллекта (SAIL — Stanford Artificial Intelligence Laboratory). Группа Маккарти стремилась не усилить, а полностью заменить человеческий интеллект электронным [13]. На базе центра Энгельбарта и лаборатории Маккарти искусственный интеллект изучали доктора наук, хакеры и студенты колледжей — включая Стива Возняка и Стива Джобса [14].
В 1970 году [15] Xerox (компания по производству бумаги) решила финансировать научно-исследовательский центр в Пало-Альто (PARC — Palo Alto Research Center). Этот проект быстро привлек внимание ветеранов ARC и SAIL, горевших желанием работать с персональными компьютерами, пользовательскими интерфейсами и графикой. На базе Пало- Альто было сделано множество инноваций (таких как ethernet), а также появилась новая метафора творческого взаимодействия с компьютерной системой — рабочий стол. Вскоре после открытия центра Xerox, образовалось менее формальное, но не менее важное компьютерное сообщество: «домашний компьютерный клуб» (The Homebrew Computing Cub). В «Домашнем клубе» состояла разношерстная публика: антивоенные активисты, инженеры и программисты. На базе «клуба» зародились многие компании: такие как Apple и Microsoft, а также технологии — например, персональный компьютер (PC) [16].
Компьютерное творчествоУже в 1950 году Клод Шеннон, систематизировав принципы английской грамматики, составил несколько предложений компьютерными методами [17]. Эти ранние исследования «компьютерного творчества» запустили междисциплинарный диалог на тему использования компьютерных подходов в решении творческих проблем.
С начала Одним из самых активных исследователей в этой области был Майкл Нолл. В 1970 он высказал потребность в «новой породе творческих компьютерщиков» [19]. На призыв Нолла вскоре откликнулось множество художников и музыкантов — например, Байан Эно. Уже в 1975 году Эно использовал алгоритмические и генеративные принципы при написании музыки. Позже он описал свое творчество так: «я взял технологию, предназначенную для создания копий, и стал делать оригинальные произведения» [20].
Следующей вехой на пути развития компьютерного творчества можно считать 1979 год, когда Бенуа Мандельброт [21] вывел множество Мандельброта. Ученый первым использовал компьютерную графику для изображения геометрических фракталов. Этим он показал, как при помощи простых правил может создаваться визуальная сложность. Фракталы значительно повлияли на наше представление о творчестве и возможностях машин. Они заставили многих людей задуматься: «могут ли компьютеры/алгоритмы выполнять творческие задачи?», и вдохновили ученых, творческих деятелей и инженеров начать эксперименты в области творчества.
С появлением видео игр началось промышленное применение компьютерного творчества. В 1978 году в играх начали применяться дорогие процедурные системы — для проработки карт игры и поведения персонажей [22]. Эти системы позволили быстро реализовывать сложные игровые сюжеты и получили дальнейшее распространение с появлением таких игр, как Simcity Уилла Райта [23].
В Трудно дать компьютерному творчеству одно единственное определение, но наиболее распространено такое: компьютерное творчество — это «осуществление операций, которые, если бы они осуществлялись человеком — считались бы творческими» [25].
В наши дни интерес к творчеству в контексте ИИ растет: этой теме посвящаются ежегодные конференции, школьные и магистерские программы [26]. Появилась целая волна идей и технологий, в основе которых лежит компьютерное творчество (как минимум на уровне задумки): персонажи с искусственным интеллектом, «искусственные» музыканты, боты-журналисты, генеративная архитектура и искусственные нейронные сети, способные фантазировать. И хотя подобные системы не идут ни в какое сравнение с возможностями человека, все же они активно применяются в культуре, промышленности и обучении — и результаты их деятельности общество принимает с огромным любопытством. Во многих областях такие системы из экспериментальных превращаются в производственные, формируя новые творческие процессы и результаты.
После Второй мировой войны Соединенные Штаты пребывали в состоянии эйфории. Союзники одержали победу, как казалось, за счет науки, технологий и системного мышления. В этом контексте фонд Джошуа Мейси-младшего организовал серию конференций (1946 — 1953) на тему «принципов работы человеческого мозга» [27] — позже появилось название «Кибернетика». Целью этих конференций было стимулировать общение между представителями различных дисциплин и восстановить единство науки [28]. Активное участие в этом движении приняли такие люди, как Дж. С. Р. Ликлайдер, Маргатер Мид, Хайнц Фон Фёрстер, Джон Фон Ньюман, Клод Шеннон и Норберт Винер.
В 1948 году Винер, вдохновленный конференцией, опубликовал свою диссертационную работу: «Кибернетика: контроль и коммуникации у животных и машин» [29], а Шеннон опубликовал «Математическую теорию связи» [30]. Эти работы легли в основу современной науки и дали теоретическое определение таким понятиям как «информация», «связь», «обратная связь» и «контроль».
Винер определял кибернетику как науку адаптивного управления, основанного на обратной связи [31]. Само название науки происходит от греческого слова штурман, рулевой. Кибернетики придерживаются мнения, что управление в сложных системах должно быть диалоговым. То есть подразумевает не только действия, но и способность слушать и адаптироваться. При управлении кораблем нужно использовать румпель и паруса — чтобы адаптироваться к смене ветра и течения. Кибернетическая модель управления циклична: решения зависят не только от того, насколько хорошо люди выполняют задуманное, но и от реакции окружающей среды. Впервые связь между кибернетикой и творчеством была продемонстрирована в 1968 году на выставке «Кибернетическая прозорливость» (Cybernetic Serendipity) в Институте современного искусства в Лондоне [32]. Деятели искусства (такие как Гордон Паск и Нам Джун Пайк) использовали компьютерные системы для создания музыки, стихов, фильмов, картин и компьютерной графики. Свой вклад в новый дух творчества внес Бакминстер Фуллер, который ввел понятие «всестороннего дизайнера» — «синтеза художника, изобретателя, механика, экономиста и стратега» [34].
В дальнейшем идеи кибернетики оказали глубокое влияние на такие сферы как бизнес, политика, искусство, дизайн и архитектура [35]. Как заметил Пак: «архитекторы — это самые первые и основные системные дизайнеры», но им не хватает «теоретической фундаментальности и единства... Кибернетика — наука, способная заполнить этот пробел» [36]. Кибернетика систематизировала и интегрировала контекст и отношения, тем самым выводя творчество и дизайн за пределы прежнего объектно-ориентированного подхода. И хотя кибернетика вышла из моды в Творческие системы, обязанные своим существованием кибернетике, находят «удивительное» применение во множестве областей: программное обеспечение (система гибкой разработки agile, ПО с открытым кодом), менеджмент (Google 20% времени), различные сферы труда (Uber/Lyft) и распределение ресурсов (алгоритмическая торговля/amazon). Примеры / СМИПеред вами подборка проектов из области изучения усиленного творчества, компьютерного творчества и творческих систем. Наша цель — обеспечить визуальный контекст и показать развитие этих областей во времени.
ПерерывВ предыдущем разделе мы рассмотрели долгую, запутанную историю науки, технологий и творчества. В ходе этого мы изучили три метафоры творчества: усиленное творчество, компьютерное творчество и творческие системы. В следующих разделах мы узнаем, какое развитие получили эти метафоры в дальнейшем и как они переросли в две современные категории: ассистированное творчество и генеративное творчество. 2
Ассистированное творчествоСо времен каменного века люди использовали различные инструменты для расширения своих возможностей и адаптации к изменяющимся потребностям. В былые времена лишь немногим удавалось в совершенстве овладеть каким-то творческим навыком, но с появлением вспомогательных (ассистирующих) систем творчество стало более куда доступным. В этом разделе мы рассмотрим три поколения вспомогательных систем для творчества и проанализируем, как они способствовали демократизации и эскалации творчества. Под влиянием идей Энгельбарта, многие ученые начали исследовать, как компьютерные системы могут «ассистировать» человеку при выполнении творческих задач. Исследователь Бен Шнайдерман описал такие системы как «технологии, которые помогают большему числу людей выполнять больше творческих задач на протяжении более длительного времени» [1]. В контексте этих исследований такие компании как Apple и Lotus разработали первые цифровые продукты для решения творческих задач. Кроме того, появились новые компании: например, Autodesk (1979) [2] и Adobe (1982) [3], которые полностью специализировались на разработке инструментов и систем для творчества. В Для осуществления творчества требовалось полное внимание человека: обратная связь была медленной, а возможности «ассистента» — крайне ограниченными. И все же такие инструменты повышали творческие возможности экспертов и новичков, что повлекло за собой волну новых творческих процессов и результатов.
Автофокус фотоаппарата, изобретенный компанией Leica в 1976 году [5], можно считать ранним примером систем ассистированного творчества второго поколения. В этих системах управление творческим процессом происходит посредством постоянной обратной связи. Машина может существенно повлиять на результат, поэтому управление процессом осуществляется совместно. Решения принимаются человеком и системой сообща. Такие системы второго поколения повсеместно распространены в современном мире. Они широко применяются во всех странах и отраслях. Автокоррекция, которую в 1991 году изобрел Дин Хакамович из Microsoft, повлияла на письменную речь миллионов людей, а автоматическая подстройка звука (Autotune) изменила процессы создания музыки.
Сложно оценить эффект, который оказали эти системы на разные сферы творчества, ясно лишь одно: системы ассистированного творчества снижают входной барьер владения творческим инструментом. Это позволяет участникам творческого процесса (как профессионалам, так и любителям) сконцентрироваться на вопросах более высокого уровня, выполнять сложные творческие задачи и быстрее осуществлять разного рода эксперименты. И хотя использование таких систем связано с определенными рисками и сложностями, в большинстве случаев они действительно повышают наши творческие способности. Ассистированное творчество 3.0Системы второго поколения зачастую накладывают ограничения на творческий процесс: управление грубое, а взаимодействия недостаточно проработаны. Из-за этих ограничений, у популярных инструментов (например, у функции автозаполнения) противоречивая репутация. Сейчас из различных исследовательских областей приходят новые технологии. Есть надежда, что они помогут обойти предыдущие ограничения. Мы называем эти технологии системами ассистированного творчества третьего поколения (AC 3.0 — assisted creation 3.0). Речь идет о проектировании систем, которые регулируют творческий процесс посредством проработанных разговорных взаимодействий, расширяют творческие способности и ускоряют освоение навыков (то есть переход от новичка к эксперту). Принципы ассистированного творчества третьего поколения находят практические применение при решении все более широкого спектра творческих задач. Приведем несколько примеров: «Ассистированное рисование» (assisted drawing) помогает иллюстраторам рисовать, корректируя штрихи. «Ассистированное письмо» (assisted writing) помогает авторам писать, улучшая стиль текста. «Ассистированное видео» (assisted video) помогает режиссерам редактировать ролики, облегчая процесс вырезания лишнего. «Ассистированная музыка» (assisted music) помогает композиторам создавать музыку, предлагая новые идеи.
Сложно показать всю глубину проводимых исследований на нескольких примерах: идей и сфер изучения очень много. Чтобы отследить развитие ассистированного творчества, мы проанализировали свежие научные публикации множества организаций при помощи машинного обучения, теории графов и визуализации. Судя по количественным показателям (числу публикаций и экспериментов), исследование и применение ассистированного творчества лидирует среди прочих творческих дисциплин. Что интересно, большой вклад в изучение проектирования систем ассистивного творчества вносят исследования на тему машинного обучения (ML — machine learning) и человеко-компьютерного взаимодействия (HCI — human-computer interaction). В совокупности эти две дисциплины обеспечивают некий концептуальный фреймворк искусственного интеллекта в контексте взаимодействия с человеком. Уже в 2011 году Ребекка Энн Фибринк, исследователь машинного обучения и человеко-компьютерного взаимодействия в университете Голдсмитс, задала уместный вопрос: «Можем ли мы найти применение машинному обучению в таких нетрадиционных областях, как творчество, исследования?» [9]. В последующие годы инициативу Фибринк поддержали представители самых различных сообществ: сегодня изучается и разрабатывается множество новых идей, теорий, экспериментов, подходов и продуктов. Непрекращающиеся исследования человеко- компьютерного взаимодействия и машинного обучения открывают перед нами новые возможности и метафоры проектирования систем ассистированного творчества.
Демократизация и эскалацияВ ходе исследования ассистированного творчества, мы заметили пару современных тенденций, которые могут оказать влияние на творчество:
В совокупности эти тенденции ускоряют процесс превращения человека из новичка в эксперта. Это вызывает интересный феномен, который мы назвали «демократизацией творчества». Сейчас мы рассмотрим эти тенденции подробнее.
Тенденция 1: творчество становится доступным.Для композитора или фотографа В творческом мире самой главной сложностью всегда был «высокий входной барьер» [10] для человека, не обладающего особыми навыками или талантами. Сегодня системы ассистированного творчества значительно снижают этот «высокий барьер», делая творческие процессы более доступными и облегчая освоение новых навыков.
Тенденция 2: совместная работа становится все более доступной.Уже в По мере того, как развиваются социальные сетей и программы для совместной работы, мы начинаем понимать, как можно задействовать технологии для повышения групповой самоорганизации, эффективности и творческих способностей. Суть в том, что творчество — это коллективный процесс, который выходит за рамки технологических средств, хотя и может быть значительно усилен посредством технологий. Чтобы добиться развития, возможности человека и возможности машины нужно синхронизировать.
Эскалация творчестваЕсли попробовать спрогнозировать развитие этих тенденций, получится сценарий, который мы называем «эскалацией творчества»: мир, в котором творчество будет широко доступно, и любой сможет писать как Шекспир, сочинять музыку как Бах, писать картины как Ван Гог, быть искусным дизайнеров и искать новые формы творческого самовыражения. Для человека, не обладающего никакими особенными творческими способностями, системы ассистированного творчества открывают множество возможностей. Если у людей появится возможность по требованию освоить творческий навык, нам придется переосмыслить такие понятия как «эксперт» и «дизайн». В итоге такой эскалации, творчество станет одним из средств эмпатического общения.
И хотя подобные сценарии пока кажутся фантастическими, сама идея будущей демократизации и эскалации творчества определяет наши сегодняшние дизайнерские решения. Уже сейчас перед нами стоит сложная задача: создавать системы, способные адаптироваться под разные культурные традиции, поддерживать различные типы творчества, отвечать множеству человеческих потребностей и обеспечивать прозрачную обратную связь. Автоматизация или усилениеПервый вопрос, который стоит задать, обсуждая демократизацию и эскалацию творчества: «Создаем ли мы инструменты, которые усилят нас, или автопилоты, которые нас заменят?» Такие вопросы преследуют человечество уже 5000 лет, с с тех пор, с как люди начали использовать крупный рогатый скот в сельском хозяйстве [11]. История доказывает нам, что у любой технологии есть своя динамика и импульс. Как говорил Маршал Маклюэн: «Вначале мы формируем технологии, а потом технологии формируют нас» [12]. Тем не менее, мы не рассматривает технологии как основную движущую силу природы: решающую роль играют человеческие решения и действия, а их определяет культура, политика и власть.
Второй вопрос, который хочется задать, это: «что понимать под автоматизацией?». На наше нынешнее представление об автоматизации сильно влияют идеи промышленной революции: массовое производство товаров машинами. Конечно проблема массовой безработицы из-за замены человеческого труда машинным — это серьезный вопрос, но все-же автоматизация имеет и преимущества. Некоторые виды деятельности стоит отдать машинам — особенно если они предполагают нечеловеческие условия труда или пустую растрату человеческого потенциала. Если рассматривать автоматизацию с точки зрения потенциала и возможностей человека: его сильных и слабых сторон, потребностей и желаний, становится ясно, что автоматизация — это скорее возможность, чем угроза. Усиление (augmentation) и автоматизация (automation) — это разные вещи: автоматизация обещает «освободить нас от нечеловеческих задач», а цель усиления — в расширении наших возможностей. То есть предполагается не заменить человека, а расширить коллективный потенциал общества. Чтобы лучше понять это явление, обратимся к концепции, которую разработало NASA для изучения вопросов автономии: метафора «H» [13]. Эта концепция сравнивает взаимодействие человека и системы с обращением с лошадьми.
Представьте себе всадника на лошади: если движения всадника точные и осознанные — лошадь в точности выполняет команды. Но стоит дать более расплывчатое указание, и лошадь выйдет за пределы привычных паттернов поведения и возьмет контроль на себя. Сама возможность «ослабить или натянуть поводья» обеспечивает плавную обратную связь и постоянный контроль. Это работает даже лучше чем постоянные команды всадника и реакции лошади. Исследователь человеко-компьютерного взаимодействия и машинного обучения Родерик Мюррей-Смит предлагает использовать метафору «H» в контексте развития интерфейсов. Он предполагает: «Устройства будущего смогут ощущать гораздо больше окружающих сигналов, что позволит взаимодействовать с ними множеством способов. Благодаря этому мы сможем время от времени снижать контроль и взаимодействовать более расслабленно» [14].
Когда мы сможем взаимодействовать с системами более расслабленно и иногда снижать уровень контроля, человеко-компьютерное взаимодействие, а также совместная работа людей примут совершенно иные формы. Если интуиция человека и интеллект машины начнут работать в паре — получится совершенно новый творческий процесс, который не смогут повторить ни человек, ни машина по-отдельности. Благодаря этому творчество станет доступнее, а коллективный потенциал человечества вырастет в разы. И хотя можно вообразить множество пессимистичных сценариев развития этой сферы, мы намеренно концентрируемся на возможностях, а не на страхах. Сложные этические вопросы и опасения должны стать почвой для исследований и призывом к принятию коллективных решений. Тогда мрачных сценариев будущего можно будет избежать. Примеры / СМИПеред вами обзор исследований, экспериментов и продуктов ассистированного творчества в контексте различных творческих задач и дисциплин. Ассистированная фотография
Ассистированное рисование
Ассистированное чтение/письмо
Ассистированная музыка
Ассистированный дизайн
Ассистированные эксперименты
Ассистированное сообщество
Ассистированная культура
3
Генеративное творчествоРастет наша способность представления сложных проблем. Мы вышли на новый уровень и можем пересмотреть многие творческие проблемы в новой перспективе. В этом разделе мы изучим генеративное творчество, а также то, как оно способствует демократизации и эскалации творчества в целом. На протяжении всей истории человечества представление всегда играло ключевую роль. Со временем системы представления информации становятся все совершеннее — и позволяют нам объяснять сложные явления в понятной форме. При помощи таких систем мы можем организовывать информацию, управлять проблемами и принимать взвешенные решения. Со времен появления письменности, системы представления постоянно развиваются. В начале 16 века — во многом благодаря работам Леонардо Да Винчи — люди стали соблюдать пропорции при изображении предметов [1], а в эпоху Просвещения в рисовании стала применяться перспектива [2]. Появление новых форм представления влекло за собой революционные изменения в науке и технологиях.
Абстракции — такие как рисование или письмо —
пытаются представить сложные идеи при помощи
ограниченных средств. Они заставляют человека
держать все частички паззла в голове. Как полагает
Мэт Йезик (Autodesk), эти инструменты создавались
в век документации, когда пропускная
способность представления проблем была низкой [3].
Йезик характеризует
Исторически так сложилось, что симуляции использовались изолированно, в узких предметных сферах. В 20 веке, вследствие развития теории систем, кибернетики, а также в связи с повсеместным распространением компьютеров, начался век моделей. Модель — это расчетное представление реальности с высокой пропускной способностью. Модель представляет саму систему — ее характеристики и модели поведения — в то время как симуляция представляет функционирование системы во времени. Эта новая парадигма представления не полагается на абстрактные методы, а скорее пытается создавать «вещи, которые функционируют как представляемые ими оригиналы».
Модели обеспечивают нам инфраструктуру
для представления всей проблемы целиком.
Они помогают понимать сложные взаимосвязанные
вопросы и проникать в логику взаимодействия
составляющих системы. И хотя технологии
моделирования использовались уже в Мы уверены, что доступные нам технологии моделирования позволяют рассматривать более широкий спектр творческих проблем на совершенно другом уровне и решать их по-другому. Мы исследуем это новое течение — его культурную и техническую стороны и сферы применения — и называем его генеративным веком. Генеративный векУже в 1960х Энгельбарт отмечал, какое влияние
на нашу способность к представлению оказывают
цифровые технологии: «Существуют информационные
структуры, слишком сложные для изучения без помощи
вспомогательных средств. Теперь мы можем
представить эти структуры внутри компьютера» [5].
В начале Под «онтологическим сдвигом» Патрик подразумевал фундаментальный сдвиг в перспективе: от трехмерного видения к многомерному. Эпоха Просвещения дала человечеству 3D-перспективу реальности, а генеративный век позволяет нам представлять (моделировать) сложные системы и видеть (осознавать) реальность в вероятностной, многомерной перспективе — nD. Под влиянием этих идей и вследствие появления важных дизайнерских публикаций [7], книг [8] и программ [9], сформировалось новое движение — генеративный дизайн.
Архитектор Майкл Хансмейер характеризует генеративный дизайн так: «мы думаем не о проектировании одного конкретного объекта, а о процессе генерации множества объектов» [10]. Он предлагает переход от объекта к процессу — от уверенности к вероятности. Вместо создания одного «артефакта» мы можем при помощи вычислительных моделей проектировать процессы создания бесчисленных «артефактов».
Вообще термин «генеративный дизайн» достаточно общий — им можно описать исследования и разработки, проводящиеся во множестве различных областей: от дизайна, архитектуры, промышленного дизайна и до машинного обучения. Общая его суть в том, чтобы дизайнеры получили доступ к расширенных дизайнерским возможностям в новой перспективе, а также в том, чтобы снизить временной разрыв между задумкой и исполнением. В генеративный век цена создания сложных и разнообразных объектов снижается. Это позволяет нам создавать на порядок более сложные формы и функции. К примеру: велосипеды, которые можно в масштабах производства адаптировать под предпочтения каждого клиента, при использовании стандартного количества материалов. И хотя генеративный подход не ограничен какой-то конкретной сферой применения, именно архитектура — и в последние годы дизайн — первыми начали систематическое применение этого подхода. Примеры:
Генеративные модели используются в творческих
сферах уже с Исследовательские проекты с аббревиатурами в названиях — такие как VAE [11], DRAW [12], VRNN [13], GAN [14], DCGAN [15], LAPGAN [16] and GRAN [17] — позволяют нам моделировать более сложные системы с высоким разрешением и применять техники моделирования для решения широкого спектра творческих проблем. Автокодирование картинок (2015) Недавно появилась новая разработка — применение моделей генеративного машинного обучения для решения творческих задач. Разработка уже дала свои плоды: были выведены новые «примитивы» творчества — структурные элементы дизайна, которые применимы во множестве творческих областей. Такие творческие генеративные модели с успехом используются для создания предметов моды, картин, музыкальных произведений, стихов, текстов песен, статей для журналов, мебели, изображений и видео эффектов, объектов промышленного дизайна, комиксов, иллюстраций и объектов архитектуры — и это далеко не полный список. Подборку проектов вы найдете в разделе «Примеры».
Генеративные модели позволяют нам исследовать данные новыми, неизведанными ранее способами. Для примера возьмем стул: мы можем представить его характеристики (цвет, высота или стиль) в качестве измерений в нашем многомерном информационном пространстве. Это пространство можно заполнить информацией о миллионах стульев. Стулья со сходными характеристиками можно разместить поблизости. Таким образом мы построим модель стула, которую можно изучить и визуализировать.
Подобные многомерные топологии позволяют нам проще воспринимать информацию, исследовать данные и задавать вопросы о взаимосвязи, логике и значении, например, «Отобразить все красные высокие стулья». Далее мы можем строить предположения и закладывать новые характеристики: например, «Отобразить все стулья, похожие на A и B, но непохожие на C». Наконец, мы можем использовать многомерные пространства для генерации новых объектов: например, «Создать стул, который напоминает машину и на котором удобно сидеть».
При помощи генеративных моделей дизайнеры могут играть с данными и создавать бесчисленное множество вариаций и решений творческих проблем. Все эти мощные инструменты позволяют нам исследовать, оптимизировать и мгновенно тестировать дизайнерские идеи, а значит в разы повышается вероятность интуитивно обнаружить что-то новое и ценное. Да, генеративные модели можно использовать для эффективного выполнения стандартных творческих задач, но они к тому же открывают для нас и новые творческие возможности, которые не идут ни в какое сравнение с классическими методами. Искусственная интуиция: Системы, которые максимизируют вероятность интуитивно обнаружить что-то новое и ценное.
Благодаря последним достижениям в машинном обучении стало возможным использовать данные из разных «модальностей» в рамках одной модели. Это позволяет нам переводить с языка одной модальности на язык другой. Суть в том, что все формы информации могут быть закодированы в одном информационном пространстве. В ходе ранних исследований мульти-модальности появились системы, которые уже нашли широкое применение: «Auto Translate» («авто перевод») [18] позволяет переводить с одного языка на другой, «Speech to Text» («речь в текст») [19] преобразует аудио в текст. Мульти-модальное машинное обучение позволяет реализовывать более сложные сценарии, которые выходят за пределы простого перевода данных: создание изображений по тексту [20], текста по видео [21], музыки по движению [22], 3D-форм на базе информации о покупках, и т.д. Мы называем это искусственная синестезия: системы, которые создают объекты в нескольких сенсорных областях. Демократизация и эскалацияГенеративный век дает нам новый простор для творчества, который мы только начинаем осваивать. И хотя сложно предположить, куда нас заведут все эти разработки, новые тренды все же стоит изучить — поскольку их влияние уже ощущается. Если тенденция к использованию и применению этих разработок сохранится, то нас ожидает сценарий, который мы называем «демократизацией и эскалацией творчества». Мы исследовали это явление и вывели четыре тренда:
Компьютерное творчество
Давайте попробуем представить развитие этих сценариев в более удаленном будущем. Становится понятно, что есть перспективы применения генеративного творчества в таких областях, как технологии, производство, добыча ресурсов, экономика и политика. Уже сегодня благодаря методам генеративного творчества происходит демократизация творчества во множестве областей. Снижая временной интервал между идеей и воплощением, генеративное творчество ускоряет появление новых «артефактов» — форм, функций и эстетики. Это позволяет нам заняться изучением того, что лежит за пределами артефактов. В совокупности с новыми технологиями производства, генеративное творчество полностью переворачивает такие понятия, как производство, потребление, труд и инновации. Поскольку современные экономические модели построены именно на концепции материальных благ («артефактов») — мы можем предположить, что необходимо будет пересмотреть основы экономики. И хотя невозможно предсказать будущее демократизации и эскалации творчества, мы уже сегодня можем принимать решения и формировать свое видение мира с учетом новых возможностей. Как говорил Роберт Антон Уилсон: Примеры / СМИНиже вы найдете подборку исследований, экспериментов и продуктов, связанных с темой генеративного творчества, и их использование в различных творческих задачах/дисциплинах. Генеративные эксперименты
Генеративный дизайн
Генеративный текст
Генеративная интуиция
Генеративная архитектура
Генеративный дизайн
Генеративные игры
Генеративная синестезия
4
ЗаключениеНаше исследование началось с серии экспериментов — мы в легкой форме изучали, как соотносятся творчество и искусственный интеллект. В результате мы погрузились в глубокое изучение творчества и подтвердили свою изначальную гипотезу: творчество выступает центральной движущей силой на протяжении всей истории человечества. Мы познакомились с новыми метафорами: усиленное творчество, вычислительное творчество, творческие системы — что позволило нам рассматривать само творчество и его взаимосвязь с технологиями с новой точки зрения.
На протяжении всего нашего пути, мы старались структурировать информацию о творчестве и технологиях. Благодаря этому мы обнаружили, проанализировали и дали определение развивающимся паттернам творчества. Мы уделили особое внимание двум из них: ассистированному творчеству и генеративному творчеству. В совокупности эти паттерны позволяют описать сценарий, который мы называем «демократизацией и эскалацией творчества». Это будет мир, где творчество широко доступно благодаря системам, позволяющим создавать новые перспективы и повышать человеческий потенциал. В ходе исследования мы научились ценить творчество. Творчество — это постоянно развивающаяся движущая сила человечества. Творчество раздвигает границы для новых междисциплинарных исследований и разработок. Основной целью этого исследовательского проекта было определись набор принципов, метафор и идей, которыми можно было бы описать будущие теории, эксперименты и применения творчества. Мы свели множество разных источников воедино и сформировали новую школу — практическое руководство по творчеству — ТворческийИИ. Задумка ТворческогоИИ в том, чтобы исследовать и ценить творчество. Наша цель — в разработке систем, повышающих человеческий потенциал. Мы верим, что вопросы «что?» и «почему?» не менее важны, чем «как?». Мы уверены, что на сложные этические вопросы нужно отвечать уже сейчас — и рассматривать их как шанс проявить творческий подход. И наконец, ТворческийИИ — это скорее вопрос, чем ответ. Все, что требуется — это больше совместной работы и творчества. Воспринимайте это как приглашение поиграть!
5
Авторы и благодарностиРоэлоф Питерс Самим Винигер Особое спасибо: Boris Anthony, Jake Witlen, Hendrik Heuer, Kiran Varanasi, Francis Tseng, Mark Riedl, Jack Clark, Alex J. Champandard, Gene Kogan, David J.Klein, Simone Rebaudengo, Matthieu Cherubini, Saurabh Datta, Max Niederhofer, Dave Ha, Kyle Kastner, Mattias Ostmar, Melisande Middleton, Tor Sanden, Mami Ebara. А также спасибо пользователям Твиттера за вдохновение, обсуждения и полезные предложения! 6
Ссылки
Автор: Роэлоф Питерс, Самим Винигер, перевод: AIC Оригинал: https://medium.com/@ArtificialExperience/creativeai-9d4b2346faf3#.k2k06oil4 Оригинал перевода: http://blog.aic.ru/doc/creative_aI_aic.pdf Рекомендуем: |
![]() |
![]() |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Реклама
© 2006-2018 CMS Magazine Правовая информация Статьи партнеров Реклама
CMS Magazine – электронное СМИ. Эл № ФС 77-32705. Статьи партнеров Рейтинг Рунета: рейтинг веб студий, рейтинг seo компаний, рейтинг CMS. |
![]() |
![]() |