Генеративно-состязательная сеть

Генеративно-состязательная сеть (англ. Generative adversarial network, сокращённо GAN) — алгоритм машинного обучения без учителя, построенный на комбинации из двух нейронных сетей, одна из которых (сеть G) генерирует образцы (см. Генеративная модель^[en]), а другая (сеть D) старается отличить правильные («подлинные») образцы от неправильных (см. Дискриминативная модель^[en]). Так как сети G и D имеют противоположные цели — создать образцы и отбраковать образцы — между ними возникает антагонистическая игра. Генеративно-состязательную сеть описал Ян Гудфеллоу^[en] из компании Google в 2014 году^[1].

Использование этой техники позволяет, в частности, генерировать фотографии, которые человеческим глазом воспринимаются как натуральные изображения. Например, известна попытка синтезировать фотографии кошек, которые вводят в заблуждение эксперта, считающего их естественными фото^[2]. Кроме того, GAN может использоваться для улучшения качества нечётких или частично испорченных фотографий.

Метод[править | править код]

В системе GAN одна из сетей (сеть G, от Generator) генерирует образцы (см. Генеративная модель^[en]), а другая (сеть D, от Discriminator) старается отличить правильные («подлинные») образцы от неправильных (см. Дискриминативная модель^[en])^[1]. Используя набор переменных латентного пространства, генеративная сеть пытается слепить новый образец, смешав несколько исходных образцов. Дискриминативная сеть обучается различать подлинные и поддельные образцы, а результаты различения подаются на вход генеративной сети так, чтобы она смогла подобрать лучший набор латентных параметров, и дискриминативная сеть уже не смогла бы отличить подлинные образцы от поддельных. Таким образом целью сети G является повысить процент ошибок сети D, а целью сети D является наоборот улучшение точности распознавания^[1]^[3].

Дискриминационная сеть D, анализируя образцы из оригинальных данных и из подделанных генератором, достигает некоторой точности различения. Генератор при этом начинает со случайных комбинаций параметров латентного пространства (см. многомерное нормальное распределение), а после оценки полученных образцов сетью D, применяется метод обратного распространения ошибки, который позволяет улучшить качество генерации, подправив входной набор латентных параметров. Постепенно искусственные изображения на выходе генеративной сети становятся всё более качественными^[4]. Сеть D реализуется как свёрточная нейронная сеть, в то время как сеть G наоборот разворачивает изображение на базе скрытых параметров.

В процессе совместного конкурентного обучения, если система достаточно сбалансирована, достигается минимаксное состояние равновесия, в котором обе сети значительно улучшили своё качество, и теперь сгенерированные изображения могут быть использованы практически как настоящие.

Идея состязательного обучения была выдвинута в 2013 году Li, Gauci и Gross^[5]. Этот метод называется также «обучением Тьюринга»^[6], так как ставит целью пройти тест Тьюринга.

Применение[править | править код]

GAN используются для получения фотореалистичных изображений, например для элементов промышленного дизайна, дизайна интерьера, одежды, сумок, портфелей, сцен компьютерных игр и т. д. Сети GAN используются также в сети Facebook^[14]. В последнее время системы GANs стали использоваться для подготовки кадров фильмов или мультипликации^[15]. Также эти системы помогают воссоздать трёхмерную модель объекта с помощью фрагментарных изображений^[16] и улучшить изображения, полученные из астрономических наблюдений^[17].

Примечания[править | править код]

↑ ¹ ² ³ Goodfellow, Ian J.; Pouget-Abadie, Jean; Mirza, Mehdi; Xu, Bing; Warde-Farley, David; Ozair, Sherjil; Courville, Aaron; Bengio, Yoshua (2014). "Generative Adversarial Networks". arXiv:1406.2661 [stat.ML].
↑ Salimans, Tim; Goodfellow, Ian; Zaremba, Wojciech; Cheung, Vicki; Radford, Alec; Chen, Xi (2016). "Improved Techniques for Training GANs". arXiv:1606.03498 [cs.LG].
↑ Luc, Pauline; Couprie, Camille; Chintala, Soumith; Verbeek, Jakob. Semantic Segmentation using Adversarial Networks (неопр.) // NIPS Workshop on Adversarial Training, Dec , Barcelona, Spain. — 2016. — 25 November (т. 2016). — arXiv:1611.08408.
↑ Andrej Karpathy, Pieter Abbeel, Greg Brockman, Peter Chen, Vicki Cheung, Rocky Duan, Ian Goodfellow, Durk Kingma, Jonathan Ho, Rein Houthooft, Tim Salimans, John Schulman, Ilya Sutskever, And Wojciech Zaremba, Generative Models, OpenAI, Архивировано из оригинала на 22 апреля 2021, Дата обращения: 19 июля 2017{{citation}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка) Википедия:Обслуживание CS1 (непригодный URL) (ссылка)
↑ Li, Wei; Gauci, Melvin; Gross, Roderich (July 6, 2013). "A Coevolutionary Approach to Learn Animal Behavior Through Controlled Interaction". Proceedings of the 15th Annual Conference on Genetic and Evolutionary Computation (GECCO 2013). Amsterdam, The Netherlands: ACM. pp. 223—230.
↑ Li, Wei; Gauci, Melvin; Groß, Roderich. Turing learning: a metric-free approach to inferring behavior and its application to swarms (англ.) // Swarm Intelligence : journal. — 2016. — 30 August (vol. 10, no. 3). — P. 211—243. — doi:10.1007/s11721-016-0126-1.
↑ Фальшивомонетчики против банкиров: стравливаем adversarial networks в Theano (неопр.). Дата обращения: 19 июля 2017. Архивировано 20 августа 2017 года.
↑ Photo Editing with Generative Adversarial Networks (Part 1) (неопр.). Дата обращения: 19 июля 2017. Архивировано 20 августа 2017 года.
↑ Michael Dietz. On the intuition behind deep learning & GANs — towards a fundamental understanding (недоступная ссылка)
↑ Anders Boesen Lindbo Larsen and Søren Kaae Sønderby Generating Faces with Torch (неопр.). Дата обращения: 19 июля 2017. Архивировано 11 июля 2017 года.
↑ Photo Editing with Generative Adversarial Networks (Part 1) (неопр.). Дата обращения: 19 июля 2017. Архивировано 20 августа 2017 года.
↑ Generative Adversarial Nets in TensorFlow Agustinus Kristiadi (неопр.). Дата обращения: 14 ноября 2017. Архивировано 17 ноября 2017 года.
↑ Image Completion with Deep Learning in TensorFlow (неопр.). Дата обращения: 14 ноября 2017. Архивировано 15 ноября 2017 года.
↑ Greenemeier, Larry When Will Computers Have Common Sense? Ask Facebook (неопр.). Scientific American (20 июня 2016). Дата обращения: 31 июля 2016. Архивировано 24 июля 2016 года.
↑ Generating Videos with Scene Dynamics (неопр.). web.mit.edu. Дата обращения: 19 июля 2017. Архивировано 20 марта 2017 года.
↑ 3D Generative Adversarial Network (неопр.). 3dgan.csail.mit.edu. Дата обращения: 19 июля 2017. Архивировано 27 октября 2019 года.
↑ Schawinski, Kevin; Zhang, Ce; Zhang, Hantian; Fowler, Lucas; Santhanam, Gokula Krishnan (2017-02-01). "Generative Adversarial Networks recover features in astrophysical images of galaxies beyond the deconvolution limit". arXiv:1702.00403 [astro-ph.IM].

Ссылки[править | править код]

Knight, Will. "What to expect of artificial intelligence in 2017". MIT Technology Review. Дата обращения: 5 января 2017.
Разбираемся с войной нейронных сетей (GAN)

[MyUser_Arxiv.org_April_7_2016c-1] ¹ ² ³ Goodfellow, Ian J.; Pouget-Abadie, Jean; Mirza, Mehdi; Xu, Bing; Warde-Farley, David; Ozair, Sherjil; Courville, Aaron; Bengio, Yoshua (2014). "Generative Adversarial Networks". arXiv:1406.2661 [stat.ML].

[ITT_GANs-2] Salimans, Tim; Goodfellow, Ian; Zaremba, Wojciech; Cheung, Vicki; Radford, Alec; Chen, Xi (2016). "Improved Techniques for Training GANs". arXiv:1606.03498 [cs.LG].

[3] Luc, Pauline; Couprie, Camille; Chintala, Soumith; Verbeek, Jakob. Semantic Segmentation using Adversarial Networks (неопр.) // NIPS Workshop on Adversarial Training, Dec , Barcelona, Spain. — 2016. — 25 November (т. 2016). — arXiv:1611.08408.

[OpenAI_com-4] Andrej Karpathy, Pieter Abbeel, Greg Brockman, Peter Chen, Vicki Cheung, Rocky Duan, Ian Goodfellow, Durk Kingma, Jonathan Ho, Rein Houthooft, Tim Salimans, John Schulman, Ilya Sutskever, And Wojciech Zaremba, Generative Models, OpenAI, Архивировано из оригинала на 22 апреля 2021, Дата обращения: 19 июля 2017{{citation}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка) Википедия:Обслуживание CS1 (непригодный URL) (ссылка)

[Li-etal-GECCO2013-5] Li, Wei; Gauci, Melvin; Gross, Roderich (July 6, 2013). "A Coevolutionary Approach to Learn Animal Behavior Through Controlled Interaction". Proceedings of the 15th Annual Conference on Genetic and Evolutionary Computation (GECCO 2013). Amsterdam, The Netherlands: ACM. pp. 223—230.

[TuringLearning2016-6] Li, Wei; Gauci, Melvin; Groß, Roderich. Turing learning: a metric-free approach to inferring behavior and its application to swarms (англ.) // Swarm Intelligence : journal. — 2016. — 30 August (vol. 10, no. 3). — P. 211—243. — doi:10.1007/s11721-016-0126-1.

[habrahabr1-7] Фальшивомонетчики против банкиров: стравливаем adversarial networks в Theano (неопр.). Дата обращения: 19 июля 2017. Архивировано 20 августа 2017 года.

[nvidia-8] Photo Editing with Generative Adversarial Networks (Part 1) (неопр.). Дата обращения: 19 июля 2017. Архивировано 20 августа 2017 года.

[Dietz-9] Michael Dietz. On the intuition behind deep learning & GANs — towards a fundamental understanding (недоступная ссылка)

[Torch-10] Anders Boesen Lindbo Larsen and Søren Kaae Sønderby Generating Faces with Torch (неопр.). Дата обращения: 19 июля 2017. Архивировано 11 июля 2017 года.

[nvidia2-11] Photo Editing with Generative Adversarial Networks (Part 1) (неопр.). Дата обращения: 19 июля 2017. Архивировано 20 августа 2017 года.

[tf-12] Generative Adversarial Nets in TensorFlow Agustinus Kristiadi (неопр.). Дата обращения: 14 ноября 2017. Архивировано 17 ноября 2017 года.

[tf1-13] Image Completion with Deep Learning in TensorFlow (неопр.). Дата обращения: 14 ноября 2017. Архивировано 15 ноября 2017 года.

[14] Greenemeier, Larry When Will Computers Have Common Sense? Ask Facebook (неопр.). Scientific American (20 июня 2016). Дата обращения: 31 июля 2016. Архивировано 24 июля 2016 года.

[15] Generating Videos with Scene Dynamics (неопр.). web.mit.edu. Дата обращения: 19 июля 2017. Архивировано 20 марта 2017 года.

[16] 3D Generative Adversarial Network (неопр.). 3dgan.csail.mit.edu. Дата обращения: 19 июля 2017. Архивировано 27 октября 2019 года.

[17] Schawinski, Kevin; Zhang, Ce; Zhang, Hantian; Fowler, Lucas; Santhanam, Gokula Krishnan (2017-02-01). "Generative Adversarial Networks recover features in astrophysical images of galaxies beyond the deconvolution limit". arXiv:1702.00403 [astro-ph.IM].

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

Машинное обучение и data mining
Задачи	Задача классификации Обучение без учителя Обучение с частичным привлечением учителя Регрессионный анализ AutoML Ассоциативные правила Выделение признаков Обучение признакам Обучение ранжированию Грамматический вывод Онлайновое обучение
Обучение с учителем	Метод k-ближайших соседей Наивный байесовский классификатор Дерево решений Метод опорных векторов Линейная регрессия Логистическая регрессия Перцептрон Ансамблевое обучение Бэггинг Бустинг Random forest Метод релевантных векторов
Кластерный анализ	Метод k-средних Метод нечёткой кластеризации Иерархическая кластеризация EM-алгоритм BIRCH CURE DBSCAN OPTICS Mean-shift
Снижение размерности	Факторный анализ Метод главных компонент CCA ICA LDA Неотрицательное матричное разложение t-SNE
Структурное прогнозирование	Графовая вероятностная модель Байесовская сеть Скрытая марковская модель CRF
Выявление аномалий	Метод k-ближайших соседей Локальный уровень выброса
Графовые вероятностные модели	Байесовская сеть Марковская сеть Скрытая марковская модель
Нейронные сети	Ограниченная машина Больцмана Самоорганизующаяся карта Функция активации Сигмоида Softmax Радиально-базисная функция Метод обратного распространения ошибки Глубокое обучение Многослойный перцептрон Рекуррентная нейронная сеть Долгая краткосрочная память Управляемый рекуррентный блок Свёрточная нейронная сеть U-Net Автокодировщик
Обучение с подкреплением	Марковский процесс Уравнение Беллмана Жадный алгоритм Q-обучение SARSA Temporal difference (TD)
Теория	Теория Вапника — Червоненкиса Дилемма смещения–дисперсии Теория вычислительного обучения Минимизация эмпирического риска Оккамово обучение PAC learning Статистическая теория обучения
Журналы и конференции	NeurIPS ICML ML JMLR ArXiv:cs.LG

Генеративно-состязательная сеть

Содержание

Метод[править | править код]

Популярные объяснения метода[править | править код]

Применение[править | править код]

Примечания[править | править код]

Ссылки[править | править код]

Навигация

Генеративно-состязательная сеть

Метод[править | править код]

Популярные объяснения метода[править | править код]

Применение[править | править код]

Примечания[править | править код]

Ссылки[править | править код]

Навигация

Поиск