Искусственный интеллект, использующий нейронную сеть, сделал попытку создать изображение кота «с нуля». Результаты оказались котострофичными.
Ранее нейросеть более чем успешно справилась с аналогичной задачей, создавая, в частности, лица человека, причем отличить искусственно созданное изображение от настоящего лица не удается.
За основу были взять фотографии реальных людей, а для генерации изображений использовался алгоритм StyleGAN. Работой занимались два независимых потока. Один генерировал изображения, а второй – оценивал результат и сравнивал его с тестовыми изображениями.
Алгоритм анализировал исходные изображения, разделял лица в соответствии с заранее заданным списком стилей, в частности, положение головы, возраст, цвет кожи, форма глаз, носа, рта и т. п. После того, как все составные части были распознаны, алгоритм мог создавать на их основе новые лица самостоятельно, без участия человека. В результате получились фотореалистичные изображения, неотличимые от реальных.
После этого была предпринята попытка выполнить ту же работу с кошачьими – получить реалистичные фото котиков, созданные компьютером. В качестве исходных данных использовались тысячи фото разнообразных котов и кошек, и алгоритм должен был работать так же, как и в случае с изображениями людей.
В результате получились довольно жуткие изображения животных, у которых деформированы головы, количество глаз и лап, порой, не соответствовало оригиналу, а тела могли принимать весьма замысловатые формы и размеры.
Правда, исходные данные не вполне соответствовали тому, что было при генерации человеческих лиц. Если на фото людей были только головы, причем все они были сфотографированы в одном ракурсе и с одним положением головы, изображения котов были самыми разнообразными - от портретов «морды лица» до фото целиком кота «в интерьере».
Проблема оказалась в том, что распознать кота на исходной фотографии оказалось для алгоритма StyleGAN не всегда просто, т. к. на одном изображении был один кот, на другом – несколько, или даже в компании с человеком.
Все это не позволило алгоритму точно понять, как же в действительности выглядит кот. Как таковой, алгоритм может хорошо анализировать предоставленные эталонные фотографии. Сгенерировать точное изображение меха, его текстуру, воспроизвести, например, форму кошачьего уха и прочие мелкие детали, но вот собрать все это воедино не удалось.
«Нейронная сеть не понимает, что такое кошки. Она не понимает, сколько у них ног. На самом деле неясно, сколько у них глаз или куда уходит вся их анатомия»,
- заявляют разработчики.
Ист.