Для тех, кто не хочет читать до конца, поиграться можно здесь.
Ранее в этом году специалисты NVIDIA Research уже удивили пользователей Сети своим инструментом GauGAN, позволявшим превращать грубые наброски в почти фотореалистичные изображения. Этот инструмент требовал от пользователей указывать, какие части изображения должны быть водой, деревьями, горами и другими ориентирами, выбирая подходящий цвет кисти, но GANimals работает полностью автоматически. Необходимо лишь загрузить фотографию своего питомца, и она создаст серию фотореалистичных изображений других животных, которые сохранят «выражение морды» образца.
На этой неделе в статье, представленной на Международной конференции по машинному зрению в корейском Сеуле, исследователи описали алгоритм, который разработали — FUNIT. Он расшифровывается как Few-shot, UNsupervised Image-to-image Translation. При использовании искусственного интеллекта для преобразования характеристик исходного изображения в целевое изображение искусственный интеллект, как правило, необходимо обучать на основе большой коллекции целевых изображений с различными уровнями освещённости и ракурсами камеры, чтобы получать результаты, которые выглядят реалистично. Но создание такой большой базы данных изображений занимает много времени и ограничивает возможности нейросети. Если ИИ натренирован превращать цыплят в индеек, это единственное, с чем он будет справляться хорошо.
Для сравнения: алгоритм FUNIT можно обучить, используя всего несколько изображений целевого животного, на которых он многократно практикуется. После того как алгоритм достаточно натренирован, ему достаточно только одного изображения исходного и целевого животных, которые могут быть абсолютно случайными и никогда ранее не обрабатываться и не анализироваться.
Желающие могут опробовать GANanimals на NVIDIA AI Playground, но пока результаты отличаются низким разрешением и не подходят ни для чего, кроме ознакомительных целей или удовлетворения любопытства. Исследователи надеются в конечном итоге улучшить возможности ИИ и алгоритма, так чтобы в скором времени можно было менять лица людей без опоры на огромные базы данных тщательно отобранных изображений.
Источник.