Таким образом, если резюмировать, Kandinsky 2.1. – достаточно интересная нейросеть, которая может составить вполне себе конкуренцию Midjourney, Dall-E и Stable Diffusion.
Из плюсов – то что можно вводить промпты на русском языке и еще 100 других. Кроме того, нейросеть можно использовать через телеграм бот или даже голосовго помощника Сбера.
Из минусов – изображения относительно невысокого разрешения, прорисовка людей в определенных стилях, особенно если на картинке несколько персонажей, иногда оставляет желать лучшего.
Но в целом первое впечатление положительное, думаю буду пользоваться и дальше.
Вывод
Эти генераторы изображений с искусственным интеллектом могут революционизировать то, как мы создаем и потребляем изображения, поскольку они могут генерировать оригинальные изображения по запросу на основе вводимого текста. Это может иметь широкий спектр применений в таких областях, как реклама, искусство и дизайн, а также более практические приложения, такие как создание макетов продуктов или визуализация данных.
Использование генераторов изображений ИИ также может иметь экономические последствия, поскольку может изменить способ создания и потребления изображений. Например, если генераторы изображений ИИ получат широкое распространение, это может снизить спрос на традиционные методы создания изображений, такие как фотография или иллюстрация, что может повлиять на рынок труда в этих областях. Уже сейчас многие компании, дизайнеры и предприниматели вместо того, чтобы заказывать дизайн изображений, логотипов, визуализацию у профессиональных иллюстраторов и платить им за это десятки, сотни, а иногда и тысячи долларов, просто используют указанные модели на основе нейронных сетей и получают достаточно хорошие по качеству изображения бесплатно либо по намного сниженной цене.
В целом, появление генераторов изображений с искусственным интеллектом, таких как DALL-E 2, Midjourney и Stable Diffusion, представляет собой захватывающее развитие в области искусственного интеллекта и может изменить то, как мы создаем и потребляем изображения. Вполне вероятно, что эти технологии продолжат развиваться и совершенствоваться в ближайшие годы, и будет интересно посмотреть, как они определят будущее ИИ и экономики.
Кстати, уже начали появляться платформы, которые позволяют генерировать не только изображения, но и полноценные видео из текста. Это может быть видео говорящих людей или движущихся животных или автомобилей или чего угодно.
Видео, которые показывают как тот или иной аватар говорит по предоставленному вами скрипту, достаточно высокого качества. Например, сервисы Elai.io, интегрированный с GPT-3 от OpenAI, или Synthesia.io, в которых можно выбрать аватар того или иного человека или даже создать свой собственный аватар с помощью смартфона, который потом будет говорить по вашему тексту. Платформа поддерживает несколько десятков языков. Представьте как это упростит работу и сэкономит бюджет для компаний, предпринимателей,