Метка нейросеть

Интересные промты GPT для изображений

В сети появился промт для нейросетей (а конкретно для GPT), который позволяет превратить автомобиль в полноценного робота-трансформера! Причём созданные образы максимально сохраняют характерные черты машин: фирменные элементы кузова, диски, ручки дверей — всё это органично вплетается в облик гигантского механического…

Нейросеть. Превращаем картинку в видео

Современные нейросети открывают безграничные возможности для творчества и визуализации. Один из таких инструментов — KlingAI, который позволяет легко превращать статичные изображения в динамичные видео. Хотите оживить фотографию и создать эффект вращения на 360 градусов? С KlingAI это просто: Загружаем изображение (например, фото…

PSHuman

PSHuman — это передовая нейросетевая модель, разработанная для высокоточного восстановления 3D-геометрии и текстуры человека из изображений. В отличие от предыдущих методов, PSHuman эффективно сочетает в себе преимущества многовидовой фотометрической стереоскопии и дифференцируемого рендеринга, что позволяет достигать непревзойденной точности и реалистичности…

Нейросети научились создавать 3D-модели по одной фотографии

Еще совсем недавно мы были поражены возможностями нейросетей, таких как Midjourney и Stable Diffusion, которые позволяли создавать невероятные изображения на основе текстовых описаний. Казалось бы, следующий логичный шаг — это нейросети, способные превращать фотографии в полноценные 3D-модели. Сегодня это уже…

Trellis: Генерация 3D-моделей из одной фотографии

Trellis — это мощная нейросеть, которая позволяет создавать 3D-модели в формате GLB всего по одной фотографии. Технология использует алгоритмы машинного обучения для реконструкции объёмных объектов, что открывает новые возможности в 3D-дизайне, геймдеве, виртуальной и дополненной реальности. С Trellis можно забыть…

Hunyuan 3D-2

Современные технологии машинного обучения и компьютерного зрения продолжают удивлять, и одной из последних инноваций стала нейросеть Hunyuan 3D-2. Она позволяет создавать реалистичные и точные 3D-модели объектов всего лишь на основе одного изображения. Давайте разберемся, как это работает и в чем…

Язык программирования Mojo

Mojo – относительно новый язык программирования, который стремительно набирает популярность в сообществе разработчиков. Он был создан с целью решения проблем, связанных с производительностью и удобством использования, которые часто встречаются в более распространенных языках. Mojo представляет собой более быструю и оптимизированную…

Функции обнаружения взгляда

В мире искусственного интеллекта модели Vision-Language (VLM) становятся все более популярными и многофункциональными инструментами. Компания Moondream, занимающаяся разработкой передовых технологий в области компьютерного зрения и обработки естественного языка, недавно представила новую функцию, которая расширяет возможности этих моделей. Moondream анонсировала новую…

Распознавание позы на фотографиях с помощью MediaPipe

В этой статье мы рассмотрим, как можно использовать библиотеку MediaPipe для распознавания позы человека на фотографиях. MediaPipe – это мощный инструмент, разработанный Google, который позволяет легко реализовать различные задачи компьютерного зрения, включая отслеживание позы, распознавание лиц и жестов. Код для…

Alibaba анонсирует передовую экспериментальную модель визуального мышления QVQ-72B AI

Qwen, подразделение облачных вычислений китайской Alibaba Group Ltd., представило QVQ-72B-Preview — экспериментальную модель искусственного интеллекта с открытым исходным кодом, способную просматривать изображения и делать выводы. Компания заявила, что предварительные тесты показали, что модель демонстрирует многообещающие возможности в области визуального мышления,…