Метка изображение

PSHuman

PSHuman — это передовая нейросетевая модель, разработанная для высокоточного восстановления 3D-геометрии и текстуры человека из изображений. В отличие от предыдущих методов, PSHuman эффективно сочетает в себе преимущества многовидовой фотометрической стереоскопии и дифференцируемого рендеринга, что позволяет достигать непревзойденной точности и реалистичности…

Нейросети научились создавать 3D-модели по одной фотографии

Еще совсем недавно мы были поражены возможностями нейросетей, таких как Midjourney и Stable Diffusion, которые позволяли создавать невероятные изображения на основе текстовых описаний. Казалось бы, следующий логичный шаг — это нейросети, способные превращать фотографии в полноценные 3D-модели. Сегодня это уже…

Trellis: Генерация 3D-моделей из одной фотографии

Trellis — это мощная нейросеть, которая позволяет создавать 3D-модели в формате GLB всего по одной фотографии. Технология использует алгоритмы машинного обучения для реконструкции объёмных объектов, что открывает новые возможности в 3D-дизайне, геймдеве, виртуальной и дополненной реальности. С Trellis можно забыть…

Hunyuan 3D-2

Современные технологии машинного обучения и компьютерного зрения продолжают удивлять, и одной из последних инноваций стала нейросеть Hunyuan 3D-2. Она позволяет создавать реалистичные и точные 3D-модели объектов всего лишь на основе одного изображения. Давайте разберемся, как это работает и в чем…

Функции обнаружения взгляда

В мире искусственного интеллекта модели Vision-Language (VLM) становятся все более популярными и многофункциональными инструментами. Компания Moondream, занимающаяся разработкой передовых технологий в области компьютерного зрения и обработки естественного языка, недавно представила новую функцию, которая расширяет возможности этих моделей. Moondream анонсировала новую…

Программа для поиска фотографий с совпадающими лицами

В современном мире, где фотографии играют ключевую роль в нашей жизни, найти определенное изображение среди сотен или тысяч файлов может быть настоящим испытанием. Особенно, если речь идет о фотографиях с похожими лицами. Для решения этой задачи была создана простая и…

Измерение расстояния на фотографии с помощью Python и OpenCV

В этой статье мы расскажем, как создать инструмент для измерения расстояний на фотографии, используя язык программирования Python и библиотеку OpenCV. Для измерения расстояний на фотографии мы используем известное расстояние между зрачками человека — 6 см. Зрачки автоматически обнаруживаются с помощью…

Alibaba анонсирует передовую экспериментальную модель визуального мышления QVQ-72B AI

Qwen, подразделение облачных вычислений китайской Alibaba Group Ltd., представило QVQ-72B-Preview — экспериментальную модель искусственного интеллекта с открытым исходным кодом, способную просматривать изображения и делать выводы. Компания заявила, что предварительные тесты показали, что модель демонстрирует многообещающие возможности в области визуального мышления,…

Создание карты на Python и Matplotlib

В мире визуализации данных и картографии, привлекательные и информативные карты играют важную роль в представлении географических особенностей регионов. В этой статье мы создадим красочную и наглядную карту острова Сахалин, раскрывая его очарование с помощью языка программирования Python и библиотек Basemap…

Создание изображений с помощью Stable Diffusion и библиотеки Diffusers

В этой статье мы рассмотрим, как использовать библиотеку diffusers для работы с моделью Stable Diffusion, которая позволяет создавать высококачественные изображения по текстовым описаниям. Библиотека diffusers предоставляет удобный интерфейс для загрузки и использования различных моделей, включая Stable Diffusion. Импорт библиотек и…