Функции обнаружения взгляда

В мире искусственного интеллекта модели Vision-Language (VLM) становятся все более популярными и многофункциональными инструментами. Компания Moondream, занимающаяся разработкой передовых технологий в области компьютерного зрения и обработки естественного языка, недавно представила новую функцию, которая расширяет возможности этих моделей. Moondream анонсировала новую…

Программа для поиска фотографий с совпадающими лицами

В современном мире, где фотографии играют ключевую роль в нашей жизни, найти определенное изображение среди сотен или тысяч файлов может быть настоящим испытанием. Особенно, если речь идет о фотографиях с похожими лицами. Для решения этой задачи была создана простая и…

Интересное на GitHub #1

Распознавайте и обрабатывайте лица из Python или из командной строки с помощью самой простой в мире библиотеки распознавания лиц. Этот репозиторий является официальной реализацией OOTDiffusion. Парсилка Рутуба FacePoke -приложение для трансформации головы в реальном времени. Depth…

Измерение расстояния на фотографии с помощью Python и OpenCV

В этой статье мы расскажем, как создать инструмент для измерения расстояний на фотографии, используя язык программирования Python и библиотеку OpenCV. Для измерения расстояний на фотографии мы используем известное расстояние между зрачками человека — 6 см. Зрачки автоматически обнаруживаются с помощью…

Распознавание позы на фотографиях с помощью MediaPipe

В этой статье мы рассмотрим, как можно использовать библиотеку MediaPipe для распознавания позы человека на фотографиях. MediaPipe – это мощный инструмент, разработанный Google, который позволяет легко реализовать различные задачи компьютерного зрения, включая отслеживание позы, распознавание лиц и жестов. Код для…

Библиотека Pillow интересные лайфхаки с изображениями

Python Imaging Library (PIL) — одна из самых популярных библиотек для работы с изображениями в Python. Несмотря на то, что она была заменена более современной библиотекой Pillow, многие по привычке называют её PIL. Pillow — это форк PIL с активной…

Библиотека NumPy: Использование для обработки изображений

NumPy (“Numerical Python”) — это библиотека Python, которая активно используется для обработки изображений благодаря своим возможностям работы с массивами. Изображения могут быть представлены как массивы чисел, где каждый элемент массива соответствует интенсивности пикселя. Как NumPy используется для обработки изображений? Примеры…

Новогоднее поздравление!

Уважаемые читатели и любители искусственного интеллекта! Поздравляем вас с наступающим 2025 годом! В уходящем 2024 году мы с энтузиазмом делились с вами ценными знаниями и новостями из мира нейросетей и языка программирования Python. Наш сайт стал источником вдохновения и обучения…

NumPy – мощный инструмент для научных вычислений в Python

NumPy (Numerical Python) — это одна из самых популярных библиотек Python, предназначенная для работы с многомерными массивами данных и выполнения разнообразных математических операций. Она является основой для многих других библиотек, таких как Pandas, Matplotlib и Scikit-learn, которые активно используются в…

Alibaba анонсирует передовую экспериментальную модель визуального мышления QVQ-72B AI

Qwen, подразделение облачных вычислений китайской Alibaba Group Ltd., представило QVQ-72B-Preview — экспериментальную модель искусственного интеллекта с открытым исходным кодом, способную просматривать изображения и делать выводы. Компания заявила, что предварительные тесты показали, что модель демонстрирует многообещающие возможности в области визуального мышления,…