Распознавайте и обрабатывайте лица из Python или из командной строки с помощью самой простой в мире библиотеки распознавания лиц.
https://github.com/ageitgey/face_recognition?tab=readme-ov-file
Этот репозиторий является официальной реализацией OOTDiffusion.
https://github.com/levihsu/OOTDiffusion
Парсилка Рутуба
https://github.com/chalyykirill/analyz-rutube?ysclid=m0y95e8gsg226239076
FacePoke -приложение для трансформации головы в реальном времени.
https://github.com/jbilcke-hf/FacePoke
Depth map – это некоторая матрица, каждый элемент которой содержит дальность до объекта. Другими словами, если имеется некотороые изображение, то матрица глубины говорит о том, какого расстояние до каждого нарисованного объекта. С помощью матрицы глубины воссоздается трехмерная модель пространства.
https://github.com/DaniilSNikulin/DepthMap?tab=readme-ov-file
Это официальный репозиторий для Pyramid Flow, эффективного для обучения метода
авторегрессионной генерации видео на основе Flow Matching . Обучаясь только на
открытых наборах данных , он может генерировать высококачественные 10-секундные видео с разрешением 768p и 24 FPS, и, естественно, поддерживает генерацию изображения в видео.
https://github.com/jy0205/Pyramid-Flow/tree/main
Minimal Flux Web UI на базе Gradio & Diffusers
https://github.com/pinokiofactory/flux-webui
AudioCraft — это библиотека PyTorch для глубокого обучения в области генерации звука. AudioCraft содержит код вывода и обучения для двух современных генеративных моделей ИИ, создающих высококачественный звук: AudioGen и MusicGen.
https://github.com/GrandaddyShmax/audiocraft_plus?tab=readme-ov-file