ПОЛИТЕХНИЧЕСКИЙ ВЕСТНИК
Серия Интелект, Инновации, Инвестиции

ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ

Ш.Ф. Мухамедова, Х.Б. Шарипов

Аннотация: 

В данной статье предлагается новаторский метод семантической аугментации данных, основанный на использовании вероятностных диффузионных моделей. Разработан программный модуль на базе фреймворка Django и библиотеки Diffusers, реализующий технику Image-to-Image с использованием модели Stable Diffusion v1.5. Ключевой особенностью метода является математическая оптимизация параметра «strength» (сила трансформации) и использование марковских цепей для генерации фотореалистичных вариаций лиц студентов без потери их биометрической идентичности. Экспериментальная проверка, проведенная на наборе данных из 500 студентов, показала высокую эффективность предложенного подхода. Обучение модели ResNet-50 на основе данных позволило повысить точность распознавания в условиях низкой освещенности с 72.3% до 89.4%. Исследование подтверждает, что генеративный искусственный интеллект способен эффективно решать проблему нехватки данных, обеспечивая экономию ресурсов на сбор реальных фотографий и повышая общую устойчивость систем безопасности.
Ключевые слова: компьютерное зрение, Stable Diffusion, аугментация данных, распознавание лиц, цепь Маркова, скрытое пространство, искусственный интеллект.