Компьютерное зрение в Гараже
ПАНДАН,2024
Кураторы: Иван Бибилов и Екатерина Юшкевич
Цель:
- разработать недорогое и быстрое решение для музейной оцифровки крупноформатных объектов

Три направления работы:

"исследовательское" - сбор исследовательского "поля" для определения области применения нашей разработки
"технологическое" - разработка кода для сборки единого "полотна" изображения из отдельных кадров видео
"физическое" - поиск и создание наилучших условий для качественной съемки объекта

Направления работы
1
Полевое исследование
Найти примеры хорошего и плохого сканирования, проанализировать ситуацию в области музейной оцифровки
2
Сбор материалов
Снять в Гараже материалы для версии кода 1.0 (пробной версии кода)
3
Настройки камеры и улучшение конструкции
Найти наиболее подходящие настройки и усовершенствовать конструкцию для съемки, чтобы сканирование получилось более точным
4
Код
Протестировать и доработать существующий код или написать новый

Полевое исследование

ВОПРОС:
Как сейчас организован процесс 2d сканирования в музеях?
ОТВЕТ:
Для оцифровки "плоских" предметов используются различные виды сканеров, могут использоваться и фотоаппараты со студийным освещением. Часто используется специальное ПО для постобработки.
Наиболее распространенными объектами для оцифровки являются:
фотографии и изображения, документы и рукописи, картины и иллюстрации, карты и планы, журналы и газеты
ВОПРОС:
Какие компании предоставляют услуги сканирования для музеев?
ОТВЕТ:
Сейчас рынок очень монополистичен - практически для всех музеев и библиотек оборудование предоставила компания "Элар" (на российском рынке), есть точечные партнерства с IBM И Google
ВОПРОС:
Что нам удалось узнать из собранного поля?
ОТВЕТ:
  • Музеи чаще всего сканируют своими силами на оборудовании, позволяющем оцифровывать объекты не больше формата А4
  • Часть музеев в принципе не имеет средств для покупки оборудования
  • Рынок сканирования очень концентрирован (не более 3 компаний), а стоимость оборудования стартует от 1.5 млн (отечественное) и 40 млн (импортное)


Конструкция


Чем лучше съемка, тем проще может быть код для создания сканов
Например, с использованием профессионального освещения, камеры, штативов меньше придется заниматься светокоррекцией и работать с искажениями. Но проблема в том, что профессиональная аппаратура габаритная и дорогостоящая, и не многие люди обладают знаниями и навыками для профессиональной съемки.
Выбор наилучших настроек камеры
Настройки
Выбор наилучших настроек и их влияние на сканирование
VS
Сравнение съемки на iPhone и Samsung
Свет
Выбор наилучшего света: вспышка, общий свет, темнота, свет от ламп, кольцевая лампа
Фильтры
Есть проблемы, которые можно решить наложением фильтров
Как мы снимаем?

  • белый ватман (фон) + горизонтальные рейки + опора + моторчик, наматывающий нить, привязанную к телефону + диодная лента + уровень + телефон с выстроенными настройками камеры = сканер;
  • снимаем предмет на видео полосками, вручную перемещаем плакат от полоски к полоске;
  • при съемке важно создать условия отсутствия других источников света в помещении

Эксперименты со светом
Вспышка:
+ более четкая картинка
— создает блики

Общий свет:
+ ровный цвет с минимальными тенями, хорошо может подойти для бликующих поверхностей
— потеряна четкость и яркость изображения из-за недостатка освещения

Два софтбокса:
+ картинка лучше передает цвета, но света все еще недостаточно
— шумы на изображении

Софтбоксы и кольцевая лампа:
+ четкая, яркая, насыщенная картинка, заметны все детали и неровности
— есть тени от движения

Лампы:
+ равномерное достаточное освещение без шумов и теней
Преимущества и ограничения нашей конструкции

Особенности и сбор материалов в архиве музея Гараж

Мы два раза съездили в архив Гаража в Санкт-Петербурге и отсняли материалы для склейки.

  • первый раз - 3 плаката, телефон перемещается вручную;
  • второй раз - автоматизированное движение телефона, 4 плаката (3 сняты с сантиметровой лентой для улучшения качества склейки)

Особенности
  • Однотонное неконтрастное изображение
    Алгоритму расчета наложения сложнее определить границы по которым рассчитывается совмещение
  • Глянцевая поверхность
    Глянцевая поверхность создает блики, искажающие изображение
  • Шрифты
    На плакатах используются шрифты как машинные, так и рукописные шрифты, для распознавания которых нужны различные подходы

Код


Код |
прошлый год vs cейчас

Код прошлого года соединял полоски с помощью особых точек (метод kp2d) - в нем можно было менять параметры, ошибки и искажения сложно было систематизировать и исправлять, как следствие код работал непредсказуемо.
Мы стремимся, чтобы код этого года был основан на простой арифметике и прост для понимания => легко было отследить, на каком этапе возникает ошибка и как ее исправить;
Повороты
На искажение при склейке полос существенно влияют даже незначительные повороты кадров относительно друг друга . Поэтому важно расчитывать не только смещение по вертикали и горизонтали но и угол поворота. Последнее внутри одной полосы мы и пробовали.
Светофильтры
Добавить фильтры, которые улучшат работу кода и качество финального изображения
Предобработка
  • резкость (фильтр Лапласа)
  • насыщенность
  • контраст
Постобработка
  • темные участки (highlights)

Для одной полосы:
1'47'' съемка
0'55 склейка
2160x8800 размер полосы

Итог из 10 линий:
(плакат 40x60 примерно)
12 минут снимали
9 минут клеили
и вышло 20000x8800
20000 - это 10 раз по 2160, но часть попала на наложение)


Эксперименты с распознаванием текста

  • Работа с библиотекой pytesseract и ее настройками (разные режими параметра config)

Работа с корректировкой самого изображения и тестирование возможностей OpenCV
- увеличением контрастности, размытием/повышением резкости, переводом в чб, пр.
Coming soon...
1
Улучшение конструкции
Ускорить мотор, чтобы телефон двигался быстрее и время на сканирование сократилось
2
Распознавание текста
Сделать распознавание отсканированного материала для большинства документов
(код).
3
Условия съемки
Подумать над затемнением помещения и решить проблему неравномерного освещения
4
Код
Доработать код, подумать об автоматизации процесса склейки полос, минимизировать несостыковки при склейке
Наша команда
  • Мария Мальцева
  • Дарья Полыгалова
  • Анастасия Чернова
Made on
Tilda