Этнограф для МузеоГрафа
Культурная атрибуция предметов этнографических коллекций
Что такое МузеоГраф?

Это цифровая платформа музейных предметов России, основанная на анализе структуры открытых данных и исследовании потребностей как музейных профессионалов, так и любителей материальной истории России.


Платформа использует открытые данные Министерства Культуры РФ, собранные в Госкаталоге. Сейчас в нем содержится 31 млн объектов, сгруппированных по 15 тематическим рубрикам.


Выпускники прошлого года разработали инструмент, облегчающий поиск по ним.


В этом году мы сосредоточились на одном вопросе по одной тематической рубрике.

Как среди предметов материальной культуры и быта
найти те, что связаны с определенной культурной группой?
Почему это сложно?
Задачи культурной атрибуции актуальны всегда, — и особенно обострились в последние десятилетия (и даже месяцы), — что связано с проблемами научной классификации, историческим и политическим контекстами и пр. В работе над проектом мы столкнулись не только с теоретическими, но и с техническими сложностями:
-1-
Неоднородность данных
каждый музей по-своему заполняет данные об объектах. Например, в нашей выборке описание содержит лишь половина предметов
-2-
подходы к классификации менялись с историческим контекстом, развитием научных парадигм и политических институтов
-3-
Неоднозначность рубрикации
определить, относится ли предмет из выборки к «этнографической коллекции», получается не всегда
Этнографические коллекции могли собираться в одно время и содержать предметы разных эпох, а регистрироваться музеем гораздо позже.
За время от формирования коллекции до настоящего момента неоднократно менялись (и меняются):
  • требования к точности атрибуции,
  • представления об этнической категоризации,
  • внешние названия этнической группы (экзоэтнонимы) и самоназвания (эндоэтнонимы, автоэтнонимы).
Итак, мы хотим разметить культурную атрибуцию экспонатов на основе анализа их названий и описаний, чтобы:

— облегчить работу исследователям и исследовательницам,

— помочь оценить представленность и видимость культурных групп в музейных коллекциях

Антрополог Дмитрий Верховцев объясняет выбор термина:
Помимо совместного существования этнических групп, сами группы в принципе не всегда существуют для их членов, а лишь выделяются внешними наблюдателями по «объективным» признакам.
В действительности же для конкретных людей более важной окажется родовая, клановая, племенная идентификация, региональная — или даже сословная. Музейные предметы сами по себе ничего не говорят об этом, поэтому лучше говорить не о группах, а об атрибуциях, то есть о действиях внешних акторов (коллекционеров, хранителей, исследователей).
С чего мы начинали?
3 252 979 предметов

из рубрики «Предметы прикладного искусства, быта и этнографии»
> 2 400 музеев

всех уровней

в списке на основе справочника Российского этнографического музея и других источников
По 2-му изданию справочника «Система научного описания музейного предмета: классификация, методика, терминология: справочник: [в 2 кн.] / Кн. 1: Общая методика атрибуции этнографического памятника. Классификаторы. Понятийные словари», 2017
Этноним
это название группы людей по признаку этнической общности.

Этапы нашей работы

Словарь этнонимов
Собрали таблицу с этнонимами
1
Лемматизация
Использовали MyStem, чтобы лемматизировать:
1) названия и описания предметов,
2) этнонимы.
Так мы добились совпадения результатов ошибочных лемматизаций
2
Прилагательные
К леммам этнонимов подобрали леммы соответствующих прилагательных
3
Поиск этнонимов
Списки лемм текстов и этнонимов проверялись на пересечение. Если оно было непустым, предмет атрибутировался соответствующим образом
4
Выгрузка атрибутированных предметов
Получилась таблица с новой колонкой, в которую попали не только найденные этнонимы, но и их синонимы
5
Поле «Культурная атрибуция»
Публикация стенда на сайте МузеоГрафа
6
Как мы собирали словарь этнонимов?
Это список атрибуций культурных групп на основе «Классификатора этнических общностей».

Для того, чтобы найти релевантные искомым этнонимам предметы, мы присвоили парам этнонимов два типа связей: соподчинения (partOf) и синонимии. Синонимы включают современные и устаревшие внешние названия групп (экзоэтнонимы), самоназвания (эндоэтнонимы).
Всего получилось 692 синонимические связи.

Наш список состоит из этнонимов, обозначающих группы, распределенные по 4 географическим ареалам: 1) Восточной и Северной Европы, 2) Кавказа, 3) Сибири и Дальнего Востока, 4) Средней Азии и Казахстана.

С чем столкнулись во время лемматизации?

Омонимия
выдача включает нерелевантные предметы

  • Лаки (коренные жители центральной части Нагорного Дагестана)
  • Дом (одна из восточных ветвей цыган)
  • Даны (древнегерманское племя, использовавшееся в качестве одного из синонимов для датчан)
  • Ходы (одна из чешских групп)
Ошибки лемматизации
иногда в текстах описаний встречаются сложные формы слов

  • Тарелка мелкая, фарфоровая, круглая, белая. Зеркало декорировано цветным изображением мальчика-эвенка на фоне леса (краска светло-зеленого цвета).

  • Изделие прямоугольной формы, вертикальной ориентации. По центру изображена женщина сидящая у берестяного чума. Женщина одета в национальное хантыйское платье, красного цвета, с темными полосками на груди и манжетах
Народы за пределами территории бывшей Российской Империи/СССР/РФ
мы не всё можем найти

  • Кукла изображает благородного воина, возможно, бамбанга Мадубрангта, облик которого принимают героини ряда яванских сказаний во время своих странствий, например, принцесса Чандракирана из цикла повестей о принце-панджи или Сумбадра из индонезийского переложения древнеиндийского эпоса «Махабхарата».

Насколько точна наша атрибуция?

Мы вручную разметили случайную выборку из тысячи предметов нашей коллекции. Названия 7,4% предметов содержали этнонимы.

Из них:

  • 13,6% автоматически не атрибутировались,
  • 4,1% атрибутировались частично (нашлась часть составного названия или обнаружился один из нескольких этнонимов),
  • 1,3% этнонимов были определены ошибочно.

Таким образом, precision нашего подхода – 0,94; recall – 0,86.

Что у нас получилось?

246 542 предметов

7, 6% от общего числа из рубрики «Предметы прикладного искусства, быта и этнографии»
> 2100 музеев

из > 2 400 музеев
660 этнонимов

нашлось в музейных коллекциях
Поиск по
«культурной
атрибуции»
на сайте МузеоГрафа
Мы благодарим антропологов Наталью Косяк и Дмитрия Верховцева за консультации и ответы на наши многочисленные вопросы.
Команда проекта
Анна Козлова
научная руководительница проекта
Ольга Тушканова
техническая руководительница проекта
Юлия Аматуни
фасилитаторка проекта
Наталья Косяк
научная экспертка проекта
Дмитрий Верховцев
научный эксперт проекта
Кристина Цхе
студентка ПАНДАНа 2021-2022
Анна Онэил
студентка ПАНДАНа 2021-2022
Михаил Гильман
студент ПАНДАНа 2021-2022
Наталья Барышникова
студентка ПАНДАНа 2021-2022
Проект «МузеоГраф» — один из учебных групповых проектов
программы «Прикладной анализ данных» (ПАНДАН) Европейского университета.

https://pandan.eusp.org/
Made on
Tilda