Это цифровая платформа музейных предметов России, основанная на анализе структуры открытых данных и исследовании потребностей как музейных профессионалов, так и любителей материальной истории России.
Платформа использует открытые данные Министерства Культуры РФ, собранные в Госкаталоге. Сейчас в нем содержится 31 млн объектов, сгруппированных по 15 тематическим рубрикам.
Выпускники прошлого года разработали инструмент, облегчающий поиск по ним.
В этом году мы сосредоточились на одном вопросе по одной тематической рубрике.
— облегчить работу исследователям и исследовательницам,
— помочь оценить представленность и видимость культурных групп в музейных коллекциях
Этапы нашей работы
С чем столкнулись во время лемматизации?
Насколько точна наша атрибуция?
Мы вручную разметили случайную выборку из тысячи предметов нашей коллекции. Названия 7,4% предметов содержали этнонимы.
Из них:
Таким образом, precision нашего подхода – 0,94; recall – 0,86.
Что у нас получилось?