PhytoLex Geo
Наносим на карту объекты базы данных PhytoLex
PhytoLex
Этноботаническая база данных

База данных «PhytoLex. Этноботаническая база данных (XI-XVIII вв.)» содержит названия растений, зафиксированные в русской книжности XI—XVIII вв. В базу включены названия растений с контекстами употребления из оригинальных и переводных литературных произведений, лексикографических сочинений, естественнонаучной и исторической литературы, памятников деловой письменности, а также исторических словарей русского языка исследуемого периода. Представлены как исконно русские, так и заимствованные фитонимы, в том числе иноязычные транслитерированные лексемы, не получившие дальнейшего распространения в русском языке.

Цель проекта PhytoLex Geo - отображать на карте географические данные о растениях, входящих в базу проекта, и предоставить инструменты для первичного анализа этих данных.
  • На карте должны отображаться как географические точки, так и ареалы.
  • Поскольку границы и названия меняются со временем, растения должны быть привязаны к исторической карте, соответствующей периоду создания источника, из которого взяты географические данные.
  • В базу занесены географические данные трех типов: 1) место произрастания, 2) место использования, 3) место купли. Эту информацию надо сохранить при привязывании растения к карте.
  • Нужны поиск и фильтрация по названиям растений, названиям локаций, типам локаций
Задачи PhytoLex Geo:
Отобрать из базы те растения, о которых имеется географическая информация


Из 42+ тысяч вхождений лишь около 10 тысяч сопровождаются сведениями о месте купли, использования или произрастания. Они были занесены в отдельную таблицу.

К каждой локации привязать ее географические координаты
Координаты были скачаны из Википедии специально для этой цели написанным парсером на Python
Таблицу с координатами привязать к карте в FlexGIS
FlexGIS автоматически преобразует числовые координаты в точки на карте.
В случаях, когда указаны не точки, а ареалы - названия стран, исторических областей, побережий и т.п., - отобразить их в соответствующем виде.
Ареалы отрисовываются в виде полигонов в приложении QGIS и переносятся в карту с помощью предустановленного плагина.
Привязать исторические топонимы к картам соответствующего периода
Карта должна включать в себя слои, отображающие административно-территориальное деление в разные исторические периоды. Локации, упоминаемые в источниках того или иного периода, привязываются к соответствующей исторической карте.
Настроить фильтрацию
Фильтрация осуществляется по значениям в полях таблицы. Можно отфильтровать растения по локации, по типу локации (место произрастания, использования, купли), по названию, по функции (медицина, ветеринария, материал, красильная, религиозная) и пр.
Сложности, с которыми мы столкнулись
  • Наш проект строится на взаимодействии четырех платформ: Фитолекс, Википедия, QGIS и FlexGIS, у каждой из которых есть свои нюансы использования и своя логика. Наша задача - "подружить" эти платформы.
  • В Википедии в координатах даны сначала широта, потом долгота, а FlexGIS при загрузке данных требует обратного порядка: сначала долгота, потом широта. Из-за этого поначалу все точки были не на своих местах.
  • Некоторые исторические топонимы в принципе невозможно нанести на карту. Например, запись "Индия" в базе данных может означать Вест-Индию или Ост-Индию. Такие локации мы изъяли из таблицы, которая отображается на карте.
  • Хотелось бы, чтобы при изменении масштаба на карте отображалась относительная плотность локаций в каждой точке. Возможно, надо сделать тепловую карту или какую-то аналогичную.
  • Числовые координаты можно перевести лишь в точку на карте, но не в область. Ареалы нам придется рисовать вручную, принимая часто неочевидное решение о том, где провести границы. Мы ориентируемся на ближайшую по времени историческую карту.


Над проектом работали:
Кира Коваленко
Куратор проекта, Центр машинного обучения, анализа данных и статистики ЕУСПб
Александр Королев
Руководитель компании Flexatel
Анастасия Михалева
Ксения Викторова
Куратор проекта, Центр машинного обучения, анализа данных и статистики ЕУСПб
Made on
Tilda