Улично-дорожная сеть и пространственный контекст
Источник: OpenStreetMap
Проблема
Подробную геометрию улиц можно найти на сайте проекта OpenStreetMap. Также на OSM есть информация о пространственном контексте – объектах, которые находятся рядом с дорогами.

Однако, геометрия улиц на OpenStreetMap не унифицирована, а один и тот же участок улицы может состоять из разных пересекающихся отрезков. Например, участок на изображении в данных OSM состоит из 17 объектов.
Решение
Дефрагментация и нарезка улично-дорожной сети.

Небольшие объекты (на изображении отмечены красным) соединялись нами с теми из примыкающих линий, которые расположены под наиболее тупым углом (отмечены зеленым). Полученные таким образом объекты были разделены на отрезки по 50 метров (или максимально близкие к 50 метрам). Сегмент уличной сети длиной 50 метров будет для нас дальше единицей анализа.
Пространственный контекст
Для анализа требовалось создать пространственный контекст сегментов улично-дорожной сети. Для этого был использован алгоритм пространственного джойна. Объекты из разных слоев OSM присоединялись к сегментам улиц. Каждому из объектов соответствует уникальный набор тэгов OSM. Всего по четырем городам было более 300 уникальных тэгов, часть из которых были укрупнены в группы. В таблице показаны самые частые тэги для каждого города.
Далее все объекты объединялись нами в единый датафрейм, и на основе подсчета признаков формировалась разреженная матрица. Таким образом была получена информация о пространственном контексте каждого дорожного сегмента.
Made on
Tilda