"Кто кем стал?"
миграция и образовательные траектории российских школьников
анализ административных микроданных

1
Что и как мы сделали?
Вопрос миграции и образовательных траекторий российских школьников обладает высокой социальной и научной значимостью. С одной стороны, лицам, принимающим решения, важно понимать, как в действительности работает система образования. С другой стороны, на сегодняшиний день представления исследователей об образовательных траекториях и миграции российских школьников ограничены, поскольку в большинстве своем построены на ограниченных выборках. У нас же есть уникальная возможность посмотреть на миграцию и образовательные траектории с помощью больших данных, представляющих фактически генеральную совокупность российских школьников.

2
Какие данные мы используем?
В проекте мы использовали набор данных о выпускниках российских школ и их последующих образовательных траекториях платформы «‎Инфраструктура научно-исследовательских данных»*. Это административные данные. Они получены путём объединения сведений из информационных систем Рособрнадзора и Роструда. В рамках проекта мы работали уже с агрегированными и обезличенными данными, которые, тем не менее, существенно расширяет возможности для анализа и оценок по сравнению с традиционными источниками.

Также участники проекта благодарят сервис DaData за расширение лимита запросов API к сервисам стандартизации и геокодирования

* Методологические положения по формированию наборов
1
Данные РОСОБРНАДЗОРа
Данные о выпускниках школ (9,11 классы), выпускниках и абитуриентах СПО, ВУЗов (включая бакалавриат, специалитет, магистратуру и т.д.) и программ ДПО
2
Данные ПФР
Общие сведения о трудовой и предпринимательской деятельности, как по трудовым договорам, так и ГПХ
3
Объединенные данные
Информация о выпускниках, абитуриентах образовательных учреждений, сведения о трудовой и предпринимательской деятельности

3
Этапы нашей работы
1
Определение предмета исследования
а) общая характеристика образовательных переходов
б) образовательная миграция
2
Сбор финальной таблицы
а) информация о поле, возрасте, годе начала и окончания обучения, группе укрупненной специальности, источниках финансирования
б) организация структуры данных, состоящей из последовательных переходов
3
Обогащение исходных данных
a) добавление через сервис DaData геоданных и стандартизация
б) создание справочника образовательных организаций, построение типологии школ и ВУЗов на основании названия организации, данных мониторига НИУ ВШЭ и ЦИАНО
4
Построение визуализации
а) источники финансирования для поступающих в ССУЗы и ВУЗы после 9 и 11 класса
б) региональная миграция при поступлении в ВУЗы
в) связь типа школы с последующей траекторией и миграцией
г) гражданство и образовательные траектории

4
Заполненность данных
Мы проверили качество данных о выпускниках 9 и 11 классов, сопоставив их количество с количеством выпускников согласно государственной агрегированной статистике.
  • Выпускники 9 классов
    • Соответствие официальной статистике – 88 %

    • Число выпускников в большей части регионов (64) соответствует числу выпускников от 85 до 100 %

    • Соответствие более 95 % в 8 регионах, среди которых Санкт-Петербург, Курская и Орловская области

    • Хуже всего соотносятся с данными статистики наши данные по Республикам Ингушетия (14 %), Адыгея (56 %), Дагестан (56 %), Алтай (69 %).

    1
  • Выпускники 11 классов
    • Заполненность данных в целом: 96 %

    • Большинство регионов заполнены больше чем на 95 %.

    • Несколько регионов заполнены на 80-90%: Пермский Край, Воронежская область, Чеченская республика, республика Кабардино-Балкария, Астраханская область, Республика Тыва, Калмыкия, Камчатский край, Республика Алтай, Забайкальский край

    • Несколько регионов значительно недозаполнены. Среди них: Республики Дагестан (53 %), Адыгея (52 %), Ингушетия (22%)
    2

5
Проблемы и ограничения
В процессе работы мы столкнулись с рядом проблем и ограничений, влияющих на репрезентативность наших результатов.
  • Наполненность данных
    Мы можем быть репрезентативны только в отношении периода с 2019 по 2021 гг.
    01
  • Административные данные
    Такой тип данных имеет свойственные недостатки, а именно много "битых" кодов и просто опечаток (частичное решение через DaData).
    02
  • Проблемы с заполняемостью
    Некоторые регионы не предоставляют или предоставляют лишь частичные данные (остальные соотносятся с количеством выпускников).
    03
  • Большое количество пропущенных значений
    Примерно 27% учащихся за конкретный год, имеющих отметку об окончании 9 класса, впоследствии пропадают из данных.
  • Отсутствие информации о поступлении в ведомственные образовательные учреждения
    В наших данных отсутствует все, что может быть связано ведомственными учреждениями.
    05

6
1. Региональная миграция и поступление в ВУЗы
В ходе работы с данными мы поняли, что у нас есть достаточно качественная информация о выпускниках 11 классов российских школ и о зачислении в высшие учебные заведения. Мы использовали эти данные для анализа в надежде найти закономерности и выделить ранее не известные тренды.

В качестве анализируемого параметра мы выбрали отношение числа выпускников 11 класса, поступивших в целевой регион (например, в Москву) из какого-то исходного региона, к общему числу выпускников 11 класса этого исходного региона (с учётом тех, кто принял решение не продолжать образование в вузе).

Для визуализации этих данных мы выбрали тепловую карту без контуров регионов Российской Федерации, на которой с помощью цвета и размера выделили различные направления миграционных потоков. Карта снабжена фильтрами, что позволяет гибко настраивать её под свои задачи и анализировать потоки образовательной миграции, например, только в какой-то части страны.


При первичном рассмотрении полученной визуализации мы сумели выделить следующие закономерности:

  1. Для большинства поступающих в высшие учебные заведения определяющим фактором является непосредственная близость целевого региона: больше всего людей уезжает именно в смежные субъекты федерации

  2. Потоки в Москву и Санкт-Петербург наблюдаются во всех регионах страны, но в каких-то регионах люди выбирают Санкт-Петербург гораздо чаще, чем Москву, а в каких-то наоборот

  3. Локальные (то есть не направленные в Москву и Санкт-Петербург, а ограниченные какой-то частью страны) потоки образовательной миграции чаще всего направлены к местному образовательному центру, который обычно возникает в крупном городе с относительно хорошо развитой инфраструктурой и высоким уровнем жизни

Отметим также, что в ходе анализа имеющихся данных нам не удалось выделить связи направления миграции с полом поступающего. Наблюдаемые различия в количестве зачисленных не существенны и мы не можем сделать по ним статистических выводов. Возможно, это было бы иначе при наличии качественных данных по всем регионам страны.
Санкт-Петербург выбирают больше в регионах с холодным климатом, а Москву — с тёплым.
Для сравнительного исследования миграционных потоков в Москву и Санкт-Петербург мы подготовили отдельную тепловую карту регионов России, на которой цветом выделена разность величин миграционных потоков в каждую из столиц. Из этой карты видно, что Санкт-Петербург выбирают больше в регионах с холодным климатом, а Москву — с тёплым. Также мы можем наблюдать достаточно большую долю регионов, в которых миграционные потоки в Москву и Санкт-Петербург отличаются незначительно (не более, чем на 5%).
Отдельно мы рассмотрели выпускников 11 класса всех регионов, не поступивших никуда, и выделили регионы, в которых больше всего людей не поступают в высшие учебные заведения сразу после окончания школы. Такими регионами оказались Чукотка, Республика Тыва и Алтайский край.
Анализируя образовательные миграционные потоки Российской Федерации, мы выделили основные точки притяжения выпускников 11 классов. В основном эти точки расположены в крупных областных центрах и обладают хорошей транспортной доступностью для соседних городов. Это, например, Москва, Санкт-Петербург, Екатеринбург, Новосибирск, Хабаровск, Саратов, Воронеж.
Для отдаленных регионов основные направления образовательной вузовской миграции не всегда формируются исходя из географического расстояния
Примечательно, что для отдаленных регионов, из которых ради поступления в вуз необходимо проделать большое путешествие (причём, скорее всего, на самолёте), основные направления образовательной вузовской миграции не всегда формируются исходя из географического расстояния. Так, например, из Чукотского автономного округа больше всего едут в Санкт-Петербург, а из Калининградской области наблюдаются миграционные потоки в Краснодарский край, Нижегородскую и Свердловскую область.
Больше всего люди уезжают из регионов с холодным климатом
Также мы рассмотрели регионы, которые являются лидерами по числу выпускников одиннадцатых классов, поступивших в вузы других субъектов федерации. Оказалось, что больше всего люди уезжают из регионов с холодным климатом (Чукотский Автономный Округ, Ненецкий Автономный Округ, Ямало-Ненецкий Автономный Округ) и из регионов, которые расположены близко к крупнейшим образовательным центрам (к Москве и Санкт-Петербургу). Меньше же всего уезжают выпускники из регионов с крупными университетами и достаточно высоким уровнем жизни (Нижегородская область, Республика Татарстан, Свердловская Область)
По итогам проделанного анализа мы сформулировали следующие направления для дальнейших исследований:

  1. Выделение образовательных миграционных потоков по специальностям, выявление локальных образовательных центров по конкретным направлениям подготовки (например, Судостроение, Нефтегазовое дело и Химическая технология)

  2. Возможность определения причин, по которым выпускники одиннадцатых классов выбирают то или иное учебное заведение (количество бюджетных мест, расстояние от родного города, стоимость коммерческого обучения, стоимость аренды жилья в регионах, климат, уровень жизни и т.п.)


7
2. Источники финансирования для поступающих в ССУЗы и ВУЗы после 9 и 11 класса
  • Наибольшая доля выпускников, уезжающих из своего региона ради обучения, среди тех, кто выбрал образовательную траекторию 11 класс - ВУЗ (34%) и наименьшая - среди выпускников 9-х классов, поступающих в СПО (9%)
  • Среди переезжающих ради продолжения образования выпускников больше женщин чем мужчин
  • При переезде в другой регион увеличивается доля выпускников, учащихся на местах с оплатой обучения. Например, при выборе траектории 9 класс - СПО, доля студентов, учащихся с оплатой обучения, среди переехавших на 10 % больше, чем среди оставшихся

  • Единственная траектория, которая является исключением, - это переезд после 11 класса и поступление в ВУЗ

  • Однако при переезде в крупные центры, например, в Москву или СПБ, доля учащихся в вузах платно увеличивается по сравнению с теми, кто остался учиться в своем регионе

  • Доля москвичей и петербуржцев, которые учатся платно, выше по сравнению с абитуриентами, переехавшими в Москву или СПБ

Возможные объяснения
  • Переезжающие сталкиваются с высокой конкуренцией, поэтому они реже могут претендовать на бюджетные места

  • В тех регионах, откуда переезжают, ниже уровень образования, и поэтому у абитуриентов меньше шансов поступить на бюджет

  • Абитуриенты сознательно выбирают направления с более высоким конкурсом, с небольшим количеством бюджетных мест или вовсе их отсутствием, так как это учебное заведение предлагает более высокое качество образования


8
3. Связь типа школы с последующей траекторией учащегося и миграцией
Данные позволяют нам рассмотреть, как тип школы может быть связан с последующими образовательными траекториями. Именно тип школы, в данном случае, выступает в роли главной объяснительной переменной.

Типология школ была основана на полных названиях организаций, где на основании ключевых слов были выделены 12 типов школ, а именно: общеобразовательные школы, частные школы, лицеи, гимназии, школы, с углубленным изучением, школы-интернаты, коррекционные школы, православные школы, школы для одаренных детей, школы для лиц с ограниченными возможностями, школы при исправительных учреждениях и филиалы школ.

Мы фокусируемся на выпускниках 11 класса, поскольку они наиболее полным образом представлены в наших данных. В финальную типологию школ вошли 8 типов. Школы для одаренных детей, для лиц с ограниченными возможностями, школы при исправительных учреждениях и филиалы школ были исключены по причине малого количества наблюдений в наших данных. Возможно, причина заключается в том, что из данных школ мало выпускаются из одиннадцатого класса, а большинство учащихся уходят после 9-го в учреждения СПО или покидают систему образования. Из чарта видно, что ряд типов школ в целом плохо представлены в наших данных, но и на существующем количестве наблюдений предположения подтверждаются.
Для первой визуализации мы выбрали характеристику образовательных траекторий учащихся в зависимости от типа школы. Из чарта видно, что траектории учащихся изменяются в зависимости от типа школы. Например, из школ-интернатов значительно большее количество учащихся уходит после 11 класса в учреждения СПО или покидает систему образования. То же самое характерно и для общеобразовательных школ, их выпускники значительно чаще идут по траектории через СПО или покидают систему. Тест хи-квадрат, с учетом размера выборки, показывает значимость, соответственно, можно сделать вывод, что связь между типом школы и последующей образовательной траекторией не случайна.
Поскольку большинство выпускников вне зависимости от типа школы выбирают траекторию ВО, необходимо попробовать визуализировать, как тип школы связан с поступлением в разные ВУЗы, на укрупненные специальности, а также с источниками финансирования и т.д.

Для этого в качестве целевого показателя было выбрано поступление в селективный ВУЗ, который определяется средним баллом ЕГЭ. Все ВУЗы со средним баллом выше 75 были классифицированы как селективные.

Чарт показывает, что учащиеся из частных школ чаще поступают в селективные ВУЗы, при этом выпускники из школ-интернатов и общеобразовательных школ заметно реже поступают в эти учреждения, примерно на 5-7%. Тест хи-квадрат, учитывающий размер выборки, показывает, что связь типа школы и поступления в селективный ВУЗ не случайна.

Однако, показатель селективности может быть нерепрезентативным, поэтому вузы были также разделены на четыре категории в зависимости от среднего балла ЕГЭ. Первая категория включает топовые университеты, со средним баллом выше или равным 90, вторая – престижные университеты со средним баллом выше или равным 70, третья – это средние университеты со средним баллом выше или равным 50 и четвертая категория — это условно «плохие» ВУЗы со средним баллом ниже 50. Нужно отдельно упомянуть, что наш словарь организаций включает примерно 50% ВУЗов, представленных в мониторинге высшего образования НИУ ВШЭ. И как видно, категория «плохих» университетов фактически не включена в их анализ.

Чарт открывает еще ряд интересных особенностей. Например, учащиеся частных школ значительно чаще поступают в топовые университеты, при этом различия для остальных типов школ относительно поступления в последние примерно одинаковые. Однако, эти различия переходят в категорию престижных университетов, где сохраняются как для частных, так и для общеобразовательных школ и интернатов. Результат теста хи-квадрат значим, что указывает на то, что эта связь не случайна.

Следующий сюжет, который хотелось представить, это как тип школы связан с источником финансирования учащихся. Последний включает 4 категории - это бюджетное, коммерческое, целевое обучение и обучение в пределах особой квоты.
Чарт демонстрирует интересные результаты. Например, учащиеся частных школ чаще поступают в ВУЗы на коммерческой основе, возможно с этим и связана их большая доля в топовых университетах. Можно предположить, что выпускники частных школ используют ресурсы семьи для получения качественного образования. В соответствии с ожиданиями, учащиеся школ-интернатов больше учатся по целевой или особой квоте. При этом различия для остальных категорий не столь заметны, можно выделить лишь выпускников лицеев, чаще обучающихся на бюджетных местах.

Следующим сюжетом будет связь типа школы и направлений подготовки учащихся. Из наших данных мы можем строить предположения только относительно групп укрупненных специальностей, или групп ОКСО. На рисунке выведены топ-5 самых частотных групп укрупненных специальностей для каждого типа школ.
Из результатов можно увидеть, что группы специальностей для разных типов школ во многом схожи, присутствуют отличия только для школ интернатов и частных школ, что может быть вызвано отдельными случаями устойчивых контактов с определенными вузами. Наиболее популярными группами специальностей являются: экономика и управление, юриспруденция, клиническая медицина, образование и педагогика. Если для всех типов школ картина примерно одинаковая, то выпускники частных школ чаше выбирают экономические специальности, а выпускники православных школ выбирают педагогические науки, что в целом соответствует здравому смыслу и ожиданиям.

Это был один большой сюжет относительно влияния типа школы на последующую образовательную траекторию. Теперь необходимо рассмотреть, как тип школы влияет на образовательную миграцию. Первый чарт показывает решение поступающих в ВУЗы сменить регион проживания, смена региона при переходе с одной образовательной ступени на другую кодировалась как фактор миграции. Также аналогичный чарт был построен без учета Москвы и Санкт-Петербурга, поскольку частные школы могут сконцентрированы исключительно в столицах, что и подтверждают чарты.
Чарты показывают, что для школ присутствуют незначительные отличия в количестве учащихся, совершивших образовательную миграцию для обучения в ВУЗе. Например, учащиеся общеобразовательных и частных школ реже совершеют образовательную миграцию. И если результат первых соответствуют прошлым чартам, то для частных школ миграция требует дальнейшего изучения, поскольку предположение о том, что они сконцентрированы в двух столицах не работает. Тем не менее, тест хи-квадрат с учетом размера выборки показывает значимость, указывая на то, что связь между типом школы и фактором миграции не случайна и отличается от нормальной.

Таким образом, результаты визуализации и проверки простой статистической связи показывают, что тип школы является важной объяснительной переменной для образовательных траекторий учащихся, а также образовательной миграции. Если говорить о перспективах для дальнейшего исследования, то многообещающим выглядит рассмотрение конкретных регионов, а именно выявление определенных кластеров школ, имеющих устойчивые траектории учащихся (в ВУЗы и не только).

9
4. Гражданство и образовательные траектории
Всего за 2019 - 2021 годы российские школы выдали аттестаты об образовании 3 437 иностранным ученикам: большинству - об окончании 9 классов (83%), 14% - об окончании 11 классов, а еще 3% за этот период получили оба этих аттестата.

Какое гражданство у иностранных школьников?- Разное :) За рассматриваемый период успешно получили аттестаты школьники из 31 страны мира. Наиболее крупные группы - диаспоры из стран бывшего СССР и стран Азии.
Школьники-иностранцы есть во всех регионах России, однако распределены они неравномерно. Помимо понятных регионов притяжения, таких как Москва и Санкт-Петербург, а также прилегающих к ним областей, есть и менее очевидные, например Камчатский край и Оренбургская область.
При этом мы наблюдаем неравномерное распределение между регионами школьников из разных стран исхода.

Можно выделить

  • регионы с доминированием среди иностранных учащихся отдельных стран исхода:

    • Калужская и Свердловская области - школьники из Афганистана

    • Северная Осетия - школьники из Катара

    • Крым - школьники с гражданством Украины

    • Тюменская область - Узбекистан

    • Красноярский край - Ангола
  • группы иностранных граждан, преимущественно проживающих и обучающихся в отдельных регионах России, например,

    • Москву предпочитают ученики из Бангладеш и Вьетнама

    • а Московскую область - граждане Молдовы

Школьники- иностранцы учатся более чем в 1800 разных школах в основном по 1-5 человек, но каждый пятый - 22,3% (800) окончил "диаспоральную" школу. К таким школам мы отнесли те 19 школ, которых за этот период окончили более 15 учеников-иностранцев (в среднем - 42 человека), подавляющее большинство из них были из одной и той же страны.

Ученики-выпускники данных "диаспоральных" школ существенно реже в дальнейшем продолжают свое образование по сравнению с теми иностранцами, кто окончил обычные школы (по крайней мере в статусе иностранных граждан).

В целом, существенная доля учеников-иностранцев не продолжают обучение сразу после окончания 9 класса, а если продолжают, то с равной вероятностью выбирают 11 класс и СПО.
Выпускники 9 и 11 классов 2019-2021 гг., иностранные граждане
Этот разведывательный этап исследования ставит больше вопросов, чем ответов:

  1. Как образуются миграционные хабы в конкретных локациях и как на эти вызовы реагирует система образования?

  2. Как происходит выбор образовательных траекторий школьниками без российского гражданства и их родителями? Особенно когда в регионе есть выбор между учебными заведениями с большой и небольшой долей иностранных граждан?

  3. Что представляют из себя "диаспоральные" учебные заведения и почему учеба в них снижает вероятность дальнейшей образовательной интеграции?

  4. Действительно ли дети с иностранным гражданством не продолжают обучение в России или они продолжают его уже с российским гражданством? или в другой стране?


Надеемся, у нас или у вас :) получится это выяснить.




10
Команда проекта
  • Иван Бибилов
    Администратор ШАД Яндекса, соруководитель программы, директор прикладного центра МАСТ ЕУСПб
  • Ксения Тенишева
    к.с.н., доцент факультета социологии ЕУСПБ
  • Витовт Копыток
    Куратор
  • Сергей Тихонов
    Куратор
  • Дмитрий Филиппов
    аспирант факультета социолгии ЕУСПБ
  • Ксения Ерицян
    студентка программы ПАНДАН
  • Михаил Перевозчиков
    студент программы ПАНДАН
  • Ксения Рунова
    студентка программы ПАНДАН
  • Владимир Лаврентьев
    студент программы ПАНДАН
https://pandan.eusp.org/
Made on
Tilda