• DOI 10.31509/2658-607x-202363-130
  • УДК 614.842; 630*96

Методы и ГИС-инструменты машинного обучения с открытым кодом в лесном транспортном моделировании

© 2023                                                           Е. С. Подольская

 

Центр по проблемам экологии и продуктивности лесов РАН,

Россия, 117997, г. Москва, ул. Профсоюзная 84/32

 

E-mail: podols_kate@mail.ru

Поступила в редакцию: 05.07.2023

После рецензирования: 22.09.2023

Принята к печати: 25.09.2023

В статье описываются методы и инструменты машинного обучения (MО) для транспортного моделирования доступа к лесным пожарам и лесным ресурсам наземными средствами для регионов России. Транспортная доступность в лесном хозяйстве является предметом изучения и улучшения. Методы MO играют важную роль в обнаружении изменений и автоматизированном сборе данных для транспортной инфраструктуры. В статье проанализированы последние научные публикации двух систем, а именно: российской электронной библиотеки «КиберЛенинка» и европейской сети для общения ученых ResearchGate. Необходимо отметить, что по состоянию на осень 2023 года количество работ по использованию МО в моделировании транспортных перемещений в лесах указанных систем было небольшим. Были изучены плагины из репозитория QGIS с открытым исходным кодом. Можно ожидать возможного увеличения количества плагинов для MО от исследователей и студентов, отдельные разработчики и небольшие исследовательские группы проявляют интерес к теме. Перспективы МО для наземного транспортного моделирования в лесном хозяйстве еще недостаточно изучены.

Ключевые слова: машинное обучение, открытый код, ГИС, лесное хозяйство, транспортное моделирование

 

Транспортное моделирование представляет собой инструмент планирования и развития регионов, изучается многими тематическими областями. Одним из результатов транспортного моделирования в лесном хозяйстве является характеристика транспортной доступности, необходимая для организации охраны, защиты и воспроизводства лесов (Подольская, 2021).

Транспортное моделирование для доступа к лесным пожарам и ресурсам леса в России сохраняет свою актуальность, так как значительная часть лесного фонда страны находится в удаленных и труднодоступных районах. В сфере транспортного моделирования в России работает ряд научных организаций, ключевыми из которых являются Всероссийский научно-исследовательский институт лесоводства и механизации лесного хозяйства (ВНИИЛМ) и Центр по проблемам экологии и продуктивности лесов Российской Академии наук (ЦЭПЛ РАН), а также ряд учебных заведений ― Мытищинский филиал МГТУ им. Н. Э. Баумана, Петрозаводский государственный университет и Санкт-Петербургский государственный лесотехнический университет имени С. М. Кирова. Как упоминалось ранее (Подольская, 2021), у каждой организации есть своя тематическая специализация в решении транспортных лесных вопросов.

Машинное обучение (МО) как технология искусственного интеллекта в настоящее время привлекает много исследователей (Шыхалиев, 2020; Михов и др., 2021), его методы показаны на рис. 1. Для лесного транспортного моделирования необходимо изучение методов и инструментов МО с целью показать современные возможности этого направления для обработки имеющихся и получаемых векторных и растровых данных, а также для выявления новых инфраструктурных закономерностей в лесном хозяйстве. Особенно перспективны методы МО для сбора данных, а также определения произошедших изменений инфраструктурного характера, что справедливо для всех направлений современных информационных технологий, включая геоинформатику.

 В лесном хозяйстве методы машинного обучения позволяют решать различные задачи, включая классификации территории по инфраструктурной нагрузке и обеспеченности объектами логистики пожаротушения (пожарно-химическими станциями, или ПХС), устанавливать зависимости между распределением лесных пожаров и объектов инфраструктуры при помощи регрессии.

Рисунок 1. Система методов машинного обучения
(перевод источника: Artificial Intelligence Tools and Platforms for GIS, 2023)

Следующие методы МО целесообразно использовать для решения задач моделирования и оценки транспортной доступности: случайные леса для районирования (Подольская и др., 2023), сверточные нейронные сети для распознавания дорог по космическим снимкам (Подольская, 2022) и последующего сравнения с наборами данных глобальных источников, например, OSM.

В последние годы публикуется много материалов по использованию методов МО в транспортных и логистических проектах, оценке природных ресурсов. Лесному транспортному моделированию пока уделяется мало внимания, хотя это направление сочетает задачи транспорта и экономики и специфику лесного хозяйства. ЦЭПЛ РАН активно применяет методы МО в различных проектах, например, для регрессионного моделирования климаторегулирующих экосистемных услуг лесов используется метод случайных лесов (Нарыкова, Плотникова, 2022; Плотникова и др., 2022).

Цель работы — изучение возможностей методов и инструментов МО для ГИС-проекта наземного транспортного моделирования в лесном хозяйстве России. Задачи работы заключаются в анализе количества опубликованных научных работ по данным проектов КиберЛенинка и ResearchGate и определении доступных ГИС-модулей (инструментов) с открытым кодом (Open Source) для лесного транспортного моделирования.

МАТЕРИАЛЫ И МЕТОДЫ

Лесное транспортное моделирование наземного доступа по дорогам общего, специального (например, лесного) и временного (например, зимники) пользования представляет собой гибридное направление транспорта и лесного хозяйства. Вследствие узкой тематической направленности заданной темы количество публикаций с использованием МО довольно ограничено.

Для анализа были использованы данные из двух разных систем (российская научная библиотека и европейская сеть для общения ученых) по поиску научных работ на русском и иностранных (преимущественно, английском) языках.

Поиск в системе научной электронной библиотеки «КиберЛенинка» в сентябре 2023 г. дал следующие результаты (рис. 2). Как показано на рис. 2, а и 2, б, работы с ключевыми словами «машинное обучение в лесном транспортном моделировании» составляют около 20% от всего числа работ по лесному хозяйству с использованием методов этого раздела искусственного интеллекта. Аналогичный результат был получен при поиске в КиберЛенинке летом 2021 г.

 (а)

 

 (б)

 

Рисунок 2. Количественные результаты поиска публикаций в электронной библиотеке «КиберЛенинка»

Поиск по ключевой фразе «Machine learning in forest transport modeling» (первые 20 страниц результатов поиска) в ResearchGate, европейской бесплатной социальной сети и средства сотрудничества ученых и исследователей, являющейся крупнейшей по количеству активных пользователей, показал две тематические группы статей с несколькими примерами в каждой. К первой группе относится применение методов МО в транспортных проектах, где авторы отмечают недостаточное использование преимуществ МО (Behrooz, Hayeri, 2022; и др.). В этой же группе появляются работы по использованию методов МО в экономических оценках стоимости строительства дорог (Jaafari et al., 2021). Во второй ― работы по распознаванию количественных и качественных характеристик леса на космических снимках (Михайлов, Сай, 2017) и природным ресурсам. В качестве учебного примера отметим, что в Санкт-Петербургском государственном университете в 2019 г. была защищена магистерская выпускная квалификационная работа по методам МО для оценки и картографирования ресурсов леса (Сныткина, 2020). По выполненному обзору можно утверждать, что самыми популярными методами МО для лесного хозяйства продолжают оставаться k-NN, SVM и варианты деревьев решений.

К актуальным задачам МО в лесном транспортном моделировании наземного доступа можно отнести наиболее популярные в картографии и геоинформатике (Kolesnikov et al., 2018):

  • классификация ― отнесение объекта к одной из категорий на основании его признаков (Михайлов, Сай, 2017);
  • регрессия ― прогнозирование одного или нескольких количественных признаков объекта на основании набора прочих его признаков (Нарыкова, Плотникова, 2022; Плотникова и др., 2022);
  • кластеризация ― разбиение множества объектов на группы на основании признаков этих объектов (пример модуля ― https://gis-lab.info/qa/qgis-attr-based-clust.html).

Опыт группы по решению транспортной задачи Лабораторией мониторинга лесных экосистем ЦЭПЛ РАН включает моделирование наземного доступа специальной пожарной техники по дорогам разных классов с использованием исследовательской регрессии для данных по лесным пожарам и инфраструктуре. Группа использует разнообразные программные средства, делая акцент на Open Source инструментах, среди которых лидирующее значение имеет ГИС-пакет с открытым кодом QGIS. Список плагинов для решения задач МО из репозитория инструментов (https://plugins.qgis.org/plugins/tags/machine-learning/) показан на рис. 3. Список инструментов, доступных в мае-октябре 2022 г. (Cluster Points, Deep Learning Datasets Maker, EnMap-Box3 и Mapflow), расширился и составляет на сентябрь 2023 г. 6 позиций (рис. 3). Все указанные плагины были выложены в репозиторий начиная с 2020 г.

Рисунок 3. Плагины QGIS с тэгом «machine learning»

Рисунок 3. Плагины QGIS с тэгом «machine learning»

Входными данными для плагинов для продолжения исследования будут цифровые инфраструктурные наборы по населенным пунктам и дорожной сети проекта OSM, архив лесных пожаров, детектированных системой MODIS, маршруты наземного доступа в леса, которые строятся по методике и реализованной в Лаборатории мониторинга лесных экосистем ЦЭПЛ РАН ГИС-технологии.

ЗАКЛЮЧЕНИЕ

В статье показано современное состояние использования методов МО в решении задач лесного хозяйства и лесном транспортном моделировании c перечислением российских организаций, работающих по соответствующей тематике, и научных работ, доступных в электронной библиотеке «КиберЛенинка» и сети ResearchGate. Выполнен краткий обзор плагинов Open Source QGIS для МО в лесном транспортном моделировании.

В качестве перспективы можно предположить, что количество плагинов будет медленно увеличиваться, их функциональные возможности станут более широкими. Ниша ГИС-инструментов транспортного моделирования в лесном хозяйстве, которые можно отнести к направлению использования методов МО, продолжает оставаться достаточно узкой ввиду, во-первых, изначально гибридной специфики темы и, во-вторых, определенной универсальности имеющихся инструментов репозитория плагинов QGIS. Имеющийся опыт изучения истории и результатов разработки плагинов позволяет также предположить, что большая часть таких тематических транспортно-лесных инструментов будут частями исследовательских или учебных квалификационных работ. Для машинного обучения будут активно использоваться библиотеки разработки на Python, например Keras, Scikit-learn, PyTorch и NumPy, относящиеся к Open Source-решениям и представляющие интерес для геоинформационных проектов.

Методы МО применительно к транспортному моделированию наземного доступа планируется применить для оценок и сценариев пространственного расположения ПХС в пожароопасных регионах России.

ФИНАНСИРОВАНИЕ

Работа выполнена в рамках темы Государственного задания «Методические подходы к оценке структурной организации и функционирования лесных экосистем», регистрационный номер № 121121600118-8.

СПИСОК ЛИТЕРАТУРЫ

Михайлов Е. В., Сай С. В. Выделение леса на космических снимках с помощью методов машинного обучения // Доклады ТУСУРа. 2017. Т. 20. № 1. С. 89–92. DOI: 10.21293/1818-0442-2017-20-1-89-92.

Михов О. М., Шаталова Н. В., Бородина О. В., Васильев Ю. И. Применение технологий машинного обучения для Drone Network в логистике и портовой деятельности России // Морские интеллектуальные технологии. 2021. № 4. Т. 1. С. 149–157.

Нарыкова А. Н., Плотникова А. С. Подготовка предикторов для моделирования климаторегулирующих экосистемных услуг лесов на региональном уровне с помощью Google Earth Engine // Научные основы устойчивого управления лесами: Материалы Всероссийской научной конференции с международным участием, посвященной 30-летию ЦЭПЛ РАН. М.: ЦЭПЛ РАН, 2022. С. 182–184.

Плотникова А. С., Савин М. С., Лукина Н. В., Тебенькова Д. Н., Колычева А. А., Чумаченко С. И., Шанин В. Н. Картографирование климаторегулирующих экосистемных услуг лесов на локальном уровне // Научные основы устойчивого управления лесами: Материалы Всероссийской научной конференции с международным участием, посвященной 30-летию ЦЭПЛ РАН. М.: ЦЭПЛ РАН, 2022. С. 190–192.

Подольская Е. С. Обзор опыта решения задач транспортного моделирования в лесном хозяйстве // Вопросы лесной науки. T. 4. № 4. 2021. С. 1–32. DOI: 10.31509/2658-607x-2021-44–92.

Подольская Е. С. Использование данных дистанционного зондирования Земли из космоса для распознавания изображения дорог в лесном хозяйстве // Вопросы лесной науки. 2022. T. 5. № 4. С. 1–21. DOI 10.31509/2658-607x-202252-115

Подольская Е. С., Ершов Д. В., Ковганко К. А. Инфраструктурное зонирование территории для определения связей с лесными пожарами (на примере Красноярского края, Россия) // Леса России: политика, промышленность, наука, образование: материалы VIII Всероссийской научно-технической конференции 24–26 мая 2023 г. / Под. ред. А. А. Добровольского. Санкт-Петербург: СПбГЛТУ, 2023. C. 330–333.

Сныткина Д. А. Применение методов машинного обучения при оценке и картографировании природных ресурсов: Магистерская ВКР (спец. 05.04.03). Санкт-Петербург: СПбГУ, 2020. 92 с.

Шыхалиев Р. Г. Исследование современного состояния применения машинного обучения в нефтегазовой отрасли // İnformasiya texnologiyaları problemləri. 2020. № 2. С. 52–60. DOI: 10.25045/jpit.v11.i2.05.

Behrooz H., Hayeri Y. M. Machine learning applications in surface transportation systems: a literature review // Applied Sciences. 2022. Vol. 12. Article ID: 9156.

CP-04-Artificial intelligence tools and platforms for GIS, 2023. URL: https://kurl.ru/TtgVM (дата обращения 10 августа 2023 г.).

Jaafari A., Pazhouhan I., Bettinger P. Machine learning modeling of forest road construction costs // Forests. 2021. Vol. 12. Article ID: 1169.

Kolesnikov A. A., Kikin P. M., Komissarova E. V., Kasyanova E. L. Use of machine learning technologies in decision of geoinformational tasks // Proceedings of the International conference “InterCarto. InterGIS”. 2018. Vol. 24 (2). P. 371–384.

URL: https://cyberleninka.ru/ (дата обращения 10 августа 2023 г.).

URL: https://www.researchgate.net/ (дата обращения 10 августа 2023 г.).

Рецензент: к. т. н., Хвостиков С. А.