16+
DOI: 10.18413/2409-1634-2021-7-1-0-8

Geodata mining – технология интеллектуального анализа пространственных данных 

Aннотация

В статье исследованы особенности обработки пространственных данных и их роль в формировании стратегических ориентиров планирования открытия компании. Предложено использовать термин GeoData mining в геомаркетинге, как сбор извлечения пространственных данных; показаны приниципальные различия научной методологии GeoData mining и Data mining. Обобщены укрупненные блоки пространственной информации при создании банка данных GeoData mining. На примере открытия магазинов рыбалки в г. Белгороде раскрыты этапы преобразования информации и потенциальные географические территории для пула объектов недвижимости.


Введение

Стратегическое маркетинговое управление – один из основных инструментов изучения и анализа процессов, происходящих в маркетинговой среде. Процессы, как правило, сопряжены с обработкой большого количества разнородных данных, получаемых в результате анкетировании и опросов; в результате изучения динамики каких-либо показателей исследуемого процесса или явления; в результате анализа документов [Шилина М.Г., Левченко В.Ю., 2014]. Совершенствование инструментов сбора информации приводит к тому, что объем данных постоянно увеличивается [Качалов Д.Л., Мишустин А.В., Фархадов М.П., 2017]. Неоднородную, зачастую неструктурированную, быстро поступающую информацию обработать традиционными методами математической статистики становится затруднительно. Необходимо внедрять в практику геомаркетинговых исследований новые технологии обработки и анализа больших массивов разнородных пространственных данных. Систематизируем требования, предъявляемые к этим геомаркетинговым
технологиям [Шайтура С.В., 2015;
Tsvetkov V.Ya., 2013, 2014]:

  • понятность в тиражировании и апробации маркетологами, которые не являются специалистами в области математического моделирования, искусственного интеллекта и программирования;
  • возможность обработки больших объемов как структурированных, так и слабо структурированных и неструктурированных данных, представленных в разных шкалах;
  • возможность поиска в массиве первичной информации, новых выводов и закономерностей, поддающихся интерпретации и имеющих практическое значение для решения задачи.

Они позволят повысить как эффективность обработки информации, полученной в результате исследований, так и научную обоснованность получаемых выводов и рекомендаций [Фомина Е.В., 2020]. Таким образом, внедрение современных методов обработки пространственных данных в геомаркетинговую практику является актуальной задачей.

Цель работы исследование узких мест и потенциальных перспектив геомаркетинговых решений стратегической обработки пространственных данных, получаемых в результате интеллектуального анализа GeoData mining, возможность тиражирования на практическом примере.

До 2000-х годов проблема академического исследования пространственных данных имела фрагментарный характер, бизнес-структуры и теоретических исследования не нуждались в методологическом исследовании. В 2008 г. Клиффорд Линч впервые ввел понятие «большие данные» в научном журнале «Nature», в этот период именно терминологическое определение пространственных данных и Big Data представлялось как синонимы. Практическое применение и тиражирование пространственных данных приходится на 2010 г. в научных публикациях Марц Натан и Уоррен Джеймс [Марц Н., Уоррен Д., 2017].

Научное исследование проведено с использованием следующих методов:

  • прогноз, построение математических моделей (инструменты реализации – дерево решений, построение алгоритмов, математической логики, искусственный интеллект);
  • статистические, математические методы (корреляционно-регрессионый анализ, анализ временных рядов, компаративный анализ).

Основная часть

Анализ пространственных данных в области геомаркетинга – это обобщенное понятие совокупности технологий (извлечение ранее неизвестных, доступных, полезных информационных источников), для принятия стратегических решений в области бизнес-структур. В научных источниках наиболее встречаемым является понятие Data mining [Berry M.J., Linoff G., 1997], в дальнейшем это сужает проблемное поле исследования. В области геомаркетинга, как инструменте стратегического планирования, авторами предложено использовать термин GeoData mining, позволяющий значительно расширить горизонты научного поля. Среди основных интеллектуально-математических инструментов GeoData mining выделим:

  • метод анализа;
  • коррелятивный анализ – поиск скрытых зависимостей и связей, выстраивание новых функций, показателей;
  • импакт-анализ;
  • факторный анализ – группировка пространственных данных по блокам: маркетинговые, географические, доходность бизнеса.

Под пространственными данными в GeoData mining понимается информация об объектах, информационной платформой выступают геоданные (ГИС, маркетинговые исследования, Wi-Fi радары и пр.) [Омельченко А.С., 2006; Цветков В.Я., Домницкая Э.В., 2008]. Дополнительными информационными каналами являются результаты экономического, географического, маркетингового, отраслевого анализа. Пространственные данные GeoData Mining – это комплекс данных, обобщенных информационным ресурсом [Савиных В.П., Цветков В.Я., 2014]. Обратим внимание, что в области геомаркетинга пространственные данные связаны с процессом извлечения информации (вырезка пространственно ограниченной части объекта исследования). GeoData mining − это процесс автоматического поиска больших объемов данных для заданных моделей. В процессах поиска GeoData mining использует вычислительные методы, распознавание образов и методы искусственного интеллекта. Именно поэтому технологию GeoData mining в геомаркетинге относят к технологиям извлечения знаний и называют технологией интеллектуального анализа. Технология Data mining данных может быть определена как «нетривиальный извлечения явных, ранее неизвестных и потенциально полезной информации из данных» [Frawley W., Piatetsky-Shapiro G., Matheus C., 1992] и «наука извлечения полезной информации из больших массивов данных или базы данных» [Hand D., Mannila H., Smyth P., 2001].  Хотя этот термин обычно используется по отношению к анализу данных, тем не менее, большую роль в нем играет искусственный интеллект, что дает основание разграничивать сбор пространственных данных и GeoData mining. Определим различия в сфере применения  Data mining и GeoData mining:

  • технологические условия: в Data mining при добыче данных итогом является получение новой формы и технологии данных, в GeoData mining – применение и использование инструмента интеллектуального анализа (получение иных форм пространственных знаний);
  • структурные условия: в Data Mining – это совокупность общего числа всех данных, в GeoData mining – это совокупность пространственных данных маркеингового и географического характера (передвижение клиентов, загруженность транспортных магистралей, число объектов инфраструктуры и пр.);
  • отраслевые условия: в Data Mining – описание любой предметной области (биология, медицина, физика и пр.), в GeoData mining – конкретизация пространственных явлений, процессов и отношений, совокупность категорий «место», время», «тема». Категория «место» с точки зрения географических особенностей является устойчивой, постоянной, а  «время» и «тема» – перманентными, в зависимости от объекта научного исследований. Глобальная устойчивость характеристики «место» и послужила основой интеграции других видов информации на этой основе.

Обобщим структурные блоки пространственной информации, используемой при проведении геомаркетинговых исследований в таблице.

Представим этапы получения и преобразования пространственной информации в GeoData Mining (рис. 1):

  • получение контакта с информационным источником и сбор первичных данных;
  • обработка данных;
  • ранжирование, классификация данных;
  • наглядное представление пространственных данных на географической карте.
  • Апробацию этапов представим на примере магазинов рыбалки, прланируемых к открытию на территории г. Белгорода. На первом этапе авторами был установлен источник первичной информации, занимающийся данным бизнесом в г. Белгороде и г. Новый Оскол с опытом более 20 лет. Среди первичных данных обработаны следующие результаты:

    Основными потребителями являются мужчины в возрасте 20-80 лет, женщины в возрасте 20-50 лет  с частотой покупки 1 раз в неделю. Площадь помещения для отрытия магазина рыбалки должна быть не менее 20 м2, ассортиментный ряд не менее 10 000 позиций. Число магазинов рыбалки в г. Белгороде составляет 33 (рис. 2). Источником является информация из Яндекс-карт.

  • Первичные данные, хранятся, как правило, в необработанным виде, удобном для пользования авторами. Наиболее важной определена следующая геопространственная информация, котрая в дальнейшем является основанием для оптимального местоположения объектов бизнеса:

  • ключевыми географическими факторами выступают – наличие парковки, большая часть клиентов добирается на автомобиле, центр города не всегда может обеспечить сочетание данных факторов. Следовательно, территориальные границы для открытия магазина рыбалки смещены в районы второй и третьей линии города (с более низкой арендной ставкой);
  • клиенты готовы преодолевать расстояния до магазинов рыбалки при условии, что сервис и качество обслуживания представлены на достаточно высоком уровне. Основным фактором соблюдения данного условия является наличие компетентного продавца-консультанта (мужчина).

  • Сообщения о дорожном движении и транспортной ситуации в районе исследования сохраняются в базе данных [Ляпин А.М., 2018]. На рис. 3 представлены потенциальные географические районы г. Белгорода (Левобережье, Крейда, Савино, Салют) характеризующиеся более низкой арендной ставкой и готовностью клиентов преодолевать расстояние до торгового объекта (площадь 20 м2).

  •  

    GeoData Mining является мультидисциплинарной областью, встраивающийся и развивающейся на базе достижений прикладной статистики, распознавания образов, маркетинговых исследований, методов искусственного интеллекта, теории баз данных и др.
  • Заключение

  • Современные вызовы внешней и внутренней среды компании формирую принципиально новые инструменты для обработки пространственных данных. Перспективным элементом в выборе оптимального местоположения явлется использование обработки информации GeoData mining. GeoData mining позволяет с использованием технологии интеллектуального анализа (сочетание группы инструментов – импакт-анализ, корреляционный анализ, факторный анализ) более качественно обрабатывать группы маркетинговых и бизнес-блоков. Методологическими предпосылками внедрения  GeoData mining выступают возможность извлечения и обработки большого массива пространственных данных, апробация и тираживания консалтинговыми команиями, качественная интерпретация превичных данных.  Структурными блоками аналитической информации создания банка пространственных данных GeoData Mining являются: данные маркетинговых исследований, обработка первичных маркетинговых данных, результаты геомаркетинговых исследований, маркетинговая разведка. Результаты апробация этапов преобразования пространственных данных GeoData mining представлены на примере магазинов рыбалки г. Белгорода (сегментирование клиентов, наличие траспортных средств передвижения, обустроенность инфраструктурных, городских объектов), как интеллектуальных анализ перспективных районов для открытия объектов торговли [Герасименко, О.А., Авилова, Ж.Н., 2016, Тхориков, Б.А., Ломовцева, О.А., Герасименко, О.А., Саблина, О.М., Титова, И.Н., 2020, Tkhorikov B.A., 2011,
    Тхориков Б.А., 2012].

Список литературы

  1. Герасименко О.А., Авилова Ж.Н., 2016. Ключевые бизнес-компетенции как экономическая категория. Вестн. Белгород. гос. технол. ун-та им. В. Г. Шухова, 2016, № 6: 273-277.
  2. Качалов Д.Л., Мишустин А.В., Фархадов М.П., 2017. Современные методы обработки больших данных в крупномасштабных системах. Математические модели современных экономических процессов, методы анализа и синтеза экономических механизмов. Актуальные проблемы и перспективы менеджмента организаций в России: материалы XI Всерос. науч.-практ. конф.  Самар. науч. центр РАН. Самара, 2017: 65-71.
  3. Ляпин А.М., 2018. Методика сбора и интеллектуального анализа коротких сообщений из сети интернет с целью выявления внештатных ситуаций в дорожно-транспортной инфраструктуре.  Известия высших учебных заведений. Поволжский регион. Технические науки, 2018, № 2 (46): 27-36.
  4. Марц Н., Уоррен Д., 2017. Большие данные. Принципы и практика построения масштабируемых систем обработки данных в реальном времени. М.: Вильямс, 2017: 68.
  5. Омельченко А.С., 2006. Геоданные как инновационный ресурс. Качество, инновации, образование, 2006, № 1.:12-14.
  6. Савиных В.П., Цветков В.Я., 2014. Геоданные как системный информационный ресурс. Вестник Российской Академии Наук. Том 84. № 9: 826-829. DOI: 10.7868/S0869587314090278.
  7. Тхориков Б.А., Ломовцева О.А., Герасименко О.А., Саблина О.М., Титова, И.Н., 2020. Геомаркетинг – новый коннцепт или прикладной инструмент бизнеса?  Вестн. Томск. гос. ун-та. Экономика. № 49. С. 199-213.
  8. Тхориков Б.А., 2012. Проектное управление в ЛПУ: опыт Белгородской области. Здравоохранение. № 7. С.28-32.
  9. Фомина Е.В., 2020. Применение аппарата нейронных сетей для анализа результатов анкетирования.  Вестник ПНИПУ. Социально-экономические науки, 2020, № 2: 99-110.
  10. Цветков В.Я., Домницкая Э.В., 2008. Геоданные как основа цифрового моделирования. Современные наукоёмкие технологии, 2008, № 4: 100-101.
  11. Шайтура, С.В. 2015. Интеллектуальный анализ геоданных. Перспективы науки и образования. № 6 (18): 24-30.
  12. Шилина, М.Г., Левченко, В.Ю. 2014. BIG DATA, OPEN DATA, LINKED DATA, метаданные в PR: актуальные модели трансформации теории и практики. Медиаскоп. № 1: 16.
  13. Berry M.J., Linoff G., (1997). Data mining techniques: for marketing, sales, and customer support. John Wiley & Sons, Inc., 1997.
  14. Frawley W., Piatetsky-Shapiro G., Matheus C., (1992). Knowledge Discovery in Databases: An Overview. AI Magazine. Fall, 1992: 213-228.
  15. Hand D., Mannila H., Smyth P., (2001). Principles of Data Mining. MIT Press, Cambridge, MA., 2001.
  16. Tkhorikov, B.A., 2011.Technology of municipal public heath service assessment. European Researcher. №. 11 (14). P.1554-1556.
  17. Tsvetkov V.Ya., (2014). Information field. Life Science Journal. № 11 (5): 551-554.
  18. Tsvetkov V.Ya., (2013). Information interaction as a Mechanism of Semantic Gap Elimination. European Researcher. Vol. 45, № 41: 782-786.