Уточнения пространственной
структуры модели местности с использованием
интеллектуальной технологии[1]
А.Е. Янковская,
зав. лаб. интеллект. систем,
д.т.н., проф., ayyankov@gmail.com
ТГУ, ТГАСУ, г.Томск
М.Е. Семенов,
к.ф.-м.н., доц., sme@tpu.ru
ТПУ, ТГАСУ, г.Томск
С.В. Китлер,
м.н.с., kitsv@sibmail.com
ТГАСУ, г.Томск
Исследование направлено на
расширение возможностей ГИС-технологий путем применения методов искусственного
интеллекта. Применение методов искусственного интеллекта существенно расширит возможности
и область применения ГИС при решении задач регионального развития и управления.
Для уточнения структуры и использования виртуальной модели местности предложены
методы тестового распознавания образов. Интеллектуальное расширение ГИС предложено
осуществить на основе интеллектуального инструментального средства ИМСЛОГ.
The investigation aimed at enhancing the capacity of GIS technology with
used of artificial intelligence methods. Application of artificial intelligence
methods will significantly increase possibilities and application domains of
GIS for decision problems of regional development and management. The methods
of test pattern recognition for clarification of the structure and use of virtual
terrain model are proposed. Software realization for intelligent extension of
GIS is requested to implement based on intelligent instrumental software
IMSLOG.
В последнее время геоинформационные
системы (ГИС) привлекают внимание многих исследователей из разных предметных областей,
таких как экология, управление, прогнозирование [1, 2], математика [3], компьютерные
науки [4], медицина [5], строительство и кадастр [6]. Типовая ГИС является
аппаратно-программным комплексом, который обеспечивает сбор, передачу,
обработку, хранение и визуальное отображение различной картографической информации,
а также текущей информации о пространственных процессах в целях ее наглядного
представления.
Включение в ГИС информационных
технологий, позволяющих реализовывать функции экспертных систем, систем
принятия решений, основанных на базах знаний: позволит эффективно организовать
хранение и использование специальных знаний, создать возможности для уточнения
и получения новых знаний, сопоставления между собой конечных и промежуточных
выводов. Особенно это важно при оперировании с нечеткими множествами и
нечеткими знаниями (с нечеткими тематическими и пространственными определениями)
при согласовании тематических слоев виртуальной модели местности (ВММ).
В отличие от традиционных ГИС
[2, 4] в данной статье предлагается ГИС,
базируемая на тестовых методах распознавания образов [2, 7-11]. Развитие
математического аппарата выявления различного рода закономерностей, включая построение
безызбыточных безусловных диагностических тестов (ББДТ) [10, 11] и смешанных
диагностических тестов (СДТ) [8, 9], позволит провести интеллектуальное
расширение ГИС [2] и эффективно решать задач регионального развития.
Актуальность развития ГИС,
базирующихся на интеллектуальных технологиях и тестовых методах искусственного
интеллекта (ИИ), не вызывает сомнений [2].
Предлагается реализовать
интеллектуальное расширение с помощью интеллектуальной распознающей системы, сконструированной
на основе инструментального интеллектуального средства (ИИС) ИМСЛОГ [12].
Постановка задачи. Необходимо
разработать математическую модель данных и знаний для уточнения пространственной
структуры местности с использованием методов распознавания образов, основанных
на диагностических тестах (ДТ).
Для уточнения структуры и использования
ВММ с применением интеллектуальной технологии предлагается использовать методы тестового
распознавания образов [7] и матричную модель представления данных и знаний [8-
11].
Для дальнейшего изложения
воспользуемся понятиями и определениями, введёнными в [7-11].
Для представления данных и
знаний при построении k-значных ДТ используется
матричная модель [10, 11] (рис. 1), включающая целочисленную матрицу
описаний (Q), задающую описание объектов в пространстве характеристических
признаков z1,z2,...,zm
и целочисленную матрицу различений (R), задающую разбиение объектов на
классы эквивалентности по каждому механизму классификации. Если значение признака
несущественно для объекта, то данный факт отмечается прочерком ("–")
в соответствующем элементе матрицы Q. Для каждого признака zj (jÎ{1, 2,…m}) задаётся интервал изменения его значений.
Множество всех
неповторяющихся строк матрицы R сопоставлено множеству выделенных
образов, представленных одностолбцовой матрицей R', элементами которой являются
номера образов.
рис. 1. Матричное представление данных и знаний
Данная
модель позволяет представлять не только данные, но и знания экспертов,
поскольку одной строкой матрицы Q можно задавать в интервальной
форме подмножество объектов, для которых характерны одни и те же итоговые
решения, задаваемые соответствующими строками матрицы R.
Диагностическим тестом [7]
называется совокупность признаков, различающих любые пары объектов, принадлежащих
разным образам.
Диагностический тест
называется безызбыточным (тупиковым [7]), если он содержит безызбыточное
количество признаков.
Безызбыточный безусловный
диагностический тест характеризуется одновременным предъявлением всех входящих
в него признаков исследуемого объекта при принятии решений. При условном проверяющем
(диагностическом) тесте признаки предъявляются последовательно в зависимости от
значений предыдущих признаков [8, 9].
Смешанный диагностический
тест представляют собой оптимальное сочетание безусловных и условных составляющих
[8]. Обоснованность, эффективность и перспективность применения смешанных тестов
связаны с возможностью последовательного извлечения информации об исследуемом
объекте для условной составляющей смешанного теста, с преимуществами
использования безусловных составляющих тестов при построении решающих правил [16],
а также с целесообразностью применения смешанных тестов при организации
интеллектуального интерфейса.
Под закономерностями [11] понимаются подмножества признаков с
определенными легко интерпретируемыми свойствами, влияющими на различимость
объектов из разных образов, устойчиво наблюдаемыми для объектов из обучающей
выборки и проявляющимися на других объектах той же природы, а также весовые
коэффициенты признаков, характеризующие их индивидуальный вклад в различимость
объектов и информационный вес, определяемый в отличие от на подмножестве
тестов, используемых для принятия итогового решения.
К
упомянутым подмножествам будем относить константные (принимающие одно и то же
значение для всех образов), устойчивые (константные внутри образа, но не являющиеся
константными), неинформативные (не различающие ни одной пары объектов),
альтернативные (в смысле включения в ДТ), зависимые (в смысле включения подмножеств
различимых пар объектов), несущественные (не входящие ни в один безызбыточный
ДТ), обязательные (входящие во все безызбыточные ДТ), псевдообязательные (не являющиеся
обязательными, но входящие во все ББДТ, участвующие в принятии решений)
признаки, а также все минимальные и все (либо часть при большом признаковом
пространстве) безызбыточные различающие подмножества признаков, являющиеся, по
сути, соответственно минимальными и безызбыточными ДТ. Весовые
коэффициенты характеристических признаков также
включены в число закономерностей [11],
как и информационный вес характеристических признаков.
Для
выявления различного рода закономерностей при построении ББДТ применяется
процедура построения матрицы импликаций (U) [10].
Матрица U представляет собой целочисленную
матрицу, столбцы которой сопоставлены столбцам матрицы Q,
а строки – всевозможным парам объектов v,
l из разных образов a, b
соответственно (классов при фиксированном механизме классификации); vÎ{1,2,...,σ(Qa)}, lÎ{1,2,...,σ(Qb)},
где σ(Qa) (σ(Qb)) – количество строк в
подматрице Qa (Qb) матрицы Q.
Строка Ui матрицы
U
представляет собой значение целочисленной вектор-функции различения, j - я (jÎ{1,2,...,m}) компонента ui,j
которой вычисляется по формуле:
,
где () – значение признака zj
для объекта v (l), а iÎ{1,2,...,s} –
множество строк матрицы U.
Будем говорить, что строка Ud
поглощает строку Uρ если
.
Безызбыточной матрицей импликаций назовем
такую матрицу U', в которой отсутствуют поглощающие строки [10, 11].
Приведем
неформальное описание алгоритма построения СДТ, используемого для уточнения
структуры слоев виртуальной модели местности. Предполагается, что объекты (виртуальная
модель местности) по итогам проведения тестирования будут разбиты на два образа
(группы): соответствующих и несоответствующих требованиям иерархической
организации слоев.
Для
анализируемого списка объектов высококвалифицированный специалист (эксперт,
программный агент) должен разбить множество тематических слоев каждого объекта на
два подмножества. Первое подмножество включает безусловную составляющую
смешанного теста, т.е. тематические слои модели местности (групповые
характеристические признаки), которые будут предъявлены в произвольном порядке
следования. Перед началом работы алгоритма необходимо указать режим
использования СДТ (обучение, контроль, тестирование). Далее для каждой объекта
необходимо выполнить следующий алгоритм формирования очередного СДТ:
1.
Присвоить каждому признаку (каждой компоненте безусловной и условной
составляющих СДТ) вес в интервале от 0 до 1.
2.
Сгенерировать безусловную составляющую очередного СДТ.
3.
Найти вес безусловной составляющей СДТ [9], равный сумме весов всех компонент
безусловной составляющей СДТ.
4.
Вычислить набранную объектом сумму весов ответов по компонентам безусловной
составляющей СДТ.
5.
Сравнить сумму, набранную в пункте 4 с наперед заданной величиной p. Если набранная сумма более
величины p, то перейти к пункту 8.
6.
В случае обучения, если объект не набрал требуемую сумму весов ответов, перейти
к пункту 7. В случае тестирования принять решение о неудовлетворительной оценке
результата и выдать рекомендацию на повторное прохождение обучения. Перейти к
пункту 15.
7.
Выдать рекомендации эксперту по итогу прохождения безусловной составляющей СДТ.
Перейти к пункту 2.
8.
Сгенерировать первую условную составляющую СДТ.
9.
Предъявить объекту очередную условную составляющую рассматриваемого СДТ.
10.
Увеличить сумму весов ответов на вес полученного ответа по очередной условной
составляющей СДТ.
11.
Проверить предъявлены ли все условные составляющие СДТ. Если нет, то
сгенерировать следующую условную составляющую СДТ и перейти к пункту 9.
12.
Проанализировать набранную сумму весов ответов по итогу прохождения СДТ.
13.
Выставить оценку объекту на основе набранного суммарного веса ответов по
прохождению СДТ.
14.
Если оценка удовлетворяет критерию прохождения теста, то перейти к пункту 15.
Иначе выдать рекомендации по итогу прохождения условной составляющей СДТ. перейти
к пункту 2.
15.
Конец.
Реализацию
вышеприведённого алгоритма предполагается осуществить в виде динамически подключаемого
модуля (плагина) к ИИИ ИМСЛОГ.
Построение интеллектуального
расширения ГИС предлагается осуществлять на основе ИИС ИМСЛОГ [12], предназначенного
для выявления различного рода закономерностей [10, 11, 21], принятия решений и
их обоснования с использованием графических, включая когнитивные, средств [11].
Архитектура ИИС ИМСЛОГ
является открытой и представляет собой пополняемую (изменяемую) иерархическую
систему программных модулей. Один модуль является резидентным, выполняет
функции координирующего центра и называется ядром. Все остальные модули
являются динамически подключаемыми, называются плагинами и подразделяются на
функциональные модули и модули системных данных. Функциональные модули
реализуют отдельные подсистемы и функции, включая различные подходы и алгоритмы
тестового распознавания образов.
Во избежание появления
неверных решений доступ пользователей к базе знаний ограничен просмотром значений
и принятием решений по исследуемому объекту.
Модуль интеллектуального
интерфейса обеспечивает интерактивное взаимодействие пользователя с ядром на
ограниченном естественном языке посредством интеллектуальной графической
оболочки либо консольного приложения.
Модуль подключения к базе
знаний выполнен в формате динамически подключаемого модуля – плагина для ИИС
ИМСЛОГ и осуществляет доступ к геоданным посредством технологии ActiveX Data
Objects (ADO). На основе результатов тестирования формируется описание
полученных результатов, которое впоследствии используется для вынесения рекомендаций по организации иерархической структуры слоев ВММ.
Исследование направлено на
расширение возможностей ГИС-технологий путем применения методов искусственного
интеллекта в решении важнейших задач регионального развития и управления, являющихся
традиционной областью приложений ГИС.
Применение методов тестового
распознавания образов, графических средств визуализации и когнитивных средств
обоснования принимаемых решений в геоинформационную систему для решения различных
прикладных задач существенно расширит возможности и область применения
интерактивных ГИС.
Для уточнения структуры и
использования виртуальной модели местности с применением интеллектуальной технологии
предложено использовать методы тестового распознавания образов и матричную модель
представления данных и знаний.
Дано неформальное описание
алгоритма построения смешанных диагностических тестов.
Предложено провести построение
интеллектуального расширения ГИС на основе интеллектуального инструментального
средства ИМСЛОГ.
Планируется разработать
методы синтеза интеллектуальных ГИС для подготовки пространственных решений на
основе сведения их информационного описания к тестовой задаче распознавания
образов, включающей пространственные и семантические характеристики объектов. Использование
методов распознавания образов позволит формализовать важный класс
управленческих решений на базе зонирования территории.
Дальнейшие исследования
направлены на формализацию элементов практических приемов формирования локальных
проектных решений, будут рассмотрены варианты их применения в задачах градостроительства.
1.
Korte G.P.E. The GIS book: Understanding the value and
implementation of geographic information systems. – 1997. – 238 p.
2.
Рюмкин А.И.,
Чумичев И.И. Интеграция геоинформационных технологий и данных
дистанционного зондирования в задачах
управления устойчивым развитием области // Интеркарто-4. ГИС для оптимизации природопользования
в целях устойчивого развития территорий. Материалы Международной конференции. Барнаул, 1998 г. – С. 232-240.
3.
Ryumkin A. Yankovskaya A. Intelligent Expansion of the
Geoinformation System// The 6th German-Russian Workshop "Pattern
Recognition and Image Understanding" OGRW-6-2003, Workshop proceedings. –
Novosibirsk, Russian Federation, 2003. – Pp. 202-205.
4.
Fan В. A hybrid spatial
data clustering method for site selection: The data driven approach of GIS
mining// Expert Systems
with Applications Volume 36,
Issue 2, Part 2. – 2009. – Pp. 3923-3936.
5.
Янковская А.Е.,
Соколович Г.Е., Рюмкин А.И., Ромашова Т.В., Коломеец В.И. Геоинформационная экомедицинская
система оптимизации профилактики обострений хронических заболеваний//
Медико-экологическая безопасность, реабилитация и социальная защита населения. Сб. докладов ХII
Международного форума. – Турция, Кемер. – Москва, 2002. – С. 150-154.
6.
Anthony Gar-On Y., Man Hong С. An integrated GIS and location-allocation approach
to public facilities planning: An example of open space planning// Computers
Environment and Urban Systems, 20. – 1996. – Pp. 339–350.
7. Журавлёв Ю.И., Гуревич И.Б. Распознавание образов и анализ
изображений// Искусственный интеллект в 3-х кн. Книга 2. Модели и методы:
Справочник/ Под ред. Д.А. Поспелова. Москва: Радио и связь. – 1990. – С.
149-191.
8. Янковская А.Е. Об оптимальном сочетании условных и
безусловных диагностических тестов в интеллектуальных системах // Искусственный
интеллект - 96. Сб. научных трудов V Национальной конференции с международным
участием. – Т. 1. – Казань, 1996. – С. 77-80.
9.
Янковская А.Е.,
Семенов М.Е. Основы построения диагностических тестов с использованием
элементов нечеткой логики в интеллектуальной системе для оценки знаний //
Интегрированные модели и мягкие вычисления в искусственном интеллекте. Сборник
научных трудов VI-й Международной научно-технической конференции (Коломна,
16-19 мая 2011 г.). В 2-х томах. Т.2. – М.:
Физматлит, 2011. – С. 733-743.
10. Янковская А.Е. Построение k-значных диагностических
тестов в интеллектуальной системе с матричным представлением знаний// Сб.
научных трудов VI Национальной конференции по искусственному интеллекту с международным
участием (КИИ-98). Том I. – Пущино, 1998. – С. 264-269.
11. Янковская А.Е. Логические тесты и средства // Новые
информационные технологии в исследовании дискретных структур. Доклады 3-ей
когнитивной графики в интеллектуальной системе Всероссийской конференции с международным
участием. – Томск: изд-во СО РАН, 2000. – С. 163-168.
12. Yankovskaya A.E.,
Gedike A.I., Ametov R.V., Bleikher A.M. IMSLOG-2002 Software Tool for
Supporting Information Technologies of Test Pattern Recognition // Pattern
Recognition and Image Analysis. – 2003. – Vol.13. – N.2. – Pp. 243-246.
13. Ивакин Я.А.
Методы интеллектуализации промышленных геоинформационных систем для диспетчеризации
пространственных процессов. – СПб.: СПИИРАН, 2008. – 239 с.
14. Артамонов Е.И. Интерактивные системы. Синтез структур –
М.: Инсвязьиздат, 2010. – 185 с.
15. Соколов И.А., Филатов В.Н., Мартыненко А.И. и др. Важнейшие
фундаментальные и прикладные проблемы геоинформатики // Информация и космос. – 2007.
– № 1. – С. 7-14.
16. Янковская А.Е., Ильинских Н.Н., Черногорюк Г.Э.,
Кузоваткин А.Н. Результаты исследований алгоритма принятия решений
непосредственно в процессе построения смешанных диагностических тестов, реализованного
в интеллектуальных биомедицинских системах// Естествознание и гуманизм. Сб.
научных трудов. Т. 1. № 3. – Томск: Издание СибГМУ, 2004. – С. 95-99.
[1] Работа выполнена при финансовой поддержке РФФИ, проект №11-07-98015-р_сибирь_а, проект №10-01-00462-a.