ПРЕОБРАЗОВАНИЕ РАСТР-ВЕКТОР
ИЗОБРАЖЕНИЙ СОСУДОВ
Болонкин А. В.,
аспирант,
МТУСИ (г. Москва),
ИПУ РАН (г. Москва)
Обработка и распознавание изображений является обширной областью исследований. В данной области разработано множество различных методов, развиваются существующие методы, появляются новые. Задача распознавания двумерных изображений кровеносных сосудов, решаемая в данной работе, актуальна для построения трехмерной модели сосудов и их последующего визуального анализа на основе такой модели.
Распознавание изображений делится на следующие этапы: предварительная обработка, сегментация, фильтрация и непосредственно распознавание. Далее по каждому из этих этапов будут рассмотрены основные известные методы, их особенности и характеристики, на основе которых производится выбор окончательного набора методов.
Выбор методов осуществляется по критериям, в основе которых лежат применимость методов для решения поставленной задачи, параметры производительности методов (сложность вычислений, объем требуемой памяти), качество работы методов (степень соответствия начального и полученного в результате распознавания изображений). В таблице представлены характеристики рассматриваемых методов и их сравнение друг с другом.
1. Предварительная обработка
Как правило, исходное изображение искажено шумами аппаратуры сканирования, дискретизации или каналов передачи данных, имеет неравномерные яркость и контрастность. Это приводит к разрывам линейных объектов, разрушению символов, маскировке сложных объектов анализа, что приводит к большому числу ошибок и отказов, особенно автоматических систем сканирования и распознавания.
Предварительная обработка включает в себя следующие преобразования: ликвидацию на исходном изображении высокочастотных помех и различного рода артефактов (засветка отдельных участков изображения, провалы на нем, трещины и т. д.), увеличение контраста, выравнивание общего яркостного фона изображения, бинаризацию и другие функциональные преобразования. При всех этих преобразованиях одним из важнейших показателей должно быть сохранение максимального числа особых элементов исходной информации.
Изображения, введенные в компьютер, редко бывают идеального качества. Чаще всего, кроме собственно изображения они содержат так называемый «шум». Это может быть искажение цвета или яркости некоторых групп пикселей, или же совершенно неправильные значения отдельных пикселей никак не связанные с их истинным цветом.
Методы шумоподавления можно разделить на следующие группы: линейные алгоритмы (например, усредняющий фильтр — Mean Filter), ранговые алгоритмы (к ним относится медианный фильтр — Median Filter), локально-адаптивные алгоритмы (Гауссово размытие — Gaussian Smoothing, Сохраняющее сглаживание — Conservative Smoothing) и другие. Как показала практика, наиболее эффективным при решении поставленной задачи является фильтр Гаусса.
Методы повышения контрастности направлены на увеличение доли полезной информации изображения. Методы повышения контрастности, так или иначе, выполняют обработку изображения с использованием гистограммы интенсивности пикселей, либо в локальной области, либо всего массива данных. К ним можно отнести увеличение контрастности, выравнивание гистограммы, оператор логарифма, экспоненциальный оператор.
Все выше перечисленные методы предварительной обработки имеют опциональный характер, поскольку дают различные результаты и не являются взаимозаменяемыми. Поэтому методы данной группы могут применяться в совокупности.
2. Сегментация
Сегментация обычно понимается как процесс поиска однородных областей на изображении. Это весьма трудный этап и в общем виде для произвольных изображений до конца не алгоритмизированный. Сегментация является одним из наиболее важных шагов в распознавании изображений, поскольку от качества сегментации зависят последующие шаги и конечный результат. Выделяет пороговую сегментацию, сегментацию с помощью наращивания областей и обнаружение границ.
При пороговой сегментации значение яркости каждого пикселя сравнивается с некоторым порогом, и в зависимости от результата сравнения этот пиксель относится к одной из двух групп. Определение порога в таких алгоритмах является ключевой задачей. Различают сегментацию по общему порогу и адаптивную пороговую сегментацию. В первом случае для всего изображения задается один или два порога, а во втором — для каждой локальной области изображения. Несмотря на свою сильную зависимость от контрастности изображения, пороговая сегментация может использоваться не как самостоятельный метод, а в совокупности с другими, например, для фильтрации результатов сегментации, выполненной другими методами, или на стадии предварительной обработки.
Методы выделения областей путем наращивания основаны на поиске групп пикселей с близкими значениями яркости. В простейшем варианте такой метод заключается в выборе пикселя, просмотре его соседей на предмет близости значений яркости и включении близких по яркости пикселей в формирующуюся область. Наиболее простой критерий однородности области основывается на оценке максимальной разности значения яркости отдельного пикселя и средней яркости формируемой области. Такой критерий будет надежно работать только тогда, когда размер области уже достаточно большой, чтобы оценка средней яркости была достоверной. Среди методов наращивания областей выделяют центроидное связывание (априорная информация на основе стартовых точек), метод слияния-расщепления (предварительный выбор однородных областей и их последующее наращивание), метод водоразделов (выделение однородных областей на основе градиента интенсивности изображения), метод деформируемых шаблонов (на основе соответствия шаблонам, изменяемым под воздействием функции внутренней энергии).
Методы обнаружения границ подразделяются на две категории:
– обнаружение пикселей краев — выделение пикселей в зависимости от их схожести с краем, т. е. таких пикселей, которые находятся на границе двух областей различной интенсивности.
– обнаружение пикселей линии — выделение пикселей в зависимости от их схожести с линией, т. е. пикселей, лежащих в темных областях, окруженных светлыми и наоборот.
К методам обнаружения границ относятся градиентные методы, методы с использованием вторых производных, отдельно выделяется метод Canny, а также методы активных контуров.
Градиентные методы основаны на свойстве того, что различным объектам на изображениях соответствуют области со схожими значениями яркости. На границах же яркость существенно меняется. Реализацией градиентных методов являются соответствующие градиентные операторы: перекрестный оператор Робертса (Roberts' Cross operator), оператор Собела (Sobel operator), метод Превитта (Prewitt method, Compass Edge Detector). Оператор Робертса обладает малой сложностью вычислений, зато высоко чувствителен к шуму. Оператор Собела обладает относительно высокая скорость работы, устойчивость к шуму. Метод Превитта характеризуется высокой степенью точности определения границ, устойчивостью к шуму, но в то же время и большой сложностью вычисления (в 8 раз больше по сравнению с оператором Собела).
Для подчеркивания перепадов яркости изображения можно использовать вторые производные. Двумерный дифференциальный оператор носит название оператора Лапласа, или лапласиана. Лапласиан — это двухмерное отображение второй производной. Он часто применяется для обнаружения границ в пересечении нуля (zero crossing edge detectors). Поскольку Лапласиан очень чувствителен к шуму, чтобы уменьшить влияние шума часто используют сглаживание, например, по методу Гаусса. В силу ассоциативности операторов свертки, обычно используют единое ядро, которое носит название Лапласиана Гауссиана (Laplacian of Gaussian — LoG), которое может быть предварительно вычислено по формуле
,
где s —
стандартное отклонение оператора Гаусса. Также метод обнаружения краев с
помощью Лапласиана Гауссиана носит названия Zero
crossing detector, Marr edge detector.
Отдельно в ряду методов обнаружения границ стоит метод Canny. В 1986 г. John Canny описал алгоритмы обнаружения границ, которые с тех пор стали одними из наиболее широко используемых. Он определил набор требований к методу обнаружения границ и описал оптимальный способ их достижения, исходя из трех критериев, которым должен удовлетворять детектор границ:
– частота ошибок (результаты метода должны соответствовать только краям и находить все из них, ни один край не должен быть пропущен);
– локализация (расстояние между краевыми пикселями, найденными с помощью метода, и действительным краем должно быть по возможности минимальным);
– единственный отклик (метод не должен определять несколько краевых пикселей там, где существует только один край).
Реализация метода Canny состоит из 4 последовательных шагов: сглаживания, дифференцирования, подавления в точках отсутствия максимума (Non-maximum Suppression) и пороговой сегментации. Общая сложность метода Canny по сравнению с другими описанными выше за счет использования нескольких стадий. В то же время, это дает лучшее качество сегментации изображения. Кроме этого, следует учесть, что он представляет собой набор различных последовательно выполняемых алгоритмов.
Достоинствами метода Canny можно
назвать устойчивость к шуму благодаря использованию метода Гаусса и то, что он
представляет собой отлаженное комплексное решение. Недостатками являются
высокая сложность вычислений, некорректное распознавание Y-разветвлений по причине применения
пороговой сегментации на основе слежения (может быть решена путем различных
доработок метода).
Метод активных контуров подразумевает использование для обнаружения границ на изображении кривых минимальной энергии, называемых снейками. Предполагается, что искомая граница на изображении представляет собой гладкую замкнутую линию (речь идет о плоском изображении). Сначала контур инициализируется в виде некоторой простой линии (например, окружности). Затем данная граница деформируется под воздействием внешних и внутренних сил, с каждой итерацией лучше аппроксимируя границу.
При использовании классических активных контуров требуется, чтобы начальный контур хорошо приближал искомую границу. В усовершенствованных методах [5] данная проблема была решена, и в качестве начального приближения можно брать фактически любую окружность в области искомой границы.
Несмотря на высокую эффективность метода активных контуров благодаря различным его доработкам, основным условием, ограничивающим его применение для решения стоящей перед нами задачи, является замкнутость границы, получаемой данным методом, в то время как кровеносные сосуды представляют собой протяженные границы в виде отдельных линий.
3. Фильтрация
В результате сегментации часто возникают шумы в виде разрозненных небольших областей, которые обычно удаляют с помощью фильтрации. Наибольшее распространение для этих целей получили цифровые фильтры-маски и нелинейные фильтры. При этом на этапе сегментации применяются специальные операторы интегрального типа. Кроме этого, некоторые методы, описанные в разделах предварительной обработки и сегментации, также могут применяться для фильтрации изображений, полученных на этапе сегментации при помощи других методов.
На этапе фильтрации в нашей задаче к изображению, обработанному методом Canny, применяется метод утончения, который дает границы сосудов толщиной в 1 пиксель, так что каждый пиксель границы имеет 1 или 2 соседей.
4. Распознавание
Конечным этапом обработки, лежащим в основе процессов интерпретации и понимания, является распознавание. Суть задачи распознавания — установить, обладают ли изучаемые объекты фиксированным конечным набором признаков, позволяющим отнести их к определенному классу.
В задачах распознавания можно ввести понятие аналогии или подобия объектов и сформулировать понятие близости объектов в качестве основания для зачисления объектов в один и тот же класс или разные классы. При этом оперируют набором прецедентов-примеров, классификация которых известна и которые могут быть предъявлены алгоритму распознавания в виде формализованных описаний для настройки на задачу в процессе обучения. Также необходимо учитывать возможность «плохой» информации (информация с пропусками, разнородная, косвенная, нечеткая, неоднозначная, вероятностная).
В задачах распознавания применяются подходы, использующие корреляционные методы, основанные на принятии решений по критерию близости к эталонам, признаковые и синтаксические методы, основанные на выборе признаков и правил, и нормализацию, приближающую изображение к эталонному.
Для восстановления трехмерной модели кровеносных сосудов процесс распознавания сводится к преобразованию двухмерных изображений в трехмерное представление, поэтому основным этапом данного процесса является сегментация. На основе анализа приведенных выше методов было решено для сегментации изначальных изображений кровеносных сосудов применять метод Canny как средство, отлаженное практикой и вбирающее в себя методы каждого указанного выше этапа, что позволяет достичь качественного результата с минимальными затратами. Само преобразование двухмерных изображений в трехмерное представление удобно производить с помощью алгоритма слежения на основе каркаса, полученного на этапе сегментации с помощью метода Canny.
В соответствии с проведенным анализом методов был построен и реализован алгоритм преобразования растр-вектр изображений кровеносных сосудов. Полученные на различных стадиях алгоритма изображения представлены в презентации к докладу. В дальнейшем планируется включить в имеющееся ПО этап построения трехмерной модели кровеносных сосудов на основе полученных векторных данных с использованием метода фотограмметрии. Результаты будут изложены в последующих работах.
1.
Hypermedia
Image Processing Reference // http://homepages.inf.ed.ac.uk/rbf/HIPR2
2. Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике. — М: Машиностроение, 1990. — 320 с.
3.
Lalonde
M., Gagnony L., Boucherz M.-C. Non-recursive paired tracking for vessel
extraction from retinal images. — Centre de recherche informatique de Montreal,
2000
4.
Parker
J. R. Algorithms for Image Processing and Computer Vision. — John Wiley
& Sons Inc, NY, USA, 1996
5. Yu Z., Bajaj Ch. Image Segmentation Using Gradient Vector Diffusion and Region Merging. 16th International Conference on Pattern Recognition (ICPR'02). — 2002. Vol 2. — P. 20941