Исследование методов отбора информативных признаков...
Кутикова В.В., Гайдель А.В.
ИССЛЕДОВАНИЕ МЕТОДОВ ОТБОРА ИНФОРМАТИВНЫХ ПРИЗНАКОВ ДЛЯ ЗАДАЧИ РАСПОЗНАВАНИЯ ТЕКСТУРНЫХ ИЗОБРАЖЕНИЙ С ПОМОЩЬЮ МАСОК ЛАВСА
В.В. Кутикова 1, А.В. Гайдель 1,2
1 Самарский государственный аэрокосмический университет имени академика С.П. Королёва (национальный исследовательский университет) (СГАУ), Самара, Россия,
2 Институт систем обработки изображений РАН, Самара, Россия
Аннотация
В работе исследуется эффективность двух методов отбора информативных признаков, основанных на масках Лавса: упорядочение признаков в соответствии с критерием дискриминантного анализа и t-критерием Стьюдента, а также перебор всех пар и троек признаков. Экспериментально показано, что вероятность ошибочной классификации для признаков, основанных на стандартном отклонении, не превышает вероятность ошибочной классификации для признаков, основанных на средней энергии.
Ключевые слова: текстурный анализ, маски Лавса, отбор признаков, критерий дискриминантного анализа, t-критерий Стьюдента.
Цитирование: Кутикова, В.В. Исследование методов отбора информативных признаков для задачи распознавания текстурных изображений с помощью масок Лавса / В.В. Кутикова, А.В. Гайдель // Компьютерная оптика. - 2015. - Т. 39, № 5. - С. 744-750. - DOI: 10.18287/0134-2452-2015-39-5-744-750.
Введение
Текстуры из-за их повсеместного присутствия на изображениях широко используются для идентификации классов объектов, представленных ими. К сожалению, формального определения понятия текстуры пока нет, однако известны два основных подхода к её описанию [1]: структурный подход, основанный на представлении текстуры как множества простых текстурных примитивов, расположенных в некотором регулярном или повторяющемся порядке, и статистический подход, согласно которому текстура является количественной характеристикой распределения значений интенсивности в области изображения. К признакам, основанным на описании структурных элементов, в работе [2] относят признаки, построенные на матрицах длин серий [3]. В качестве статистических характеристик текстуры широко используются признаки Харалика [4], которые основаны на матрице вхождений. По матрице вхождений можно вычислить такие характеристики, как энергия, энтропия, контраст, однородность, корреляция.
Среди других известных методов распознавания текстур можно выделить методы, основанные на автокорреляционной функции, функции Габора, модели Марковского случайного поля, а также фрактальный метод, Фурье- и вейвлет-анализ [5, 6]. Не менее известен метод Лавса [7], который, как утверждают в
[8], напоминает процесс зрительного восприятия текстуры человеком. Данный подход широко используется при сегментации изображений на области с одинаковой текстурой. Например, в работе [9] исследуется эффективность признаков, основанных на масках Лавса, в задаче текстурной сегментации изображений диагностических кристаллограмм. Однако мало исследований посвящено маскам Лавса, и их потенциал для решения задачи распознавания текстурных изображений ещё не до конца раскрыт.
Разумеется, не все из перечисленных признаков являются одинаково информативными для конкрет-
ной задачи распознавания текстурных изображений. Полезные для одной задачи текстурные характеристики могут оказаться малоинформативными для другой задачи. Кроме того, некоторые из них являются бесполезными сами по себе, но информативными при совместном использовании с другими признаками. Так, в работе [10], где с помощью текстурного анализа рентгеновских снимков шейки бедра проводилась диагностика заболеваний костной ткани, хорошо зарекомендовали себя корреляционные признаки. Для компьютерной диагностики хронической обструктивной болезни лёгких [11] наиболее эффективная группа признаков состоит из двух информационных мер Харалика и трёх признаков на основе длин серий. Наиболее информативными для задачи диагностики нефрологических заболеваний с помощью анализа ультразвуковых изображений почек [12] оказались признаки Харалика.
Для отбора информативных признаков часто используют некоторый критерий оценки значимости признака, значения которого пропорциональны качеству признака. В роли такого критерия могут выступать критерий корреляции Пирсона, критерий взаимной информации, критерий хи-квадрат, t-критерий Стьюдента [13]. В работах [10 - 12, 14] используются методы отбора, основанные на критерии дискриминантного анализа, также для отбора признаков применяются генетический алгоритм [15] и метод дифференциальной эволюции [16].
Целью данной работы является исследование эффективности методов отбора признаков, основанных на масках Лавса. В параграфе 1 описывается алгоритм формирования текстурных признаков, основанных на масках Лавса. После чего в параграфе 2 приводится обзор используемых методов отбора информативных признаков и в параграфе 3 рассматриваются результаты экспериментальных исследований, проводимых на трёх наборах изображений.
744
Компьютерная оптика, 2015, том 39, №5
Исследование методов отбора информативных признаков ...
Кутикова В.В., Гайдель А.В.
1. Алгоритм формирования текстурных признаков
Пусть f(x,у) - входное изображение размером n х т, где x = 1, n, у = 1, m . Алгоритм выделения текстурных признаков основан на фильтрации входного изображения двумерными масками Лавса, полученными внешним произведением пар одномерных масок одинакового размера. В [5] приведены 14 одномерных масок размерности 3, 5 и 7, из которых получено 70 двумерных: 9 масок размером 3 х 3, 25 масок размером 5 х 5 и 36 масок размером 7 х 7.
Пусть hk(s, t) - k-я двумерная маска размера Nx N,
где k = 170, s = IN , t = 1N, Nе{3, 5, 7} . Процедура фильтрации входного изображения f(x,у) реализуется как двумерная линейная система с конечной импульсной характеристикой hk(s, t). Для полученных на выходе описанной системы изображений gk (x, у) вычисляются средняя энергия
sk
—ЁЁ g2( x у)
пт
x=1 у=1
и среднеквадратическое отклонение (СКО)
пт
п т __
ЁЁ (gk(x, у) - gk)
x =1 у =1
2
где gk - среднее значение изображения gk(s, t). Результатом вычисления СКО и энергии каждого отфильтрованного изображения будет пара векторов признаков: вектор энергий и вектор СКО. В данной работе полученные векторы признаков исследуются независимо друг от друга.
2. Отбор текстурных признаков
Отбор признаков с помощью критерия дискриминантного анализа
Пусть U е МKxV - обучающая выборка, содержащая V изображений, где K - размерность признакового пространства, Uj - значение /'-го признака для вектора признаков Uj е МK , класс Ф(Цг) которого известен.
Согласно описанному в [10] методу, признаки сортируются в порядке убывания следующего критерия:
J (k) = ---D(k)-------, (1)
2 (D(1)(k) + D(2) (k))
где D(k) - оценка общей дисперсии k-го признака, D(1)(k) - оценка дисперсии k-го признака внутри /-го класса, / = 1,2. Чем больше значение этого критерия, тем лучше признак разделяет изображения, принадлежащие разным классам. После сортировки формируются группы признаков следующим образом: сначала для классификации изображений используется только лучший признак по критерию (1), затем группа из него и следующего по значимости признака и т.д. Для каждой из сформированных групп на основе
тестовой выборки оценивается вероятность ошибочной классификации.
Пусть U е МKxV - тестовая выборка, состоящая из V изображений. Относительно каждого вектора признаков Uj е МK известен его класс Ф (Uj). Тогда
оценка вероятности ошибочной классификации имеет следующий вид:
1
£ = —
V
{jе {с2,
v} | ф(и j )*Ф (и j)}
(2)
где ф(иj) - класс вектора Uj из тестовой выборки, определённый в результате классификации.
Отбор признаков с помощью t-критерия Стьюдента
Данный подход повторяет описанную выше процедуру отбора признаков, только в качестве критерия разделимости признакового пространства вместо (1) используется t-критерий Стьюдента, вычисляемый по следующей формуле:
t(k)
M(1) (k) - M (2)(k) lD(1)(k) + P(2)(k) V V V2
(3)
где M(/)(k) - среднее значение k-го признака внутри l-го класса, Vl - количество векторов класса l в обучающей выборке, / = 1, 2.
Выбор лучшей пары и тройки признаков По обучающей выборке U для каждой пары и тройки признаков оценивается вероятность ошибочной классификации (2), за лучшие принимаются пара и тройка признаков, оценка (2) которых минимальна. На контрольной выборке U проверяется качество отобранных групп с помощью оценки (2).
3. Экспериментальное исследование качества сформированных признаков
В ходе выполнения работы проведено три серии экспериментов, исходными данными которых были полутоновые изображения текстур двух классов. В первой серии - это изображения камня и песка из базы текстур [17], во второй - изображения двух разновидностей риса также из [17] и в третьей - снимки компьютерной томографии лёгкого без патологии и лёгкого с эмфиземой. Набор изображений случайным образом был разбит на экспериментальную и тестовую выборки равного объёма, в каждой из которых для первых двух серий экспериментов оказалось по 80 изображений каждого класса. Дальнейшие исследования проводились для заданного разбиения набора изображений, повторных разбиений не проводилось. На рис. 1 и 2 приведены примеры используемых изображений в первой и второй сериях экспериментов соответственно. Для третьей серии в обучающей и тестовой выборках находилось по 22 изображения лёгкого без патологии и 42 изображения лёгкого с эмфиземой, примеры которых представлены на рис. 3.
Компьютерная оптика, 2015, том 39, №5
745
Исследование методов отбора информативных признаков...
Кутикова В.В., Гайдель А.В.
Для классификации изображений в работе используется правило, основанное на принципе ближайшего соседа, где в качестве меры близости векторов признаков выступает евклидово расстояние. Т акой выбор обусловлен высокой скоростью работы и простотой реализации метода, а также тем, что ошибка классификатора, работающего по принципу ближайшего соседа, не может превышать ошибку байесовского классификатора более чем в два раза [18].
Рис. 1. Примеры изображений: камень (а), песок (б)
Рис. 2. Примеры, изображений: длиннозёрный рис (а), среднезёрный рис (б)
Рис. 3. Примеры, изображений: лёгкое без патологии (а), лёгкое с эмфиземой (б)
Результаты отбора признаков с помощью критерия дискриминантного анализа
В табл. 1 представлены результаты отбора лучшей группы признаков для трёх серий экспериментов при использовании в качестве признаков вектора энергий. В табл. 2 приведены аналогичные результаты для вектора СКО. Отбор проводился на основании вероятности ошибки распознавания изображений из тестовой выборки. Под вероятностью ошибки распознавания (классификации) в данной работе понимается оценка (2).
Согласно табл. 1, в первой серии лучшей является группа, состоящая из семи наиболее информативных по критерию (1) признаков. Вероятность ошибочной
классификации при этом составляет 0,18. Видно, что с ростом числа признаков эта вероятность либо не меняется, либо растёт, поэтому увеличивать количество признаков в группе в данном случае не имеет смысла. Для классификации изображений двух видов риса во второй серии экспериментов, как оказалось, можно использовать группу, состоящую только из одного признака, причём разделение классов в таком случае будет безошибочным. В третьей серии отобранная группа состоит из одного признака и обеспечивает вероятность ошибки, равную 0,19.
Табл. 1. Результаты отбора лучших групп признаков для вектора энергий
Количество признаков в группе Вероятность ошибочной классификации
1 серия 2 серия 3 серия
1 0,26 0 0,19
2 0,22 0 0,19
3 0,22 0 0,21
4 0,21 0 0,21
5 0,21 0 0,21
6 0,20 0 0,21
7 0,18 0 0,21
8 0,19 0 0,21
9 0,18 0 0,21
10 0,18 0 0,21
Табл. 2. Результаты отбора лучших групп признаков для вектора СКО
Количество признаков в группе Вероятность ошибочной классификации
1 серия 2 серия 3 серия
1 0,24 0 0,21
2 0,21 0 0,21
3 0,19 0 0,21
4 0,16 0 0,21
5 0,16 0 0,21
6 0,16 0 0,17
7 0,16 0 0,17
8 0,18 0 0,14
9 0,17 0 0,14
10 0,16 0 0,19
Из табл. 2 видно, что при использовании в качестве признаков вектора СКО в первой серии экспериментов лучшая группа включает четыре признака, а вероятность ошибки составляет 0,16. Во второй серии для безошибочной классификации изображений двух видов риса достаточно использовать только лучший по критерию (1) признак. В третьей серии лучшая группа состоит из восьми признаков и обеспечивает вероятность ошибки, равную 0,14.
Данные, приведённые в табл. 1 и 2, позволяют утверждать, что вероятность ошибочной классификации лучшей группой признаков для вектора СКО меньше или равна вероятности ошибочной классификации лучшей группой для вектора энергий во всех трёх сериях экспериментов.
На рис. 4 - 6 представлены графики, демонстрирующие зависимость вероятности ошибочной классификации от количества признаков в группе, для
746
Компьютерная оптика, 2015, том 39, №5
Исследование методов отбора информативных признаков ...
Кутикова В.В., Гайдель А.В.
трёх серий экспериментов. Стоит отметить, что в первой и третьей сериях можно подобрать такие группы признаков, вероятности ошибочной классификации которых меньше, чем у ранее отобранных групп. Т ак, в первой серии (рис. 4) для вектора энергий при использовании группы из 49 признаков достигается наименьшая вероятность ошибки - 0,03, то есть снижение ошибки на 0,15 сопровождается повышением длительности вычисления признаков примерно в 8 раз, а для вектора СКО безошибочная классификация изображений обойдётся увеличением времени вычисления признаков (45 признаков) в 15 раз.
Вероятность ошибочной классификации 0,30
0,25 0,20 0,15 0,10 0,05
0 10 20 30 40 50 60 70
Количество признаков в группе
Рис. 4. Результаты классификации изображений песка и камня группами признаков
Вероятность ошибочной классификации 0,30
0,25
0,20
0,15
0,10
0,05
0 10 20 30 40 50 60 70
Количество признаков в группе
Рис. 5. Результаты классификации изображений лёгкого без патологии и лёгкого с эмфиземой группами признаков
В третьей серии (рис. 5) для вектора СКО наименьшая вероятность ошибки, равная 0,09, достигается группой из 31 признака, время вычисления которой в 4 раза больше времени вычисления выбранной группы из 8 признаков. Для вектора энергий отобранная ранее группа, состоящая из одного признака, обеспечивает наименьшую вероятность ошибки.
Результаты классификации изображений двух видов риса, представленные на рис. 6, показывают, что только при использовании групп, состоящих из 19 -24 признаков, которые получены вычислением СКО, вероятность ошибки составляет 0,0063, другие группы признаков разделяют изображения без ошибок.
Вероятность ошибочной классификации 0,007
0,006 0,005 0,004 0,003 0,002 0,001
0 10 20 30 40 50 60 70
Количество признаков в группе
Рис. 6. Результаты классификации изображений двух видов риса группами признаков
Результаты отбора признаков с помощью t-критерия Стьюдента
На первом этапе отбора при упорядочении признаков оказалось, что в первых двух сериях результаты сортировки признаков по убыванию значения критериев (1) и (3) совпадают, поэтому продолжать процедуру отбора не имеет смысла.
Для третьей серии экспериментов результаты отбора лучшей группы признаков представлены в табл. 3.
Табл. 3. Результаты отбора признаков для третьей серии экспериментов
Количество Вероятность
признаков в ошибочной классификации
группе Вектор энергий Вектор СКО
1 0,19 0,21
2 0,19 0,21
3 0,21 0,21
4 0,21 0,21
5 0,21 0,21
6 0,21 0,17
7 0,21 0,17
8 0,21 0,14
9 0,21 0,14
10 0,21 0,19
Видно, что при использовании вектора энергий лучшая группа состоит из одного признака и обеспечивает вероятность ошибочной классификации, равную 0,19. Для вектора СКО лучшей оказалась группа из восьми признаков. Вероятность ошибки при этом составляет 0,14. Согласно графику на рис. 7, для вектора энергий минимальная вероятность ошибки, соответствующая группе из 14 признаков, равна 0,17. В данном случае снижение вероятности ошибочной классификации на 0,02 обойдётся увеличением времени вычисления признаков в 9 раз. Для вектора СКО минимальная вероятность ошибки, равная 0,09, обеспечивается группой из 32 признаков, время вычисления которой в 4 раза больше времени вычисления ранее отобранной группы из 8 признаков.
Отметим также, что, несмотря на большие различия в результатах упорядочивания признаков в соответствии с критериями (1) и (3), результаты класси-
яшя, * > Вектор энергий Вектор СКО
Компьютерная оптика, 2015, том 39, №5
747
Исследование методов отбора информативных признаков...
Кутикова В.В., Гайдель А.В.
фикации сформированными группами оказались очень похожими, а отобранные группы совпадают как по количеству признаков, так и по качеству классификации.
Вероятностъ ошибочной классификации 0,24--------------------------------
0,22
0,20
0,18
0,16
0,14
0,12
0,10
0,08
7Г \i 1 Г
J | ч 1
U 1 Вектор энергий Вектор СКО
* ■ ■ ■ ■ *
■ 1 1 ■ 1
О 10 20 30 40 50 60 70
Количество признаков в группе
Рис. 7. Результаты классификации изображений лёгкого без патологии и лёгкого с эмфиземой группами признаков
Результаты отбора лучшей пары и лучшей тройки признаков В табл. 4 приведены результаты классификации группами признаков, найденными перебором для вектора энергий и вектора СКО.
Табл. 4. Лучшие пара и тройка признаков
Количество признаков в группе Вероятность ошибочной классификации
1 серия 2 серия 3 серия
Вектор энергий
2 0,043 0,01 1 0,16
3 | 0,037 0,02 | 0,17
Вектор СКО
2 0,043 0,01 0,15
3 | 0,037 0,02 0,07
Проведём сравнение данных из табл. 4 и результатов отбора признаков с помощью однофакторного дисперсионного анализа и t-критерия (табл. 1 - 3). В первой серии экспериментов уже лучшие пары из табл. 4 разделяют изображения с большей достоверностью, чем лучшие группы признаков из табл. 1 и 2. Во второй серии данный подход оказался менее эффективным, чем однофакторный дисперсионный анализ, так как в этом случае лучшие пара и тройка признаков не позволяют безошибочно классифицировать изображения. Для вектора СКО в третьей серии экспериментов лучшая группа признаков (табл. 2 или 3) имеет меньшую вероятность ошибки, чем лучшая пара, но большую, чем лучшая тройка признаков из табл. 4. Для вектора энергий в этой же серии и пара, и тройка признаков классифицируют изображения с меньшей вероятностью ошибки, чем отобранная группа из табл. 1 или 3.
Стоит также отметить, что при решении задачи классификации изображений лёгкого без патологий и лёгкого с эмфиземой в третьей серии экспериментов наименьшая вероятность ошибки составляет 0,07, что меньше 0,11 - вероятности ошибки, полученной при
решении этой же задачи в работе [11], где отобранная группа состояла из пяти признаков.
Как и в случае отбора признаков с помощью критерия дискриминантного анализа и t-критерия Стью-дента, вероятность ошибочной классификации лучшей группой для вектора СКО меньше или равна вероятности ошибочной классификации лучшей группой для вектора энергий.
Заключение
В работе проводилось сравнение методов отбора текстурных признаков, основанных на масках Лавса. Для полученных векторов признаков, вектора энергий и вектора СКО исследовалась эффективность двух методов отбора информативных признаков: упорядочение признаков в соответствии с критерием дискриминантного анализа и t-критерием Стьюдента, а также перебор всех пар и троек признаков. Экспериментальные исследования проводились на трёх наборах текстурных изображений. В первой серии экспериментов - это изображения камня и песка, во второй - изображения двух видов риса и в третьей -снимки компьютерной томографии лёгкого без патологии и лёгкого с эмфиземой.
Данные нашего исследования показали, что перебор всех пар и троек признаков эффективен в задачах классификации изображений песка и камня, а также изображений лёгкого без патологии и лёгкого с эмфиземой, так как вероятность ошибочной классификации в этом случае в два и более раза меньше, чем вероятность ошибки, полученной при отборе признаков с помощью критерия дискриминантного анализа или t-критерия Стьюдента. Кроме того, для задачи классификации изображений лёгких найденная таким способом тройка признаков обеспечивает вероятность ошибки 0,07, что меньше 0,11 - вероятности ошибки, полученной при решении этой же задачи в работе [11], где отобранная группа состояла из пяти признаков.
Результаты отбора признаков с помощью критерия дискриминантного анализа и t-критерия для классификации изображений песка, камня и двух видов риса совпадают. Во второй серии данный подход к отбору признаков оказался эффективным, так как позволил безошибочно классифицировать изображения двух видов риса, что нельзя сказать про перебор всех пар и троек признаков.
Полученные в рамках трёх серий экспериментов результаты позволяют утверждать, что для вектора СКО вероятность ошибочной классификации лучшей группой не превышает вероятность ошибочной классификации лучшей группой для вектора энергий.
Благодарности
Работа выполнена при поддержке гранта РФФИ 14-07-97040-р_поволжье_а и Министерства образования и науки РФ в рамках мероприятий Программы повышения конкурентоспособности СГАУ среди ведущих мировых научно-образовательных центров на
748
Компьютерная оптика, 2015, том 39, №5
Исследование методов отбора информативных признаков ...
Кутикова В.В., Гайдель А.В.
2013-2020 годы, а также Программы фундаментальных исследований ОНИТ РАН «Биоинформатика, современные информационные технологии и математические методы в медицине».
Литература
1. Шапиро, Л. Компьютерное зрение / Л. Шапиро, Дж. Стокман; пер. с англ. - М.: БИНОМ. Лаборатория знаний, 2006. - 752 с.
2. Фраленко, В.П. Методы текстурного анализа изображений, обработка данных дистанционного зондирования Земли / В.П. Фраленко // Программные системы: теория и практика. - 2014. - Т. 22, № 4. - С. 19-39.
3. Mollazade, K. Analysis of texture-based features for predicting mechanical properties of horticultural products by laser light backscattering imaging / K. Mollazade, M. Omid, F.A. Tab, Y.R. Kalaj, S.S. Mohtasebi, M. Zude // Computers and Electronics in Agriculture. - 2013. - Vol. 98. - P. 34-45.
4. Haralick, R.M. Textural features for image classification / R.M. Haralick, K. Shanmugam, I. Dinstein // IEEE Transactions on Systems, Man, and Cybernetics. - 1973. -Vol. 3(6). - P. 610-621.
5. Petrou, M. Image Processing: Dealing with Texture / M. Petou, P.G. Sevilla. - Chichester, UK: John Wiley & Sons Ltd., 2006. - 618 p.
6. Pratt, W. Digital image processing / W. Pratt. - John Wiley & Sons, 1978. - 738 p.
7. Laws, K.I. Rapid Texture Identification / K.I. Laws // SPIE. - 1980. - Vol. 238. - P. 376-380.
8. Lee, D.C. Image segmentation from texture measurement / D.C. Lee, T. Schenk // XVIIth ISPRS Congress. Technical Commission III: Mathematical Analysis of Data. Washington, 1992. - P. 195-199.
9. Куприянов, А.В. Сегментация текстурных изображе-
ний на основе оценивания локальных статистических признаков / А.В. Куприянов // Вестник Самарского государственного аэрокосмического университета. -
2008. - № 2(15). - С. 245-251.
10. Гайдель, А.В. Исследование текстурных признаков для диагностики заболеваний костной ткани по рентгеновским изображениям / А.В. Гайдель, С.С. Первушкин // Компьютерная оптика. - 2013. - Т. 37, № 1. - С. 113-119.
11. Гайдель, А.В. Возможности текстурного анализа компьютерных томограмм в диагностике хронической обструктивной болезни / А.В. Гайдель, С.С. Зельтер,
A. В. Капишников, А.Г. Храмов // Компьютерная оптика. - 2014. - Т. 38, № 4. - С. 843-850.
12. Гайдель, А.В. Исследование текстурных признаков для диагностики нефрологических заболеваний по ультразвуковым изображениям / А.В. Гайдель, С.Н. Ларионова, А.Г. Храмов // Вестник Самарского государственного аэрокосмического университета имени академика С.П. Королёва. -2014. - № 1(43). - С. 229-237.
13. Chandra, B. An efficient statistical feature selection approach for classification of gene expression data /
B. Chandra, M. Gupta // Journal of Biomedical Informatics. - 2011. - Vol. 44. - P. 529-535.
14. Ильясова, Н.Ю. Формирование признаков для повышения качества медицинской диагностики на основе методов дискриминантного анализа / Н.Ю. Ильясова, А.В. Куприянов, Р.А. Парингер // Компьютерная оптика. - 2014. - Т. 38, № 4. - С. 851-855.
15. Tsai, C.-F. Genetic algorithms in feature and instance selection / C.-F. Tsai, W. Eberle, C.Y. Chu // Knowledge-Based Systems. - 2013. - Vol. 39. - P. 240-247.
16. Rami, N.K. Feature subset selection using differential evolution and a statistical repair mechanism / N.K. Rami, A. Al-Ani, A. Al-Jumaily // Expert Systems with Applications. - 2011. - Vol. 38(9). - P. 11515-11526.
17. База текстур Kylberg [Электронный ресурс]. - URL: http://www.cb.uu.se/~gustaf/texture/ (дата обращения 20.10.2015).
18. Fukunaga, K. Introduction to statistical pattern recognition / K. Fukunaga. - San Diego: Academic Press, 1990. - 592 p.
References
[1] Shapiro LG, Stockman GC. Computer Vision. N.J.: Rren-tice-Hall; 2001.
[2] Fralenko VP. Methods of image texture analysis, Earth remote sensing data processing [In Russian]. Program systems: theory and applications 2014; 22(4): 19-39.
[3] Mollazade K, Omid M, Tab FA, Kalaj YR, Mohtasebi SS, Zude M. Analysis of texture-based features for predicting mechanical properties of horticultural products by laser light backscattering imaging. Computers and Electronics in Agriculture 2013; 98: 34-45.
[4] Haralick RM, Shanmugam K, Dinstein I. Textural features for image classification. // IEEE Transactions on Systems, Man, and Cybernetics 1973; 3(6): 610-21.
[5] Petrou M, Sevilla PG. Image Processing: Dealing with Texture. John Wiley & Sons Ltd; 2006.
[6] Pratt W. Digital image processing. John Wiley & Sons; 1978.
[7] Laws KI. Rapid Texture Identification. SPIE 1980; 238: 376-80.
[8] Lee DC, Schenk T. Image segmentation from texture measurement. XVIIth ISPRS Congress. Technical Commission III: Mathematical Analysis of Data. Washington 1992; 195-9.
[9] Kupriyanov AV. Texture image segmentation based on estimating the local statistical features. [In Russian]. Herald of the Samara State Aerospace University 2008; 2(15): 245-51.
[10] Gaidel AV, Pervushkin SS. Research of the textural features for the bony tissue diseases diagnostics using the roentgenograms [In Russian]. Computer Optics 2013; 37(1): 113-9.
[11] Gaidel AV, Zelter PM, Kapishnikov AV, Khramov AG. Computed tomography texture analysis capabilities in diagnosing a chronic obstructive pulmonary disease [In Russian]. Computer Optics 2014; 38(4): 843-50.
[ 12] Gaidel AV, Larionova SN, Khramov AG. Research of the textural feactures for the nephrological diseases diagnostics using the ultrasound images [In Russian]. Herald of the Samara State Aerospace University 2014; 1(43): 229-37.
[13] Chandra B, Gupta M. An efficient statistical feature selection approach for classification of gene expression data. Journal of Biomedical Informatics 2011; 44: 529-35.
[14] Ilyasova NYu, Kupriyanov AV, Paringer RA. Formation of features for improving the quality of medical diagnosis based on discriminant analysis methods [In Russian]. Computer Optics 2014; 38(4): 851-5.
[15] Tsai CF, Eberle W, Chu CY. Genetic algorithms in feature and instance selection. Knowledge-Based Systems 2013; 39: 240-7.
[16] Rami NK, Al-Ani A, Al-Jumaily A. Feature subset selection using differential evolution and a statistical repair mechanism. Expert Systems with Applications 2011; 38(9): 11515-26.
[17] Kylberg texture dataset. Source: (http://www.cb.uu.se/~gus-taf/texture/).
[18] Fukunaga K. Introduction to statistical pattern recognition. San Diego: Academic Press; 1990.
Компьютерная оптика, 2015, том 39, №5
749
Исследование методов отбора информативных признаков...
Кутикова В.В., Гайдель А.В.
STUDY OF INFORMATIVE FEATURE SELECTION APPROACHES
FOR THE TEXTURE IMAGE RECOGNITION PROBLEM USING LAWS’ MASKS
V. V. Kutikova 1, A. V. Gaidel12 1 Samara State Aerospace University, Samara, Russia,
2 Image Processing Systems Institute, Russian Academy of Sciences, Samara, Russia
Abstract
In the paper, the efficiency of two methods for feature selection based on Laws’ masks is studied. These are a method of feature ordering in accordance with the criterion of discriminant analysis and t-statistic and a method of iterations through all pairs and triplets of features. The experimental results show that the classification error of the best group for features based on the standard deviation does not exceed the classification error of the best group for features based on the average energy.
Keywords: texture analysis, Laws’ masks, feature selection, criterion of discriminant analysis, t-statistic.
Citation: Kutikova VV, Gaidel AV. Study of informative feature selection approaches for the texture image recognition problem using the Laws’ masks. Computer Optics 2015; 39(5): 744-50.-DOI: 10.18287/0134-2452-2015-39-5-744-750.
Acknowledgements: The work was partially funded by the Russian Foundation of Basic Research (grant 14-07-97040-р_поволжье_а) and the Russian Federation Ministry of Education and Science as part of SSAU's competitiveness enhancement program in 2013-2020 and the RAS basic research program "Bioinformatics, modern information technologies and mathematical methods in medicine".
Сведения об авторах
Кутикова Виктория Витальевна, 1994 года рождения, в 2015 году окончила бакалавриат Самарского государственного аэрокосмического университета имени академика С. П. Королёва по направлению «Прикладная математика и информатика». Область научных интересов: компьютерная обработка изображений, теория распознавания образов, биоинформатика.
E-mail: vkutikova94@gmail.com .
Viktoriya Vitalievna Kutikova (b. 1994) graduated from Samara State Aerospace University in 2015 with a Bachelor's degree, majoring in Applied Mathematics and Informatics. Current research interests are in computer image processing, patten recognition, bioinformatics.
Гайдель Андрей Викторович, 1989 года рождения, в 2012 году с отличием окончил Самарский государственный аэрокосмический университет имени академика С. П. Королёва по направлению «Прикладная математика и информатика», работает инженером НИЛ-35 СГАУ и стажёром-исследователем в Институте систем обработки изображений РАН. Область научных интересов: компьютерная обработка изображений, теория распознавания образов, математическое моделирование, теория алгоритмов.
E-mail: andrev. gaidel@gmail.com .
Andrey Viktorovich Gaidel (b. 1989) graduated with honors from Samara State Aerospace University in 2012, majoring in Applied Mathematics and Informatics. He works as an engineer at SRL-35 laboratory of Samara State Aerospace University and an intern researcher at the Image Processing Systems Institute of the Russian Academy of Sciences. His research interests currently focus on computer image processing, pattern recognition, mathematical modeling and theory of computation.
Поступила в редакцию 27 октября 2015 г. Окончательный вариант - 22 ноября 2015 г.
750
Компьютерная оптика, 2015, том 39, №5