Научная статья на тему 'Автоматическое оценивание возраста человека с использованием адаптивного выравнивания яркости и биологически обусловленных признаков'

Автоматическое оценивание возраста человека с использованием адаптивного выравнивания яркости и биологически обусловленных признаков Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
386
61
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОЦЕНИВАНИЕ ВОЗРАСТА / НОРМАЛИЗАЦИЯ ИЗОБРАЖЕНИЯ ЛИЦА / КОНТРАСТНО-ОГРАНИЧЕННОЕ АДАПТИВНОЕ ВЫРАВНИВАНИЕ ГИСТОГРАММЫ / БИОЛОГИЧЕСКИ ОБУСЛОВЛЕННЫЕ ПРИЗНАКИ / МЕТОД РАНЖИРОВАНИЯ / AGE ESTIMATION / FACE IMAGE NORMALIZATION / CONTRAST LIMITED ADAPTIVE HISTOGRAM EQUALIZATION / BIOLOGICALLY INSPIRED FEATURES / RANKING METHOD

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Спижевой А. С., Оголихина А. И., Бовырин А. В.

Предложено использование биологически обусловленных признаков совместно с методом ранжирования для автоматического оценивания возраста человека по фотографии. С целью обеспечения устойчивости оценивания были рассмотрены методы геометрической нормализации и нормализации яркости. На стандартной базе FG-NET средняя ошибка оценивания составила 4.1 года, что демонстрирует превосходство предложенного подхода над наилучшими известными методами.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Спижевой А. С., Оголихина А. И., Бовырин А. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AUTOMATIC FACIAL AGE ESTIMATION USING ADAPTIVE BRIGHTNESS EQUALIZATION AND BIOLOGICALLY INSPIRED FEATURES

Biologically inspired features together with the ranking method are proposed to be used for automatic facial age estimation. Geometric and brightness normalization methods are considered to secure the estimation sustainability. The average estimation error of 4.1 years was obtained on the standard FG-NET database that demonstrates the superiority of the proposed approach over the best known methods.

Текст научной работы на тему «Автоматическое оценивание возраста человека с использованием адаптивного выравнивания яркости и биологически обусловленных признаков»

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

УДК 004.932.2

АВТОМАТИЧЕСКОЕ ОЦЕНИВАНИЕ ВОЗРАСТА ЧЕЛОВЕКА С ИСПОЛЬЗОВАНИЕМ АДАПТИВНОГО ВЫРАВНИВАНИЯ ЯРКОСТИ И БИОЛОГИЧЕСКИ ОБУ СЛОВЛЕННЫХ ПРИЗНАКОВ

© 2014 г. А.С. Спижевой, А.И. Оголихина, А.В. Бовырин

Нижегородский госуниверситет им. Н.И. Лобачевского

alexey. spizhevoj @gmail. com

Поступила в редакцию 26.11.2013

Предложено использование биологически обусловленных признаков совместно с методом ранжирования для автоматического оценивания возраста человека по фотографии. С целью обеспечения устойчивости оценивания были рассмотрены методы геометрической нормализации и нормализации яркости. На стандартной базе FG-NET средняя ошибка оценивания составила 4.1 года, что демонстрирует превосходство предложенного подхода над наилучшими известными методами.

Ключевые слова: оценивание возраста, нормализация изображения лица, контрастно-ограниченное адаптивное выравнивание гистограммы, биологически обусловленные признаки, метод ранжирования.

Введение

В последнее время наблюдается непрерывный рост интереса к задаче автоматического оценивания возраста. Умение точно определять возраст человека по его фотографии находит свое применение во многих областях, а именно, таких как:

• создание человеко-машинных интерфейсов, в которых поведение системы подстраивается под пользователя;

• анализ возрастного состава аудитории и выстраивание стратегии маркетинга;

• мониторинговые системы;

• биометрические системы;

• системы поиска изображений в больших базах данных.

Однако автоматическое оценивание возраста человека является достаточно сложной задачей. Изменение внешности во времени включает в себя два процесса: изменение геометрических параметров лица, т.е. его формы и размеров, а также изменение текстуры кожи. Если первый процесс проходит с наибольшей интенсивностью в детстве, то интенсивность второго начинает преобладать по мере достижения зрелого возраста. И хотя интенсивность этих процессов варьируется в зависимости от времени, они всегда идут одновременно, и для точного оценивания возраста необходимо учитывать в комплексе как геометрические, так и текстурные изменения лица.

Задача автоматического оценивания возраста заключается в определении возраста или возрастной группы по изображению лица. Все существующие на данный момент подходы можно примерно разделить на два подкласса в зависимости от используемого ими типа алгоритма машинного обучения: классификация [1, 2] или регрессия [3, 4]. Однако существуют и гибридные системы, составляющие меньшинство, которые используют оба подхода, см., например, [5].

Ввиду сложности процесса изменения лица по мере старения, самому человеку порой не под силу определить точный возраст по фотографии. Задачу осложняет также то, что изменение внешности с течением времени носит индивидуальный характер, зависит от многих факторов, таких как пол, условия окружающей среды, образ жизни, наследственность, этническое происхождение. Из-за влияния этих и других факторов внешность человека может не соответствовать его реальному возрасту, что осложняет задачу оценивания и приводит к увеличению ошибки. Положение головы, наличие макияжа, освещенность в момент фотографирования также могут приводить к ошибкам в определении возраста.

Постановка задачи

Мы формулируем задачу автоматического оценивания возраста по фотографии лица человека следующим образом: пусть имеется трени-

ровочная выборка, содержащая m изображений лиц {(X., yt), i = 1,..., m}, где Xt = X (I.) - описатель, вычисленный по изображению лица It, X -функция, которая осуществляет вычисление описателя лица по изображению, и y. -истинное значение возраста в годах. Цель состоит в том, чтобы научиться вычислять оценку возраста y(X(I)) по новому для системы изображению лица I, которое не содержится в тренировочной выборке.

Два основных вопроса, которые будут рассматриваться далее, - это как выбирать функцию X, т.е. как вычислять описатели лица, и каким образом осуществлять моделирование функции возраста, т.е. вычислять оценку возраста y(X (I)).

Описатели лица

Для вычисления признаков изображения лица были использованы биологически обусловленные признаки (biologically inspired features, BIF), предложенные в работе [1]. Как отмечалось во введении, такие факторы, как поворот головы и условия освещения в момент фотографирования, оказывают заметное влияние на результат оценивания возраста. В нашем случае оба этих фактора будут сказываться на описателях лица. Это крайне нежелательно, т.к. ни ориентация головы, ни освещенность не несут никакой информации о возрасте человека и могут лишь ухудшить качество работы всей системы. Поэтому предварительно мы выполняем нормализацию изображения, чтобы сделать систему более устойчивой к изменениям масштаба, наклона, смещения и уменьшить влияние неравномерного освещения. Таким образом, алгоритм вычисления описателей лица включает в себя следующие шаги:

1. Нормализовать входное изображение лица.

1.1. Выполнить геометрическую нормализацию.

1.2. Выполнить нормализацию яркости.

2. Вычислить биологически обусловленные признаки.

3. Уменьшить размерность вектора признаков.

Далее мы рассмотрим все шаги подробнее.

Геометрическая нормализация

Г еометрическая нормализация позволяет сделать описатели лица инвариантными к таким двумерным геометрическим трансформациям,

как изменение масштаба, поворот и сдвиг. Суть предлагаемого подхода состоит в применении такого геометрического преобразования к исходному изображению, которое переводит центры глаз в две фиксированные и выбранные заранее точки. Таким способом масштаб лица, ориентация в плоскости изображения и сдвиг будут зафиксированы.

Пусть Pie = (Xe , У ie )T и Pre = (Xre , Уге )T - это координаты центров левого и правого глаза на исходном изображении I. Используя преобразование подобия, которое является комбинацией поворота, масштабирования и сдвига, точки Pie и pre переводятся в фиксированные точки

Pe = (0.78W,0.25H)T и pe = (0.22W,0.25H)T , где W и H - это желаемые ширина и высота изображения после геометрической нормализации. Координаты фиксированных точек (новое положение глаз) ре и pre были подобраны экспериментально.

Информация об исходном расположении глаз бралась из данных базы FG-NET [6]. В реальных приложениях координаты глаз могут быть найдены при помощи заранее обученных детекторов признаков лица. Библиотека OpenCV [7], например, содержит обученные детекторы глаз.

Нормализация яркости

Следующим шагом в работе всей системы является нормализация яркости изображения. Данный шаг позволяет исключить нежелательное влияние вариации освещенности в изображении на описатели лица. Без нормализации яркости неравномерность освещения, недостаточная или избыточная освещённость влияют на описатели, не несут никакой полезной информации и, следовательно, ухудшают точность оценивания возраста.

В данной работе были рассмотрены два метода нормализации яркости изображения: выравнивание гистограммы (histogram equalization, HE) и контрастно-ограниченное адаптивное выравнивание гистограммы (contrast-limited adaptive histogram equalization, CLAHE) [8]. Подробное описание и сравнение двух этих методов применительно к задаче биометрической идентификации можно найти в работе [9], ниже оба метода будут кратко изложены.

Выравнивание гистограммы применяется к чёрно-белому изображению I и преобразует его таким образом, чтобы гистограмма яркостей выходного изображения примерно отвечала равномерному закону распределения. Алгоритм состоит из следующих двух шагов:

1. Вычислить интегральную функцию

распределения яркостей F(I) = "V —, где — -

Т0 п

количество пикселей изображения I, значение яркости которых равно i, п - общее количество пикселей изображения, I - уровень яркости (от

0 до 255).

2. Преобразовать входное изображение: I'(х,у) = 255Г(I(х,у)), где I' - выходное изображение, а х и у - координаты пикселей.

Однако если распределение яркостей на исходном изображении сильно геометрически неоднородно, например, одна половина лица намного ярче другой из-за падающей на лицо тени, то в таком случае обычный метод глобального выравнивания гистограммы работает недостаточно хорошо, т.к. после нормализации одна половина лица все равно окажется ярче другой. В случае геометрически неоднородного распределения яркостей желательно получить в результате нормализации более однородное распределение на выходном изображении, т.к. это может улучшить точность оценивания возраста.

Адаптивное выравнивание гистограммы [8], в отличие от глобального, анализирует небольшие участки изображения и позволяет усилить локальный контраст, не делая предположений о распределении яркостей на всем изображении. Для каждого пикселя рассматривается только небольшая окрестность изображения, по которой строится функция преобразования, при этом все изображение, как таковое, не используется. Однако такой подход склонен к зашум-лению однородных областей изображения. В таких областях интегральная кривая Г(I), вычисляемая на первом шаге работы алгоритма выравнивания гистограммы, будет иметь резкий наклон из-за того, что большое число пикселей имеют схожую яркость. Это приведёт к тому, что два близких значения яркости на изображении

1 будут отображены в сильно разные по значению яркости на изображении I'. Чем меньше размер окрестности, тем больше однородных областей и тем сильнее будет зашумление.

Добавление ограничения перепада яркости позволяет избавиться от эффекта зашумления. Алгоритм с такой модификацией называется контрастно-ограниченным адаптивным выравниванием гистограммы и включает в себя следующие шаги:

1. Для каждого пикселя с координатами р = (х, у) на изображении I:

1.1. Вычислить гистограмму Н к (I) окрестности пикселя р размера к х к.

1.2. Обрезать гистограмму Нрк (I) = = тт(Нр к (I),Т) по заданному порогу Т .

1.3. Перераспределить срезанные значения яркости гистограммы Н к (I) так, чтобы высота бинов не превосходила значения порога Т, и получить новую гистограмму Н рк (I).

1.4. По гистограмме Нрк(I) вычислить интегральную функцию распределения Гр к (I) =

=£Нр,к а

1=о

1.5. Вычислить яркость пикселя выходного изображения I'(х, у) = 255Гр к (I (х, у)).

Биологически обусловленные признаки

Биологически обусловленные признаки [1] были разработаны для приближенного моделирования процесса восприятия визуальной информации клетками зрительной коры головного мозга млекопитающего, см. [4]. Входной информацией для алгоритма является чёрно-белое изображение. Процесс вычисления признаков включает в себя следующие шаги:

1. Для каждого 0 из заранее выбранного множества углов:

1.1. Применить множество фильтров Г абора к исходному изображению I.

1.2. Выполнить пост-обработку результатов работы фильтров.

1.3. Вычислить статистические признаки по обработанным результатам от фильтров.

1.4. Объединить все признаки в один вектор.

Всего применяется 16 фильтров с разными

параметрами для 8 разных ориентаций в диапазоне [О, п ], итого 128 фильтров. Значения параметров для 16 фильтров приведены в [1], были получены как результат аппроксимации данных нейрофизиологических экспериментов, см. [4]. Число ориентаций можно варьировать. В наших экспериментах (от 4 до 12 углов) при 8 углах была достигнута наилучшая точность.

Фильтрация изображения

Фильтр Габора - это линейный фильтр с ядром G, которое можно рассматривать как двумерную функцию Гаусса, модулированную косинусной волной в некотором направлении. Ядро G задаётся следующим образом:

у) = ехр(- х ^Т2у х' + ф^ (1)

2с Л

где x = x cos 0 + y sin 0, y =-x sin 0 + y cos 0 , 0 - ориентация, s - размер фильтра, x, y e e {— s/2,...,s/2}, у - коэффициент сжатия, ст -среднеквадратическое отклонение функции Гаусса, X - длина волны, ф - сдвиг фазы волны.

Следующий шаг вычисления биологически обусловленных признаков, идущий после применения фильтров, заключается в попарном слиянии полученных на предыдущем шаге результатов фильтрации. Все отфильтрованные изображения разбиваются на пары: в каждой паре изображения соответствуют разным, но близким по параметрам s , ст , X фильтрам Габора с одинаковыми ориентациями 0. Далее в каждой паре изображения сливаются в одно путём применения попиксель-ной операции взятия максимума:

Fk = max(/ * G2k , I * G2k ), (2)

где k - номер пары отфильтрованных изображений, знак * означает операцию применения линейного фильтра (корреляция). Операция линейной фильтрации изображения I с фильтром G размера s х s выполняется следующим образом:

F(X y) = 21 (x + i, y + j)G(i, j),

—s<i<s —s<j<s

где F = I * G - результат фильтрации. Использование максимумов, а не непосредственно выходов от фильтров повышает устойчивость признаков к незначительным двумерным трансформациям, таким как, например, изменение масштаба.

Статистические признаки

Данный шаг предполагает применение техники «скользящего окна» по изображениям Fk, полученным на предыдущем шаге слияния отфильтрованных изображений. В каждом окне с координатами верхнего левого угла (x0,y0) и размером Nk х Nk мы вычисляем стандартное отклонение для значений элементов из окна:

W 2 (F

k (x,y)e[l,Nk ]2

x0,yo,k (x, y) Fx0,yo,k

Уменьшение размерности вектора признаков

Общее количество признаков может быть очень большим (11072 для изображения 66 х 66), при этом некоторые признаки могут быть статистически зависимыми. При высокой размерности и относительно малом объёме тренировочной выборки может возникнуть проблема переобучения. Для уменьшения размерности вектора признаков используется метод главных компонент [10]. Суть данного метода заключается в следующем. Пусть имеется т наблюдений X1 случайной многомерной величины X размерности N. Оценка матрицы ковариации будет иметь следующий вид:

l

s = -2 (X - х)(X - х)'.

m

(4)

После этого мы находим собственные значения и собственные векторы для оценки матрицы ковариации. В результате вместо того чтобы работать в высокоразмерном пространстве, мы работаем в низкоразмерном пространстве размерности п << N, сформированном собственными векторами матрицы £, которые соответствуют п наибольшим собственным числам. Эти векторы задают п ортогональных направлений, вдоль которых вариация, согласно имеющимся данным, максимальна. Новые значения многомерной случайной величины могут быть получены проецированием после центрирования исходного значения на подпространство, образованное собственными векторами:

X ' =

(Xi - X).

(5)

)2 , (3)

где уо к (х, у) - элемент (х, у) текущего окна в изображении Гк, мк - среднее значение элементов текущего окна. Конкретные значения размеров окон Nk для каждого к = 1,...,8 приводятся в [1]. Вычисленные значения стандартных отклонений формируют биологически обусловленные признаки. Чтобы уменьшить количество признаков, используются не все позиции скользящего окна: окно перемещается с шагом, равным половине своего размера.

Рассматривая вектор признаков как случайную многомерную величину, а данные из обучающей выборки - как наблюдения этой случайной величины, можно уменьшить размерность вектора признаков с помощью описанного метода. Данным образом осуществляется уменьшение размерности вектора признаков с 11072 до 881 - значения, обеспечивающего наилучший результат в проведенных нами экспериментах.

Алгоритм оценивания

В качестве подхода, используемого для оценивания возраста по описателям лица, используется метод, основанный на ранжировании. Пусть имеется множество запросов Q и описателей Б. Целью обучения ранжированию является построение такой модели f ^, d), которая

T

v

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

n

k

на выходе даёт меру соответствия того, насколько хорошо объект rf е Б соответствует данному запросу q е Q . Предполагается, что мера соответствия принадлежит некоторому линейно упорядоченному множеству У, см. [11]. После построения такой модели можно, например, ранжировать документы по мере их соответствия некоторому запросу, как это делается в поисковых системах. Однако обучение ранжированию также оказывается удобной техникой для оценивания возраста, т.к. позволяет разбить исходную постановку задачи на множество подзадач, каждая из которых отвечает на вопрос: «Старше ли данный человек t лет?». Такие вопросы составляют множество запросов Q в терминах постановки задачи обучения ранжированию. Главным преимуществом такого подхода является моделирование важного свойства процесса старения - неоднородности для разных возрастных групп, т.е. закон старения может описываться по-разному в разные годы, что действительно имеет место, потому что, как отмечалось ранее во введении, до определенного возраста при старении преобладает процесс изменения формы черепа, а только затем начинает преобладать старение кожи. Строя разные бинарные классификаторы для ответа на каждый вопрос описанного типа, мы явно учитываем временную неоднородность процесса старения.

Пусть Х1 - это описатель /-го лица в тренировочной выборке, которому соответствует истинный возраст у. е{0,1,...,К}, где К -максимально допустимый возраст (максимальный наблюдаемый возраст человека в обучающей выборке). Возрастная метка 0 означает возраст до одного года. Для каждого возможного возраста t мы разделяем тренировочный набор данных на две части следующим образом:

х;= {(X, ,1)|у > о,

X; = {(X, ,0) | у, < 0. ( )

Два этих множества используются для тренировки множества бинарных классификаторов {/,}, каждый из которых отвечает, соответственно, на вопрос: «Старше ли данный человек t лет или нет?». Чтобы получить финальную оценку возраста, к входному вектору признаков применяются все К бинарных классификаторов. Выходное значение равно числу классификаторов, ответивших положительно на соответствующий вопрос, т.е.

y( X) = 2 ft (X).

ны опорных векторов (support vector machine, SVM, см. [12]) с RBF ядром, реализованный в библиотеке OpenCV.

Стандартный тестовый набор данных

Эксперименты проводились на стандартном тестовом наборе данных - базе изображений FG-NET [6]. Данная база содержит 1002 фотографий 82 различных людей, по несколько изображений на человека, в возрасте от младенчества до 69 лет. Вместе с фотографиями и возрастными метками в базе доступны 68 ключевых точек лица, из которых в нашей системе используются только центры глаз на шаге геометрической нормализации. Распределение возрастов в базе неравномерно, т.к. большая часть изображений (около 90%) соответствует возрастам до 30 лет. Примеры фотографий одного из субъектов, представленных в базе FG-NET, приведены на рис. 1.

Характеристики качества оценивания

Используются две широко распространенные меры качества работы алгоритмов оценивания возраста. Первая - это средняя абсолютная ошибка (mean absolute error, MAE), которая вычисляется следующим образом:

i m

MAE = -2l yt -yj,

m i=1

где m - общее число тестовых изображений, y -истинное значение возраста человека на i-й фотографии, а y. - оценка возраста человека на i-й фотографии. Другой широко используемой характеристикой точности является интегральная функция распределения абсолютной ошибки (суммарный счет, cumulative score, CS), которая отражает распределение абсолютных ошибок по годам и вычисляется следующим образом:

CS (L) =

me.

m

•100%, где m <L - количество тес-

(7)

Для построения классификаторов использовался метод классификации с помощью маши-

товых изображений с абсолютной ошибкой предсказания e < L лет. Чем меньше значение MAE, тем точнее метод, и чем выше значение CS для каждого года, тем лучше, т.к. это означает, что совершаются меньшие по абсолютному значению ошибки.

Для оценивания качества работы системы использовалась техника кросс-валидации с числом разбиений, равным количеству человек в базе. При каждом разбиении база с изображениями делилась на тренировочную и тестовые подвыборки. В качестве тестовой выборки использовались все фотографии одного и только одного человека, соответственно в качестве

Рис. 1. Примеры фотографий из базы РО-ЫЕТ

О 2 4 6 8 10 12 14 16 18 20

Ошибка в годах

Рис. 2. График зависимости меры CS(L) от уровня ошибки L на базе FG-NET

Таблица

Сравнение результатов работы предложенного метода с наилучшими известными подходами на стандартной базе FG-NET

Метод МАЕ CS(L=5)

BIF+SVR [1] 4.77 « 69%

ААМ+ОНИапк1 [2] 4.48 74.4%

ААМ+ОНИапк2 [2] 4.56 74.4%

С-^СА+^ЬРР [10] 4.38 « 74%

Предложенный метод (НЕ) 4.32 74.7%

Предложенный метод (СЬАНЕ) 4.1 76.4%

тренировочной выборки использовались все остальные изображения. Обучение классификатора осуществлялось только на изображениях из тренировочной выборки, а тестирование - только на изображениях из тестовой выборки. При такой схеме все изображения одного и того же человека используются либо для обучения, либо для тестирования. Общее число разбиений равнялось 82 - количеству различных людей в базе.

Результаты экспериментов

В данном разделе приводится сравнение результатов оценивания возраста при помощи подхода, предложенного в статье, с наилучшими известными на данный момент методами. Для сравнения использовалась одна и та же база данных Бв-ЖТ. Были проведены эксперименты по исследованию различных методов нормализации изображения - результаты отражены в таблице, из которой можно видеть, что по всем показателям предложенный метод с нормализацией яркости на основе метода ^АНЕ обеспечивает наилучшее качество работы.

Из проведенных экспериментов также можно видеть превосходство метода контрастноограниченного адаптивного выравнивания гис-

тограммы по сравнению с обычным выравниванием гистограммы для нормализации яркости изображения. На рис. 2 изображен график меры CS в зависимости от уровня ошибки.

Заключение

В данной статье предложен новый метод для автоматического оценивания возраста человека по его фотографии, основанный на биологически обусловленных признаках и методе ранжирования. Было проведено сравнение двух методов нормализации яркости изображений. В качестве наилучшего подхода был выбран метод контрастно-ограниченного адаптивного выравнивания гистограммы - данный подход показал лучшие результаты по сравнению с обычным глобальным выравниванием гистограммы. Также были проведены вычислительные эксперименты на стандартном тестовом наборе данных Рв-ЫЕТ. По результатам экспериментов предложенный авторами метод автоматического оценивания возраста превзошел все известные подходы по точности на одном и том же наборе данных, в частности, была достигнута средняя абсолютная ошибка оценивания в 4.1 года.

Список литературы

1. Guo Guodong, Guowang Mu, Yun Fu, and Thomas S. Huang. Human age estimation using bioinspired features // Computer Vision and Pattern Recognition. 2009. Р. 112-119.

2. Guo Guodong, Yun Fu, Charles R. Dyer, and Thomas S. Huang. Image-based human age estimation by manifold learning and locally adjusted robust regression // Image Processing, IEEE Transactions. 2008. V. 17. № 7. P. 1178-1188.

3. Chang Kuang-Yu, Chu-Song Chen and Yi-Ping Hung. Ordinal hyperplanes ranker with cost sensitivities for age estimation // Computer Vision and Pattern Recognition (CVPR). IEEE Conference. 2011. P. 585-592.

4. Riesenhuber Maximilian and Tomaso Poggio. Hierarchical models of object recognition in cortex // Nature neuroscience 2. 1999. № 11. P. 1019-1025.

5. Guo Guodong, Yun Fu, Thomas S. Huang, and Charles R. Dyer. Locally adjusted robust regression for human age estimation // Applications of Computer Vision. 2008. WACV 2008. IEEE Workshop. 2008. P. 1-6.

6. The FG-NET Aging Database. URL: http:// www.fgnet.rsunit.com/, URL: http://www-prima. in-rialpes .fr/FGnet/.

7. Open Source Computer Vision Library. URL: http://opencv. org/.

8. Pizer Stephen M. et al. Adaptive histogram equalization and its variations // Computer vision, graphics, and image processing. 1987. V. 39. № 3. P. 355-368.

9. Benitez-Garcia G., Olivares-Mercado J., Aguilar-Torres G. et al. Identification Based on Contrast Limited Adaptive Histogram Equalization (CLAHE) // Image processing, computer vision, & pattern recognition. IPCV. 2011.

10. Abdi H., Williams L.J. Principal component analysis // Wiley Interdisciplinary Reviews: Computational Statistics. 2010. № 2(4). P. 433-459.

11. Hang L. A short introduction to learning to rank // IEICE TRANSACTIONS on Information and Systems. 2011. № 94(10). P. 1854-1862.

12. Cortes Corinna, Vapnik V. Support-vector networks // Machine learning. 1995. № 20.3. P. 273-297.

13. Chao W.-L., Liu J.-Z., Ding J.-J. Facial age estimation based on label-sensitive learning and age-specific local regression // Acoustics, Speech and Signal Processing (ICASSP). IEEE International Conference. 2012. P. 1941-1944.

AUTOMATIC FACIAL AGE ESTIMATION USING ADAPTIVE BRIGHTNESS EQUALIZATION AND BIOLOGICALLY INSPIRED FEATURES

A.S. Spizhevoy, A. I. Ogolikhina, A V. Bovyrin

Biologically inspired features together with the ranking method are proposed to be used for automatic facial age estimation. Geometric and brightness normalization methods are considered to secure the estimation sustainability. The average estimation error of 4.1 years was obtained on the standard FG-NET database that demonstrates the superiority of the proposed approach over the best known methods.

Keywords: age estimation, face image normalization, contrast limited adaptive histogram equalization, biologically inspired features, ranking method.

References

14. Guo Guodong, Guowang Mu, Yun Fu, and Thomas S. Huang. Human age estimation using bioinspired features // Computer Vision and Pattern Recognition. 2009. P. 112-119.

15. Guo Guodong, Yun Fu, Charles R. Dyer, and Thomas S. Huang. Image-based human age estimation by manifold learning and locally adjusted robust regression // Image Processing, IEEE Transactions. 2008. V. 17. № 7. P. 1178-1188.

16. Chang Kuang-Yu, Chu-Song Chen and Yi-Ping Hung. Ordinal hyperplanes ranker with cost sensitivities for age estimation // Computer Vision and Pattern Recognition (CVPR). IEEE Conference. 2011. P. 585-592.

17. Riesenhuber Maximilian and Tomaso Poggio. Hierarchical models of object recognition in cortex // Nature neuroscience 2. 1999. № 11. P. 1019-1025.

18. Guo Guodong, Yun Fu, Thomas S. Huang, and Charles R. Dyer. Locally adjusted robust regression for human age estimation // Applications of Computer Vision. 2008. WACV 2008. IEEE Workshop. 2008. P. 1-6.

19. The FG-NET Aging Database. URL: http:// www.fgnet.rsunit.com/, URL: http://www-prima. in-rialpes.fr/FGnet/.

20. Open Source Computer Vision Library. URL: http://opencv. org/.

21. Pizer Stephen M. et al. Adaptive histogram equalization and its variations // Computer vision, graphics, and image processing. 1987. V. 39. № 3. P. 355368.

22. Benitez-Garcia G., Olivares-Mercado J., Aguilar-Torres G. et al. Identification Based on Contrast Limited Adaptive Histogram Equalization (CLAHE) // Image processing, computer vision, & pattern recognition. IPCV. 2011.

23. Abdi H., Williams L.J. Principal component analysis // Wiley Interdisciplinary Reviews: Computational Statistics. 2010. № 2(4). P. 433-459.

24. Hang L. A short introduction to learning to rank // IEICE TRANSACTIONS on Information and Systems. 2011. № 94(10). P. 1854-1862.

25. Cortes Corinna, Vapnik V. Support-vector networks // Machine learning. 1995. № 20.3. P. 273-297.

26. Chao W.-L., Liu J.-Z., Ding J.-J. Facial age estimation based on label-sensitive learning and age-specific local regression // Acoustics, Speech and Signal Processing (ICASSP). IEEE International Conference. 2012. P. 1941-1944.

i Надоели баннеры? Вы всегда можете отключить рекламу.