Научная статья на тему 'К вопросу об оптимальном количестве исходных изображений для получения инвариантного обобщённого фотопортрета'

К вопросу об оптимальном количестве исходных изображений для получения инвариантного обобщённого фотопортрета Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
105
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФИЗИЧЕСКАЯ АНТРОПОЛОГИЯ / PHYSICAL ANTHROPOLOGY / ОБОБЩЕННЫЙ ФОТОПОРТРЕТ / ИНДИВИДУАЛЬНЫЕ ОСОБЕННОСТИ / INDIVIDUAL FEATURES / УСТРАНЕНИЕ ЦИФРОВЫХ ШУМОВ / ELIMINATION OF DIGITAL NOISE / ПИКСЕЛЬ / PIXEL / СРЕДНЕЕ КВАДРАТИЧЕСКОЕ ОТКЛОНЕНИЕ / MEAN SQUARE DEVIATION / COMPOSITE PHOTOPORTRAIT

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Савинецкий Александр Борисович, Маурер Андрей Маркович, Сыроежкин Герман Вячеславович

Цель данного исследования оценить необходимое и достаточное количество индивидуальных изображений для формирования устойчивого и узнаваемого зрительного образа обобщённого фотопортрета конкретной выборки. Материал: 72 цифровых фронтальных фотоснимка русских девочек в возрасте 7-9 лет. Метод: метод получения обобщенного фотопортрета с помощью авторского программного обеспечения «faceONface». Результаты: на основе рандомизированных выборок разной численности (от 5 до 70 индивидов) сформировано 10 обобщенных фотопортретов; к полученным фотообобщениям применен метод «устранения шумов» Гонсалеса. График изменения среднеквадратичного отклонения в зависимости от числа накопленных изображений визуализирует давно подмеченную антропологами эмпирическую закономерность достижения количественного порога, при котором добавление новых изображений существенно не меняет визуальное восприятие фотобобщения. Предложено объяснение явления «семантической стабилизации» изображения при достижении определённого порога накопления. При формировании обобщенного фотопортрета индивидуальные особенности каждого лица предложено считать аналогом цифрового «шума». При достижении порога численности в 30-40 исходных снимков обобщённый фотопортрет конкретной выборки освобождается от «личностного шума» (персональных морфологических особенностей лица) и приближается к типологически однородному инвариантному изображению.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Савинецкий Александр Борисович, Маурер Андрей Маркович, Сыроежкин Герман Вячеславович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On the question of optimal number of initial images for obtaining an invariant composite photo portrait

The purpose of this study is to evaluate the necessary and sufficient number of individual images to form a stable and recognizable visual image a composite portrait of a particular sample. Data: 72 digital frontal photographs of Russian girls aged between 7-9 years. Method: software «faceONface» designed for composite photo portrait creation. Results: 10 composite portraits generated on the basis of randomized samples with different capacity (from 5 to 70 individuals); the Gonzalez’s method of «noise elimination» was applied to the data. The graph of variance in mean-square deviation as a function of the number of accumulated images, visualizes previously noticed empirical regularity of achieving a quantitative threshold in which the addition of new images does not significantly change the visual perception of the generalized portrait. A possible explanation of the phenomenon of «semantic stabilization» of an image when a certain threshold of accumulation is reached is proposed. When forming a generalized photo portrait, the individual characteristics of each person are suggested to be considered analogous to the digital «noise». When a threshold in 30-40 initial images is reached, the generalized portrait of a specific sample is freed from «personal noise» (personal morphological features of the face) and approaches a typologically uniform invariant image.

Текст научной работы на тему «К вопросу об оптимальном количестве исходных изображений для получения инвариантного обобщённого фотопортрета»

К ВОПРОСУ ОБ ОПТИМАЛЬНОМ КОЛИЧЕСТВЕ ИСХОДНЫХ ИЗОБРАЖЕНИЙ ДЛЯ ПОЛУЧЕНИЯ ИНВАРИАНТНОГО ОБОБЩЁННОГО ФОТОПОРТРЕТА

А.Б. Савинецкий1, А.М. Маурер2, Г.В. Сыроежкин1

Национальный исследовательский ядерный университет «МИФИ», Москва 2 МГУ имени МВ. Ломоносова, НИИ и Музей антропологии, Москва

Цель данного исследования - оценить необходимое и достаточное количество индивидуальных изображений для формирования устойчивого и узнаваемого зрительного образа - обобщённого фотопортрета конкретной выборки. Материал: 72 цифровых фронтальных фотоснимка русских девочек в возрасте 7-9 лет. Метод: метод получения обобщенного фотопортрета с помощью авторского программного обеспечения «faceONface». Результаты: на основе рандомизированных выборок разной численности (от 5 до 70 индивидов) сформировано 10 обобщенных фотопортретов; к полученным фотообобщениям применен метод «устранения шумов» Гонсалеса. График изменения среднеквадратичного отклонения в зависимости от числа накопленных изображений визуализирует давно подмеченную антропологами эмпирическую закономерность достижения количественного порога, при котором добавление новых изображений существенно не меняет визуальное восприятие фото-бобщения. Предложено объяснение явления «семантической стабилизации» изображения при достижении определённого порога накопления. При формировании обобщенного фотопортрета индивидуальные особенности каждого лица предложено считать аналогом цифрового «шума». При достижении порога численности в 30-40 исходных снимков обобщённый фотопортрет конкретной выборки освобождается от «личностного шума» (персональных морфологических особенностей лица) и приближается к типологически однородному инвариантному изображению.

Ключевые слова: физическая антропология, обобщенный фотопортрет, индивидуальные особенности, устранение цифровых шумов, пиксель, среднее квадратическое отклонение

Введение

Метод обобщенного портрета широко используется в антропологии в качестве познавательного инструмента, имеющего как научно-иллюстративный, так и гуманитарный аспект. С одной стороны метод упрощает решение таких задач, как визуализация половой, возрастной и этно-территориальной изменчивости популяций, [Перевозчиков, Маурер, 2009] с другой - помогает осмыслить такие эстетические категорий, как красота и гармоничность [Гиляров, 1999]. Внедрена в практику инновационная компьютерная программа «ТасеО№асе», разработанная А.Б. Савинецким и Г.В. Сыроеж-киным [Савинецкий с соавт., 2015], позволяющая получать фотообобщения повышенной чёткости путем наложения и сопоставления изображений в норме анфас по трем точкам - двум зрачковым (рирНПоп) и ротовой фотюп), и прошедшая тестирование в лаборатории расоведения НИИ и Музея антропологии МГУ имени М.В.Ломоносова [Маурер, Сыроежкин, 2015; Сыроежкин, Савинецкий, Маурер, 2017].

Ранее эмпирически было показано, что численность порядка тридцати-сорока лиц, вводимых в обобщённый фотопортрет, полученный методом проекционной фотопечати, в целом достаточна для визуальной характеристики генетически однородной группы [Павловский, Перевозчиков, 1977]. Однако не представлялось возможным дать математическое описание процесса накопления и «стабилизации» итогового изображения. Иными словами, ранее качество фотообобщения оценивалось исключительно визуально и не подкреплялось статистическим обоснованием.

Цель данной работы - дать количественную оценку достижения порога численности индивидуальных изображений, необходимых и достаточных для формирования устойчивого и узнаваемого зрительного образа.

Известно, что при фотосъемке вследствие несовершенства технологий, а также самой фотонной природы света возникают дефекты изображения, вносимые фотосенсорами и электроникой устройств - так называемый цифровой шум. Метод устранения шумов путем многократного фотогра-

фирования и последующего редактирования снимка определённого участка неба (метод усреднения изображений) широко применим в астрофотографии [Гонсалес, Вудс, 2012]. Алгоритм получения очищенного от «шума» четкого изображения астрономического объекта состоит из двух этапов:

- осуществляется многократное фотографирование астрономического объекта,

- полученные изображения последовательно накладываются друг на друга с усреднением каждого из пикселей (элементов) изображений.

Аналогичные методы используются и в медицинских исследованиях во время проведения ультразвукового исследования и рентгенографии. При последующей обработке полученных изображений программное обеспечение аппаратов производит объединение нескольких отдельных снимков с целью получения наиболее четкого результата [Сыроежкин с соавт., 2017]. В настоящей работе авторами предпринята попытка применить этот метод устранения шумов к массиву антропологических цифровых данных для получения оценки необходимого и достаточного числа изображений для формирования инвариантного обобщенного фотопортрета. Приведем математическое обоснование такого подхода:

Пусть зашумленное изображение g(x,y) формируется добавлением шума n(x,y) к исходному изображению f(x,y), т.е.

g(x,y) = f(x,y) + n(x,y). (формула 1)

Предполагается, что значения шума в каждой точке (x,y) являются некоррелированными и имеют среднее нулевое значение. Тогда усредненное из К изображений §{х,у) выражается формулой:

§(?с,у) ^ЙЦ^СхоО. (формула 2)

С учетом, того что Цф.уУ) =о и значения шума некоррелированы, получаем:

Е{д{х, у)} = fix,у). (формула 3)

На следующем этапе мы оценили разброс значений (иными словами, дисперсию) математического ожидания (в нашем случае f(x,y)).

Дисперсия суммы независимых или некоррелированных случайных величин равна сумме дисперсий. Таким образом:

ЩдОс,у)]-Щ±Яш1д&уУ\ = ¿Sf-iDfofry)] .

Обозначим т>[д(х,у)] как сг/с*,>0

Из [Боровков, 2009] имеем:

= d зО) = ¿SUDfoCcoO] =

где d^Oc,y)]=J)[f&Vi]

Поскольку i>{f{\ = 0uT)[rii]=a*(Xiy) для всех #

Имеем

X

.

1=1

И окончательно:

2 -1 2

.

Стандартное отклонение в каждой точке усредненного изображения будет

= — - (формула 5)

Согласно формуле 5 при увеличении K величина отклонения (уровень шума) значения элемента в каждой точке (x,y) уменьшается. А из формулы 3 следует, что §{х,у) приближается к f(x,y) с увеличением числа суммируемых зашумленных изображений.

Таким образом, применительно к задачам физической антропологии, если рассматривать индивидуальные черты людей на изображении как шум, можно примерно оценить необходимое количество портретов, при котором результат обобщения будет меняться незначительно.

Соотношение между стандартными отклонениями для К и К+1 изображений можно оценить используя следующую формулу:

ск = Jgk = /777 ■ (формула 6)

Материалы и методы

72 цифровых фронтальных фотопортрета русских девочек в возрасте 7-9 лет (рис. 1) использованы для получения 10 серий обобщённых фотопортретов разной численности.

Полевая фотография школьниц вторых-третьих классов была выполнена А.М. Маурером в пригородах Горно-Алтайска Республики Алтай и в ряде населённых пунктов Благовещенского района Алтайского края в ходе антропологических экспедиции 2013-2014 годов под руководством В.Н. Разгона, В.А. Бацевича и Е.Г. Воронкова. Данная серия индивидуальных снимков девочек принята за генеральную совокупность. На материале этой серии фотоснимков при помощи компьютерной программы «faceONface» [Сыроежкин с соавт., 2014] созданы представленные ниже обобщённые фотопортреты. Для обобщённых фотопортретов, сформированных на различных по численности сериях исходных снимков, были рассчитаны и оценены изменения между стандартными отклонениями (уровнем шума).

Рис. 1. Русские девочки 7-9 лет, анфас, N=72

Рис. 2. Результат получения обобщённого фотопортрета по трём случайным выборкам из пяти изображений (а, Ь, с)

Описание эксперимента

В ходе эксперимента были получены десять обобщённых фотопортретов на основе рандомизированных выборок разной численности: три портрета, при формировании которых использовалось по 5 индивидуальных фотоснимков (рис. 1); фотообобщения из 10, 15, 20, 30, 40, 50 и 70 индивидуальных цифровых изображений (рис. 2-4). Выборки формировались путём случайного извлечения индивидуальных фотоизображений с последующим возвращением их в «колоду».

Наблюдаемые результаты эксперимента

Три фотообобщения (рис. 2), сформированные на основе случайных выборок (по пяти изображениям) из генеральной совокупности, визуально воспринимаются как изображения различных людей. Индивидуальные черты девочек не вполне сглажены и на серии обобщенных изображений из 10, 15 и 20 суммированных фотографий, отобранных по тому же принципу. Однако заметно плавное повышение однородности полученных изображений, становящихся инвариантами, с приближением к численному рубежу в 30-40 фотографий (рис. 3).

Рис. 3. Результат получения обобщённого фотопортрета по выборкам из 10 (а), 15 (Ь), 20 (с)

и 30 (с1) изображений

Рис. 4. Результат получения обобщённого фотопортрета по выборкам из 40 (а), 50 (Ь) и 70 (с) индивидуальных изображений

Визуально однородный ряд фотообобщений, составленных из 40, 50 и 70 индивидуальных портретов показывает, что дальнейшее наращивание числа исходных снимков существенно не влияет на итоговую картинку и дает основание говорить о достижении оптимального числового порога накопления. (рис. 4).

Обсуждение

Значение цветов пикселей результирующего обобщенного изображения равно среднему арифметическому пикселей исходных изображений [Савинецкий с соавт., 2015] (в указанной работе изложены подробности о визуализации среднеквадратичного отклонения выборки для каждого пикселя). Изменение стандартного отклонения согласно формуле (6) представлено на графике (рис. 5), где по оси абсцисс представлено количество фотографий, используемых для построения усредненного изображения, а по оси ординат соотношение среднеквадратичных отклонений в зависимости от числа изображений. Иными словами, график демонстрирует, насколько будет меняться формируемое композитное изображение при добавлении каждой очередной фотографии.

Очевидно, что уже на совокупности примерно из сорока изображений достигается изменение всего в 1%, то есть добавление дополнительных снимков из генеральной совокупности не вносит визуальных изменений в усредненное изображение.

В антропологической фотографии, одним из методов которой является обобщённый фотопортрет [Перевозчиков, 1987], производится совмещение множества объектов одного класса - фронтальные фотографии лица или тела людей одного пола, возраста и, как правило, одной этно-тер-риториальной группы. В этом случае в категорию «шум» попадают индивидуальные черты каждого объекта (лица или тела), составляющие признаки различия. Обобщённые изображения подвыбо-рок из генеральной совокупности несут в себе сжатую (эссенциальную) информацию разного уровня, а итоговое фотообобщение множества лиц русских девочек - это квинтэссенция признаков сходства конкретной выборки.

Заключение

На основании анализа применения известного в астрофотографии алгоритма к сериям обобщённых фотопортретов разной численности предложено объяснение явления «семантической стабилизации» изображения при достижении определённого порога накопления. Смысл «картинки» не меняется при последующем прибавлении новых портретных изображений. Аналогом цифрового «шума» в данном случае выступают индивидуальные особенности каждого лица. В результате формируется очищенный от «личностного шума» (персональных морфологических особенностей лица) типологи-

чески однородный обобщённый портрет конкретной выборки. Следует иметь в виду, что популяци-онно-содержательным обобщённый портрет становится при соблюдении однородности исходных серий портретов по полу, возрасту, этническому и расовому составу.

Междисциплинарный подход, применение метода устранения шумов позволил объяснить давно подмеченный антропологами эффект выравнивания и смысловой «стабилизации» итогового обобщённого изображения по мере накопления численности вводимых в обобщённый портрет индивидуальных фотографий.

Библиография

Боровков A.A. Теория вероятностей. 5-е изд. М.: Либ-роком, 2009. 656 с.

Гиляров A.M. Секреты красоты // Природа, 1999. № 6. Гонсалес Р., Вудс Р. Цифровая обработка изображений. 3-е изд. исправл. и дополненное. М.: Техносфера, 2012.

Маурер A.M., Сыроежкин Г.В. Расширенные возможности метода обобщенного фотопортрета (три евразийские выборки) // Антропология в Московском университете: к юбилею МГУ: Сборник научных статей. [Электронный ресурс] / отв. ред. А. П. Бужилова. М.: НИИ и Музей антропологии МГУ, 2015.

Павловский О.М., Перевозчиков И.В. Обобщенные фотопортреты некоторых групп населения Средней Азии // Вопросы антропологии, 1977. № 56. С. 16-28. Перевозчиков И.В. Основы антропологической фотографии. М.: МГУ, 1987. 60 с.

Перевозчиков И.В., Маурер A.M. Обобщенный фотопортрет: история, методы, результаты // Вестник Московского университета. Серия XIII. Антропология, 2009. № 1. С. 35-44.

Савинеикий А.Б., Низаметдинов Ш.У., Сыроежкин Г.В., Сафиуллин А.Э. Разработка методов создания и обработки обобщенных компьютерных изображений и их приложение в антропологии // Научная визуализация, 2015. Т. 7. № 5. С. 53-67.

Сыроежкин Г.В., Савинеикий А.Б., Маурер A.M. New computer program «face-on-face» as a new practical anthropological virtual instrument // Вестник Московского университета. Серия XXIII. Антропология, 2014. № 3. С. 35-37.

Сыроежкин Г.В., Савинеикий А.Б., Маурер A.M. Математическая оценка количества изображений, необходимых для формирования стабильного обобщённого портрета // Вестник научных конференций. Тамбов, 2017. Т. 6. С. 108-111.

Контактная информация:

Савинецкий Александр Борисович: e-mail: albor52@inbox.ru; Маурер Андрей Маркович: e-mail: foto-rer@yandex.ru; Сыроежкин Гзрман Вячеславович: e-mail: laocooler@gmail.com.

ON THE QUESTION OF OPTIMAL NUMBER OF INITIAL IMAGES FOR OBTAINING AN INVARIANT COMPOSITE PHOTO PORTRAIT

A.B. Savinetskiy1, A.M. Maurer2, G.V. Syroezhkin1 1National Research Nuclear University "MEPhF, Moscow

2Lomonosov Moscow State University, Anuchin's Research Institute and Museum of Anthropology, Moscow

The purpose of this study is to evaluate the necessary and sufficient number of individual images to form a stable and recognizable visual image - a composite portrait of a particular sample. Data: 72 digital frontal photographs of Russian girls aged between 7-9 years. Method: software «faceONface» designed for composite photo portrait creation. Results: 10 composite portraits generated on the basis of randomized samples with different capacity (from 5 to 70 individuals); the Gonzalez's method of «noise elimination» was applied to the data. The graph of variance in mean-square deviation as a function of the number of accumulated images, visualizes previously noticed empirical regularity of achieving a quantitative threshold in which the addition of new images does not significantly change the visual perception of the generalized portrait. A possible explanation of the phenomenon of «semantic stabilization» of an image when a certain threshold of accumulation is reached is proposed. When forming a generalized photo portrait, the individual characteristics of each person are suggested to be considered analogous to the digital «noise». When a threshold in 30-40 initial images is reached, the generalized portrait of a specific sample is freed from «personal noise» (personal morphological features of the face) and approaches a typologically uniform invariant image.

Keywords: physical anthropology, composite photoportrait, individual features, elimination of digital noise, pixel, mean square deviation

i Надоели баннеры? Вы всегда можете отключить рекламу.