Научная статья на тему 'Компьютерные методы суммирования изображений. Обобщенный и усредненный портреты'

Компьютерные методы суммирования изображений. Обобщенный и усредненный портреты Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
367
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОБОБЩЕННЫЙ ПОРТРЕТ / УСРЕДНЕННЫЙ ПОРТРЕТ / ГАЛЬТОН / ПЕРРЕТ / КОМПЬЮТЕРНЫЕ МЕТОДЫ СУММИРОВАНИЯ ИЗОБРАЖЕНИЙ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Локк Кристина Эдвиновна

Мысленно можно суммировать отдельные образы в некое обобщенное представление о множестве объектов, однако данное обобщение субъективно и нам трудно поделиться такой информацией с окружающими. Существуют методы, которые позволяют избежать указанных проблем. В настоящее время есть 2 наиболее распространенных метода получения суммарного изображения на основе индивидуальных фотографий. Первый метод обобщенного (составного) портрета, предложенный Френсисом Гальтоном еще в 1878 году и получивший в 2008 году при участии автора статьи компьютерное решение, второй метод усредненного портрета, разработанный Дэвидом Перретом с соавторами в 1990-х годах. Данная работа посвящена сопоставлению двух методов. Автор приходит к выводу, что результаты суммирования разными методами вполне сравнимы. Однако обобщенный по методу Гальтона портрет несет в себе больше информации, но из-за этого она труднее воспринимается. Рассматриваемые методы в определенной степени дополняют друг друга: метод Гальтона хорошо работает на выборках малого и среднего размера, а метод Перрета с соавторами наилучшим образом покажет себя на выборках среднего и большого размера.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Локк Кристина Эдвиновна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Компьютерные методы суммирования изображений. Обобщенный и усредненный портреты»

КОМПЬЮТЕРНЫЕ МЕТОДЫ СУММИРОВАНИЯ ИЗОБРАЖЕНИЙ. ОБОБЩЕННЫЙ И УСРЕДНЕННЫЙ ПОРТРЕТЫ

К.Э. Локк

НИИ и Музей антропологии МГУ, Москва

Мысленно можно суммировать отдельные образы в некое обобщенное представление о множестве объектов, однако данное обобщение субъективно и нам трудно поделиться такой информацией с окружающими. Существуют методы, которые позволяют избежать указанных проблем. В настоящее время есть 2 наиболее распространенных метода получения суммарного изображения на основе индивидуальных фотографий. Первый - метод обобщенного (составного) портрета, предложенный Френсисом Гальтоном еще в 1878 году и получивший в 2008 году при участии автора статьи компьютерное решение, второй - метод усредненного портрета, разработанный Дэвидом Перретом с соавторами в 1990-х годах. Данная работа посвящена сопоставлению двух методов. Автор приходит к выводу, что результаты суммирования разными методами вполне сравнимы. Однако обобщенный по методу Гальтона портрет несет в себе больше информации, но из-за этого она труднее воспринимается. Рассматриваемые методы в определенной степени дополняют друг друга: метод Гальтона хорошо работает на выборках малого и среднего размера, а метод Перрета с соавторами наилучшим образом покажет себя на выборках среднего и большого размера.

Ключевые слова: обобщенный портрет, усредненный портрет, Гальтон, Перрет, компьютерные методы суммирования изображений

Введение

Известно, что человек большую часть информации о внешнем мире получает через зрительный анализатор. Мысленно можно суммировать отдельные образы в некое обобщенное представление о множестве объектов, но поделиться этим обобщением с коллегой мы можем лишь словесно со всеми вытекающими недостатками подобной передачи информации.

В антропологии всегда было стремление к получению суммарных изобразительных характеристик о форме. В настоящее время существует два наиболее распространенных метода получения суммарного изображения на основе индивидуальных фотографий. Первый - метод обобщенного (составного) портрета, предложенный Френсисом Гальтоном еще в 1878 году и получивший в 2008 году свое компьютерное решение. Второй -метод усредненного портрета, разработанный Дэвидом Перретом с соавторами в 1990-х годах. Сопоставлению этих двух методов и посвящена данная статья.

Подробно о методах

Классический метод обобщенного (composite) фотопортрета какой-либо группы людей состоит из следующих этапов: а) получение одинаковых по освещенности и пространственной ориентации, и оптимальных по градационным характеристикам негативных изображений; б) совмещение негативных изображений в процессе фотографической печати на одном листе бумаги с использованием реперных точек, линий и размеров, при этом каждое негативное изображение экспонируется с выдержкой в n-раз меньшей оптимальной (где n -численность выборки), в итоге этого процесса получается результирующее обобщенное изображение. Нужно отметить, что обобщенное изображение выглядит несколько «размытым» и нечетким, а четкость деталей результирующего изображения напрямую зависит от меры схожести индивидуальных лиц. Чаще всего реперным размером выбирается межзрачковое расстояние, совмещение производится по центрам зрачков [Galton, 1878; Перевозчиков, Маурер, 2009].

В совместной работе сотрудника НИИ и Музея антропологии МГУ А.М. Маурера и студентки А.П. Ивановской [Ивановская А.П., 2005] было показано, что цветные обобщенные изображения могут быть созданы при помощи программы Adobe Photoshop, здесь также был использован принцип Гальтона. Процесс обобщения включал в себя использование множества полупрозрачных слоев, которые накладывались друг на друга и совмещались по реперным точкам вручную. Такая работа оставалась очень трудоемкой, занимала достаточно много времени (несколько часов) и требовала наличия компьютера большой мощности.

В 2008 г. автором статьи в сотрудничестве с выпускником ВМК МГУ Михаилом Николаевичем Тихомировым был создан компьютерный метод обобщенного портрета аналогичный методу, предложенному Гальтоном, и написана оригинальная компьютерная программа, названная BMPtone. Программа работает с точечными изображениями формата BMP. Формат ВМР сохраняет информацию о каждом пикселе, при этом 2 координаты записывают положение пикселя в изображении и 3 координаты RGB (красный, зеленый, синий) записывают цвет.

В данном случае этапы построения обобщенного изображения выглядят следующим образом: а) на цифровых индивидуальных изображениях проставляется по 2 реперные точки; б) реперные точки всех индивидуальных изображений совме-

щаются друг с другом при помощи компьютера, происходит масштабирование и поворот изображений (ранее данную работу выполнял сам исследователь в процессе фотопечати); в) программа строит цветное обобщенное изображение, рассчитывая среднюю арифметическую величину по каждому из пикселей по трем цветовым каналам. Результирующее обобщенное изображение, как и в классическом случае, получается несколько «размытым», а тестовые сравнения подтверждают практически полную идентичность классического и компьютерного методов (рис. 1). Идентичность получаемых результатов крайне важна, так как она дает возможность сравнивать полученные новым методом портреты с существующими ныне фотографическими обобщениями, которых в Институте антропологии МГУ накоплено около ста.

Существует альтернативный компьютерный метод по получению обобщенного изображения, разработанный Дэвидом Перретом с соавторами в 1990-х годах [Perret, May & Yoshikawa, 1994; URL: http://www.faceresearch.org/tech/protomethods (дата обращения: 20.09.2010)]. Логика построения результирующего изображения здесь совсем другая: а) на каждом индивидуальном изображении отмечаются 174 характерных точки, «ответственные» за основные черты лица (рис. 2), так что каждая из точек имеет на плоскости свою координату; б) для каждой точки вычисляют среднюю арифметическую координату; в) по положению

Рис. 1. Тестовое сравнение классического фотографического метода (слева) с компьютерным методом обобщенного портрета (справа). Первое изображение создано И.В. Перевозчиковым и А.М. Маурером, второе - К.Э. Локк. В каждом портрете обобщено по 65 изображений дворян мужского пола

средних координат всех точек строят обобщенное (среднее) лицо. В данном случае речь о «размытости» деталей вообще не идет, обобщенное изображение получается похожим на обычную фотографию (рис. 3) и, по сути, является визуальным отображением таблицы средних величин по комплексу лицевых признаков.

В последнее время в Интернете появилось очень много обобщенных изображений, сделанных по методу Д. Перрета. Многие из этих изображений имеют чисто развлекательный характер, например, обобщения лиц известных актеров или футболистов, но встречаются и изображения сделанные по лицам внутри определенного этноса, и такие изображения представляют для антрополога научный интерес. Первый вопрос, напрашивающийся в таком случае, - на сколько сопостави-

мы результаты обобщений, полученных методом Гальтона и методом Перрета.

Сопоставление методов Гальтона и Перрета

В разделе «Are attractive faces only average?», опубликованном на странице http://www.face-research.org/students/averageness, приводится иллюстрация (рис. 3), сопоставляющая два метода, однако в тексте говорится лишь о том, что обобщенное по методу Ф. Гальтона изображение получается нечетким, а, используя новый компьютерный метод Д. Перрета с соавторами, мы получаем четкое усредненное изображение (average

Рис. 2. Индивидуальные лица (верхний ряд) и лица с помеченными на них опорными точками для построения усредненной формы (нижний ряд) [11Р1_: http://www.faceresearch.org/tech/protomethods (дата обращения: 20.09.2010)]

Рис. 3. Тестовое сравнение метода Перрета (слева) с Гальтоновским методом (справа) [URL: http://www.faceresearch.org/students/averageness (дата обращения: 20.09.2010)]

faces). Информация о количестве обобщенных человек1 и их этнической принадлежности отсутствовала, поэтому было решено провести собственное исследование по сопоставлению методов построения обобщенного изображения.

На одном из популярных сайтов была найдена страница, содержащая 16 индивидуальных фотографий голливудских красавиц, результаты парных усреднений, а также окончательный усредненный результат по 16 индивидуальным лицам. [URL:http://trinixy.ru/41352-samaya-krasivaya-zhenshhina-v-mire-26-foto.html (дата обращения: 20.09.2010)].

По взятым с данной страницы индивидуальным изображениям в программе BMPtone был построен обобщенный портрет, который был сравнен с усредненным портретом, предложенным на сайте (рис. 4). Полученные двумя разными методами портреты достаточно близки и, несомненно, представляют собой лица одного антропологического типа, но все же на взгляд хорошо различимы, как и портреты на рис. 3, и отличия эти создаются не только «размытостью» одного из изображений, но и небольшими нюансами в строении лиц. По рис. 3 обобщенное лицо справа имеет более узкий нос, менее полные и ниже расположенные губы, менее развитую складку верхнего века и менее массивный подбородок по сравнению с усредненным лицом (слева). По рис. 4 обобщенное лицо справа имеет более широкопосаженные глаза, более короткий нос, более узкую нижнюю

1 Автору статьи кажется, что в данном случае выборка была крайне малочисленной, порядка 5 человек.

челюсть и чуть менее развитую складку верхнего века по сравнению с усредненным лицом (слева)2. Эти нюансы показывают собой различия между типичным лицом (лицо, полученное методом Гальтона) и средним лицом (по методу Перрета).

Чтобы понять, в чем заключаются различия двух методов, нужно вернуться к сути, которую вкладывал в метод его создатель. Ф. Гальтон так определял цель исследования: «Каков был бы надежный метод, при наличии рисунков или фотографий нескольких достаточно схожих людей, но имеющих различия в строении деталей, для извлечения их типических характеристик? План такого исследования... состоял в идее оптического сопоставления путем наложения отдельных рисунков для получения суммированного результата» [цит. по: Канаев, 1972]. Гипотеза Д. Перре-та с соавторами состояла в привлекательности лиц средней формы («average» face shape), поэтому созданный ими компьютерный метод был призван вычислять среднее лицо по имеющимся индивидуальным фотографиям [Perret, May & Yoshikawa, 1994; URL: http://www.faceresearch.org/ tech/protomethods (дата обращения: 20.09.2010)]. В данном случае рабочая идея - усреднять, а не искать сходства. Если бы мы имели дело с одномерным анализом, то метод Гальтона соответствовал бы нахождению моды - наиболее часто встречаемой величины, а метод Перрета - нахождению средней арифметической величины. Известно, что в случае симметричного распределения призна-

2 Из-за вышеперечисленных особенностей лицо справа на рис. 4 кажется более юным.

Рис.4. Тестовое сравнение метода Перрета (слева) с Гальтоновским методом (справа). В каждом изображении обобщено по 16 голливудских красавиц

ка средняя величина и мода совпадают, однако, при асимметричном распределении эти величины отстоят друг от друга тем дальше, чем сильнее выражена асимметрия. Но наша ситуация с различными принципами обобщения в реальности еще сложнее.

При работе с плоским изображением, каким является фотография, мы имеем дело с многомерным анализом проецируемым на плоскость. В методе Перрета фактически происходит расчет средних величин по комплексу лицевых признаков, то есть, как мы уже говорили, обобщенное изображение является визуальным отображением таблицы средних величин. Усредненное изображение может быть получено при любых условиях, когда возможно проставление маркирующих точек, оно абсолютно четкое, недвусмысленное и не нуждается в последующих интерпретациях. Важным также является то, что каждое из индивидуальных изображений в полной мере вносит свой вклад в создание среднего.

На данном примере (рис. 5) можно увидеть, что сколь разными не были бы исходные лица усредненный портрет можно получить всегда, так же как средние величины можно рассчитать по любым числам. Используя demo-версию программы Перрета со страницы Иир://шшшТасеге-search.org/demos/average, каждый может построить среднее лицо из любых (!) понравившихся индивидуальных лиц. Но имеет ли научный смысл при-

веденное такое обобщение? На наш взгляд нет, оно имеет чисто развлекательный характер, и делать какие-либо выводы по обобщениям такого рода не стоит. Используя метод Перрета, нужно всегда тщательно следить за этнической (или расовой) однородностью выборки и ее количественной составляющей. Всем известно, что при небольших численностях наблюдений средняя величина, рассчитанная по выборке, подвержена случайным отклонениям от реальной средней величины и тем больше приближается к ней, чем больше количество наблюдений. Таким образом, метод Перрета будет очень хорошо работать в больших выборках порядка несколько сотен человек, в то время как при работе с малыми выборками мы можем получить некий эмпирический артефакт3. Вполне ожидаемо, что с какого-то момента увеличение численности выборки перестанет оказывать значимое влияние на результат усреднения, однако такое предположение требует дополнительной проверки.

При совмещении фотографий методом Галь-тона на плоскости происходят 2 многомерных анализа: 1 - регрессионный анализ по ведущему размеру при совмещении реперных точек (в приводимых нами случаях - это межзрачковое рас-

3 То есть результат не соответствующий действительности, вследствие неправильно организованного исследования.

Рис. 5. Пять профессиональных игроков в регби и их усредненный портрет (справа) по методу Перрета [URL: http://www.faceresearch.org/tech/proto2 (дата обращения: 20.09.2010)]

стояние); 2 - корреляционный анализ на фоне индивидуальной изменчивости. Плотность и четкость деталей обобщенного изображения зависят от меры схожести индивидуальных лиц, от того, есть ли внутри данной выборки некое типологическое единство. Чем выше индивидуальная вариация по комплексу признаков, тем более размытым будет обобщенный портрет. При отсутствии типологического единства выборки портрет получается нечитаемым (слишком сильно размыт). Метод Гальтона выявляет реально существующее морфологическое сходство, т.к. в обобщенном изображении суммируются и соответственно проявляются лишь те черты, которые оказываются сходными у многих индивидов. Таким образом, получается, что индивиды, обладающие нетипичной для данной популяции внешностью, принимают малое участие в создании обобщенного образа и их черты в основном размываются, а индивиды с более типичной внешностью напротив вносят больший вклад. Можно сказать, что метод Гальтона нивелирует случайные отклонения от морфологического типа, что помогает исследователю избежать случайных ошибок, однако, отклонения эти не исчезают, а накапливаются в качестве «шума» - размытости обобщенного изображения. В случае присутствия в выборке двух различных морфологических типов обобщенное изображение начнет местами раздваиваться. Таким образом, метод Гальтона имеет два больших преимущества: он устойчив к влиянию случайных отклонений (устойчивость образа, создаваемого портретом) и чувствителен к влиянию неслучайных отклонений (раздвоение обобщенного изображения, либо его нечитаемость).

Необходимо отметить, что нечитаемость или сильная размытость обобщенного изображения может явиться также следствием несоблюдения определенных методических правил. Например, когда мы имеем дело с обобщением лиц, запечатленных в определенном развороте или норме. Это замечание особенно актуально, когда речь идет о работе с живописными портретами, по-

скольку приходится работать с ракурсами, заданными художником [Перевозчиков, Локк, Сухова, Маурер, 2008]. В таком случае нужно особенно тщательно подходить к выбору изображений для построения обобщенного портрета, иначе результат может оставлять желать лучшего.

На рис. 6 представлены 2 обобщенных портрета: первый составлен из 20 женских фотографий с разворотом головы 3/4, а также немного больше или меньше 3/4; второй портрет составлен по 20 живописным портретам с разворотом головы от 5/6 до 3/4, т.е. в большинстве случаев это развороты, не доходящие до 3/44. Левый портрет получился плохо читаемым, притом что при обобщении тех же самых лиц в фас результат получился хорошим, тип обобщенного лица на правом портрете читается без труда. Дело здесь в том, что при разворотах головы близких к 3/4 большинство лицевых размеров на портрете претерпевают сильные перспективные сокращения и каждый дополнительный градус поворота их резко увеличивает. При легких поворотах головы, существенно не доходящих до 3/4, перспективные сокращения лица невелики и несколько дополнительных градусов поворота не играют существенной роли5. Иными словами, тщательность подбора подходящих для обобщения ракурсов сильно зависит от разворота, выбранного нами в качестве опоры, и зависимость эта нелинейная. При обобщении разворотов 3/4 исследователю нужно четко придерживаться выбранного ракурса, иначе портрет будет сильно размыт. При обобщении разворотов близких 5/6 (наиболее часто используемый художниками ракурс) допустим некий разброс углов поворота.

4 3/4 примерно соответствует повороту головы на 30 градусов от положения фас, 5/6 примерно соответствует повороту головы на 10-20 градусов, наиболее часто используемый художниками ракурс поворот головы на 20 градусов.

5 Перевозчиков И.В., Локк К.Э. Материалы неопубликованного исследования.

Рис. 6. Влияние соблюдения методических требований на качество обобщенного изображения: плохо читаемый портрет (слева) и хорошо читаемый портрет (справа). В каждом портрете по 20 изображений женщин

Таким образом, индикатором качественности работы, проведенной исследователем6, является результат обобщения. Единичные отклоне- 2. ния от нормы не повлияют на обобщенный результат, но наличие многих «отклонений» обязательно скажется.

Метод Гальтона хорошо работает на выборках малого и среднего размера, примерно до 100 человек, а при больших численностях индивиду- 3. альных изображений обобщенный портрет становится все более размытым и начинает как бы «растворяться». Образ, создаваемый обобщенным портретом, по достижении численности выборки порядка 40 человек перестает существенно меняться при дальнейшем увеличении численности, то есть обладает некой устойчивостью [Павловский О.М., 1980; Маурер, Перевозчиков, 1999].

4.

Краткие итоги сопоставления двух методов

1. Результаты суммирования индивидуальных фотографий методом Ф. Гальтона и методом Д. Перрета с соавторами сопоставимы друг с 5-

6 Здесь имеется в виду качественность подборки фотографий определенного ракурса и определенной ра-сово-этнической принадлежности.

другом и представляют изображения одного антропологического типа. Каждый из этих методов имеет определенную специфику, которую нужно учитывать при подборке изображений, предназначенных для обобщения. Важно соблюдать методические требования для получения адекватного результата.

Обобщенный по методу Гальтона портрет учитывает разброс индивидуальной изменчивости, в зависимости от которой он может получиться более или менее четким, что оставляет пространство для различных интерпретаций. Усредненный по методу Перрета портрет четкий и интерпретация его однозначна. То есть Гальтоновский обобщенный портрет несет в себе больше информации, но из-за этого она труднее читается. Метод Гальтона имеет два преимущества: он устойчив к влиянию случайных отклонений и чувствителен к влиянию неслучайных отклонений (раздвоение обобщенного изображения, либо его нечитаемость). Метод Д. Пер-рета с соавторами такими свойствами не обладает.

Рассматриваемые методы в определенном смысле дополняют друг друга: метод Гальтона хорошо работает на выборках малого и среднего размера, а метод Перрета с соавторами наилучшим образом покажет себя на выборках среднего и большого размера.

В заключение автору хотелось бы отметить, что метод, предложенный Ф. Гальтоном, является по логике своей более простым и вследствие этого более универсальным, он не ограничивает исследователя в объекте обобщения, мы с легкостью можем суммировать изображения различных частей тела в разнообразных ракурсах, выбрав точки совмещения в соответствии с поставленной задачей. Очевидно, что программное обеспечение метода Д. Перрета в указанных случаях пришлось бы каждый раз изменять, при использовании компьютерной версии метода Гальтона этого не требуется. Автор надеется посвятить этому вопросу отдельную статью и выражает искреннюю благодарность своему научному руководителю И.В. Перевозчикову за возможность работы в этом направлении, а также горячо благодарит М.Н. Тихомирова за создание необходимой компьютерной программы.

Библиография

Ивановская А.П. Технология создания обобщенного портрета, курсовая работа. Рукопись. М., 2005. РГГУ архив учебно-научного центра социальной антропологии.

Канаев И. И. Френсис Гальтон. М.: Наука, 1972, С. 132. Маурер A.M., Перевозчиков И.В. Региональные обобщенные портреты великорусов по материалам Русской антропологической экспедиции 1955-1959 гг. // Восточные славяне. М., 1999. С. 95-108. Павловский О.М. О чем рассказывает обобщенный фотопортрет // Наука и жизнь, 1980. № 1. C. 84-90. Перевозчиков И.В., Локк К.Э., Сухова A.B., Маурер A.M. Опыт антропологического описания населения России по произведениям портретной живописи середины XVIII - начала XIX вв. // Актуальные вопросы антропологии. Минск: Право и экономика, 2008. Вып. 3. С. 141-148. Перевозчиков И.В., Маурер A.M. Обобщенный фотопортрет: история, методы, результаты // Вестник Московского университета. Серия XXIII. Антропология. М., 2009. № 1. С. 35-44.

Galton Fr. Composite Portraits // Nature, 1878. Vol. 23. P. 97-100.

Perrett, D. I., May, K. A. & Yoshikawa, S. Facial shape and judgments of female attractiveness // Nature, 1994. Vol. 368. P. 239-242.

URL: http://www.faceresearch.org (дата обращения: 20.09.2010).

Контактная информация:

Локк Кристина Эдвиновна, 125009, Москва, ул. Моховая,11, НИИ и Музей антропологии МГУ; е -mail: lokkkris@rambler.ru.

COMPUTER METHODS OF SUMMATION IMAGE. COMPOSITE PORTRAIT AND AVERAGE FACE SHAPE

Kr. Lock

Institute and Museum of Anthropology, MSU, Moscow

We can summarize in our mind single images into a composite image of objects but this generalization is subjective and we have difficulties to describe it to other people. Some methods can help to resolve these problems. There are two most useful methods to get a composite image based on individual photos. First of them is the method of composite portraits proposed by Francis Galton in 1878. In 2008 its computer modification was developed with the participation of the author of this article. The second method of average face shape was created by David Perret and collegues in 1990's. In this article these two methods are compared. The author comes to the conclusion that the results of summation by different methods are quite comparable. However a composite portrait by Galton's method contains more information but it is difficult to perceive. The two methods complement each other in a certain way: Galton's method works well for small and medium-size sample groups, Perret's method will be most useful for large sample groups.

Key words: composite portrait, method of average face shape, Galton, Perret, computer methods of summation image

i Надоели баннеры? Вы всегда можете отключить рекламу.