ПЭНАРАЛЫЦ ЗЕРТТЕУЛЕР INTERDISCIPLINARY RESEARCH - МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ
УДК 572 МРНТИ 34.37.21
https://doi.org/10.52967/akz2024.2.24.238.251
О межисследовательских расхождениях в оценках возраста по костям скелета взрослого человека на примере выборки окуневской культуры
© 2024 г. Широбоков И.Г., Громов А.В.
Keywords: physical anthropology, inter-observer error, Transition Analysis 3, intraclass correlation
TYMiH сездер: физикалык антропология, зерттеуаралык к,айшылык,тар, Transition Analysis 3, санатшЫк корреляция
Ключевые слова:
физическая антропология, межисследовательские расхождения, Transition Analysis 3, внутриклассовая корреляция
Ivan Shirobokov1* and Andrey Gromov1
^Corresponding author, Candidate of historical sciences, Peter the Great Museum of Anthropology and Ethnography (Kunstkamera), Saint Petersburg, Russia. ORCID: 0000-0002-3555-7509 E-mail: ivansmith@bk.ru Candidate of historical sciences, Peter the Great Museum of Anthropology and Ethnography (Kunstkamera), Saint Petersburg, Russia.
ORCID: 0000-0002-3263-3801 E-mail: a.v.gromov@mail.ru
On inter-observer error in age estimates based on the adult skeletons: A case study of the Okunev culture sample
The study is dedicated to analyzing inter-observer disparities in age estimations based on skeletal remains of varying completeness. Five anthropologists estimated the sex and age of a series of skeletons from two burial grounds of the Okunev culture (Khakassia, Early Bronze Age). Age estimation was conducted in two variants: 1. according to traditional methods used by physical anthropologists; 2. using the "Transition Analysis 3" (TA3) free software, which is based on a random generalized linear model trained on documented information about age-related variability of dozens of features. The intraclass correlation coefficient (ICC) was utilized as a measure of agreement between the assessments. The results indicate a high consistency of assessments obtained within both approaches, with an advantage for TA3. The new method also reveals an additional advantage in estimating the age of individuals older than 50 years. The higher consistency of TA3 assessments is likely explained by the standardized procedure of recording numerous skeletal features with a limited number of options. The consistency of age-at-death structure assessments for the sample as a whole is also noticeably higher when using TA3 compared to the traditional approach. However, in this case, the larger age intervals proposed by TA3 compared to subjectively assessed intervals in the standard approach likely play a key role. Sex assessments coincided among participants in 19 out of 23 (83%) cases. A comparison of morphological and genetic sex estimations obtained for 9 skeletons revealed an average agreement in 84% of cases.
For citation: Shirobokov, I., Gromov, A. 2024. On inter-observer error in age estimates based on the adult skeletons: A case study of the Okunev culture sample. Kazakhstan Archeology, 2 (24), 238-251 (in Russian). DOI: 10.52967/akz2024.2.24.238.251
Иван Григорьевич Широбоков1*, Андрей Викторович Громов1 "корреспондент авторы, тарих гылымдарыныц кандидаты, РГА ¥лы Петр атындагы Антропология жэне этнография музей (Кунсткамера), Санкт-Петербург, Ресей
Иван Григорьевич Широбоков1*, Андрей Викторович Громов1 "автор-корреспондент, кандидат исторических наук, Музей антропологии и этнографии им. Петра Великого (Кунсткамера) РАН, Санкт-Петербург, Россия
1тарих FbmbiMAapbiHbi^ кандидаты, PFA ¥лы Петр атындаFы Антропология жэне этнография музей (Кунсткамера), Санкт-Петербург, Ресей
Окунев мэдениетшщ ipiKTeMeci непзшде ересек
адамныц к,ацк,а сYЙектерi бойынша жасты багалаудагы зерттеуаралык, к,айшылык,тар туралы
Зерттеу дэрежеа эртYрлi жиынтык1тaFы к,ацк,а сYЙектер бойынша жасты баFалаудаFы зерттеуаралык к,айшылык,тарды талдауFа арналFан. Бес антрополог окунев мэдениетшщ екi к1орымындаFы (Хакасия, ерте кола дэуiрi) к,ацк,алар топтамасыныц жынысына жэне жасына тэуелсiз баFалау жасады. Жасты баFалау екi нуск,ада жYргiзiлдi: 1. физикалык, антропологияда к,олданылатын дэстYрлi эдiстерге сэйкес; 2. ондаFан белгшщ жас бойынша взгергiштiгi туралы к1yжатталFан ак,параттарда ок1ытылFан жалпыланFан кездейсок сызык,тык, модельге сYЙенетiн «Transition Analysis 3» (TA3) баFдарламасыныц квмегiмен. БаFалаулар арасындаFы келiскен влшем ретiнде санатiшiлiк корреляция коэффициент (1СС) крлданылды. Нэтижелер ек эдiс, эсiресе ТА3 аясында алынFан баFалаулардыц вте жоFары Yйлескенiн дэлелдедг Жаца тэсiл 50 жастан жоFары индивидтердщ жа-сын баFалауда крсымша артык,шылык,тарды да анык,тады. ТА3 баFалауларыньщ барынша жоFары YЙлесiмi кацканыц вте квп белгшерш аз нуск,амен белгшеудщ стандарт процедурасымен тYсiндiрiледi. 1рттемелердщ жас курылымдарын баFалаудаFы Yйлесiм дэстYрлi эдкке к1араFанда ТА3-тi к1олданFан кезде айтарлык,тай жоFары болды. Бiрак1 бул жаFдайда стандарт эдiстегi субъективтi баFаланатын интервал-дармен салыстырFанда ТА3 усынатын жас интер-валдар шамасыныц квп болуы негiзгi рвл атк,аруы мYмкiн. Жынысты баFалау к,атысушылар арасында 23-тщ 19 жаFдайында (83%) сэйкес келдi. 9 к,ацк,адан алынFан жыныстыц генетикалык, анык,тамасы мен морфологиялык, баFалауды сэйкестендiру орта есеп-пен 84% жаFдайда бiр-бiрiне сэйкес келдi.
Сiлтеме жасау Yшiн: Широбоков И.Г., Громов А.В. Окунев мэдениетшщ iрiктемесi негiзiнде ересек адамныц к,ацк,а сYЙектерi бойынша жасты баFалаудаFы зерттеуаралык к,айшылык,тар туралы. Н,азак,стан археологиясы. 2024. № 2 (24). 238-251-бб. (Орысша). DOI: 10.52967/akz2024.2.24.238.251
1кандидат исторических наук, Музей антропологии и этнографии им. Петра Великого (Кунсткамера) РАН, Санкт-Петербург, Россия
О межисследовательских расхождениях в оценках возраста по костям скелета взрослого человека на примере выборки окуневской культуры
Исследование посвящено анализу межисследовательских расхождений в оценках возраста по костям скелета разной степени комплектности. Пять антропологов провели независимую оценку пола и возраста серии скелетов из двух могильников оку-невской культуры (Хакасия, эпоха ранней бронзы). Оценка возраста проводилась в двух вариантах: 1. в соответствии с традиционными методами, используемыми физическими антропологами; 2. при помощи программы «Transition Analysis 3» (TA3), в основе которой лежит случайная обобщённая линейная модель, обучаемая на задокументированной информации о возрастной изменчивости десятков признаков. В качестве меры согласия между оценками использовался коэффициент внутриклассовой корреляции (ICC). Результаты свидетельствуют о высокой согласованности оценок, полученных в рамках обоих подходов, и преимуществе ТАЗ. Новый метод обнаруживает также дополнительное преимущество в оценке возраста индивидов старше 50 лет. Более высокая согласованность оценок TA3, вероятно, объясняется стандартизированной процедурой фиксации большого числа скелетных признаков с небольшим числом вариантов. Согласованность оценок возрастной структуры выборки в целом также заметно выше при использовании TA3, чем при традиционном подходе. Однако в этом случае, вероятно, ключевую роль играет большая величина возрастных интервалов, предлагаемых TA3, по сравнению с субъективно оцениваемыми интервалами при стандартном подходе. Оценки пола совпали между участниками в 19 из 23 (83%) случаев. Сопоставление генетических определений пола, полученных для 9-ти скелетов, и морфологических оценок обнаружило совпадение в среднем в 84% случаев.
Для цитирования: Широбоков И.Г., Громов А.В. О межисследовательских расхождениях в оценках возраста по костям скелета взрослого человека на примере выборки окуневской культуры. Археология Казахстана. 2024. № 2 (24). С. 238-251. DOI: 10.52967/akz2024.2.24.238.251
Введение (Широбоков И.Г., Громов А.В.)
Независимо от того, является ли целью исследования определение по костям скелета индивидуального возраста или реконструкция возрастной структуры всей выборки, получение точных и воспроизводимых оценок относится к числу вечно актуальных тем в антропологии.
Существует множество работ, посвящённых анализу внутри- и межисследовательских расхождений в оценках конкретных систем признаков [Daumas et al. 2023; Dubourg et al. 2020; Fojas et al. 2017; Kimmerle et al. 2008; Willems et al. 2002; и др.]. В сообществе антропологов стран СНГ такие исследования также проводились неоднократно, однако, насколько известно авторам, их результаты не становились предметом специальных публикаций на русском языке. Сопоставимость оценок возраста обычно тестируется в частном порядке по договорённости отдельных исследователей, занятых изучением общей темы. В последние годы интерес к этой теме возрос. Были организованы семинары, участники которых независимо друг от друга оценивали пол и возраст по костям скелета разной степени комплектности, а затем анализировались расхождения между исследователями, разными методами и/или антропологическими оценками и задокументированными данными о поле и возрасте. В частности, такие семинары проходили в рамках конференций «Палеоантропологические и биоархеологические исследования: традиции и новые методики» в 2015 г. и «Гохмановские чтения: палеоантропология и этногенез» в 2022 г. в Кунсткамере.
Набор и шкалы, в которых проводится оценка конкретных признаков, могут заметно варьировать от метода к методу, и надёжность определения их значений может различаться при работе с разными возрастными группами и скелетами разной степени сохранности. Важную роль играет чёткое описание методики оценки в руководствах и наличие в них качественных иллюстраций, демонстрирующих возрастные различия между стадиями анализируемых признаков, а также понимание исследователями основных закономерностей возрастной изменчивости скелета. В этом отношении тот подход, который чаще всего используют антропологи, работающие с материалами из археологических раскопок в России и Казахстане, часто остаётся непрозрачным для читателя. Степень облитерации швов и стёртости зубов, состояние суставных поверхностей длинных костей и костей таза обычно оцениваются исследователями приблизительно, а оценки возраста в публикациях приводятся без фиксации значений отдельных признаков и использованной программы.
В последние два десятилетия исследователями разных стран активно ведётся разработка новых методов оценки возраста, которые включают десятки различных признаков скелета, в т. ч. входящих в стандартную программу, но претендующих на преодоление её недостатков. Один из таких новых подходов, анализ переходов, реализован в программе «Transition Analysis 3» (TA3 в дальнейшем) [Milner et al. 2020]. При её создании авторы оценили и объединили данные о возрастной изменчивости различных признаков скелета более 1600 человек с задокументированным возрастом, происходящих с территории США, Португалии, Великобритании, Южной Африки и Таиланда. Возрастная изменчивость 74 признаков различных элементов скелета в данной программе оценивается в бинарной или порядковой шкале с небольшим числом вариантов, а руководство сопровождается цветными фотографиями, что теоретически должно способствовать высокой степени согласованности оценок между исследователями. TA3 опирается на методы машинного обучения и заметно отличается как от традиционных методов определения возраста, так и от программы ADBOU - предыдущей версии анализа переходов, более популярной в антропологической среде [Boldsen et al. 2002]. Обработка данных в TA3 осуществляется при помощи случайной обобщённой линейной модели, причём последняя заново проходит обучение каждый раз, когда исследователь вводит в программу набор доступных для наблюдения параметров. Это позволяет работать с останками разной степени комплектности и сохранности. Применение метода значительно облегчает специализированная программа с удобным пользовательским интерфейсом, снабжённая иллюстрированным руководством1.
1 Получить доступ к программе и руководству по её использованию можно по ссылке: https://www. statsmachine.net/software/TA3/
Программа TA3 появилась в свободном доступе четыре года назад. Исследователи, работающие с материалами из археологических раскопок, отмечают, что TA3 позволяет выявить присутствие в выборках индивидов старческого возраста, остающихся незаметными при использовании традиционных методик [Bolster et al. 2024; Tomberg 2022], однако опубликованных работ, посвящённых влиянию межисследовательских расхождений в определении дифференцирующих признаков на вариативность оценок возраста, выносимых моделью TA3, к настоящему времени не существует.
Цель данной работы заключается в проведении оценки согласованности оценок, независимо полученных в рамках TA3 и стандартного подхода. В обоих случаях анализировались расхождения между исследователями именно в итоговых оценках возраста, а не в значениях конкретных признаков.
Дополнительные задачи заключались:
- в анализе влияния расхождений в оценках возраста, полученных в рамках двух методик, на общую возрастную структуру выборки;
- в оценке расхождений определений половой принадлежности индивидов в сравнении с генетическими данными.
Материал и методы исследования (Широбоков И.Г., Громов А.В.)
В качестве материалов исследования были использованы скелеты из раскопок могильников окуневской культуры Уйбат-Чарков (Uybat-Charkov) и Красный Камень (Krasny Kamen). Памятники относятся к эпохе ранней бронзы. Первый могильник расположен близ села Чарков Усть-Абаканского района Республики Хакасия и был раскопан И.П. Лазаретовым в 2009 г. Исследованный курган содержал погребения в грунтовых ямах и катакомбах. С помощью радиоуглеродного датирования установлен приблизительный возраст кургана - XXV-XXIII вв. до н.э. [Лазаретов, Поляков 2018b]. Второй могильник находится около поселка Красный Камень Боградского района Республики Хакасия. Раскопки памятника проводились И.П. Лазаретовым в 2010 и 2018 гг. Раскопанные курганы содержали погребения в грунтовых ямах и каменных ящиках. На основании радиоуглеродных дат, полученных для кургана 1, его возраст определён в пределах XXIII-XXII вв. до н.э. [Лазаретов, Поляков 2018а]. В настоящее время антропологические материалы из этих могильников хранятся в МАЭ РАН (г. Санкт-Петербург, Российская Федерация), составив коллекции основного фонда № 7784 (Уйбат-Чарков) и № 7785 (Красный Камень). Всего были обследованы 23 скелета взрослых индивидов разной степени сохранности и комплектности.
В тестировании приняли участие пять исследователей: А.В. Громов, А.А. Казарницкий, Н.И. Лазаретова, Е.Н. Учанева и И.Г. Широбоков. Каждый участник проводил независимую оценку пола и возраста всех скелетов. Оценка возраста проводилась в двух вариантах: 1. в соответствии с традиционными методами, используемыми физическими антропологами; 2. при помощи бета-версии программы TA3. Порядок исследования был общим для всех участников: сначала проводилась оценка пола и возраста при помощи стандартных методов, а затем фиксировались признаки, входящие в программу TA3.
Традиционные методы определения возраста включали в себя оценку степени облитерации швов свода черепа, степени стёртости зубов, состояния суставных поверхностей позвонков и длинных костей, состояние лобкового симфиза [Алексеев, Дебец 1964; Алексеев 1966; Buikstra, Ubelaker 1994; White, Folkens 2005]. Каждый участник сам определял набор признаков и их относительную значимость при установлении возрастного интервала. Дополнительно оценивался пол индивидов. В большинстве случаев участники опирались на признаки таза (в первую очередь, величину лобкового и седалищного углов), а в случае его отсутствия - на морфологические особенности
других элементов скелета, не оговаривая между собой значимость конкретных признаков. Таким образом, половозрастные характеристики определялись в значительной степени субъективно, в соответствии с теми методами, которыми каждый исследователь привык пользоваться в собственной практике.
С другой стороны, программа TA3 предполагала строгое следование методике, а оценка выносилась моделью на основе анализа набора признаков, оцениваемых в порядковой шкале (в большинстве случаев 2-3 варианта, сопровождаемые цветными фотографиями). Участники исследования совместно протестировали программу на примере одного из скелетов и исключили часть признаков из дальнейшего анализа - в первую очередь те, низкая ценность которых для оценки возраста отмечалась авторами программы [Milner et al. 2020]. В частности, из анализа были исключены признаки, локализованные на дистальных сегментах конечностей, ребрах, грудине, а также признаки диффузного идиопатического скелетного гиперостоза (ДИСГ) позвоночника. К сожалению, руководство не содержит описания последних, но очевидно, что в программу были включены признаки значительного окостенения связок и энтезов (боковая поверхность позвонков при этом выглядит так, словно она покрыта расплавленным свечным воском), отдельно оцениваемые для шейного, грудного и поясничного отделов позвоночника. По признанию самих авторов, ДИСГ оказывает селективное влияние на смертность и соответствующие признаки не могут быть использованы при оценке возраста [Milner et al. 2020: 3]. Набор признаков, который фактически оценивался, варьировал в зависимости от сохранности скелетов, большая часть из которых отличалась неполной комплектностью.
Программа TA3 имеет целью установление индивидуальных оценок возраста, которые представляются в виде точечной оценки, 95% доверительного интервала, стандартной ошибки и коэффициента корреляции между паспортным возрастом и возрастом, прогнозируемым моделью в тестовой выборке. Однако она не предназначена для оценки возрастной структуры всей выборки. В настоящем исследовании возрастные распределения строились на основании индивидуальных средних оценок и стандартных ошибок, а вероятность принадлежности индивидов к конкретным возрастных интервалам оценивалась по нормальному типу. Первым автором была написана программа на Python для проведения соответствующих расчётов.
Анализ согласованности оценок возраста, полученных разными исследователями, проводился при помощи коэффициента внутриклассовой корреляции (ICC). В отличие от парного t-критерия и стандартного коэффициента корреляции Пирсона, ICC позволяет определять согласованность между оценками нескольких исследователей сразу, а также учитывать влияние систематических расхождений. Коэффициент учитывает соотношение двух разных компонентов общей дисперсий в оценках: дисперсию, обусловленную различиями между оцениваемыми объектами, и дисперсию, обусловленную различиями между оценщиками или методиками. Существует несколько типов коэффициента внутриклассовой корреляции, предназначенных для оценки согласованности при разных условиях задачи. Для решения задачи исследования был выбран ICC (2, k) (согласно классификации [Shrout, Fleiss 1979]), предполагающий, что анализируются межисследовательские расхождения в абсолютных оценках, участники теста отобраны случайным образом, каждый из них оценивает возраст одних и тех же скелетов.
При расчёте коэффициентов сравнивались точечные оценки возраста, получаемые моделью TA3, и оценки, рассчитанные путём усреднения пограничных значений возрастных интервалов, устанавливаемых в рамках традиционного подхода. Расчёт коэффициентов внутриклассовой корреляции осуществлялся при помощи программы на Python, написанной первым автором с использованием библиотеки pingouin [Vallat 2018].
Результаты и обсуждение (Широбоков И.Г., Громов А.В.)
Индивидуальные оценки пола и возраста скелетов, полученные участниками исследования,
приведены в Таблицах 1-2. В большинстве случаев оценки возраста близки между собой, хотя в отдельных случаях наблюдаются заметные расхождения как при использовании традиционных методов, так и TA3. Списки индивидов со спорными оценками почти не совпадают между собой, т. е. расхождения не могут быть удовлетворительно объяснены сохранностью костей отдельных скелетов.
Таблица 1 - Индивидуальные половозрастные оценки скелетов из могильников Уйбат-Чарков и Красный
Камень, полученные при помощи традиционных методов 1-кесте - Уйбат-Чарков жэне Красный Камень корымдарынан алынган кацкалардын, дэстYрлi эдктер
квмег>мен алынган жеке жыныс-жас багалаулары Table 1 - Individual sex and age assessments of skeletons from the Uybat-Charkov and Krasny Kamen sites
based on traditional methods
Скелет, шифр Участник l Участник 2 Участник S Участник 4 Участник 5
возраст пол возраст пол возраст пол возраст пол возраст пол
УЧ, мог. 2 50+ ? 55+ м? 55+ ж 50+ м 55+ ж?
УЧ, могЗ-Л 45-50 м 35-45 м 35-40 м 30-40 м 40-50 м
УЧ, мог. S-Г 50-60 м 55+ м 40-50 м 45-55 м 40-50 м
УЧ, мог. 4-l 60+ ж? 55+ м 55+ ж 50+ м 50+ м
УЧ, мог. 7 35-50 м 25-45 м 20+ м 18+ м 30+ м
УЧ, мог. 9-A 30-40 ж 55+ ж 55+ ж? 40-50 ж 55+ ж
УЧ, мог 9-Б 50+ ж 55+ ж 55+ ж 50+ м? 55+ м?
УЧ, мог lO-l 50-55 м 55+ м 55+ м 35-45 м 50+ м
УЧ, мог. l0-2 50+ ж? 55+ ж? 55+ ж? 50+ ж 55+ ж
УЧ, мог ll-A 20-30 ж 25-35 ж 30 ж 25-35 ж 20-30 ж
УЧ, мог. l2 30-35 м 30-40 м? 30-40 м 25-35 м 25-40 м
УЧ, мог lS 30-35 ж 35-45 ж 30-40 ж 25-35 ж 40-60 ж
КК, к. l, мог. l 20-25 ж 18-25 ж 20-25 ж 18-22 ж 20-25 ж
КК, к. l, мог. S 30-40 ж 35-45 ж 35-40 ж 25-35 ж? 40-50 ж
КК, к. l, мог. 5 45-50 м 45-55 м 35-45 м 30-40 м 50+ м
КК, к. l, мог. б 35-45 ж 45-55 ж 40-55 ж - - 40-50 ж
КК, к. 2, мог. 2-A 30-40 ж 30-40 ж 30-35 ж 25-35 м 40-50 ж
КК, к. 2, мог. 2-Б 30-35 ж 45-55 ж 30-40 ж 30-40 ж 45-55 ж
КК, к. 2, мог. 4-l 45-55 м 55+ м 40-55 м 40-50 м 35-45 м
КК, к. 2, мог. 4-2 30-35 ж 30-40 ж? 30-40 ж? 25-35 ж? 25-40 ?
КК, к. 2, мог. 5-l 35-40 ж 30-40 ж 30 ж 25-35 ж 25-35 ж
КК, к. 2, мог. 5-2 30-40 ж 25-35 ж 30 ж 25+ ж 25-55 ж?
КК, к. 2, мог. б-Е 50-55 м 55+ м 55+ м 45-55 м 55+ м
Примечания: УЧ - Уйбат-Чарков, КК - Красный камень. Жирным шрифтом отмечены оценки возраста скелетов с наибольшим разбросом по результатам расчета коэффициента вариации (CV>20%)
Таблица 2 - Индивидуальные оценки возраста скелетов из могильников Уйбат-Чарков и Красный Камень, полученные при помощи TA3 2-кесте - Уйбат-Чарков жэне Красный Камень корымдарынан алынган кацкалардын, ТА3 квмег'!мен
алынган жеке жас багалаулары
Table 2 - Individual sex and age assessments of skeletons from the Uybat-Charkov and Krasny Kamen sites
based on TA3
Скелет, шифр Участник 1 Участник 2 Участник 3 Участник 4 Участник 5
M SE M SE M SE M SE M SE
УЧ, мог. 2 69.4 9.5 78.4 10.1 63.3 9.6 82.2 9.8 66.7 10.2
УЧ, мог.3-А 50.1 9.6 49 9.8 46.7 9.4 43 9.6 48.2 9.8
УЧ, мог. 3-Г 59.2 9.1 61.4 9.4 63.6 9.2 62.8 9.1 53.5 9.4
УЧ, мог. 4-1 57.4 9.2 71.7 10 66 9.6 75.6 9.9 72.4 10
УЧ, мог. 7 33.2 11 39 13.2 40.9 12.5 24.3 13 29.3 14.8
УЧ, мог. 9-А 46.2 11 50.9 10.6 61.2 11.7 79 11 57 10.9
УЧ, мог. 9-Б 54.1 11 53.6 11.1 48 12.1 71.2 13 52.7 13.3
УЧ, мог. 10-1 73 8.9 75.4 9.3 80.8 9.1 74.9 9.1 79.6 9.3
УЧ, мог. 10-2 71.5 8.9 78 9.3 75.4 9.2 78.7 9.1 75.8 9.4
УЧ, мог. 11-А 31.3 11 32.2 11.6 31.3 11.7 31.6 12 31.6 11.7
УЧ, мог. 12 44.8 10 39.3 11 35.5 10.7 25.1 11 34.6 11
УЧ, мог. 13 40.7 9.9 41 10.4 36.8 9.7 35.8 9.5 46.1 9
КК, к. 1, мог. 1 29.4 9.2 33.1 9.2 31 9.1 28.4 9.2 30.6 9.4
КК, к. 1, мог. 3 45.8 9.2 44.5 9.4 38.8 9.3 43.7 9.3 52 9.6
КК, к. 1, мог. 5 52.3 9.3 58.3 9.3 54.8 9.3 45.7 9.3 58.9 9.5
КК, к. 1, мог. 6 40.4 11 63.1 11.2 47.9 11.3 - - 46.4 12.8
КК, к. 2, мог. 2-A 31.8 9.9 28.6 9.9 35.1 9.9 31.7 9.9 31.7 9.9
КК, к. 2, мог. 2-Б 28.7 9.6 45.2 9.4 38.3 9.5 28.9 9.8 50.4 10.1
КК, к. 2, мог 4-1 57.8 10 66.7 10.1 54.7 10.8 59.7 11 55.1 10.9
КК, к. 2, мог 4-2 33.6 11 40.6 10 33.8 10.3 31.7 11 29.9 10.5
КК, к. 2, мог 5-1 37.8 12 37.3 11.6 32.9 11.6 37.8 11.6 37.8 11.6
КК, к. 2, мог 5-2 42.9 13 35.6 12.8 35.6 12.8 35.6 13 50.4 12.8
КК, к. 2, мог. 6-Е 46.7 15 72 14.2 63.2 14.8 77.5 15 72 14.2
Примечания: УЧ - Уйбат-Чарков, КК - Красный камень. М - средняя оценка, SE - стандартная ошибка. Жирным шрифтом отмечены оценки возраста скелетов с наибольшим разбросом по результатам расчёта коэффициента вариации (СУ>20%)
Межисследовательские расхождения в индивидуальных оценках возраста В целом, величина коэффициента внутриклассовой корреляции имеет высокую величину между оценками, полученными как в рамках традиционных методов, так и при помощи ТАЗ (Таблицы 3-4). Общая хорошая сопоставимость оценок разных исследователей сочетается с существенными вариациями в отдельных случаях. При этом различия между коэффициентами, рассчитанными в рамках двух подходов, носят систематический характер: согласованность оценок для каждой пары исследователей оказывается выше в том варианте, когда использовалась программа ТАЗ (табл. 4).
Таблица 3 - Коэффициенты внутриклассовой корреляции (ICC) между оценками исследователей, определявшими возраст скелетов при помощи традиционных методов и TA3 3-кесте - ДэстYрлi эд>стер жэне ТА3 квмег>мен к^ацк^алардын, жасын анык,таган зерттеуш'1лерд'1ц
багалаулары арасындагы санатiшiлiк корреляция коэффициенттерi (1СС) Table 3 - Intraclass correlation coefficients (ICC) between researchers' estimates
of skeletal age using traditional methods and TA3
Вариант анализа ICC F df1 df2 p-значение 95% доверительный
интервал
Полная выборка
Метод TA3 0.97 30.7 21 84 <0.000001 0.94-0.98
Традиционные методы 0.94 20.3 21 84 <0.000001 0.88-0.97
Сокращенная выборка*
Метод TA3 0.96 26.8 16 64 <0.000001 0.92-0.98
Традиционные методы 0.90 12.3 16 64 <0.000001 0.80-0.96
* - Из выборки исключены индивиды, возраст которых превышал 50 лет согласно усреднённым оценкам, полученным
при помощи традиционных методов
Таблица 4 - Матрица попарных внутриклассовых корреляций (ICC) между оценками исследователей, определявшими возраст скелетов при помощи традиционных методов и TA3 4-кесте - ДэстYрлi эд>стер жэне ТА3 квмег>мен к^ацк^алардын, жасын анык,таган зерттеуш'1лерд'1ц багалаулары арасындагы екеуара санатiшiлiк корреляция (1СС) матрицасы Table 4 - Matrix of pairwise intraclass correlations (iCc) between researchers' estimates of skeletal age
using traditional methods and TA3
ICC Участник 1 Участник 2 Участник 3 Участник 4 Участник 5
Участник 1 - 0.88 0.91 0.82 0.91
Участник 2 0.92 - 0.95 0.91 0.84
Участник 3 0.93 0.96 - 0.89 0.91
Участник 4 0.89 0.95 0.95 - 0.78
Участник 5 0.85 0.92 0.92 0.91 -
Примечание: Выше диагонали приведены значения ICC для оценок возраста, полученных при помощи традиционных методов, ниже диагонали - для оценок, рассчитанных моделью TA3.
Тем не менее, на первый взгляд преимущества ТАЗ перед традиционными методами не являются существенными. Это может показаться удивительным, если учитывать тот факт, что участники пользовались традиционными методами, не оценивая степень развития признаков в баллах и произвольно оценивая их значимость для окончательной оценки. По этой причине следование более строгой методике при использовании ТАЗ и вынесение моделью окончательной оценки должны были автоматически приводить к повышению показателя согласованности оценок.
Однако впечатление о лишь небольшом преимуществе ТАЗ, в значительной степени обусловленном условиями проведения теста, по-видимому, является ошибочным, поскольку дифференцирующие способности методик заметно различаются. В рамках традиционного подхода участники использовали как закрытые, так и открытые интервалы, такие как «старше 50 лет», «старше 55 лет» и даже «старше 20 лет» (в случае, когда комплектность скелета не позволяла
надёжно оценить возраст). Стандартные методы не предполагают возможным сколь-нибудь точное определение возраста в старческой группе, тогда как TA3 позволяет получать оценки для возрастных групп старше 70 и даже старше 80 лет. При оценке расхождений возникла проблема расчёта средних оценок возраста для индивидов с открытым интервалом. Условно верхняя граница была принята равной 60 годам, т. е. если исследователь определил возраст индивида как «старше 50 лет», средняя оценка его возраста при расчёте коэффициента внутриклассовой корреляции составила 55 лет. Это означает, что высокая степень согласованности оценок, полученных в рамках традиционного подхода, завышена за счет невозможности установления возраста в старческих группах и вынужденного принятия условных оценок.
Отсюда следует, что межисследовательская согласованность оценок в определённой степени зависит от возрастной структуры анализируемой выборки. Для снижения влияния открытых интервалов был проведён дополнительный расчёт коэффициентов корреляции, при котором учитывались только индивиды со средней оценкой 50 лет и ниже (согласно усреднённым оценкам, полученным при помощи традиционных методов). В этом случае показатель согласованности оценок, полученных при помощи TA3, сохранился приблизительно на том же уровне, тогда как ICC для оценок, рассчитанных в рамках стандартного подхода, заметно снизился (табл. 3).
Расхождения в средних оценках, полученных при помощи двух разных методик
Вынужденное использование открытых возрастных интервалов в рамках традиционного подхода имеет важное дополнительное следствие для анализа согласованности оценок не только между исследователями, но и между методиками. На рисунке 1 отмечены усреднённые (полученные по данным всех пяти участников) индивидуальные оценки возраста окуневцев, полученные в рамках двух подходов. В абсолютном большинстве случаев средние оценки возраста, полученные моделью TA3, оказались несколько выше. На графике хорошо заметно, насколько важным является принятие условной верхней границы для поддержания сопоставимости результатов. В случае, когда мы принимаем в качестве верхней границы возраста смерти 100-летний рубеж (что означает, что средний возраст людей, оцениваемых как «старше 50», принимается условно равным 75 годам), результаты, полученные в рамках двух методик, оказываются довольно близкими. При использовании верхней границы, условно ограниченной 60 годами, степень согласованности заметно ниже. Соответствующие величины коэффициентов ICC между усреднёнными оценками составляют 0.52 и 0.92 соответственно.
Этот рисунок служит хорошей иллюстрацией тезиса о некорректности использования коэффициента корреляции Пирсона при оценке расхождений. Корреляции Пирсона между наборами возрастных оценок, полученными двумя методами, имеют приблизительно равную величину, независимо от того, как оценивалась условная верхняя граница открытого интервала при использовании стандартных методик - в 100 или 60 лет (r=0.91 и 0.87 соответственно, p=0.67). Однако в первом случае у индивидов старше 50 лет наблюдается систематическое занижение среднего возраста, полученного при помощи традиционных методов, по сравнению с оценками TA3. Во втором случае систематические различия отсутствуют, но возрастает относительная дисперсия оценок.
Расхождения в оценках возрастной структуры выборки между исследователями
В отличие от криминалистов и судебных антропологов, для физических антропологов, работающих с останками из раскопок археологических памятников, наибольшее значение имеют расхождения не в индивидуальных оценках возраста скелета, а в возрастной структуре выборки в целом. Сопоставимость оценок имеет важное значение для палеодемографических исследований. Теоретически, при работе с большими выборками, суммарный эффект влияния межисследовательских расхождений в оценках возраста на общую форму распределения может оказаться незначительным - конечно, при условии, что расхождения не носят систематического характера (отсутствует смещение в оценках).
Рис. 1. Диаграмма рассеяния усреднённых оценок возраста 23 скелетов, полученных при помощи традиционных методов и TA3. См. пояснения в тексте
1-сур. ДэстYрлi эдiстер жэне ТА3 кемепмен алынFан 23 к,ацк,аньщ орташаланFан жас баFалауларынын, шашырау диаграммасы
Fig. 1. Scatter diagram of averaged age estimates of 23 skeletons obtained using traditional methods
and TA3. See explanations in the text
Поскольку размеры окуневской выборки невелики, полученные результаты можно считать предварительными. Варианты возрастной структуры выборки, рассчитанные в рамках двух подходов, достаточно заметно различаются между собой как по уровню межисследовательской согласованности, так и по форме. Возрастные распределения, полученные путём оценки традиционными методами, отличаются заметными вариациями между исследователями, тогда как варианты, основанные на оценках TA3, демонстрируют заметно большую согласованность (рис. 2).
Учитывая приведённые выше результаты расчётов ICC, обнаружившие высокую степень согласованности оценок, логичным будет предположить, что неожиданно высокие различия между вариативностью структур обусловлены величиной интервалов, которые используются участниками и моделью TA3. В рамках традиционного подхода исследователи использовали интервалы величиной 5, 10 или 15 лет. В качестве условного допущения можно исходить из того, что устанавливаемый интервал является 95% доверительным интервалом, в пределах которого с точки зрения исследователя находится реальная оценка возраста. Однако для TA3 соответствующие доверительные интервалы будут иметь заметно большую величину и составлять уже 30-40 лет. Вполне очевидно, что при оценке возрастной структуры расширение возрастных интервалов приводит к снижению влияния межисследовательских расхождений. Кроме того, большая согласованность оценок TA3 может быть связана с включением в программу анализа большего числа признаков. Можно предполагать, что при этом случайные межисследовательские расхождения в определении значений отдельных признаков будут оказывать незначительное влияние на оценку модели. В пользу этого предположения говорит умеренная отрицательная корреляция между коэффициентом вариации оценок возраста скелета,
Рис. 2. Возрастная структура выборки, установленная по оценкам пяти разных исследователей при помощи традиционных методов (A) и TA3 (B) 2-сур. ДэстYрлi эдiстер (А) жэне тАз (В) кемепмен эртYрлi бес зерттеушшщ баталаулары бойынша белпленген iрiктемелердщ жас к,урылымы Fig. 2. Age-at-death structure of the skeletal sample estimated by five différent researchers using traditional methods (A) and TA3 (B)
вынесенных моделью, и числом признаков, введённых исследователем в программу (r=-0.51, p=0.01). Для проверки этого предположения был также проведён дополнительный анализ: набор признаков, анализируемых в рамках TA3, был сокращен в 2-3 раза за счёт исключения всех признаков осевого скелета. Вновь рассчитанный коэффициент несколько уменьшился, приблизившись к аналогичному показателю, рассчитанному для традиционных методов (ICC=0.95, доверительный интервал: 0.910.98). Примечательно, что при исключении признаков осевого скелета на 4 года уменьшилась также средняя оценка возраста индивидов в выборке. Таким образом, комплектность (и сохранность) скелета взрослых индивидов оказывает систематическое влияние на оценки возраста.
Между двумя разными подходами различается не только вариативность реконструируемых распределений, но и форма последних. Усреднённая форма распределения, основанного на оценках TA3, выглядит более сглаженной и приближенной к ожидаемой для популяционных моделей, нежели полученная при помощи традиционных методов - в последнем случае наблюдается отчетливый пик в интервале 30-35 лет (рис. 3). Средняя доля индивидов старше 50 лет на 12% выше при использовании TA3, соответственно, выше и средний возраст смерти (50 лет и 42 года соответственно).
Расхождения в оценке пола
Оценки пола совпали между участниками в 19 из 23 (83%) случаев. Среди скелетов, половая принадлежность которых не вызывала сомнений у исследователей, 11 принадлежали женщинам и 8 - мужчинам. Ещё в четырёх случаях исследователи разошлись во мнениях, но в двух из них оценка только одного исследователя не сходилась с оценками четырёх других.
Результаты были сопоставлены также с оценками пола, полученными в ходе генетического анализа, результаты которого в настоящее время готовятся к публикации. Всего такие определения были получены для 9 из 23 индивидов. Точность определений (доля совпадающих морфологических и генетических оценок) среди участников варьирует от 78 до 100% (средняя точность 84%).
Возможные причины межисследовательских расхождений в оценках возраста
Причины наблюдаемых расхождений в оценках различны. Некоторая доля дисперсии межисследовательских расхождений обусловлена объективной сложностью оценки
Рис. 3. Два усредненных варианта возрастной структуры окуневской выборки, полученные при помощи традиционных методов и TA3 и приведённые к общей форме с финальной возрастной когортой «старше 50 лет»
3-сур. ДэстYрлi эд^ер жэне ТА3 кемепмен алынFан жэне со^ы «50 жастан Yлкен» жас когортасымен жалпы формаFа келтiрiлген окунев iрiктемелерiнщ жас курылымыныц орташаланFан екi нуск,асы
Fig. 3. Two averaged variants of the age-at-death structure of the Okunev culture sample, obtained using traditional methods and TA3, reduced to a common form with the final age cohort «over 50 years old»
дифференцирующих признаков на костях скелетов, тогда как другая, несомненно, объясняется комплексом причин, которые принято скрывать за многозначным термином «человеческий фактор». Сюда относятся различия в степени концентрации внимания участников, в опыте фиксации признаков, в несогласованных отклонениях от протокола программы. При этом, опираясь на литературные данные, можно с уверенностью утверждать, что оценки возраста и величины возрастных интервалов, выносимые разными участниками, отличались бы некоторой дисперсией даже в случае если бы сами значения исходных признаков были определены одинаково [Канеман и др. 2021]. А в проведённом исследовании, как это часто и бывает на практике, не только балловые значения, но даже и сами наборы рассматриваемых признаков у разных участников совпадали не полностью, в т. ч. при использовании формализованного подхода ТАЗ.
Частично вынесенные оценки, вероятно, расходятся из-за предвзятого отношения к определению возраста конкретных скелетов, т. е. субъективной убеждённости участников в его принадлежности к некоторой возрастной группе. В руководстве ТАЗ оговаривается, что оценка каждого признака должна проводиться независимо как от признаков на других костях, так и от предполагаемой оценки скелета. Однако соблюсти это условие некоторым участникам в полной мере не удалось. Об этом свидетельствуют результаты следующего теста. Для каждого скелета были рассчитаны средние оценки возраста, а также абсолютные отклонения от них (в годах), наблюдаемые в определениях каждого из участников. Процедура была отдельно проведена для оценок, полученных в рамках каждого из подходов, а затем для каждого участника были рассчитаны корреляции между наблюдаемыми отклонениями. У 2 из 5 участников обнаружились умеренные положительные корреляции между отклонениями оценок от средних (0.56 и 0.44). Следовательно, можно предполагать, что в некоторых случаях на оценки исходных признаков, включенных в программу ТАЗ, повлияла уже сформировавшаяся к тому времени точка зрения о том, что скелет принадлежит человеку определённого возраста. Это предубеждение в свою очередь повлияло на оценку возраста, выносимую моделью.
Заключение (Широбоков И.Г., Громов А.В.)
Полученные результаты свидетельствуют о большей согласованности оценок возраста между исследователями в случае, когда они используют программу TA3, нежели стандартные методы. Большее сходство обнаруживается как при анализе индивидуальных оценок возраста скелетов, так и при оценке возрастной структуры выборки в целом. Различия в согласованности оценок между подходами объясняются преимущественно вынужденным следованием более строгому протоколу анализа при использовании TA3, а также тем, что в этом случае окончательная оценка выносится не человеком, а моделью. Обладает ли при этом программа TA3 преимуществом перед традиционным подходом в точности оценок относительно реального возраста скелетов предстоит выяснить в будущем, однако уже сейчас литературные данные позволяют относиться к возможностям нового метода с оптимизмом.
ЛИТЕРАТУРА
1 АлексеевВ.П. Остеометрия. Методика антропологических исследований. М.: Наука, 1966. 249 с.
2 Алексеев В.П., Дебец Г.Ф. Краниометрия. Методика антропологических исследований. М.: Наука, 1964.
126 с.
3 Канеман Д., Сибони О., Санстейн К.Р. Шум. Несовершенство человеческих суждений. М.: АСТ, 2021.
544 c.
4 Лазаретов И.П., Поляков А.В. Могильник Красный Камень - погребально-ритуальный комплекс ранней
бронзы // Теория и практика археологических исследований, 1. 2018а. Т. 22, № 2. С. 21-46.
5 Лазаретов И.П., Поляков А.В. Исследования могильника Уйбат-Чарков и новые данные о раннем этапе
развития окуневской культуры // Теория и практика археологических исследований, 1. 2018b. Т. 23, № 3. С. 41-69.
6 Boldsen J.L., Milner G.R., Konigsberg L.W., Wood J.W. Transition analysis: A new method for estimating age from
skeletons // Hoppa R.D., Vaupel J.W. Paleodemography: Age distributions from skeletal samples. Cambridge University Press, 2002. Pp. 73-106.
7 Bolster A.L., JeanLouis H.J., Gregoricka L.A., Ullinger J.M. Estimating adult age categories in commingled
skeletons with Transition Analysis 3 // American Journal of Biological Anthropology. 2024. Vol. 183 (2). Pp. 1-12.
8 Buikstra J.E., Ubelaker D.H. Standards for data collection from human skeletal remains: pro-ceedings of a seminar
at the Field Museum of Natural History, organized by Jonathan Haas. Ar-kansas archaeological research series. 44. Indianapolis: Western Newspaper Company, 1994. 206 p.
9 DaumasM., Lefèvre P., Martrille L., Beauthier J.-P., Louryan S., Polet C. Method assessment and observer variation
in age estimation: A comparative analysis of the Suchey-Brooks and the içcan methods on an archaeological medieval population // Journal of Archaeological Science: Reports. 2023. Vol. 52, 104234.
10 Dubourg O., Toutin R., Bascou A., Jousset N., Telmon N., Saint-Martin P., Savall F. Inter-observer agreement of
the Suchey-Brooks method from a French computed tomography sample // La Revue de Médecine Légale. 2020. Vol. 11 (2). Pp. 74-80.
11 Fojas C.L., Kim J., Minsky-Rowland J.D., Algee-Hewitt B.F.B. Testing inter-observer reliability of the Transition
Analysis aging method on the William M. Bass forensic skeletal collection // American Journal of Physical Anthropology. 2017. Vol. 165 (1). Pp. 183-193.
12 Kimmerle E.H., Prince D.A., Berg G.E. Inter-observer variation in methodologies involving the pubic symphysis,
sternal ribs, and teeth // Journal of Forensic Sciences. 2008. Vol. 53 (3). Pp. 594-600.
13 Milner G.R., Boldsen J.L., Ousley S.D., Getz S.M., Weise S., Tarp P. TA3 Installation and Software User Guide:
Version 0.16. 2020.
14 Shrout P.E., Fleiss J.L. Intraclass correlations: Uses in assessing rater reliability // Psychological Bulletin. 1979.
Vol. 86 (2). Pp. 420-428.
15 Tornberg A. Beyond the age of 60+ Evidence of an elderly female from the Neolithic-Early Bronze Age using
Transition Analysis 3 age estimation // Fornvannen: Journal of Swedish Antiquarian Research. 2022. Vol. 17 7(2). Pp. 134-139.
16 VallatR. Pingouin: statistics in Python // Journal of Open Source Software. 2018. Vol. 3 (31). P. 1026.
17 Willems G., Moulin-Romsee C., Solheim T. Non-destructive dental-age calculation methods in adults: intra- and
inter-observer effects // Forensic Science International. 2002. Vol. 126 (3). Pp. 221-226.
18 White T.D., Folkens P.A. The human bone manual. New York: Elsevier Academic Press, 2005. 488 p.
REFERENCES
1 Alekseev, V. P. 1966. Osteometriya. Metodika antropologicheskih issledovaniy (Osteometry. Methods
of anthropological research). Moscow: "Nauka" Publ. (in Russian).
2 Alekseev, V P. Debets, G. F. 1964. Craniometry. Methods of anthropological research (Kraniometriya. Metodika
antropologicheskih issledovaniy). Moscow: "Nauka" Publ. (in Russian).
3 Kahneman, D., Sibony, O., Sunstein, C. R. 2021. Noise: A Flaw in Human Judgment (Shum. Nesovershenstvo
chelovecheskih suzhdeniy). Moscow: "AST" Publ. (in Russian).
4 Lazaretov, I. P., Polyakov, A. V. 2018a. In: Teoriya i praktika arheologicheskih issledovaniy (Theory and practice
of archaeological research), 1, 22 (2), 21-46 (in Russian).
5 Lazaretov, I. P., Polyakov, A. V. 2018b. In: Teoriya i praktika arheologicheskih issledovaniy (Theory and practice
of archaeological research), 1, 23 (3), 41-69 (in Russian).
6 Boldsen, J. L., Milner, G. R., Konigsberg, L. W., Wood, J. W. 2002. In: Hoppa, R. D., Vaupel, J. W. (eds.)
Paleodemography: Age distributions from skeletal samples. Cambridge University Press, 73-106 (in English).
7 Bolster, A. L., JeanLouis, H. J., Gregoricka, L. A., Ullinger, J. M. 2024. In: American Journal of Biological
Anthropology, 183 (2), 1-12 (in English).
8 Buikstra, J. E., Ubelaker, D. H. 1994. Standards for data collection from human skeletal remains proceedings of
a seminar at the Field Museum of Natural History, organized by Jonathan Haas. Arkansas archaeological research series. 44. Indianapolis: Western Newspaper Company (in English).
9 Daumas, M., Lefèvre, P., Martrille, L., Beauthier, J.-P., Louryan, S., Polet, C. 2023. In: JAS: Reports, 52, 104234
(in English).
10 Dubourg, O., Toutin, R., Bascou, A., Jousset, N., Telmon, N., Saint-Martin, P., Savall, F. 2020. In: La Revue de
Médecine Légale, 11 (2), 74-80 (in English).
11 Fojas, C. L., Kim, J., Minsky-Rowland, J. D., Algee-Hewitt, B. F. B. 2017. In: American Journal of Physical
Anthropology, 165 (1), 183-193 (in English).
12 Kimmerle, E. H., Prince, D. A., Berg, G. E. 2008. In: Journal of Forensic Sciences, 53 (3), 594-600 (in English).
13 Milner, G. R., Boldsen, J. L., Ousley, S. D., Getz, S. M., Weise, S., Tarp, P. 2020. TA3 Installation and Software
User Guide: Version 0.16 (in English).
14 Shrout, P. E., Fleiss, J. L. 1979. In: Psychological Bulletin, 86 (2), 420-428 (in English).
15 Tornberg, A. 2022. In: Fornvânnen: Journal of Swedish Antiquarian Research, 177 (2), 134-139 (in English).
16 Vallat, R. 2018. In: Journal of Open Source Software, 3 (31), 1026 (in English).
17 Willems, G., Moulin-Romsee, C., Solheim, T. 2002. In: Forensic Science International, 126 (3), 221-
226 (in English).
18 White, T. D., Folkens, P. A. 2005. The human bone manual. New York: Elsevier Academic Press (in English).
МYДделер к,ак,тытысы туралы ак,паратты ашу. Автор м^дделер к,ак,тытысыныц жок,тытын мэлiмдейдi. /
Раскрытие информации о конфликте интересов. Автор заявляет об отсутствии конфликта интересов. /
Disclosure of conflict of interest information. The author claims no conflict of interest.
Мак,ала туралы аппарат / Информация о статье / Information about the article.
Редакцията тYстi / Поступила в редакцию / Entered the editorial office: 08.05.2024.
Рецензенттер мак,улдатан / Одобрено рецензентами / Approved by reviewers: 17.05.2024.
Жариялаута к,абылданды / Принята к публикации / Accepted for publication: 17.05.2024.