In many theoretical relationships developed to determine the force of resistance to cutting, digging and soil compaction, soil compressibility is present as one of the coefficients. It was previously established that the properties and type of soil influence the value of this parameter. In this regard, experimental studies were carried out to determine the influence of frozen soil type, temperature and compressive pressure on soil compressibility.
Key words: soil compression, cutting resistance force, frozen soil, working body.
Kuznetsova Victoria Nikolaevna, doctor of technical sciences, professor, vice rector, [email protected], Russia, Omsk, Siberian State Automobile and Highway University,
Kuznetsov Ilya Sergeevich, lecturer, ilvxa_kvznetsov@yk. com, Russia, Omsk, Siberian State Automobile and Highway University,
Dubkov Valery Vitalievich, candidate of technical sciences, docent, dubkovvv. [email protected], Russia, Omsk, Siberian State Automobile and Highway University
УДК 519.234.6; 004.942
DOI: 10.24412/2071-6168-2024-3-74-75
АНАЛИЗ РЕЗУЛЬТАТОВ РАНЖИРОВАНИЯ НАУЧНЫХ ПУБЛИКАЦИЙ С ИСПОЛЬЗОВАНИЕМ МЕТОДА РАНГОВОЙ КОРРЕЛЯЦИИ
И.Г. Ольгина
В работе рассмотрены вопросы ранжирования публикаций с использованием комплексного показателя, созданного на основе сетевых метрик. Использованы методы ранговой корреляции Спирмена и Стьюдента для сравнения результатов ранжирования с рейтингом Field-Weighted Citation Impact в Scopus. Определена тесная положительная линейная зависимость между двумя ранжированиями. Установлено также, что теснота связи между рангами, полученными с помощью разработанного метода, и рангами по показателю цитируемости, взвешенного по предметной области, зависит от комбинации сетевых метрик, входящих в комплексных показатель. Сделан ряд содержательных выводов, следующих из анализа графа цитирования.
Ключевые слова: сеть цитирования, граф, публикация, наукометрия, сетевой анализ, метод ранговой корреляции.
Введение. Ведется создание национальной системы оценки результативности научных исследований. Важным результатом научной деятельности для представления полученных успехов и обсуждения их в научном сообществе являются научные публикации. C 2022 года в России приостановлен доступ к крупнейшим в мире реферативно-библиографическим и наукометрическим базам данных Scopus и Web of Science. Для определения уровня научных публикаций в наукометрических базах данных используются различные метрики. Показатели оценки результативности публикаций, которые предоставляли указанные базы, стали недоступны. К тому же имеющиеся показатели, используемые в наукометрических базах имели ограничения. Они учитывали только количество цитирований. Этого недостаточно для качественной оценки публикации. Следует отметить, что, ориентируясь только на цитирования, можно упустить из виду новейшие публикации, которые не получили цитирований в силу времени. Такие показатели не позволяют при анализе публикации учитывать авторитетность авторов в исследуемой тематике, цитирующих ее, на какие источники по важности она ссылается. Таким образом, значения показателей у двух публикаций могут быть одинаковыми, но неравносильны по значимости.
Исходя из перечисленных выше затруднений, с которыми можно столкнуться при качественном анализе научных публикаций, определяется необходимость поиска принципиально нового подхода к выявлению важных публикаций по требуемой тематике.
Появление науки о сетях - Network Science - позволяет исследовать сложные сетевые системы посредством представления их в виде графовых моделей. Широкое применение нашел метод сетевого анализа [1]. За последние десятилетия возрос интерес к науке о сетях, что повлекло за собой закономерное развитие всевозможных инструментов для исследований в данной области. Возможно построение сетей цитирования патентов [1], ключевых слов [2], научных публикаций [3], сетей цитирования авторов [4], сетей по совместному цитированию и соавторству
[5].
Основная задача данного исследования заключается в построении графа цитирования научных публикаций Scopus и его исследовании. Следует доказать применимость метода анализа сетей цитирования путем сравнения ранжирований для графа цитирования с известным показателем Field-Weighted Citation Impact.
Основные определения и постановка задачи. Предметом данного исследования являются графовые модели сетей цитирования научных публикаций. При этом вершинами графа являются научные публикации, дуги -коммуникации между ними, реализующиеся путем цитирования. Соответственно сеть цитирования научных публикаций представляется в виде ориентированного графа G = (V, E), где V - множество вершин графа, E -множество дуг графа.
Предлагаемый метод определения важности узла сети цитирования заключается в ранжировании показателей комплексной оценки центральности узлов сети цитирования по убыванию приоритета. Строится математическая модель, позволяющая определить Ch - меру центральности по важности - соответствующего профиля исследования по следующей формуле:
п
Ch(v) = ^fcffi;(v) , (1)
¡=1
где v - узел сети, Ri - ранг i-го показателя, n - число показателей, fch - индекс релевантности i-го показателя, 0 < fch < 1, fch е Q, h - профиль исследования.
Предложено следующее определение: профиль исследования - это комплекс мер центральности узла сети цитирования с установленным индексом релевантности для каждой меры центральности, имеющих общую задачу. В зависимости от целей подбора и анализа публикаций в сети, используя различные комбинации параметров (мер цен-тральностей), можно получить различные профили исследования h, используя формулу 1 [6].
Необходимо доказать адекватность математической модели определения важности узла сети цитирования научных публикаций, используя известные методы корреляционного анализа.
Сравнение ранжирования научных публикаций в Scopus. Произведено сравнение результатов ранжирования научных публикаций БД Scopus по показателю Field-Weighted Citation Impact (FWCI) с результатами ранжирования разработанным методом. FWCI (влияние цитирования, взвешенное по полю) - показатель, полученный от SciVal, показывает, насколько количество цитирований, полученных публикациями исследователя, соотносится со средним количеством цитирований, полученных всеми другими аналогичными публикациями, индексируемыми в базе данных Scopus [7]. Интерпретация значения FWCI:
- влияние цитирования, взвешенное по полю, равное 1,00, указывает на то, что публикации цитировались в среднем по миру для аналогичных публикаций;
- влияние цитирования, взвешенное по полю, превышающее 1,00, указывает на то, что публикации цитировались чаще, чем можно было бы ожидать, исходя из среднего мирового показателя для аналогичных публикаций, например, оценка 1,44 означает, что результаты цитировались на 44 % чаще, чем ожидалось;
- влияние цитирования, взвешенное по полю, менее 1,00 указывает на то, что публикации цитировались меньше, чем можно было бы ожидать, исходя из среднего мирового показателя для аналогичных публикаций, например, оценка 0,85 означает, что цитируется на 15 % меньше, чем в среднем по миру.
FWCI рассчитывается как отношение числа цитирований публикаций объекта к среднему числу цитирований, полученных всеми остальными схожими публикациями в мире. Для расчёта индикатора учитываются цитирования, полученные в год опубликования работы, а также в последующие три года, среднемировое значение равно единице.
FWCI учитывает различия в исследовательском поведении по дисциплинам. Следовательно, целесообразно провести сравнение с результатами ранжирования согласно профилю исследования «Входящий/Исходящий» (по показателю Rh). Данный профиль позволяет выявлять публикации важные по определенному тематическому направлению. Для расчета меры центральности по важности (Ch) по формуле (1) согласно выбранному профилю исследования, используются следующие параметры: мера центральности по степени связности, мера центральности по близости к другим узлам, мера центральности по посредничеству, мера центральности по авторитетности и мера центральности по информативности. Весовой коэффициент fch - индекс релевантности i-го показателя - каждой из перечисленных мер центральности примем равным 1.
Для исследования было взято 100 публикаций, отобранных по ключевому слову «Network Science» из базы данных Scopus, занимающих с 1 по 94 ранги согласно профилю исследования «Входящий/Исходящий». Данные представлены на август 2023 года. В таблице 1 показано десять первых и пять последних публикаций, упорядоченных по убыванию в рейтинге Rh, их значения FWCI и порядковые номера по FWCI (RFWCI).
Таблица 1
Значения Rh и RFWCI для публикаций, входящих в Scopus__
Автор публикации (год издания) Ранги FWCI
Rh rFWCI
Baronchelli A. (2013) 1 41 3,41
Karuza E.A. (2016) 2 85 1,06
Merseal H.M. (2023) 3 42 3,4
Kenett Y.N. (2022) 4 5 19,56
Vitevitch M.S. (2015a) 5 34 4,09
Medaglia J.D. (2015) 6 14 8,13
Bassett D.S. (2017a) 7 7 14,21
Stam C.J. (2014a) 8 23 6,87
Mucha P.J. (2010) 9 13 8,37
Vitevitch M.S. (2012) 10 46 3,21
Siew C.S.Q. (2017) 96 70 1,83
Stella M. (2021) 97 94 0,72
Brandes U.(2013) 98 19 7,28
Nguyen T.A.S. (2022) 99 105 0
Siew C.S.Q. (2019) 100 59
В качестве математического инструмента был использован ранговый коэффициент корреляции Спирмена и Стьюдента. Несмотря на то, что коэффициент корреляции Пирсона является самым популярным коэффициентом корреляции среди других в научных публикациях, он имеет существенные ограничения. Условия применения параметрического коэффициента корреляции Пирсона подробно описаны в работе [8]. Исходя из условий, принимая решение об использовании коэффициента корреляции Пирсона, необходимо убедиться, что количественные данные всех исследуемых выборок подчиняются закону нормального распределения, а также нужно построить диаграммы рассеяния, чтобы доказать линейность связи между признаками и их гомоскедастичность. При невыполнении вышеперечисленных условий следует воспользоваться ранговым коэффициентом корреляции Спирмена.
Следует принять во внимание, что недостатком использования коэффициента корреляции Пирсона является его сильная чувствительность к выбросам. При наличии в выборке единственного выброса величина коэффициента корреляции Пирсона может существенно снижаться [8]. Корреляция Пирсона может оценивать только линейную связь между двумя непрерывными переменными (зависимость является линейной только тогда, когда изменение одной переменной связано с пропорциональным изменением другой переменной).
Корреляция Спирмена является ранговой, т. е. при расчете коэффициента корреляции не берутся численные значения, а используются соответствующие им ранги. Метод Спирмена более универсален и менее строг, чем метод Пирсона. Точность Пирсона немного выше, но это совершенно не принципиально в рамках задачи, которая решается в данной работе.
При многочисленной выборке (не менее 30) применим метод Стьюдента.
Расчет коэффициента ранговой корреляции методом Спирмена для анализа результатов эксперимента. В основу метода положен принцип нумерации значений статистического ряда. Каждому элементу совокупности присваивается порядковый номер в ряду, который будет упорядочен по уровню признака (по убыванию приоритета) [9]. Тогда коэффициент ранговой корреляции Спирмена вычисляется по формуле:
6 гг^-гГ" )2
р = 1--^2-Т)—' (2)
где п - количество научных публикаций в выборке; г/1 - ранг г'-го элемента первого статистического ряда, г/1 е Кн; г[ШС1 - ранг г'-го элемента второго статистического ряда, е
При наличии одинаковых рангов формула (2) расчета коэффициента линейной корреляции Спирмена будет несколько иной (3) [10, 11]. В этом случае в формулу вычисления коэффициентов корреляции добавляются два новых члена, учитывающие одинаковые ранги. Они называются поправками на одинаковые ранги.
Р = 1 -п(п2- 1)'-0,5(7> + ТгРшс) ' Т = ■ (3)
Тги и Тгрша - поправки по столбцам, имеющим одинаковые ранги (4); Г -количество одинаковых рангов в столбце.
Могут встретиться, например, в КШС1 ранги, равные 28,5; 44,5; 56,5; 67,5; 77,5; 87,5; 95,5; 101,5 - по два раза и 106,5 - четыре раза. Тогда Тггшс, = (23 - 2) х 8 + 43 - 4 = 108.
В нашем случае в качестве г/1 взяты места публикаций в рейтинге Кн, а в качестве г/
места в рейтин-
ге К№С1.
Ранговый коэффициент корреляции Спирмена принимает значения на отрезке [-1; 1]. Для выборки расчетный коэффициент сравнивается с табличными с разными уровнями значимости а (таблица 2). Значения критических уровней взяты из таблицы критических значений статистических критериев [12]. Для п = 100 значение критического уровня при а = 0,05 равно 0,197, при а = 0,01 - 0,256 и при а = 0,001 - 0,324. Полученное значение р = 0,364 и находится в пределах рР 0,324.
Таблица 2
Метод ранговой корреляции а = 0,1 а = 0,05 а = 0,01 а = 0,001
Метод Спирмена 0,165 0,197 0,256 0,324
Метод Стьюдента 1,660 1,984 2,626 3,39
Традиционно выделяют три уровня статистической значимости результатов математической обработки данных [10]:
- а < 0,05 - обычный уровень статистической значимости. Его можно интерпретировать так: «Получен статистически значимый результат».
- а < 0,01 - высокий уровень значимости. Его можно интерпретировать следующим образом: «Обнаружена выраженная закономерность», например, тесная связь между двумя переменными, если речь идет об уровне значимости коэффициента корреляции.
- а < 0,001 - очень высокий уровень значимости.
Полученное значение р > а = 0,001, следовательно, между качественными признаками существует значимая ранговая корреляционная связь.
Формулируется нулевая гипотеза Но - выборки Кк и ЯШС1, отражающие связь, независимы. Нулевая гипотеза отклоняется, если значение р меньше (или равно) заранее определенного уровня, а. Уровень статистической значимости а также называется уровнем значимости и представляет собой вероятность отклонения нулевой гипотезы при условии, что она верна. Обычно она устанавливается на уровне не более 5 %, при а = 0,05.
На рисунке 1 показано, что в нашем случае гипотеза Но о независимости отклоняется.
0,197 0,256 0,364
Следовательно, установлена положительная линейная зависимость между двумя ранжированиями. Согласно этому заключению делается вывод о том, что применение профиля исследования «Входящий/Исходящий» разработанного метода для выявления важных публикаций исследуемой тематики можно использовать наряду с известным показателем ЕШС1 или как альтернативный.
Расчет коэффициента ранговой корреляции методом Стьюдента для анализа результатов эксперимента. Преимущество распределения Стьюдента заключается в его независимости от параметров генеральной совокупности: оно зависит только от объёма выборки n. Применяется при многочисленной выборке. Суммарный объем выборок должен быть не менее 30 (для вероятности равной 95 %) и не менее 100 (для вероятности 99 %). В рассматриваемом эксперименте объем выборки равен 100.
Значения коэффициента ранговой корреляции Стьюдента определяется по формуле:
|t|=-p= Vn—2 , (4)
Vi -р2
где р - значение коэффициента парной корреляции.
Для нашего коэффициента корреляции р = 0,364 ранговый коэффициент корреляции Стьюдента, вычисленный по формуле (4), равен 3,871.
Найдем критическое значение критерия с помощью статистической функции СТЪЮДЕНТ.ОБР.2Х в мастере функции в Excel с числом степеней свободы (n - 2) и уровнем значимости а: при а = 0,05 - ирит = 1,984; при а = 0,01 - гкрит = 2,626; при а = 0,001 - t^ = 3,393.
В силу того, что t > 1крит, так как 3,871 > 3,393, при уровне значимости 0,001 отклоняется Но и коэффициент ранговой корреляции является статистически значимым.
Результаты сравнения ранжирования по профилям исследования. В качестве сравнения корреляционной зависимости с FWCI были взяты еще профиль исследования «Входящий», характеризующийся учетом релевантных центральностей в режиме in (рассматриваются только входящие связи), и мера центральности полустепень захода (in-degree), которая соответствует количеству цитирований публикации.
1. При сравнении с профилем «Входящий» значение рангового коэффициента Спирмена р = 0,16. Следовательно, существует положительная линейная зависимость, однако уровень статистической значимости низкий р < а = 0,1.
2. При сравнении с мерой центральности полустепень захода значение рангового коэффициента Спир-мет р = 0,229. Следовательно, существует положительная линейная зависимость. Уровень статистической значимости находится в пределах 0, 0,197 < р < 0,256, т.е. р > а = 0,05, что соответствует обычному уровню статистической значимости.
В таблице 3 приведены значения коэффициентов ранговой корреляции Спирмена и Стьюдента в сравнении FWCI с профилем исследования «Входящий/Исходящий», «Входящий» и мерой центральности полустепень захода (in-degree).
Таблица 3
Значения коэффициентов ранговой корреляции, при n = 100_
Метод ранговой корреляции Профиль исследования
Входящий/Исходящий, p Полустепень захода, p Входящий, p
Метод Спирмена 0,364 0,229 0,16
Метод Стьюдента 3,871 2,327 1,61
Из таблицы 3 видно, что коэффициент ранговой корреляции принимает наибольшее значение в сравнении с результатами ранжирования при использовании разработанного метода, согласно профилю исследования «Входящий/Исходящий», сформированного с помощью комбинирования сетевых метрик, чем в сравнении с результатами ранжирования по показателю меры центральности полустепени захода (цитирования). В итоге можно сделать вывод о целесообразности применения предложенной в работе математической модели определения важности узла сети цитирования (формула 1) с помощью комбинирования метрик для улучшения и расширения показателей оценки научных публикаций. Причем, согласно большей корреляционной зависимости результатов ранжирования по профилю исследования «Входящий/Исходящий» в сравнении с коэффициентом корреляции профиля исследования «Входящий», делается вывод, что комбинация мер центральности в первом случае более подходящая, чем во втором.
Заключение. Проведенные исследования позволили установить, что использование метода определения важности узла сети цитирования научных публикаций для ранжирования публикаций является эффективным подходом. Представлены результаты анализа публикаций на основе данных международной базы цитирования Scopus.
Подтверждена пригодность математической модели определения важных узлов сети цитирования научных публикаций путем сравнения научных публикаций по важности и Field-Weighted Citation Impact с помощью методов ранговой корреляции Спирмена и Стьюдента. Установлено также, что теснота связи между рангами, полученными по формуле (1), и рангами, полученными по FWCI, зависит от профиля исследования. Коэффициент ранговой корреляции принимает наибольшее значение в равнении с показателем профиля исследования, сформированного с помощью комбинирования сетевых метрик, чем в сравнении с показателем меры центральности вершин графа по полустепени захода (цитирования). В итоге делается вывод о целесообразности использования предложенной в работе формулы определения важности узлов сети цитирования с помощью комбинирования сетевых метрик для улучшения и расширения показателей оценки научных публикаций.
Исходя из полученных результатов исследований, можно сделать вывод о том, что применение сетевого анализа раскрывает широкий спектр возможностей для анализа научных публикаций.
Список литературы
1. Lu Z. Patent Citation Network Analysis Based on Improved Main Path Analysis: Mapping Key Technology Trajectory / Z. Lu, Y. Ma, L. Song // Advances in Artificial Intelligence and Security (ICAIS 2021): Communications in Computer and Information Science. Springer Cham, 2021. Vol. 1423. Р. 158-171. DOI: 10.1007/978-3-030-78618-2_13.
2. A term function-aware keyword citation network method for science mapping analysis / J. Wang, Q. Cheng, W. Lu [et al.] // Information Processing & Management. 2023. Vol. 60, no. 4. Р. 103-405. DOI: 10.1016/j.ipm.2023.103405.
3. Current state and future trends: a citation network analysis of the academic performance field / C. Martinez-Perez, C. Alvarez-Peregrina, C. Villa-Collar, M. Á. Sánchez-Tena // International Journal of Environmental Research and Public Health. 2020. Vol. 17, no. 15. P. 5352. DOI: 10.3390/ijerph17155352.
4. Measuring academic influence using heterogeneous author-citation networks / F. Zhao, Y. Zhang, J. Lu, O. Shai // Scientometrics. 2019. Vol. 118. Р. 1119-1140. DOI: 10.1007/s11192-019-03010-5.
5. Scientific publication recommendations based on collaborative citation networks / T. Huynh, K. Hoang, L. Do [et al.]. // International Conference on Collaboration Technologies and Systems (CTS). IEEE, 2012. DOI: 10.1109/CTS.2012.6261069. [Электронный ресурс] URL: https://ieeexplore.ieee.org/abstract/document/6261069 (дата обращения: 03.03.2024).
6. Ольгина И.Г. Программный и алгоритмические средства сетевого анализа для определения важности научных публикаций // Электронные библиотеки. 2023. №. 5. С. 646 - 672. DOI: 10.26907/1562-5419-2023-26-5-646672.
7. Research Metrics // University of the Sunshine Coast. [Электронный ресурс] URL: https://libguides.usc.edu.au/researchmetrics/researchmetrics-field-weighted-citation-impact (дата обращения: 03.03.2024).
8. Баврина А.П. Современные правила применения корреляционного анализа / А. П. Баврина, И. Б. Борисов // Медицинский альманах. 2021. № 3 (68). С. 70-79.
9. Печников А.А. Структура графа цитирования журналов Math-Net.Ru / А.А. Печников, Д.Е. Чебуков // Научный сервис в сети Интернет: тр. XXIII Всерос. науч. конф. (20-23 сент. 2021 г.) / Ин-т приклад. мат. им. М.В. Келдыша РАН. Москва: Изд-во ИПМ им. М. В. Келдыша РАН, 2021. С. 265-278.
10. Проверка статистической значимости // Data Science. [Электронный ресурс] URL: http://datascientist.one/proverka-stat-znachimosti (дата обращения: 23.08.2023).
11. Коэффициент корреляции рангов Спирмена. [Электронный ресурс] URL: http://cito-web.yspu.org/link1/metod/met125/node36.html (дата обращения: 23.08.2023).
12. Таблицы критических значений статистических критериев // StatAnalyse.org. [Электронный ресурс] URL: https://web.archive.org/web/20100302075025 (дата обращения: 23.08.2023).
Ольгина Инна Геннадьевна, директор библиотеки, старший преподаватель, inna_olgina@mail. ru, Россия, Омск, Омский государственный технический университет
ANALYSIS OF THE RESULTS OF RANKING SCIENTIFIC PUBLICATIONS USING THE RANK CORRELATION
METHOD
I.G. Olgina
The article considers the ranking publications issues using a complex indicator on the basis of network metrics. The authors have used Spirman and Student Rank Correlation methods for comparison of ranking results with Field-Weighted Citation Impact in Scopus. The research also determines a strong positive linear relationship between two rankings. Moreover, the authors identify that the close relationship between the ranks, obtained by the developed method, and the ranks, according to the citation indicator and weighted by the subject area, depends on the network metrics combination included in the complex indicator. On the basis of the citation graph analysis, the authors provide some relevant conclusions in the research.
Key words: citation network, graph, publication, scientometrics, network analysis, rank correlation method.
Olgina Inna Gennadevna, director of the library, senior lecturer, inna_olgina@mail. ru, Russia, Omsk, Omsk State Technical University
УДК 004
Б01: 10.24412/2071-6168-2024-3-78-79
РАСЧЕТ ЭКОНОМИЧЕСКОЙ ЭФФЕКТИВНОСТИ СИСТЕМЫ КОНТРОЛЯ ВОЗГОРАНИЯ
ТОРФЯНИКОВ С ИСПОЛЬЗОВАНИЕМ ДАТЧИКОВ ТЕМПЕРАТУРЫ И ВЛАЖНОСТИ
А.П. Зверев
В данной статье рассмотрен вопрос об экономической эффективности использования кабеля внутри торфяных болот с прикреплёнными к нему датчиками температуры и влажности для контроля возгорания торфяников. При этом определено, что написанная программа для ПЭВМ позволяет контролировать не только текущее состояние торфяника, но и производить контроль в течении всего календарного года. Также в статье показано количество торфяных болот на территории Московской области. При этом говорится что 2010 год показал количество пожаров, а также ту особенность, что в данный период не учитывались торфяные разработки, в которых ранее производились выработки торфа. И приведен расчет стоимости предлагаемой системы.
Ключевые слова: торфяник, оптоволоконный кабель, датчики температуры и влажности, соединительный шкаф, ЕДДС (единая дежурно диспетчерская служба), программа для ПЭВМ.
Введение Торф означает (масса, сформировавшаяся в условиях нехватки кислорода в сочетании с высокой влажностью из не полностью разложившихся остатков болотных растений). Таким образом, торф - это полезное ископаемое, используется как топливо, удобрение, теплоизоляционный материал и др. [1,2,3,4].
78