4. Huff Post. Статья из блога. Available at: https://www.huffpost.com/entry/melania-be-best-anniversary-bully_n_5cd2773ee4b0e524a47cd48c
5. Huff Post. Статья из блога. Available at: https://www.huffpost.com/entry/jada-pinkett-smith-will-smith-genie-aladdin_n_5ce54fffe4b09b23e65bc6d8
6. Big Picture. Статья из блога. Available at: https://bigpicture.ru/?p=1130005
7. Fifty Coffees. Статья из блога. Available at: www.fiftycoffees.com/coffees/2014/3/31/chelsea-lindman
8. Fifty Coffees. Статья из блога. Available at: www.fiftycoffees.com/ally-bogard
9. Fritz Morgen. Статья из блога. Available at: https://fritzmorgen.livejournal.com/1580172.html
References
1. Bavrova-Hudyakova O.S. Proyavlenie mental'nosti nositelej kitajskoj lingvokul'tury v tekstah sovremennoj blogosfery. Novye paradigmy v kognitivnoj lingvistike. Seriya: Filologicheskij sbornik. 2014; Vypusk 13: 320 - 329.
2. Gorshkova E.I. Blog kak vidinternet-kommunikacii. Avtoreferat dissertacii ... kandidata filologicheskih nauk. Sankt-Peterburg, 2013.
3. Ibraeva A.F. Yazykovye osobennosti tekstov angloyazychnoj i russkoyazychnoj blogosfery. Filologicheskie nauki. Voprosy teorii i praktiki. 2018: 333 - 336.
4. Huff Post. Stat'ya iz bloga. Available at: https://www.huffpost.com/entry/melania-be-best-anniversary-bully_n_5cd2773ee4b0e524a47cd48c
5. Huff Post. Stat'ya iz bloga. Available at: https://www.huffpost.com/entry/jada-pinkett-smith-will-smith-genie-aladdin_n_5ce54fffe4b09b23e65bc6d8
6. Big Picture. Stat'ya iz bloga. Available at: https://bigpicture.ru/?p=1130005
7. Fifty Coffees. Stat'ya iz bloga. Available at: www.fiftycoffees.com/coffees/2014/3/31/chelsea-lindman
8. Fifty Coffees. Stat'ya iz bloga. Available at: www.fiftycoffees.com/ally-bogard
9. Fritz Morgen. Stat'ya iz bloga. Available at: https://fritzmorgen.livejournal.com/1580172.html
Статья поступила в редакцию 26.11.20
УДК 81'32
Kysylbaikova M.I., Cand. of Sciences (Philology), senior lecturer, M.K. Ammosov North-Eastern Federal University (Yakutsk, Russia),
E-mail: [email protected]
EVALUATION OF MATHEMATICAL EXPECTATION USING A CONFIDENCE INTERVAL (ON THE EXAMPLE OF THE CONCEPT "CULTURE" RESEARCHING IN YAKUT LANGUAGE). The study is devoted to the description of the results of using the "confidence method" from mathematical linguistics to confirm the results of a free associative experiment conducted among native speakers of the Yakut language as part of the study of the concept "culture". The experiment involved 2000 respondents, who presented associative reactions to 15 stimulus words representing the studied concept. The paper presents the possibility of using the "confidence method" for experimental confirmation of the reliability of the obtained reliability coefficients. A method for determining the confidence interval for the share of a feature and a method for determining the required volume of the corresponding sample are proposed. The used method proves the effectiveness of its application to confirm that if the same number of respondents participate in the experiment, the same results can be achieved.
Key words: confidence interval, linguistics, linguistic consciousness, concept, mathematical linguistics.
М.И. Кысылбаикоеа, канд. филол. наук, доц., Северо-Восточный федеральный университет имени М.К. Аммосова, г. Якутск,
E-mail: [email protected]
ОЦЕНКА МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ С ПОМОЩЬЮ ДОВЕРИТЕЛЬНОГО ИНТЕРВАЛА (НА ПРИМЕРЕ ИССЛЕДОВАНИЯ КОНЦЕПТА «КУЛЬТУРА» В ЯКУТСКОМ ЯЗЫКЕ)
Исследование посвящено описанию результатов использования «доверительного метода» из математической лингвистики для подтверждения полученных результатов свободного ассоциативного эксперимента, проведенного среди носителей якутского языка в рамках исследования концепта «культура». В эксперименте приняли участие 2 000 респондентов, которые представили ассоциативные реакции на 15 слов-стимулов, репрезентирующих исследуемый концепт. В работе представлена возможность использования «доверительного метода» для экспериментального подтверждения достоверности полученных коэффициентов достоверности. Предложены метод определения доверительного интервала для доли признака и метод определения необходимого объема соответствующей выборки. Использованный метод доказывает эффективность его применения для подтверждения того, что, если удвоить количество испытуемых в эксперименте, можно получить те же результаты.
Ключевые слова: доверительный интервал, лингвистика, языковое сознание, концепт, математическая лингвистика.
В настоящее время можно выделить два основных направления применения математики в лингвистике. По мнению Т.А. Гавазы, «первое направление связано со структурной лингвистикой, основной целью которой является изучение языка как определенного вида организованной структуры, выявление закономерностей организации данной структуры и способов ее функционирования» [1]. Математические методы, используемые для достижения этой цели, являются составными компонентами такой науки, как математическая лингвистика. В этом случае объектом изучения математической лингвистики становятся не конкретные языки, а абстрактные модели различных аспектов языка. «Основу аппарата изучения математической лингвистики составляют методы математической логики, абстрактной алгебры, комбинаторные методы, методы теории вероятностей и математической статистики. В зависимости от того, какие свойства языка изучаются, какие разделы математики способствуют получению наиболее эффективных результатов, различают теоретико-множественную (структурную) модель языка, алгоритмическую и вероятностную (статистическую) языковые модели», считает Т.А. Гаваза [1].
При изучении языкового сознания носителей тех или иных языков часто используемым методом является свободный ассоциативный эксперимент среди представителей исследуемой культуры [2].
В нашем ассоциативном эксперименте приняли участие 2 000 респондентов - носителей якутского языка. Испытуемым было предложено дать первые ассоциации на слова-стимулы исследуемого концепта «культура», всего было представлено 15 слов-стимулов.
Чтобы сделать выводы о полученных результатах языкового сознания представителей той или иной культуры, необходимо иметь достаточно большое количество респондентов. Для выявления точности и надежности полученных данных, в нашем случае для уверенности, что такое же полученное количество респондентов ассоциативного эксперимента будет иметь такие же результаты ответов, используем доверительный интервал - метод математической лингвистики. Для оценки математического ожидания с помощью доверительного интервала и статистической параметризации следует знать, как и каким образом решаются задачи.
Доверительный интервал. Отвечая требованиям состоятельности, несмещенности и эффективности, точечная оценка 6* имеет один серьезный недостаток: она не дает сведений о точности и надежности приближения к параметру 6 генеральной лингвистической совокупности. Этот недостаток особенно ощутим тогда, когда число наблюдений мало. Чтобы устранить этот недостаток, вводится иной вид оценки - доверительный интервал [3].
Для определения доверительного интервала необходимо найти такие случайные значения 6н*, 6в*, каждое из которых является функцией выборочных наблюдений х1 х2 хн чтобы образуемый ими промежуток (6н*, 6в*) с вероятностью не менее ^ покрывал неравенство 6н* < 6 < 6в*, в котором 6н* выступает в роли нижней, а 6в* - верхней границы доверительного интервала.
При оценке параметра 6 с помощью доверительного интервала учитываются две величины.
Во-первых, необходимо указать ширину доверительного интервала 6в* -6н*, половину которого составляет величина погрешности е = (6в* - 6н*) / 2, ха-
^БЫ 1991-5497. МИР НАУКИ, КУЛЬТУРЫ.ОБРАЗОВАНИЯ. ЫМ ^(85)020^0
рактеризующая точность нашей оценки. Чем уже интервал, т.е. чем меньше разность 6в* - 6н*, следовательно, чем меньше е, тем точнее оценка параметра 6.
Во-вторых, следует учитывать, с какой вероятностью интервал (6н*, 6в*) покрывает параметр 6. Ведь нижняя (6н*) и верхняя (6в*) границы интервала суть случайные величины, зависящие от опыта: при многократном повторении опыта величина и положение интервала (6н*, 6в*) относительно 6 будут меняться. Однако доверительный интервал должен быть построен так, чтобы доверительная вероятность (надежность) ^ захвата им параметра 6 была бы достаточно велика, а вероятность q, представляющая собой дополнение до единицы и указывающая на то, что 6 не будет покрыт интервалом (6н*, 6в*), была бы соответственно мала (мы будем впредь называть q уровнем значимости). Чем ближе вероятность ^ к единице, а вероятность q к нулю, тем меньше риск ошибиться в оценке параметра 6.
Интегральная оценка вероятности р с помощью нормального распределения. Пусть вероятность р альтернативного лингвистического признака А не слишком близка к нулю и единице, а число наблюдений N достаточно велико (такая ситуация имеет обычно место при статистических исследованиях в области грамматики, фонетики и фонологии). Вероятность р неизвестна, и ее нужно оценить через получаемую в опыте частость f = F / N.
Теоретически можно в(ынвологоть, что параметром. этого распределения служат величины
м (р / ы) = м (о = р и о (10 = да
При бесконечном увеличении числа испытаний (т.е. объема выборки) предельным распределением нормированной частости М(/}~ _р- 1
V ,/р <1 -
Таблица значений критерия Стъюдента ^-критерия)
является нормальное распределение
(| ~ 1 ¿¡ = 2Ф {¿) = [5, где Ъ - величина, значение которой соответствует заданной нодежност. , пр. v=8 (табл. 1). От неравенства
о
перейдем к двойному неравенству
- Ъ < (р - Т)/а < Ъ .л. f - оЪ, < р <f+ 04
где
2
0= я
Заменив вероятность р на полученное из опыта значение частости f и следуя рассуждениям, приходим к доверительноАу интервалу вероятности, который имеет вид
.^■[1-/3 -д
я <p<f+z^ да
При этом нижняя оценка параметра р равна
рн=^гр я =(_£,
а верхняя составляет
' , ^ рв=Г+гр да =„£,
где величина £ указывает на погрешность пр. определен.. доверительного интервала для р.
Используя данный метод, мы получили следующие результаты: (см. табл. 2).
Таблица 1
. Критические значения коэффициента Стъюдента
! !
V Двусторонний уровень значимости q V Двусторонний уровень значимости q
\> 0,10 0,05 0,02 0,01 0,10 0,05 0,02 0,01 q
q 0,90 0,95 0,98 0,99 0,90 0,95 0,98 0,99 \>
1 6,31 12,70 31,82 63,70 18 1,73 2,10 2,55 2,88
2 2,92 4,30 6,97 9,92 19 1,73 2,09 2,54 2,86
3 2,35 3,18 4,54 5,84 20 1,73 2,09 2,53 2,85
4 2,13 2,78 3,75 4,60 21 1,72 2,08 2,52 2,83
5 2,01 2,57 3,37 4,03 22 1,72 2,07 2,51 2,82
6 1,94 2,45 3,14 3,71 23 1,71 2,07 2,50 2,81
7 1,89 2,36 3,10 3,50 24 1,71 2,06 2,49 2,80
8 1,86 2,31 2,90 3,36 25 1,71 2,06 2,49 2,79
9 1,83 2,26 2,82 3,25 26 1,71 2,06 2,48 2,78
10 1,81 2,23 2,76 3,17 27 1,71 2,05 2,47 2,77
11 1,80 2,20 2,72 3,11 28 1,70 2,05 2,46 2,76
12 1,78 2,18 2,68 3,05 29 1,70 2,05 2,46 2,76
13 1,77 2,16 2,65 3,01 30 1,70 2,04 2,46 2,75
14 1,76 2,14 2,62 2,98 40 1,68 2,02 2,42 2,70
15 1,75 2,13 2,60 2,95 60 1,67 2,00 2,39 2,66
16 1,75 2,12 2,58 2,92 120 1,66 1,98 2,36 2,62
17 1,74 2,11 2,57 2,90 8 1,64 1,96 2,33 2,58 q ( у
0,05 0,025 0,01 0,005 0,05 0,025 0,01 0,005
Односторонний уровень значимости q/2 Односторонний уровень значимости q/2
Таблица 2
Таблица частотности употребления концепта «культура» в якутском языке
№ Когнитивный признак Абсолютная частотность Относительная Доверительный интервал
частотность вероятности
1. признак «Вера» 990 3,7% 0,030 - 0,044
2. признак «Взаимоотношения» 1284 4,8% 0,045 - 0,051
3. признак «Спорт» 760 2,8% 0,026 - 0,030
4. признак «Литература» 1573 5,8% 0,055 - 0,061
5. признак История 63 0,2% 0,0014 - 0,0026
6. признак «Учебные принадлежности» 239 0,9% 0,008 - 0,010
7. признак «Электронное устройство» 422 1,6% 0,015 - 0,017
8. признак «Атрибуты культуры» 257 0,95% 0,0085 - 0,010
9. признак «Представитель культуры» 246 0,91% 0,008 - 0,010
10. признак «Описание культуры» 118 0,4% 0,0032 - 0,0048
11. признак «Движения в искусстве» 513 1,9% 0,017 - 0,021
12. признак «Движения в спорте» 869 3,2% 0,030 - 0,034
13. признак «Движения в образовании» 756 2,8% 0,026 - 0,030
14. признак «Место культуры» 3010 11,2% 0,108 - 0,116
15. признак «Периодизация культуры» 688 2,55% 0,024 - 0,028
16. признак «Искусство» 390 1,4% 0,013 - 0,015
17. признак «Фольклор» 2084 7,7% 0,074 - 0,080
18. признак «Человеческие ценности» 1439 5,3% 0,050 - 0,056
19. признак «Национальные праздники» 560 2% 0,020 - 0,022
20. признак «Искусство» 575 2,1% 0,020 - 0,022
21. признак «Институционализация» 978 3,6% 0,034 - 0,038
22. признак «Семья» 304 1,1% 0,010 - 0,012
23. признак «География» 385 1,4% 0,013 - 0,015
24. признак«Природа» 142 0,5% 0,004 - 0,006
25. признак «Средства массовой информации» 22 0,08% 0,0005 - 0,0011
26. признак «Транспорт» 4 0,01% 0,0000 - 0,0002
Всего реакций: 26976 (100%), отказов - 3 024.
В таблице представлены семантические признаки, представляющие структуру концепта «культура» в языковом сознании носителей якутского языка [4] с их абсолютной, относительной частотностью и доверительным интервалом вероятности.
Как видно из таблицы, ядром концепта «культура» в языковом сознании носителей якутского языка является «фольклор». Фольклор - это прошлое, настоящее и, возможно, будущее якутской культуры. Результаты исследования показывают (с учетом результатов доверительного интервала), что большое количество респондентов воспринимает культуру в первую очередь в виде фольклора. Культура якутов основана на фольклоре, фольклор - это устное народное творчество. Фольклор народа саха богат и разнообразен. Среди разных его
Библиографический список
жанров выдающееся место принадлежит богатырскому эпосу олонхо. Реакция «олонхо» находится на первом месте среди реакций признака «фольклор» [4]. Олонхо представляет собой эпическую поэму о героических подвигах древних богатырей, этот жанр возник в глубокой древности [5].
Мы представили оценку возможной погрешности вероятности появления реакции с помощью опытной частости. Опыт - результаты опроса. Таким образом, выявлены границы интервала, в котором с надежностью в 95% находится истинная вероятность появления реакции. Можно сказать, что если мы проведем такой же ассоциативный эксперимент у такого же количества респондентов, то получим примерно столько же реакций; ядром и перифериями концепта «культура» станут те же, что представлены в результатах данного эксперимента.
1. Гаваза Т. А. Профессиональная направленность курса математики на гуманитарных факультетах педагогического вуза. Вестник Псковского государственного университета. Серия: Естественные и физико-математические науки. 2007; № 2: 113 - 114.
2. Аскольдов С.А. Концепт и слово. Русская словесность. От теории словесности к структуре текста. Москва: Academia, 1997.
3. Пиотровский РГ Математическая лингвистика. Москва: Высшая школа, 1977.
4. Кысылбаикова М.И. Концептуализация культуры в языковом национальном сознании. Available at: https://dlib.rsl.ru/01009833592
5. Иванов В.Н. Якутия. Историко-культурный атлас. Москва: Феория, 2007.
References
1. Gavaza T.A. Professional'naya napravlennost' kursa matematiki na gumanitarnyh fakul'tetah pedagogicheskogo vuza. VestnikPskovskogo gosudarstvennogo universiteta. Seriya: Estestvennye i fiziko-matematicheskie nauki. 2007; № 2: 113 - 114.
2. Askol'dov S.A. Koncept i slovo. Russkaya slovesnost'. Ot teorii slovesnosti k strukture teksta. Moskva: Academia, 1997.
3. Piotrovskij R.G. Matematicheskaya lingvistika. Moskva: Vysshaya shkola, 1977.
4. Kysylbaikova M.I. Konceptualizaciya kul'tury vyazykovom nacional'nom soznanii. Available at: https://dlib.rsl.ru/01009833592
5. Ivanov V.N. Yakutiya. Istoriko-kul'turnyjatlas. Moskva: Feoriya, 2007.
Статья поступила в редакцию 29.11.20
УДК 811.511: 142
Lelkhova F.M., Cand. of Sciences (Philology), leading researcher, Ob-Ugric Institute of Applied Research and Dvelopment (Khanty-Mansiysk, Russia), E-mail: [email protected]
NAMES OF TREES AND SHRUBS IN THE KHANTY LANGUAGE. The article deals with lexical and semantic groups of names of trees and shrubs in the dialects of the Khanty language. The object of research in this work is the nominations of tree and shrub vegetation in the Khanty language, which provide a rich material for studying the language nomination in synchrony and diachrony, since they belong to the most archaic layers of vocabulary. There are no special works devoted to the study of the Khanty names of trees and shrubs from a linguistic point of view. The purpose of the article is to systematize and describe the meaning of tree flora in the dialects of the Khanty language at the present stage, to identify dialect features. The study uses a set of methods and techniques for analyzing linguistic material: the method of semantic classification, lexical-semantic analysis, word-formation, linguistic-geographical analysis, as well as elements of etymological analysis. The main method for studying plant names is description.
Key words: Khanty language, dialect vocabulary, flora, Khanty.
Ф.М. Лельхова, канд. филол. наук, вед. науч. сотр. БУ ХМАО - Югры «Обско-угорский институт прикладных исследований и разработок», г. Ханты-Мансийск, E-mail: [email protected]
НАЗВАНИЯ ДЕРЕВЬЕВ И КУСТАРНИКОВ В ХАНТЫЙСКОМ ЯЗЫКЕ
В настоящей статье рассматриваются лексико-семантические группы названий деревьев и кустарников в диалектах хантыйского языка. Объектом исследования в работе являются номинации древесной и кустарниковой растительности в хантыйском языке, дающие богатый материал для изучения языковой номинации в синхронии и диахронии, поскольку относятся к наиболее архаичным пластам лексики. В хантыйском языкознании отсутствуют специальные работы, посвященные изучению названий деревьев и кустарников с лингвистической точки зрения. Целью статьи является систематизация и описание значений древесной флоры в диалектах хантыйского языка на современном этапе, выявление диалектных особенностей. В исследовании использован комплекс методов и приемов анализа лингвистического материала: метод семантической классификации, лексико-семантический анализ, словообразовательный, лингвогеографический анализ, а также элементы этимологического анализа. Основным методом при исследовании названий растений является описание.
Ключевые слова: хантыйский язык, диалектная лексика, флора, ханты.