Научная статья на тему 'Специфика частотного ядра глаголов и существительных современного английского языка в пространстве разноуровневых и разноаспектных признаков'

Специфика частотного ядра глаголов и существительных современного английского языка в пространстве разноуровневых и разноаспектных признаков Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
188
51
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЧАСТОТНОСТЬ / ГЛАГОЛЫ / СУЩЕСТВИТЕЛЬНЫЕ / СООТНОШЕНИЕ ПРИЗНАКОВ / КОЭФФИЦИЕНТ СХОДСТВА / FREQUENCY / VERBS / NOUNS / INTERRELATION OF CHARACTERISTICS / QUOTIENT OF SIMILARITY

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Грахольская Марина Ивановна

В статье ставится задача установить степень сходства и различия системы межуровневых связей, характеризующих частотную лексику, а именно: глаголы и существительные в современном английском языке. Задача решается при помощи сопоставления статистически значимых корреляций в языке и в его частотном ядре при помощи коэффициента сходства Жаккара.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Грахольская Марина Ивановна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Peculiarities of Frequency Verbs and Nouns of Contemporary English Regarding Various Characteristics of Different Linguistic Levels and Aspects

The paper deals with establishing the similarity and discrepancy measure within the system of interlevel relations characterizing frequency nouns and verbs of contemporary English. The problem is solved by means of comparing relevant correlations of all the lexical units of the language and its core set with the help of the quotient of similarity.

Текст научной работы на тему «Специфика частотного ядра глаголов и существительных современного английского языка в пространстве разноуровневых и разноаспектных признаков»

УДК 811.111’373 ББК 81.432.1-3

Грахольская Марина Ивановна

аспирант кафедра иностранных языков СмолГУ г. Смоленск Grakholskaya Marina Ivanovna Post-graduate Chair of Foreign Languages Smolensk State University Smolensk grakholskaya@mail.ru Специфика частотного ядра глаголов и существительных современного английского языка в пространстве разноуровневых и разноаспектных

признаков

Peculiarities of Frequency Verbs and Nouns of Contemporary English Regarding Various Characteristics of Different Linguistic Levels and Aspects

В статье ставится задача установить степень сходства и различия системы межуровневых связей, характеризующих частотную лексику, а именно: глаголы и существительные в современном английском языке. Задача решается при помощи сопоставления статистически значимых корреляций в языке и в его частотном ядре при помощи коэффициента сходства Жаккара.

The paper deals with establishing the similarity and discrepancy measure within the system of interlevel relations characterizing frequency nouns and verbs of contemporary English. The problem is solved by means of comparing relevant correlations of all the lexical units of the language and its core set with the help of the quotient of similarity.

Ключевые слова: частотность; глаголы; существительные; соотношение признаков; коэффициент сходства.

Key words: frequency; verbs; nouns; interrelation of characteristics; quotient of similarity.

Частотная лексика давно привлекает к себе внимание лингвистов, работающих в различных областях - от лексикографии и лексикологии до методики преподавания иностранного языка. Особо важное место частотные лексические единицы стали занимать в исследованиях по стилеметрии, посвященных установлению авторства и выявлению маркеров индивидуального стиля [1; 4; 8; 9; 11]. Не удивительно поэтому, что частотная лексика из средства стилеметрического анализа, одного из важнейших параметров анализа стиля, стала в свою очередь объектом изучения.

Так, Л.В. Климова изучает грамматические, лексико-семантические и стилистические свойства высокочастотных существительных, прилагательных и числительных в современном русском языке [6], а Л.И. Головина рассматривает семантический аспект при анализе отглагольных суффиксальных существительных лексического минимума [5]. Вместе с тем приходится констатировать, что систематического исследования частотных единиц на материале английского языка с учетом разноуровневых и разноаспектных признаков не проводилось.

В нашем исследовании была поставлена задача установить основные зависимости между различными параметрами английских существительных и глаголов, относящихся к числу наиболее частотных лексических единиц (далее ЧЛ) и сопоставить эти системы между собой.

В качестве материала исследования привлекается список ЧЛ словаря Longman Dictionary of Contemporary English [10]. Общее количество существительных наиболее частотных существительных по данным этого словаря составляет 265 единиц, среди высокочастотных глаголов отмечено 150 единиц.

Каждому глаголу и существительному был приписан ряд характеристик. Для высокочастотных глаголов в этой статье произведен анализ соотношения фонетических, морфемных, деривационных и диахронических признаков. Ниже приводятся эти признаки.

Фонология: тип фонемы в начальной (call) и конечной позиции слова (find). Слоговой состав (слоги): один слог (build), два слога (assume), три слога (consider). Акцентные характеристики (ударения): первый слог (cover), второй слог (continue), третий слог (understand). Морфемика: членимость глагольной основы (realize), префиксальная (remember) и суффиксальная (happen) членимость, наличие соотносимого по конверсии существительного (help). Деривационные: наличие отглагольного деривата вообще, наличие префиксального (enter - reenter), суффиксального деривата (draw - drawing), наличие субстантивного (hear - hearing), адъективного (accept - acceptable) и глагольного (believe - disbelieve)

деривата. Ряд признаков являются диахроническими. Хронология: глагол зафиксирован в древнеанглийский (meet), в среднеанглийский (produce), в новоанглийский (occur) период. Этимология: корень глагола имеет германское (pull), романское (recognize) происхождение.

Признаковое пространство исследования именной лексики включает в целом тот же список фонетических, морфемных, деривационных и диахронических признаков. Небольшое различие имеется только для этимологических признаков, в число которых включен признак «греческое происхождение корня» (project), а также признак, отражающий то, что глагольная основа принадлежит какому-либо другому языку (т.е. не германского, не романского и не греческого происхождения).

Для выявления характера соотношений указанных разноуровневых и разноаспектных характеристик применяется коэффициент корреляции Коула [2; 3; 4; 7].

В результате анализа были получены следующие виды соотношений, которые отражены в приводимой таблице 1. В ней указано количество статистически значимых корреляций и количество случаев, когда корреляции отсутствуют. Среди статистически значимых корреляций выделяются положительные и отрицательные зависимости. В первом случае признаки взаимно обусловливают друг друга, во втором - взаимно несовместимы.

В верхней части таблицы даются результаты корреляционного анализа глаголов, в нижней части - существительных. Для большего различия соотношения признаков существительных обозначены курсивом.

Первое число в ячейках таблицы обозначает количество положительных корреляций, второе - число отрицательных корреляций. Третье число показывает, сколько соотношений является незначимыми.

При последовательном сопоставлении разноуровневых и разноаспектных признаков, приписанных высокочастотным глаголам современного английского

языка, было изучено 228 соотношений пар признаков. Аналогичные признаки высокочастотной именной лексики образуют 468 пар соотношений.

Как видно из таблицы 1, 481 корреляция является статистически значимой. Всего отмечено 259 положительных корреляций, 222 - отрицательных.

По частям речи данные следующие. У глаголов 91 положительная корреляция, 71 - отрицательная. У существительных 168 положительных корреляций, 151 - отрицательная. Положительные корреляции превалируют над отрицательными, то есть в глагольном и именном частотном ядре достаточно высокое положительное взаимодействие разноуровневых признаков.

Таблица 1

Соотношения разноуровневых и разноаспектных признаков высокочастотных

глаголов и существительных

Фонетика Слоги Ударение а к и % <а р о Хронология Этимология Деривация

Фонетика х 2-3-1 2-3-1 3-4-1 2-4-1 2-2-0 4-1-7

Слоги 11-12-7 х 3-2-0 7-5-0 4-4-1 3-3-0 11-3-4

Ударение 8-6-4 5-7-3 х 6-5-1 3-3-3 2-2-2 8-3-7

Морфемика 12-17-7 22-6-2 18-6-0 х 9-5-1 5-5-0 10-7-7

Хронология 5-4-9 5-5-5 4-4-1 12-6-0 х 3-3-0 1-2-18

Этимология 6-2-16 5-6-9 3-3-6 8-7-9 5-5-3 х 2-2-10

Деривация 7-8-21 5-13-12 6-8-4 7-13-16 3-6-9 4-7-13 х

Наличие значительного количества релевантных соотношений позволяет сформировать представление о механизмах, действующих в рамках высокочастотной лексики.

Наибольшее количество статистически значимых корреляций у глаголов отмечено между фонетическими параметрами между собой, фонетическими характеристиками и морфемикой, диахронией и деривацией. Интересно отметить, что соотношения морфемных признаков с параметрами диахронического и де-

ривационного уровней также являются в основном статистически значимыми. Деривационные параметры, напротив, демонстрируют большинство нерелевантных соотношений с хронологическими и этимологическими характеристиками.

У существительных также стоит отметить наличие весомого количества статистически значимых соотношений между признаками фонетического уровня и остальными параметрами, привлеченных к исследованию. Однако стоит уточнить, что такие фонетические параметры, как тип инициальной/финальной фонемы являются исключением, так как с диахроническими и деривационными характеристиками они связаны минимально. Признаки диахронического и деривационного уровней также минимально связаны и между собой. Во всех остальных случаях отмечено превалирование релевантных соотношений над статистически незначимыми.

Среди статистически значимых корреляций отмечено примерно равное количество положительных (168) и отрицательных (151) связей. Подобное распределение позволяет говорить о том, что в частотном ядре именной лексики наблюдается определенное равновесие между благоприятными и ограничивающими факторами, влияющими на качество соотношений между разноуровневыми признаками.

Для большей точности представляется возможным сравнить внутрисистемные соотношения, возникшие в рамках частотного ядра глагольной и именной лексики с помощью привлечения коэффициента сходства Жаккара [2; 3; 4]. Он изменяется в диапазоне от 0 до 1. При 0 наблюдается полное несходство, при 1 - полное совпадение.

Формула данного коэффициента имеет следующий вид: т

К = ----------------,

$ і + $ 2 — т

где т - количество совпадений между одними и теми же признаками в глагольной и именной системе, Ь - общее количество соотношений в глагольной

системе, Ь2 - общее количество соотношений в именной системе. В данной работе под совпадением понимается сходство знаков коэффициента корреляции. Кроме того совпадение имеет место в тех случаях, когда зафиксировано отсутствие релевантных соотношений в обеих системах. Теснота связи между параметрами не учитывается. Статистическая релевантность полученных коэффициентов устанавливалась посредством вычисления ошибки выборки о для уровня значимости р=0,01.

В результате проведенного анализа были получены коэффициенты, размещенные в таблице 2, где отражена степень сходства глагольного и именного частотного ядра. В первом столбце таблицы 2 перечислены рассматриваемые соотношения признаков, второй столбец демонстрирует показатели К, где К -коэффициент сходства Жаккара.

Наиболее сильное сходство демонстрируют соотношения параметров «фонетика - хронологические характеристики», «хронология - слоговые характеристики», «акцентные характеристики - хронология», «акцентные характеристики - морфемика», «морфемика-хронология», «слоговые характеристики -морфемика», «этимология - слоговые характеристики», «морфемика-этимология», что указывает на достаточно высокую схожесть диахронических и морфемных параметров относительно звуковой оболочки глаголов и существительных частотного ядра. Следует отметить, что последние три пары обладают наивысшим показателем сходства, где К = 1.

Высокие показатели сходства также наблюдаются в парах «фонетика - слоговый состав», «слоговый состав - акцентные характеристики», «фонетика -этимология», «акцентные характеристики - этимология», «фонетика - деривация», «деривация - слоговый состав», «деривация - хронология», «деривация -этимология».

Наименьший показатель сходства замечен в паре «акцентные характеристики - деривация» (К = 0,2). Интересно, что слабых коэффициентов не обнаружено.

Таблица 2

Коэффициент сходства соотношений разноуровневых признаков глаголов частотного ядра и общеглагольной системы

К

Фонетика - слоговый состав 0,33

Фонетика - акцентные характеристики 0,29

Слоговый состав - акцентные характеристики 0,38

Фонетика - хронология 0,64

Фонетика - этимология 0,41

Слоговый состав - хронология 0,64

Слоговый состав - этимология 1,00

Акцентные характеристики - хронология 0,64

Акцентные характеристики - этимология 0,5

Фонетика - морфемика 0,28

Слоговый состав - морфемика 1,00

Акцентные характеристики - морфемика 0,76

Фонетика - деривация 0,41

Слоговый состав - деривация 0,56

Акцентные характеристики - деривация 0,2

Морфемика - деривация 0,25

Морфемика - хронология 0,87

Морфемика - этимология 1,00

Деривация - хронология 0,38

Деривация - этимология 0,33

В целом, из общего числа корреляций признаков равного 644 было зафиксировано 195 совпадений, что в процентном соотношении составляет 30,3%. Коэффициент сходства Жаккара имеет показатель К = 0,43.

Полученные результаты позволяют сделать ряд выводов.

(1) Интересным является факт, что как именная, так и глагольная системы являются практически одинаково взаимосвязанными: так процент статисти-

чески значимых связей от общего количества соотношений в системе высокочастотной глагольной лексики составляет 68,1%, а в системе высокочастотной именной лексики - 68,2%.

(2) Несмотря на практически равный процент статистически значимых связей, каждая из систем ЧЛ характеризуется своим набором признаков, которые демонстрируют взаимное притяжение. Так фонетика больше связана с хронологией и этимологией в именной системе ЧЛ. Напротив, слоговый состав больше связан с акцентными характеристиками, морфемикой и диахронией в глагольной системе ЧЛ. Хронология и этимология также демонстрируют большее притяжение именно в системе глагольной ЧЛ.

(3) Сопоставление глагольной и именной систем корреляций показывает, что их коэффициент степени сходства между собой относится к сильным показателям. Это свидетельствует о наличии весомого количества сходных черт, но есть и различия. Наибольшие черты сходства ЧЛ - типологические маркеры ядра лексических единиц. Это прослеживается в парах «фонетика - хронология», «хронология - слоговые характеристики», «акцентные характеристики - хронология», «акцентные характеристики - морфемика», «морфемика-хронология», «слоговые характеристики - морфемика», «этимология - слоговые характеристики», «мор-фемика-этимология». Наименьшие по силе показатели сходства зафиксированы в парах «акцентные характеристики - фонетика», «фонетика - морфемика», «акцентные характеристики - деривация», «морфемика - деривация».

(4)

Библиографический список

1. Андреев, В. С. Моделирование индивидуального стиля американских поэтов-романтиков // Вестник Тамбовского университета. Серия: Гуманитарные науки. 2012. № 10 (114). С. 47 - 52.

2. Андреев, С. Н. Устойчивость результатов исследования языкового материала // Иностранный язык в высшей школе. Рязань: Рязанский гос.пед.ун-т, 2005. №2. С. 93-105.

3. Андреев, С. Н. Язык vs. метаязык: устойчивость системы деривационных отношений // Известия Смоленского государственного университета. 2011. №4 (16). С. 218-225.

4. Андреев, С. Н. Точный и вольный перевод стихотворного текста: количественная оценка // Известия Смоленского государственного университета. 2012. №4 (20). С. 88-95.

5. Головина, Л. И. Структурно-семантическая характеристика и семанти-зация частотных значений отглагольных суффиксальных существительных лексического минимума для национальной школы: Дис. ... канд. филол. наук -Елец, 1984. 180 с.

6. Климова, Л. В. Высокочастотные имена существительные, прилагательные и числительные в современном русском языке: Дис. ... канд. филол. наук. - Екатеринбург, 2004. 189 с.

7. Тулдава, Ю. А. Об измерении связи качественных признаков в лингвистике (1): Сопряженность альтернативных признаков // Квантитативная лингвистика и автоматический анализ текстов: Ученые записки Тартусского ун-та. 1988. Вып.827. С. 146-162.

8. Andreev, S. Estimation of Similarity Between Poetic Texts and their Translations by Means of Discriminant Analysis // Journal of Quantitative Linguistics. Vol.10, No. 2, 2003. P. 159-176.

9. Holmes, D. I. Stylometry and the civil war: The case of the Pickett letters // Chance. 2003. Vol. 16, No. 2, P. 18-26.

10. Longman Dictionary of Contemporary English / Director Della Summers. -Harlow: Pearson Education Ltd, 2006. - 1950 p.

11. Savoy, J. Authorship attribution // Journal of Quantitative Linguistics. 2012. Vol. 19 (2). P. 312-161.

Bibliography

1. Andreev, V. S. Modeling of individual styles of American romantic poets [Text] / V.S. Andreev // Tambov University Review. The Humanities Series. Tambov: TSU, 2012. № 10 (114). - P.47-52.

2. Andreev, S. N. Stability of Linguistic Material Research Result [Text] / S.N. Andreev // Foreign Languages in Higher School. Ryazan: RGPU, 2005. №2. - P.93-105.

3. Andreev, S.N. Language vs. Metalanguage: derivation system stability [Text] / S.N. Andreev // Proceedings of the Smolensk State University. Smolensk: SmolGU, 2011. №4 (16). - P.218-225.

4. Andreev, S. N. Literal and Liberal Translation of Verse Text: Quantitative Estimation [Text] / S.N. Andreev // Proceedings of the Smolensk State University. Smolensk: SmolGU, 2012. №4 (20). - P.88-95.

5. Golovina, L. I. Structural and Semantic Characteristics and Semantization of Frequency Meanings of Verbal Suffixal Nouns of Lexical Minimum for National School: Diss. ... Cand. of Philol. [Text] / L. I. Golovina. - Elets, 1984. - 180 p.

6. Klimova, L. V. Frequency Nouns, Adjectives, and Numerals in Contemporary Russian: Diss. ... Cand. of Philol. [Text] / L. V. Klimova. - Yekaterinburg, 2004. - 189 p.

7. Tuldava, Yu. A. On Establishing Relations Between Qualitative Parameters in Linguistics (1): Association of Alternative Parameters [Text] / Quantitative Linguistics and Automatic Text Analysis. Tartu University. 1988. Issue 827. - P. 146 -162.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. Andreev S. Estimation of Similarity Between Poetic Texts and their Translations by Means of Discriminant Analysis // Journal of Quantitative Linguistics. Vol.10, No. 2, 2003. P. 159-176.

9. Holmes D. I. Stylometry and the civil war: The case of the Pickett letters // Chance. 2003. Vol. 16, No. 2, P. 18-26.

10. Longman Dictionary of Contemporary English / Director Della Summers. -Harlow: Pearson Education Ltd, 2006. - 1950 p.

11. Savoy J. Authorship attribution // Journal of Quantitative Linguistics. 2012. Vol. 19 (2). P. 312-161.

i Надоели баннеры? Вы всегда можете отключить рекламу.