Анализ грамматического частотного профиля лексем корпуса детской речи как метод изучения развития речи в норме и при первичном недоразвитии речи у дошкольников
Корнев А.Н., СПбГПМУ [email protected]
Балчюниене И., Университет Vytautas Magnus (Каунас, Литва), СПбГПМУ
i.bal ciuni ene@hmf. vdu.lt Воейкова М.Д., Иванова К.А., ИЛИ РАН maria.voeikova@gmail. com, kira.ivanova@gmail. com Ягунова Е.В., СПбГУ [email protected]
Аннотация
Среди разнообразных методов изучения детской речи до настоящего времени не предпринималось попыток количественно -го статистического анализа распределения грамматических категорий в текстах детей, как с нормой развития, так и при состояниях первичного недоразвития речи. Существует много свидетельств, что в процессе развития языка и речи ребенок начинает использовать синтаксически более сложные конструкции, включающие все более широкий круг знаменательных и служебных слов. Предлагаемая нами методика основана на вычислении грамматического частотного профиля (ГЧП) в репрезентативной выборке детских текстов. В проведенном исследовании были использована совокупность текстов, полученных от 12 детей 6 лет с нормой развития и 12 детей с первичным недоразвитием речи. Тексты являются частью созданного нами корпуса детской речи в норме и при патологии. Тексты включали такие жанры детского дискурса, как вымышленный нарратив, созданный ребенком по серии картинок, диалог-рассуждение ребенка с взрослым и вопросно-ответный диалог ребенка с взрослым. Анализ 12726 словоупотреблений позволили выявить некоторые особенности ГЧП, отличающие детей с нормой развития от детей с первичным недоразвитием речи. Кроме того достоверные различия были получены в текстах, различающихся по жанру.
1 Введение
При изучении детской речи в развитии используются разнообразные методы: наблюдение, качественное описание отдельных текстов или даже отдельных слов [МеТеаг, 1985],
анализ дневниковых записей [Гвоздев, 1949; Zarçbina, 1965; Smith, 1973; Rüke-Dravina, 1993], лонгитюдные наблюдения бытовых разговоров с аудио- и видеорегистрацией [Bloom, 1970; Brown, 1973; Voeikova, Dressler (eds.) 2002; Stephany, Voeik ova (eds.) 2009; Воейкова 2004; 2011; Гагарина 2008; Елисеева 2008; 2014; Цейтлин (ред.) 2000; 2009; 2013; Казаковская, 2006; Balciüniene, 2009], экспериментальный анализ вызванной разными приемами [Sekerina et al. (eds.), 2008; Blom, Unsworth (eds.), 2010] речи. Наряду с другими квантитативными методами анализа корпусных материалов используется и частотный анализ слов, частей речи, а в дистрибутивном анализе и грамматических паттернов [Rayson, Garside, 2000; Rayson, 2002; Rayson et al. 2004; Baron et al., 2012]. «Понятие грамматического «поведения» языковых единиц в применении к корпусу видится как распределение разного рода элементов в контексте. Это грамматический профиль (распределение форм словоизменения)...» [Ля-шевская, 2014: 7]. Автор данного термина, который мы заимствовали, использует его применительно к поведению отдельных лексем в корпусе русского языка у взрослых его носителей. Мы же намереваемся использовать данный подход для характеристики возрастных срезов корпуса детской речи. Существует много свидетельств, что в процессе развития языка и речи ребенок начинает использовать синтаксически более сложные конструкции, включающие все более широкий круг знаменательных и служебных слов. Например, на самом раннем этапе развития -в первом полугодии 2-го года в речи представлены только существительные, а глаголов нет совсем. Позже в лексикон ребенка включаются все в большем количестве глаголы,
прилагательные, наречия и др. [Гвоздев, 2007; Цейтлин, 2009]. Таким образом, в целом ча-стеречный состав или грамматический профиль дискурса ребенка с возрастом меняется не только в количественном, но и в пропорциональном отношении. Следовательно, анализ грамматического частотного профиля корпуса детских высказываний представляет собой дополнительный источник информации о развитии речевого поведения ребенка и структуре его языковой системы, как в норме, так и при патологии. Существуют отдельные наблюдения, свидетельствующие, например, что у детей с моторной алалией до 4 лет отчетливо проявляется дефицит глаголов и других частей речи, кроме существительных и ономатопей [Ковшиков 1985]. Известны аналогичные данные у взрослых больных эфферентной моторной афазией (т.н. «телеграфный стиль») [Лурия 1947]. Систематического изучения этого вопроса у детей с первичным недоразвитием речи не предпринималось. В настоящем исследовании был предпринят частотный анализ корпусных данных - текстов, полученных у детей 6 лет в экспериментальных ситуациях диалога-рассуждения и составления нарратива (рассказа и пересказа по серии картинок). Было выдвинуто предположение, что у детей частотное распределение частей речи зависит не только от закономерностей языка, как относительно статической системы (в диахронии), но и от ряда внутренних и внешних факторов. К числу внешних факторов, например, относятся жанр дискурса, условия получения речевого материала (коммуникативный, социальный и эмоциональный контекст) [Sachs, Devin, 1976]. Внутренние факторы, оказывающие влияние на темпы и сроки появления частей речи [Гвоздев 2007], а главное - на количественное соотношение частей речи в больших массивах текста в разные возрастные периоды, изучены весьма слабо. Практически нет данных о пропорциональных отношениях частей у детей в возрастной период после 4 лет. Целью настоящего исследования было сопоставить грамматический частотный профиль (далее -ГЧП) речевой продукции детей с нормой речевого развития и у тех, у кого выявлено первичное недоразвитие речи (далее - ПНР) [Корнев, 2006]. Иными словами предметом анализа было частота встречаемости всех основных частей речи в общей совокупности словоупотреблений.
2 Методология
В качестве речевого материала были тексты, произведенные в разных жанрах дискурса: а) вымышленного (fictional) нарратива, б) вопросно-ответного диалога по теме того же нарратива; в) диалога взрослый-ребенок. Перечисленные тексты составляют содержание Корпуса устной речи детей с нормой и отставанием в развитии речи1, подробно описанного нами ранее [Корнев и др., 2015а; 2015б], отражающего, как актуальный уровень языковых возможностей русскоговорящих детей в разных естественных коммуникативных ситуациях, так и способность решать коммуникативно-речевые задачи в экспериментальной ситуации.
Речевой материал вымышленного наррати-ва включает составление рассказа по серии картинок и пересказ истории, предъявленной вслух с опорой на другую серию картинок. Соответственно методике RAIN (Russian Instrument for Narrative Assessment2) [Kornev, Balciuniené, 2014], в части первой перед ребенком раскладываются 6 картинок, на которых изображена история, и предлагается рассказать о том, что с ними произошло. Во второй части экспериментатор раскладывает перед ребенком другую серию из 6 картинок, предупреждает, что устный рассказ нужно будет пересказать, рассказывает (зачитывает) историю вслух и затем предлагает пересказать. После рассказа/пересказа экспериментатор задает 10 стандартных вопросов, уточняющих понимание ребенком причинно-следственные отношения в сюжете рассказа и внутренние состояния персонажей истории.
Диалог взрослый-ребенок - это дискуссия ребенка с взрослым по поводу сюжетной картинки-нелепицы (содержащей логические несообразности), требующая формулировки логических умозаключений.
В качестве испытуемых основной группы были исследованы 12 детей 6 лет с ПНР, посещающие специализированный детский сад для детей с нарушениями речевого развития. Критериями включения в группу были: существенное отставание в развитии всех основ-
1 Создание и анализ Корпуса поддержаны грантами ФФЛИ№С-25-2013/2014 и РГНФ №14-04-00509.
2 Создание методики поддержано грантом РФФИ №1306-90901. Методика RAIN создана на основе мулти-лингвальной методики анализа нарратива у детей-билингвов MAIN (Multilingual Asessment Instrument for Narratives) [Gagarina et al., 2012].
ных уровней языка (фонологии, морфологии, синтаксиса) при отсутствии снижения интеллекта. К моменту начала эксперимента все дети прошли двухлетний курс коррекционной работы с логопедом и проявления ПНР были уже частично компенсированы. У всех детей было проведено исследование интеллекта по методике Равена. Дети с показателями ниже 23 в группу не включались. Контрольную группу составили 12 детей посещающих общеобразовательный детский сад, не имеющих отклонений в развитии. У всех детей контрольной группы тоже было проведено исследование интеллекта по методике Равена. Дети с показателями ниже 23 в группу не включались.
Весь речевой материал был транскрибирован в формате CHAT [MacWhinney, 2000], морфологически аннотирован с помощью программы MORCOMM [Gagarina et al., 2003] и закодирован для дискурс-анализа.
3 Результаты
Для каждой из частей речи были получены показатели частотности в общем массиве данных у детей с нормой развития (НР) и у детей с ПНР. Частота словоупореблений, относящихся к разным грамматическим категориям существенно различается, что соответствует данным литературы, как по данным взрослых, так и у детей.
В целом распределение частот грамматических категорий, как и ожидалось, в обеих группах было идентичным. Однако по сравнительный анализ некоторых категорий показал наличие достоверных различий между группами (см. Рис. 1).
В частности у детей с ПНР среди всех словоупотреблений достоверно реже, чем у здоровых сверстников встречались такие грамматические категории, категории, как причастия и местоимения (соответственно p = 0,00086 и p = 0,0023; P < 0,05; и p = 0,10 и p = 0,12; P < 0,000).
В то же время по некоторым грамматическим категориям дети с ПНР опережали нормально развитых сверстников: в числе прилагательных и связок (р = 0,026655202 и р = 0,021987977; Р < 0,05; p = 0,075523073 и p = 0,062505147; Р < 0,000).
Поскольку нами исследовались тексты, принадлежащие к разным жанрам дискурса, было предпринято пилотное сопоставительное исследование грамматического частотного про-
филя в текстах-нарративах (3210 словоупотреблений) и в текстах-диалогах (9516 словоупотреблений).
Полученные результаты показали, что жанр дискурса весьма значительно влияет на ГЧП, причем у детей с нормой развития это выражено значительно в большем числе грамматических категорий, чем у детей с ПНР.
0,25 0,2 0,15 0,1 0,05 -
£
Л
3 22 8
с — —1*
О X ~
4 -
га F
га
о. с
с; с;
g I
U о
I I
В £
с о о 2
я а 2 £ о г
s s
s о
о й
н |
о з
CL i
С =
с;
I норма
□ пнр
ч о
Рис. 1. Грамматический частотный профиль в совокупности всех текстов Корпуса у детей с ПНР и с нормой развития
Примечания. **достоверность различий при Р < 0,01; *достоверность различий при Р < 0,05.
Статистический анализ показал, что нарра-тив и диалог избирательно и разнонаправленно влияют на актуализацию и частотность словоупотреблений в разных частях речи. Относительно письменных текстов такие данные существуют [Иау80п 2002]. Устные тексты с этой точки зрения почти не изучены. Данных о детской речи по частотности грамматических категорий в разных жанрах дискурса нет. Полученные в настоящем исследовании данные показали, что направленность изменений частотного распределения грамматических категорий идентична как у детей с нормой развития, так и у детей с ПНР. Так в группе нормы в 10 грамматических категориях число словоупотреблений достоверно различало тексты-нарративы и тексты-диалоги (см. Рис. 2).
У пяти грамматических категорий (существительных, глаголов, причастий, числи-
*
тельных и союзов) частота была достоверно выше в нарративах, а у пяти остальных грамматических категорий (наречий, междометий, модальных частиц, местоимений и частиц) - в диалогах.
В группе детей с ПНР распределение словоупотреблений по грамматическим категориям различало нарративы и диалоги только в 6 категориях (см. Рис. 3). У трех грамматических категорий (существительных, глаголов и числительных) частота была достоверно выше в нарративах, а у трех остальных (наречий, модальных частиц и частиц) - в диалогах.
Рис. 2. Грамматический частотный профиль у детей с нормой развития в нарративах и диалогах
Примечания. ***достоверность различий при P < 0,001; **достоверность различий при P < 0,01.
4 Обсуждение
Достаточно давно ведутся дискуссии по поводу взаимозависимости vs. автономности развития разных языковых средств, разделившие сторонников нативистского [Pinker, Ullman, 2002] и конструкционистского подхода [Bates, Goodman, 1999]. Первые настаивали на автономности этих модулей, вторые -на их взаимозависимости. Идея модулярности в ее мягком варианте [Bates et al., 1995] в известной степени согласуется с принципом гетерохронности психического развития. Давно замечено, что нередко интегральные показатели, относящиеся к разным уровням
языка, у некоторых детей не согласуются друг с другом по степени функциональной зрелости [Bates et al., 1995]. Это и дало основание выделять в том, что называют языковой способностью, относительно автономные модули, графики и механизмы, формирования которых не совпадают.
Рис. 3. Грамматический частотный профиль у детей с ПНР в нарративах и диалогах
Примечания. ***достоверность различий при P <
0,001; **достоверность различий при P < 0,01; *достоверность различий при P < 0,05.
Иногда это существенно затрудняет суммарную оценку языковой компетенции. Приходится учитывать не только так называемый «возраст развития» лексикона, морфологических средств грамматического оформления или фонологических средств, но и соотношение между ними, т.е. так называемый «лингвистический профиль». В литературе достаточно много свидетельств временной асин-хронии в сформированности разных языковых средств у отдельных детей [Bates, Goodman, 1999]. Применительно к детям раннего возраста описаны типологические варианты таких асинхроний (например, экспрессивный vs. референциальный типы), которые, тем не менее, не сохраняются после 3 лет [Nelson, 1981].
Однако исследований, проясняющих этот вопрос, еще недостаточно. Весьма редко встречаются попытки соотнести показатели
зрелости языка, относящиеся к разным его уровням: фонологии и морфологии, лексики и синтаксиса и т.п. Большинство работ такого типа выполнены на детях с отклонениями в речевом развитии [Моу1е й а1., 2007]. Например, в исследовании Моу1е с соавторами (2007) показано, что у детей с задержкой речевого развития в 4 и 5 лет связь синтаксиса и лексики значительно слабее, чем у детей с нормой развития.
Предлагаемый метод позволяет оценить лексическое разнообразие детских текстов по частотности грамматических характеристик, т.е. по грамматическому частотному профилю. Этот показатель вносит новое измерение в описание детской речи. Даже относительно поверхностный анализ ГЧП, предпринятый нами, раскрывает немало новых возможностей для анализа формирующейся детской языковой системы и речевого поведения детей. Есть основания предполагать, что функциональная система языка и речи [Корнев, 2006] имеет более и менее жесткие звенья. Менее жесткие звенья динамически более чутко реагируют на семантические, прагматические и жанровые аспекты коммуникативного поведения. Используя динамический подход к изучению детского дискурса, мы выявили, что, например, некоторые параметры макро- и микроструктуры нарративного дискурса меняются в зависимости от когнитивной сложности истории, способа создания текста (рассказ vs. пересказ) и даже порядка предъявления нарративных заданий (1 га. 2 сессия) [Когпеу, Ва1сшшепе, 2015]. Результаты, полученные в данном исследовании, свидетельствуют, что частеречный состав порождаемого текста является более устойчивой характеристикой по отношению к перечисленным влияниям, но зато существенно зависит от жанровых особенностей дискурса. Возможно, не только когнитивная семантика дискурса (например, сюжет, ситуативные компоненты), но и прагматика дискурса существенно влияют на вероятность привлечения лексики тех или иных частей речи. Особый интерес представляет возрастной аспект этой проблемы, которому будут посвящены наши дальнейшие исследования. Таким образом, предлагаемая нами методика анализа ГЧП имеет огромный эвристический потенциал для изучения формирования языковой системы у детей. Кроме того, она дает возможность изучать процесс взаимодействия языковой системы, подсистемы программи-
рования, контроля и ресурсного обеспечения
ФСЯР.
Список литературы
Воейкова М. Д. Ранние этапы усвоения детьми именной морфологии русского языка. М.: Знак, 2011.
Воейкова. М. Д. Квалитативные семантические комплексы и их выражение в современном русском литературном языке и в детской речи. Дисс. д. филол. наук. СПб.: РГПУ, 2004.
Гагарина Н. В. Становление грамматических категорий глагола в детской речи. СПб.: Наука, 2008.
Гвоздев А. Н. Вопросы изучения детской речи. СПб.: «Детство-Пресс», 2007.
Гвоздев А. Н. Формирование у ребенка грамматического строя русского языка. Москва: Акад. педаг. наук РСФСР, 1949.
Елисеева М. Б. Становление индивидуальной языковой системы ребенка. М.: Языки славянской культуры, 2014.
Елисеева М. Б. Фонетическое и лексическое развитие ребенка раннего возраста. СПб.: РГПУ, 2008.
Казаковская В. В. Вопросо-ответные единства в диалоге «взрослый ребенок». СПб.: Наука, 2008.
Ковшиков В. А. Экспрессивная алалия. Л.: 1985.
Корнев А. Н. Основы логопатологии детского возраста: Клинические и психологические аспекты. Санкт-Петербург: Речь, 2006.
Корнев А. Н., Балчюниене И., Воейкова М. Д., Иванова К.И., Ягунова Е. В. Формирование языка у детей с нормой и отставанием в развитии речи: корпусное исследование спонтанных и вызванных текстов // Acta Lingüistica Petropol-itana T.9 (1). 2015а. C. 659-683.
Корнев А. Н., Балчюниене И., Воейкова М. Д., Иванова К.И., Ягунова Е. В. Квантитативный подход к изучению формирования языка у детей с нормой и отставанием в развитии речи: корпусное исследование спонтанных и вызванных текстов // Новые информационные технологии в автоматизированных системах - 2015. Москва. 2015б. C. 636-646.
Лурия, А. Р. 1947. Травматическая афазия. Клиника, семиотика и восстановительная терапия. М.: Издательство академии медицинских наук.
Ляшевская О. Н. Корпусные инструменты в грамматических исследованиях русского языка. Москва: Институт русского языка им. В. В. Виноградова РАН, 2014.
Цейтлин С. Н. (ред.). Речь ребенка: ранние этапы. Труды Постоянно действующего семинара по онтолингвистике. Выпуск первый. СПб.: Изд-во РГПУ, 2000.
Цейтлин С. Н. Лингвистические этюды. СПб.: Изд-во РГПУ, 2013.
Цейтлин С. Н. Очерки по словообразованию и формообразованию в детской речи. М.: Знак, 2009.
BalCiuniene, Ingrida. 2009. Analysis of Conversational Structure from the Perspective of Language Acquisition. Kaunas: VDU.
Baron, Alistair, Rayson, Paul, Greenwood, Phil, Walkerdine, James, Rashid, Awais. 2012. Children online: A survey of child language and CMC corpora. International Journal of Corpus Linguistics, 17 (4), 443-481.
Bates, Elizabeth, Dale, Philip S., Thal, Donna. 1995. Individual differences and their implications for theories of language development. In P. Fletcher, B. MacWhinney (eds.). Handbook of child language. Oxford: Basil Blackwell, 96-151.
Bates, Elizabeth, Goodman, Judith C. 1999. On the emergence of grammar from the lexicon. In B. MacWhinney (ed.). The Emergence of Language. Lawrence Erlbaum, P. 29-79.
Blom, Elma, Unsworth, Sharon (Eds.). 2010. Experimental Methods in Language Acquisition Research. Amsterdam, John Benjamins Publishing Company.
Bloom, Lois. 1970. Language Development: Form and Function in Emerging Grammars. Cambridge, MA: MIT Press.
Brown, Roger. 1973. A First Language: The Early Stages. Cambridge, Mass., Harvard University Press.
Gagarina, Natalia, Klop, Daleen, Kunnari, Sari, Tantele, Koula, Valimaa, Taina, Balciuniene, Ingrida, Bohnacker, Ute, Walters, Joel. 2012. MAIN: Multilingual Assessment Instrument for Narratives. ZASPil Nr. 56 - December 2012. Berlin: ZAS. 136 p.
Gagarina, Natalia, Voeikova, Maria, Gruzincev, Sergej. 2003. New version of morphological coding for speech production of Russian children (in the framework of CHILDES). FDSL, IV, 243-258.
Kornev, Aleksandr N., Balciuniene, Ingrida. 2014. Narrative analysis as the SLI assessment tool: Evidences from Russian-speaking preschoolers. 4th In-ternaitonal Congress on Early Prevention in Children with Verbal Communication Disorders. Proceedings. Varna, Konstantin Preslavsky University of Shumen, 49-58.
Kornev, Aleksandr N., Balciuniene, Ingrida. 2015. Narrative production weakness in Russian dyslexics: Linguistic or procedural limitations? Estonian Papers in Applied Linguistics, 11, 141157. DOI: http://dx.doi.org/10.5128/ERYa11.09.
MacWhinney, Brian. 2000. The CHILDES Project: Tools for Analyzing Talk. Vol. I: Transcription,
Format and Programs. Mahwah, NJ, Lawrence Erlbaum Associates.
McTear Michael. 1985. Children's Conversation. Oxford, Basil Blackwell.
Moyle, Maura J., Weismer, Susan E., Evans, Julia L., Lindstrom, Mary J. 2007. Longitudinal relationships between lexical and grammatical development in typical and late-talking children. Journal of Speech, Language, and Hearing Research, 50, 508-528.
Nelson, Katherine. 1981. Individual differences in language development: Implications for development and language. Developmental Psychology, 17, 2, 170-187.
Pinker, Steven, Ullman, Michael T. 2002. The past and future of the past tense. Trends in Cognitive Science, 6, 456-463.
Rayson, Paul, Berridge, Damon, Francis, Brian J. 2004. Extending the Cochran rule for the comparison of word frequencies between corpora. Paper presented at the 7es Journées internationales d'Analyse statistique des Données Textuelles.
Rayson, Paul, Garside, R. 2000. Comparing corpora using frequency profiling. Paper presented at the Workshop on Comparing Corpora, held in conjunction with the 38th annual meeting of the Association for Computational Linguistics (ACL 2000).
Rayson, Paul. 2002. Matrix: A statistical method and software tool for linguistic analysis through corpus comparison. PhD thesis. Lancaster: Lancaster University.
Rüke-Dravina, Velta. 1993. Latviesu meitene apgust savupirmo valodu. Riga: Dio Nordic.
Sachs, Jacqueline, Devin, Judith. 1976. Young children's use of age-appropriate speech styles in social interaction and role playing. Journal of Child Language, 3, 81-98.
Sekerina, Irina A., Fernández, Eva M., Clahsen, Harald (Eds.). 2008. Developmental Psycholinguistics: On-line methods in children's language processing. Amsterdam, John Benjamins Publishing Company.
Smith, Neil V. 1973. The Acquisition of Phonology: A Case Study. Cambridge, Cambridge University Press.
Stephany, Ursula, Voeikova, Maria (eds.). 2009. Development of Nominal Inflection in First Language Acquisition: A Cross-linguistic Perspective. Berlin-NY, Mouton de Gruyter.
Voeikova, Maria, Dressler, Wolfgang U. (eds.). 2002. Pre-and Protomorphology: Early Phases of Morphological Development in Nouns and Verbs. Munchen, Lincom.
Zarçbina, Maria. 1965. Ksztaltowanie siq systemu jçzykowego dziecka. Kraków, Wydawnictwo Pol-skiej Akademii Nauk.