Научная статья на тему 'Роль физических параметров в формировании внутренней структуры электронного текста'

Роль физических параметров в формировании внутренней структуры электронного текста Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
79
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕКСТ / КОНТИНУАЛЬНОСТЬ / ДИСКРЕТНОСТЬ / ПРЕДЛОЖЕНИЕ / СЛОВОФОРМА / СИММЕТРИЯ / АСИММЕТРИЯ / СЕМАНТИКА / TEXT / CONTINUITY / DISCONTINUITY / SENTENCE / WORD / SYMMETRY / ASYMMETRY / SEMANTICS

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Андрусенко Татьяна Владиславовна

В статье устанавливаются физические параметры текста блога и изучается их изменение в зависимость от симметричных и асимметричных тенденций в системе текста. В работе описываются результаты эксперимента, который позволил установить зависимость между физическими характеристиками текста (континуальностью и дискретностью) и внутренней структурой текста.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Role of Physical Characteristics in the Organization of the Electronic Text Inner Structure

The article defines the physical characteristics of blogs. The changes of the physical characteristics are connected with the symmetry or asymmetry in the text system. The results of the experiment allowed stating the relation between the physical characteristics and the inner structure of the text.

Текст научной работы на тему «Роль физических параметров в формировании внутренней структуры электронного текста»

УДК 801.54: 004 ББК 81.2+32.81

Андрусенко Татьяна Владиславовна

соискатель кафедра романской филологии и методики преподавания французского языка Оренбургский государственный университет г.Оренбург Andrusenko Tatyana Vladislavovna Applicant for a Degree

Chair of Romance Philology and Methods of Teaching the French Language

Orenburg State University Orenburg

Роль физических параметров в формировании внутренней структуры электронного текста Role of Physical Characteristics in the Organization of the Electronic

Text Inner Structure

В статье устанавливаются физические параметры текста блога и изучается их изменение в зависимость от симметричных и асимметричных тенденций в системе текста. В работе описываются результаты эксперимента, который позволил установить зависимость между физическими характеристиками текста (континуальностью и дискретностью) и внутренней структурой текста.

The article defines the physical characteristics of blogs. The changes of the physical characteristics are connected with the symmetry or asymmetry in the text system. The results of the experiment allowed stating the relation between the physical characteristics and the inner structure of the text.

Ключевые слова: текст, континуальность, дискретность, предложение, словоформа, симметрия, асимметрия, семантика.

Key words: text, continuity, discontinuity, sentence, word, symmetry, asymmetry, semantics.

Двадцать первый век отличается не только колоссальным увеличением объема информации, который нахлынул на современного человека, но и появлением совершенно новых форм этой информации. Виртуальное общение все больше заменяет реальное общение, в котором немаловажное место занимают форумы, блоги, электронные письма. Наша статья посвящена тексту блога. Блоги занимают промежуточное место между письменной и устной речью, они обладают такой чертой свойственной устной речи как просторечная, фамильярная лексика, нарушение грамматических и орфографических норм, простота синтаксиса, но по своей форме остаются разновидностью письменной речи.

Целью статьи стало изучение распределения физических характеристик в пространственном становлении текста блога и установление сущностных характеристик данного типа текстов, а также исследование взаимодействия внутренней структуры текста и его физических параметров. Размер предложения -один из значимых первичных текстовых параметров, в котором специфически преломляется много факторов: семантическая и синтаксическая сложность, установка на простоту / затрудненность восприятия, уровень владения языком и пр. [1. с.101-102].

Единицами анализа были выбраны словоформа и предложение как маркеры таких фундаментальных закономерностей развития текста как континуальность и дискретность, которые в тексте постоянно чередуются. Под словоформой понимается форма отдельного слова в синтетических языках, или часть слова разделенного пробелом, если речь идет об аналитических языках, к каким относится и французский язык.

Теоретической базой исследования послужил позиционный анализ [3. с. 19]. Позиционная структура находит свое отражение в метроритмической матрице - стабильно воспроизводимая схеме расположения текста (см. рисунок 1).

Зачин

АСП!

зачин

пред-ГЦ

АСП2 пост-ГЦ конец

46 0,236 пред-ГЦн пост-ГЦн

-0,236

0,618

+0,236

Абс. Н. ГЦн ГЦ Абс. К

Рис.1 Метроритмическая матрица

Для исследования физических характеристик французского текста блога использовался следующий алгоритм действий:

1. Методом сплошной выборки отобрано 200 текстов блогов.

0

1

2. В каждом тексте определены следующие характеристики: количество предложений в отдельно взятом тексте и длина предложения, выраженная числом словоформ.

3. Для установления локализации каждого предложения определена доля каждого предложения в тексте, для чего последовательно

размер каждого предложения разделили на размер всего текста. Изучены колебания размера предложений относительно позиций, которые нашли отражение в графике.

4. На следующем этапе определены средние, максимальные и минимальные параметры французских публицистических текстов.

5. Результаты исследования позиционной динамики изменения размера предложения на внутритекстовом отрезке пространства-времени приведены на рисунке.

В ходе исследования отобраны методом сплошной выборки 200 французских текстов блогов:

http://www.blogsfrancais.com/

http://inclassable.typepad.com/un_blog_parjour/cinéma/

http://cinematique.blogspirit.com/

http://filmsquebec.over-blog.com/

http://www.madamedame.blogspot.com/

http://inclassable.typepad.com/un blog par jour/europe/

http://auto.blogactiv.eu/

http://inclassable.typepad.com/un blog par jour/politique/

http://mrdupontgoestowashington.wordpress.com/

http://ruedebretagne.blogspot.com/

http://florianchiron.eu/

http://crise-europe.blog.lemonde.fr/

http://bataillesocialiste.wordpress.com/

http://peripolis.blogspot.com/

Анализ вышеназванного корпуса текстов позволил установить следующие физические характеристики данного типа текстов: средний объем текста блога составил 6 предложений , 116, 565 словоформы. Средняя длина предложения этой категории текста равняется 19,42 словоформы.

Минимальный объем текста блога равняется 16 словоформам.

Le racisme / n'est pas une opinion c'est un délit, et la pédophilie ,c'est quoi ?

un crime !

Максимальный объем текста блога достиг 511 словоформ. Максимальная континуальность в тексте блога составила 100 словоформ.

Il y a du bon sens mais je veux dire à tous ceux qui ont écrit un commentaire et en étant ancienne secrétaire, qu'il n'y en a pas un qui sait écrire le français, on y voit des fautes énormes qu'un enfant de cours moyen ne ferait pas, j'ai toujours eu l'habitude de corriger les fautes d'orthographe des polytechniciens et des ingénieursje connais l'espéranto mais je sais écrire dans ma langue, mais vous vous ne connaissez pas plus l'espéranto que vous ne connaissez le français, je m'adresse à jérémy Bizet, juanin également, cela la fiche bien, défendre une langue internationale quand on est incapable d'écrire dans la sienne.

количество словоформ

30

25

20

15

10

0,2796

0,4904 0,6586

0,791 0,905

локализация в тексте

♦ количество словоформ

Рис.2 Континуальность-дискретность художественного текста

5

0

1

Становление текста блога начинается с максимальной континуальности, в Зачине длина предложения составила 24,63 словоформы, в зоне Конца континуальность сокращается в 2,45 раз и равняется 10,055 словоформам (см. рис. 1). Максимальная длина предложения в начале текста свидетельствует о развертывании структуры текста, что акцентирует внимание читателей, стимулируя их к прочтению блога. Изучение динамики колебаний размера предложений позволяет выделить особенности глубинной структуры текста. Размер предложения текста манифестирует динамику развития сюжета [2. с. 89].

На участке, совпадающем с зоной ПредГЦ, динамика пространственно-временного развития изменяется, На данном участке разница в длине соседних предложений сократилась до 4 словоформ. Данный факт объясняется при помощи позиционного анализа: в области ПредГЦ асимметричная тенденция сменяется стремлением к симметрии (см. рис.2). В системе текста намечается стабилизация: разница в длине предложений сокращается с 6 словоформ в зоне ПостГЦн до 4 словоформ в ПредГЦ.

На следующем участке (ПостГЦ) констатировалось аналогичное явление -структурная гармонизация. После точки гармонического центра разница в дли-

не предложений продолжает сокращаться и не превышает 3 словоформ, количество новой информации в тексте постепенно сокращается по мере того как структура текста выравнивается.

Особенно отчетливо влияние симметрии отмечалось после прохождения точки АСП2, удаленной на 0,854 долю от начала текста, здесь разница в физических параметрах составляет 1 словоформу. В зоне Конца никаких структурных изменений уже не происходит, что подтверждает анализ физических характеристик. Спокойный ритм формирования структуры текста в ПостГЦ и зоне Конца демонстрирует, что в тексте увеличивается число структурных повторов и соответственно уменьшается количество новой информации.

Под влиянием ГЦ в областях ПостГЦ и Конца симметрия превалирует и, как следствие наблюдается синхронизация структуры текста: физические параметры выравниваются, длина предложения сокращается на 1 словоформу с 11,665 словоформ до 10,055 словоформ.

При помощи анализа физических параметров текста блога, были установлены основные участки, определяющие формирование системно-динамической организации текста. Этими основными участками выступили зоны Зачина и ПредГЦн с максимальной континуальностью и резкими изменениями длины предложения, которые манифестируют асимметричные тенденции в системе. Противоположную роль играют области ПостГЦ и Конца с отчетливо выраженными симметричными характеристиками, выравниванием физических параметров и преобладанием дискретизацией.

Зачин Si vous voulez vivre en direct ,éprouver par vous même le "Babel" de l'union européenne allez sur le cite du commissaire européen Léonard Orban,il a mis à disposition des européens un / ПредГЦн forum dans lequel chaque citoyen peut s'exprimer sur le multilinguisme.Quand je parcours les textesje ne lits / ГЦн que / ПостГЦн ceux qui sont écrits dans ma langue,un peu d'anglais et le reste je ne peut les comprendre(nous n'avons pas d'interprète pour ce qui me semble être du polonais d'après les caractères).Je ne perçois / ПредГЦ les messages de ce forum qu' au travers de la fenêtre étroite de ma langue et de l'anglais obligatoire.Toutes les autres opinions

sont hors de ma vue.Nous sommes ballonnés par la multitude des langues de l'Union.Et si nous adoptions tous l'anglais.Nous ne verrions le monde / ГЦ qu'au / ПостГЦ travers des livresjournaux,chansons, films en langue anglaise.La preuve si vous allez sur ce forum,vous vous précipiterez sur ce que vous pourrez comprendre,tous les autres messages n'existeront même pas,j'ai fait un effort en me servant de traducteurs sur la toile,ma bonne volonté n'a pas résister à l'ampleur de/ Конец la tâche.Tout cela pour en arriver à la conclusion qu'il nous faut "La Langue Équitable" pour tous les européens,j'insiste sur TOUS .Le problème persiste,nous sommes déjà en 2008.Veillez consulter ce lien:http://www.taurillon.org/Du-bon-usage-du-multilinguisme

Установив основные в формирование системно-динамической организации участки текста, провели эксперимент, чтобы показать, как формируется семантика текста на данных участках. Алгоритм эксперимента подробно описан в §2.2.1. Информантами выступили студенты факультета филологии ОГУ, которым были предложены 50 публицистических текстов.

Перед испытуемыми стояли следующие задачи:

1. Найти в текстах фразу, соответствующую основной идее текста. В нашем исследовании мы пользуемся рабочим термином семантический центр. Семантический центр - это фраза, в которой наиболее точно сформулирована основная идея текста.

2. Отметить в текстах ключевые слова, которые в дальнейшем будут именоваться тематическим компонентом.

В результате эксперимента установлено, что наиболее значительными с точки зрения семантики в развитии текста выступают зоны, расположенные в начале текста: Зачина, ПредГЦн, ПостГЦн. В области Зачина в 46% случаев дислоцировалось семантическое ядро. Если сопоставить данный факт с анализом физических характеристик, то можно сделать вывод о том, что ключевая информация располагается на отрезке, где превалирует континуальность над дискретностью. В следующей интервале ПредГЦн испытуемые в 52 % случаев отметили семантическое ядро. Незначительное сокращение маркированности

семантического ядра с 5 2 % до 46 % случаев наблюдалось на участке ПостГЦн, здесь возрастает роль асимметричных процессов (см. таблицу 1).

Таблица 1

Локализация семантического центра в тексте блога

Позиции Зачин Пред ГЦн ГЦн Пост ГЦн Пред ГЦ ГЦ Пост ГЦ Конец

Кол-во случаев 23 26 16 23 15 7 11 7

Начиная с участка ПредГЦ, в системе текста блога стремительно сокращаются показатели семантического ядра с 46 % до 30 %. Данный отрезок 15из 50 испытуемых выделили в качестве семантического ядра, на данном участке дискретность преобладает над континуальностью: длина предложения сократилась еще на 4 словоформы с 18,575 словоформ до 14,85 словоформ и составила 14 словоформ. Область ПредГЦ характеризуется спокойным развитием, демонстрируя стремление в системе к симметрии, колебания в физических параметрах соседних предложений сократились с 6 словоформ в ПостГЦн до 4 словоформ в ПредГЦ.

Следующий участок, ПостГЦ в 22 % случаев испытуемые выделили в качестве семантического ядра. Область ПостГЦ характеризуется постепенным сокращением длины предложения, т.е. нарастающей дискретностью. Здесь все большую роль приобретает симметрия. Длина предложения на данном отрезке сократилась всего лишь на 1 словоформу, пространственно-временное развитие отличается спокойным ритмом, это обстоятельство находит свое отражение и в содержании текста, количество новой информации уменьшается.

Аналогичная тенденция была свойственна тексту в зоне Конца. Данный отрезок лишь 7 испытуемых выделили как семантическое ядро, что составило 14 % от общего количества текстов блогов.

Таблица 2

Дистрибуция тематического компонента в тексте блога

Позициии Зачин Пред ГЦн ГЦн Пост ГЦн Пред ГЦ ГЦ Пост ГЦ Конец

Кол-во случаев 37 24 3 20 25 1 12 7

Тематический компонент преимущественно отмечают на отрезке, совпадающем с областью Зачина в 37 из 50 анализируемых текстов блогов, что составило 74 %, т.е. совпадает с зонами, отмеченными как семантическое ядро. Исследование показывает, что область Зачина стала наиболее благоприятной для становления тематического компонента. В тексте как синергетической системе идет становление основных тем, которые будут развиваться по мере развития сюжета (см. таблицу 2). Если показатели семантического ядра сокращаются вдвое в ПредГЦ по сравнению с областью ПостГЦн. Тематический компонент продолжает развиваться на участке ПредГЦ, в 50 % случаев испытуемые здесь отметили тематический компонент. Таким образом, тематический компонент в большинстве случаев дислоцируется в начале текста либо в зоне, которая предшествует ГЦ текста.

ГЦ текста играет исключительно важную роль в становлении его физической и содержательной сторон. Он приводит систему в состояние равновесия, после прохождения точки ГЦ в тексте физические параметры на практически не изменяются: длина предложения сократилась на 1 словоформу, в системе продолжает увеличиваться дискретность. На участке ПостГЦн 12 из 50 информантов выделили тематический компонент, а на участке Конца только 4 информанта, это демонстрирует, что количество новой информации в тексте значительно сократилось.

Статистический анализ физических параметров участка текста, совпадающего с семантическим ядром, позволил сделать вывод о том, что он обладает максимальной длиной предложения в тексте в 60 % случаев, в 74 % случаев превысил средние показатели. Объясняется этот факт тем, что ключевая идея требует от автора блога более сложного синтаксиса и соответственно этот отре-

зок текста отличается большей континуальностью. Максимальная континуальность замедляет ритм развития текста блога и тем самым маркирует семантическое ядро.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Итак, характерной чертой текстов блогов является его минимальный объем. Анализ физических параметров текста блога и данные полученные в ходе эксперимента наглядно продемонстрировали, что изменение длины предложения показывает поворотные моменты в формировании внутренней структуре текста, его содержания.

Зоны, характеризующиеся максимальной континуальностью: Зачин и ПредГЦ, как правило, выступают зонами дислокации наиболее значимой с семантической точки зрения информации. Отличительной чертой этого участка текста является стремление к симметрии, что проявляется в росте повторов. Обычно испытуемые выделяют в качестве тематического компонента наиболее частотные слова. Наиболее неинформативными в тексте блога выступили зоны ПостГЦ и Конца, зоны с максимальной дискретностью.

Библиографический список

1. Белоусов, К.И. Текст: пространство, время, темпоритм : монография [Текст]. - / К.И. Белоусов. - Новосибирск: Сибирские огни, 2005. - 248 с.

2. Моисеева, И.Ю. Текстообразование: Системно- динамический аспект [Текст]. - / И.Ю. Моисеева. Оренбург: Изд- во ОГПУ, 2007 . - 344 с.

3. Москальчук, Г.Г. Структура текста как синергетический процесс [Текст]. - / Г Г. Москальчук. - М.: Едиториал УРСС, 2003. - 296 с.

Bibliography

1. Belousov, K. I. Text: Space, Time, Rhythm : Monograph [Тех1;] / K.I. Belousov. - Novosibirsk: Sibirskie Ogni, 2005. - 248 p.

2. Moiseeva, I.Yu. Text Formation : System-and-Dynamic Aspect [Text] / I.Yu. Moiseeva. -Orenburg: Orenburg State Pedagogical University Publishing House, 2007. - 344 p.

3. Moskalchuk, G.G. Text Structure as a Synergical Process [Тех^ / G.G. Moskalchuk. - M.: Editorial URSS, 2003. - 296 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.