УДК 4:681.14 ББК 81.1:32.973.2-018
М.А. Коряковцев
опеределение степени формализобанности
текста резюме на сайтах трудоустройства
В данной статье предлагается описание метода определения степени формализованное™ текста резюме. Предложенный метод позволяет определить степень формализованности всех электронных резюме на сайте трудоустройства путем анализа содержимого форм заполнения резюме. Содержимое форм заполнения резюме расцениваются как заданные авторами сайта трудоустройства специфические структуры резюме. Формы заполнения резюме рассмотрены как последовательность элементов управления. Каждый из элементов управления ответственен за редактирование отдельной части текста резюме. Проведена классификация содержимого форм создания по способу ввода информации и типу вводимой информации. Введен типологический параметр степени формализованности электронных резюме. Согласно этому параметру определены следующие степени формализованности электронных резюме: отсутствие формализованности, частичная и полная формализованность. Определена степень формализованности резюме наиболее популярных сайтов трудоустройства. Резюме таких сайтов, как «HeadHunter», «Superjob.Ru» и «Работали» являются частично формализованными.
Ключевые слова: резюме, структура резюме, электронные бланки, сайты трудоустройств, фор-мализованность текста.
M. A. Koryakovtsev
the determination of the formality degree in the online resume text
A method for determining the degree of formality of the resume text is proposed. The proposed method allows determining the degree of formality for all electronic resume on employment site. This was done by analyzing the contents of the input form of the employment sites resume. The content of the input form is regarded as the site-specific structure of the resume defined by the authors of the employment site. The input form is considered as a sequence of controls. Each of the controls is responsible for the editing of separate parts of the resume text. The classifications of controls by the input method and the type of input data were created. The typological parameter of formality degree for the digital resume was introduced. Pursuant to typological parameter, the following formality degree of digital resume was defined: the lack of formality, the partial and complete formality. The formality degree was estimated for the most popular sites of employment. Resume of employment sites like «HeadHunter», «Superjob.Ru» and «Работа^ш> considered are partly formalized.
Key words: resume, resume structure, resume input forms, employment sites, text formality.
Электронное резюме представляет собой смешанный по форме текст. Он состоит как из обычных слов, словосочетаний и предложений, так из специальных графических символов. При этом содержание его структурировано и представлено некоторыми областями значений определённым образом именованных частей.
Данное исследование нацелено на рассмотрение содержательной структу-
ры текста резюме на сайтах трудоустройства и установление степени его форма-лизованности. Установление степени формализованности отдельных резюме является определяющим этапом в разработке обобщенной формальной модели текста резюме.
За понятием «резюме» стоит в первую очередь его смысловое содержание и организация. В толковых и специальных словарях ключевым словом в опре-
делении резюме является «сведения» [1, с. 725; 2, с. 1114]. В словарях лингвистических терминов ключевым является «жанр официально-делового стиля» [3, с. 302; 5. с. 369]. Однако и в толковых, и в терминологических словарях указано обязательное содержание резюме, включающее контактные данные, сведения об образовании и опыте работы.
Сайты трудоустройства представляют собой специализированные ресурсы Интернет, на которых пользователю предлагается как возможность создания собственного резюме, так и поиска резюме, опубликованных другими пользователями, по различным критериям. Сервис «Яндекс.Каталог» насчитывает более двухсот ресурсов Интернет, посвященных трудоустройству.
Попытки формализации текстов резюме на сайтах трудоустройства уже проводились. Например, в статье Т.В. Ка-чаевой и В.С. Южикова приводится описание самообучающейся системы автоматической обработки классификации резюме. Тем не менее по описанной методике с использованием ключевых слов корректное выделение логических блоков происходило не во всех случаях [4, с. 66-67]. Это связано с тем, что проектирование, обучение и эксплуатация системы происходила на текстах резюме, представленных адресату.
Ключевым отличием, в рамках данной статьи, между обычными (универсальными), резюме и резюме на сайтах трудоустройства являются изменения в модели делового дискурса, представленной в работе О.В. Тойкиной, «адресант ^ текст ^ канал передачи ^ особая форма резюме ^ адресат» [6, с. 8]. В случае с резюме, расположенными на сайтах трудоустройства, адресант имеет дело с несколькими текстами через заполнение электронных бланков, а канал передачи является строго определенным - сайт трудоустройства.
Электронные бланки - это особые вебстраницы на сайте трудоустройства. Их особенность заключается в том, что они
содержат так называемые HTML формы1. Эти формы содержат последовательность элементов управления. На сайте трудоустройства элементы управления HTML форм предназначены для отображения и изменения отдельных частей текста резюме. С электронными бланками пользователь сталкивается при заполнении собственного резюме. Другая особенность электронных бланков заключается в том, что они полностью отражают содержательную структура текста резюме.
Работа с электронными бланками освобождает нас от необходимости выяснения структуры по сформированным электронным резюме. Сложность, или даже невозможность, такого исследования заключается в колоссальном количестве сформированных резюме2 и их постоянном добавлении и изменении. Электронные же бланки всегда представлены на сайтах трудоустройства в небольшом и неизменном количестве.
Материалом для этого исследования послужили 20 HTML форм на 14 электронных бланках.
Источниками электронных бланков явились три наиболее популярные сайта трудоустройства: «Headhunter» (режим доступа http://hh.ru/), «Superjob» (режим доступа: http://www.superjob.ru/) и «Работали» (режим доступа http://www. rabota.ru/).
Для определения наиболее популярных сайтов трудоустройств был использован показатель тематического индекса цитирования, предоставляемый интернет-сервисом «Яндекс.Каталог».
Рассмотрим элементы управления электронных бланков с точки зрения того, как с ними взаимодействует пользователь. На основании анализа 165 элементов управления было выделено пять различных «сценариев работы», или же методов ввода, с ними:
1) пользователь нажимает на вебстранице на гиперссылку, и в браузере поверх веб-страницы появляется диалоговое окно с возможностью выбора одного или нескольких предоставляемых значе-
1 Подробно HTML формы описаны в спецификации W3C. Режим доступа: http://www.w3.org/TR/ html401/interact/forms.html
2 Например, сайт «hh.ru» содержит более 16 миллионов резюме и ежедневно пополняется новыми.
го са I-о >s
о ^
I-
о >.
о
г ^
IX
го I->s го о
го
X
ф ^
го
I-
о ф
I-
ь
о
X X
го ш о
с; го
п.
о -&
X
ф
с
ф
I-
о
X
ф
с; ф ч
ф ^
ф с О
ш
<и
ш
о ^
к с^ о
ний. Выбранные значения помещаются внутрь элемента управления, рядом с гиперссылкой. Такие элементы управления будем называть выборочными. Пример выборочного элемента управления представлен на рисунке 1.
Административный персонал х
• Начальный уровень, Мало опыта х
Изменить профобласти
Рис. 1. Пример выборочного элемента управления «Профобласти»
2) пользователь указывает некоторое количество значений для элемента управления путем установки рядом с возможными значениями специальной отметки - галочки. Такие элементы управления будем называть флажками. Пример флажков представлен на рисунке 2.
@ Полный день Сменный график Гибкий график Удаленная работа Вахтовый метод
Рис. 2. Пример флажков «Тип занятости»
3) пользователь выбирает одно из предложенных значений путем нажатия на него левой кнопкой мыши. Такие элементы управления будем называть переключателями. Пример переключателя представлен на рисунке 3.
@ Мужской Женский
Рис. 3. Пример переключателя «Пол»
4) пользователь выбирает одно из предложенных значений из списка, который открывается нажатием на символ « т». Такие элементы управления будем называть выпадающими списками. Пример выпадающего списка представлен на рисунке 4.
июля
1987
года (28 лет)
Рис. 4. Пример выпадающего списка «Дата рождения»
5) пользователь вводит некоторый текст с клавиатуры. Такие элементы управления будем называть областями ввода текста. Пример области ввода текста представлен на рисунке 5.
Рис. 5. Пример области ввода текста «Специальность»
На основании обозначенных «сценариях работы» введем такую характеристику элементов управления, как тип содержимого. Тип содержимого определяется по тому, какой информацией пользователь может заполнить тот или иной элемент управления.
Первым выделим фиксированный тип содержимого. Фиксированный тип содержимого говорит о том, что в элементе управления в качестве значений может содержаться конкретный, строго ограниченный набор слов или словосочетаний. Этот набор предоставляется сайтами трудоустройства и пользователь не может его изменить. Фиксированный тип содержимого имеют следующие типы элементов управления: выборочный элемент управления, флажки, переключатель и выпадающий список. Элементы управления, имеющие фиксированный тип содержимого, будем называть фиксированными.
Указательный тип содержимого ожидает от пользователя ввода информации
в виде слова или словосочетания (а также числовой информации). При этом возможный ввод ограничивается только темой, заданной в заголовке элемента управления. Этот заголовок располагается слева от элемента управления. Указательный тип содержимого имеют некоторые элементы управления, относящиеся к областям ввода текста. Элементы управления, имеющие указательный тип содержимого, будем называть указательными.
Свободный тип содержимого предполагает, что пользователь вводит информацию в виде законченной мысли - предложения или совокупности предложений. При этом вводимая информация ограничивается только темой, заданной в заголовке элемента управления. Свободный тип содержимого имеют некоторые элементы управления, относящиеся к областям ввода текста. Элементы управления, имеющие свободный тип содержимого, будем называть свободными.
В качестве типологического параметра степени формализованности будем использовать количественный параметр - количество элементов управления, имеющих свободный тип содержимого. Этот параметр высчитывается для конкретного сайта трудоустройства, на основании всех его электронных бланков. С помощью этого параметра можно сделать заключение о степени формали-зованности всех электронных резюме, присутствующих на конкретном сайте трудоустройства.
Для обозначенного типологического параметра введем следующие конкретные степени формализованности: отсутствие формализации, частичная формализация и полная формализация. Для каждой из этих степеней приведем соответствующее значение типологического параметра.
• Отсутствие формализации - во всех электронных бланках в рамках одного сайта трудоустройства все элементы управления имеют свободный тип содержимого.
• Частичная формализация - электронные бланки содержат поля со всеми
типами содержимого: свободным, фиксированным и указательным.
• Полная формализация - в электронных бланках содержаться только элементы управления с указательным или фиксированным содержимым.
Определим степень формализован-ности для резюме на указанных ранее сайтах трудоустройства. Для этого подсчитаем, сколько элементов управления в бланках сайта трудоустройства имеют конкретный тип содержимого - фиксированный, указательный и свободный.
Электронные бланки на сайте «Headhunter» содержат 25 элементов управления с фиксированным типом содержимого, 35 с указательным и 5 со свободным; на сайте «Superjob.Ru» - 23 элемента управления с фиксированным типом содержимого, 17 с указательным и 3 со свободным; на сайте «Работа^ш> - 22 элемента управления с фиксированным типом содержимого, 28 с указательным и 7 со свободным. Таким образом, все электронные резюме с сайтов трудоустройства «Headhunter», «Superjob.Ru» и «Работа^ш> являются частично формализованными.
Заключение. В данной статье предлагается методика определения степени формализованности текста резюме на сайтах трудоустройства, которые предоставляют пользователю электронные бланки для заполнения резюме. Электронными бланками мы называем вебстраницы сайта трудоустройства, содержащие в себе одну или несколько HTML форм для редактирования текста резюме. В рамках представленной методики электронные бланки рассматриваются как совокупность отдельных элементов управления.
Элементы управления электронных бланков были классифицированы по двух признакам:
1) по способу взаимодействия пользователя с элементом управления - на выборочные элементы управления, флажки, переключатели, выпадающие списки и области ввода текста.
2) по ограничению пользователя во вводе информации - на фиксированные, указательные и свободные.
го са
н о >s
о ^
н
о >.
о
г
н
X
го н >s го о
го
X
ф ^
го
I-
о ф
I-
ь
о
X X
го ш о
с; го
п.
о -&
X
ф
с
ф
I-
о
X
ф
с; ф
ч ф
^ ф
с
о
Степень формализованности текстов резюме определяется наличием свободных элементов управления. Резюме являются неформализованными, если электронные бланки сайта трудоустройства, на котором это резюме опубликовано, содержат только свободные элементы управления. Резюме являются частично формализованными, если соответствующие электронные бланки содержат свободные и указательные или фиксированные элементы управления. Резюме являются полностью формали-
зованными, если в электронных бланках отсутствуют свободные элементы управления.
Дальнейшая формализация, что очевидно, должна происходить именно в рамках содержимого свободных элементов управления. Поскольку содержимое этих элементов представляет собой совокупность предложений, то рассмотрение этой совокупности как текста и его формализация должно происходить в рамках уже лингвистического исследования.
Библиографический список
1. Барихин, А.Б. Большая юридическая энциклопедия [Текст] / А.Б. Барихин. - М.: Книжный мир, 2010. - 960 с.
2. Большой толковый словарь русского языка [Текст] / С.А. Кузнецов. - СПб.: Норинт, 2000. -1536 с.
3. Жеребило, Т.В. Словарь лингвистических терминов [Текст] / Т.В. Жеребило. - Назрань: Пилигрим, 2010. - 486 с.
4. Качаева, Т.В. Автоматизированная система распознавания и классификации резюме [Текст] / Т.В. Качаева, В. С. Южиков // Труды российской конференции молодых ученых по информационному поиску в рамках RuSSIR 2007. - Екатеринбург: б. и., 2007. - С. 64-72.
5. Матвеева, Т.В. Полный словарь лингвистических терминов [Текст] / Т.В. Матвеева. - Ростов-н/Д: «ФЕНИКС», 2010. - 562 с.
6. Тойкина, О.В. Лингвокультурологические аспекты институционального делового дискурса в жанре резюме [Текст]: автореф. дис. ... канд. фил. наук / О.В. Тойкина. - Ижевск, 2014. - 23 с.
References
1. Barihin A. B. Big legal encyclopedia. M.: Knizhnyiy Mir, 2010. P. 960. [in Russian].
2. Big spelling dictionary of the Russian language. Ed. by Kuznetsov S.A. SPb.: Norint, 2000. P. 1536. [in Russian].
3. Zherebilo T.V. Dictionary of linguistic terms. Nazran: Piligrim, 2010. P. 486. [in Russian].
4. Kachaeva T.V., Yuzikov V.S. Automated system of resume recognition and classification. Trudy rossiiskoi konferentssii molodykh uchenykh po informatsioonomu poisku v ramkakh RuSSIR 2007. Yekaterinburg, 2007. P. 64-72. [in Russian].
5. Matveeva T.V. Full dictionary of linguistic terms. Rostov-na-Donu: "PHENIX", 2010. P. 562. [in Russian].
6. Toikina O.V. Lingvocultural aspects of institutional business discourse in resume genre. Author's abstract dis. ... cand. of sciences (Philology). Izhevsk, 2014. P. 23. [in Russian].
Сведения об авторе: Коряковцев Михаил Андреевич,
ф аспирант кафедры английской Ё? филологии и перевода, ^ Тюменский государственный ^ университет,
^ г. Тюмень, Российская Федерация. 2 Ктай: [email protected]
Information about the author: Koryakovtsev Mikhail Andreevich,
Post graduate student, Department of English Philology and Translation Studies, Tyumen State University, Tyumen, Russia. E-mail: [email protected]