УДК 371.39, 519.72
АЦПАРАТТАРДЫ ТАСЫМАЛДАУДЫЦ ТИ1МД1Л1Г1Н АРТТЫРУДАГЫ КОДТАУ ТЕОРИЯСЫНЫЦ Р0Л1 ЖЭНЕ ОРНЫ
БАЗАРБЕКОВА АЙЖАН БАЗАРБЕКОВНА
С. Сейфуллин атындагы ^азак агротехникалык зерттеу университетi, шетел тiлдерi кафедрасыныц окытушысы, Астана, ^азакстан
МУХАТБЕК АРАЙЛЫМ МУХТАРЦЫЗЫ
С. Сейфуллин атындагы ^азак агротехникалык зерттеу университетi, шетел тiлдерi кафедрасыныц окытушысы, Астана, ^азакстан
САПАРЦАНОВА БОТАГ0З МАУЛЕЩЫЗЫ
С. Сейфуллин атындагы ^азак агротехникалык зерттеу университетi, 1 курс студент^
Астана, ^азакстан
ЦАБЫЛ БАЛЖАН ГАЛЫМЖАЩЫЗЫ
С. Сейфуллин атындагы ^азак агротехникалык зерттеу университетi, 1 курс студент^
Астана, ^азакстан
Н¥РЛЫБЕК АЯГУЛ М¥РАТБЕЩЫЗЫ
С. Сейфуллин атындагы ^азак агротехникалык зерттеу университетi, 1 курс студент^
Астана, ^азакстан
Ацдатпа. Ацпарат теориясыныц нег1зг1 эд1стер1не кодтау жэне декодтау жатады. Мацалада ацпараттарды кодтау эд1с1 зерттелген. Мэлгметтердг цодтау мынандай Ym мэселет шешед1: хабарламаларды цупияландыру; ацпаратты тыгыздау (сжатие информации); хабарламалардагы кездейсоц цателерд1 табу жэне тYзету. Жумыста кодтау теориясыныц б1р мэселеЫ ацпараттарды тыгыздау процедурасы жан-жацты царастырылган. Ацпараттарды тыгыздауда цолданылган ец алгашцы кодтыц тацбалар -Морзе элтпеЫ царастырылган; Бодо жэне Фано кодтарыныц ерекшелттерг ашылган; екшк санац ЖYйесiн ацпараттарды кодтауда жэне влшеуде цолдану процедурасы царастырылган. Сонымен цатар, цазац тiлiндегi свздер мен свйлемдердi кодтау мYмкiндiктерi зерттелген. Казац тiлiндегi мэттдер зерттелт, свздердi цурайтын эрттер, тыныс белгiлерi жэне цифрлардыц мэттде кездесу жшлт табылган. Казац тшнде бершген хабарламалардагы «артыц» ацпараттар мвлшерi есептелт, шамасы нацты аныцталды.
Ty^h свздер: кодтау теориясы, ацпаратты тыгыздау, Морзе элтеЫ, Бодо жэне Фано коды, артыц ацпарат.
К1р1спе
Кодтау теориясы акпараттык теориямен тыгыз байланыскан жэне математика мен компьютерлш гылымдардыц курамына юредь Мэлiметтердi кодтаудыц непзп Yш багыты бар: 1) хабарламаларды купияландыру; 2) акпаратты тыгыздау (сжатие информации); 3) хабарламалардагы кездейсок кателердi табу жэне тузету. Бiз бул макалада акпараттарды тыгыздаудагы кодтау эдютершщ колданылу аспектшерш карастырамыз. Акпаратты тыгыздау аркылы хабарламаларды байланыс каналдары аркылы Yнемдi жэне тиiмдi тасымалдауга болады.
Акпараттык энтропияныц формуласы ашылган соц оныц колданбалы жагын дамыту басталды [1]. Аталган формула акпаратты тасымалдауга кажетп кодтарды зерттеу кезiнде жан-жакты колданыс тапты. Кодтау процедурасы мэлiметтi немесе хабарды байланыс каналдары (телеграф, телефон, радио, теледидар жэне т.б.) аркылы тасымалдау мэселесш
ОФ "Международный научно-исследовательский центр "Endless Light in Science"
шешу кезшде пайда болды. Мундагы кодтаудьщ Heri3ri максаты акпаратты купияландыру емес, хабарды тасымалдауды тез, ыцгайлы жэне сенiмдi ету едi. Осы максатка арналган код жасайтын курылгы хабарламадагы ap6ip символды, немесе тутас 6ip сез немесе фразаны белгш бiр сигналдар комбинациясына айналдыра алады. Осы сигналдар комбинациясын код немесе кодтыц свз деп атайды. Ал хабарды сигналдардыц тiзбегiне айналдыру операциясы кодтау (кодирование) деп, ал керi операцияны, ягни кабылданган сигналдарды бастапкы хабар калпына келтiру операциясын - декодтау (декодирование) деп атайды [2-3].
Будан байкайтынымыз, мэлiметтердi немесе хабарларды эр тYрлi кодтык сездермен тацбалауга болады. Егер олай болмаса кодтык сездер кемепмен жеткен хабарды калпына келаре алмас едiк.
Зерттеу эдкнамасы жэне нэтижелер1
Хабарды тасымалдауга арналган ец бiрiншi код - Морзе элшпеа болып табылады. «Морзе элшпеа» Yштiк кодка жатады. Бул код бойынша эрбiр эрiпке немесе цифрга паузамен белiнген электр тогыныц кыска (нYкте) жэне узактау (сызыкша) импульстершщ, сигналдар арасындагы узын пауза (эрштер арасын беледi) жэне екi есе узын пауза (сездер арасын белед^ езiндiк тiзбектерi сэйкес келедi.
Кешшрек телеграфта тек импульс пен паузадан туратын екi элементар сигналдар (Бодо коды) кец тYPде колданыла бастады. Бул екi сигналдыц узактыгы бiрдей. Бодо коды бойынша эрбiр эршке немесе тыныс белгiсiне бес осындай сигналдан туратын езiндiк кодтык сез сэйкес келедь Екi эр тYрлi екi элементар сигналдан гана туратын код - екшк деп аталады. Мунда кодтык сездi тек 0 жэне 1 символдарымен белгiлеуге болады. Екшк кодыныц магынасын толык тYсiну Yшiн мынандай мысалды карастырайык.
Мысал 1. Бiр адам 0 жэне 7 арасындагы бiр санды ойласын (Бул аралыкта 8 сан бар). Осы санды табушы екiншi адамга «иэ» немесе «жок» деген сездерден туратын гана жауап алатын сурактар кою керек.Ойланган санды тезiрек табу Yшiн сурактарды калайша кою керек.
Ец карапайым жол - сэттшкке Yмiт артып, сандардыц бэрiн кез-келген тэртшпен айтып шыгуга болады. Бул жагдайда егер сэттiлiк болса - бiр сурактан кейiн ойланган сан табылады, ал егер сэтаздш тосып тураса онда 7 сурак койып гана санды табуга болады. Сэттшкп кYтпей суракты тиiмдi тYPде беруге тырысайык. Тиiмдi сурактар жYЙесi кемепмен «иэ» немесе «жок» деген жауаптар кемепмен ойланган сан женшде кебiрек акпарат алуга тырысайык. Мысалы, бiрiншi суракты былай койсак: Ол сан 0 мен 3 тщ арасында ма? «Иэ» немесе «жок» жауаптарыныц екеуi де бiздi максатка бiрдей жакындатады. Ол санды табудыц 4 мYмкiндiгi калады.
Егер бiрiншi суракка канагаттанарлык жауап алсак, мынандай сурак коюга болады: ол сан 0 немесе 1 саны ма? Егер бiрiншi суракка терю жауап алсак онда мынандай сурак койылуы мYмкiн: ол сан 4 не 5 пе? Екiншi сурак койылганнан кейiн кандай жагдай болсын санды табудыц 2 мYмкiндiгi калады. Ендi осы санды табу Yшiн бiр сурак койсак жеткшкп. Сонымен ойланган санды табу Yшiн ец аз дегенде 3 сурак койсак жеткшкть Ал будан аз сурак жеткшказ екенiн дэлелдеуге болады.
Егер «иэ» немесе «жок» деген мYмкiн жауаптарды 0 жэне 1 символдарымен белгшесек, онда суракка алынган жауаптар нел жэне бiрдiц тiзбегi тYрiнде жазылады. Мысалы, ойланган сан 0 болса, онда алынатын Yш жауап «иэ» болады. Yш «иэ» 000 тiзбегiне сэйкес келедь
Егер ойланган сан 3 болса, онда жауаптар «иэ», «жок», «жок» болады. Демек 3 санына 011 тобеп сэйкес келедь Жауаптардыц нэтижелерi бойынша темендегi кестенi толтырамыз.
Кесте 1 - Белгш бiр мэлiметтi табу кезiндегi жауаптарды 0 жэне 1 символдарымен тацбалау
Ойланган сан 0 1 2 3 4 5 6 7
Жауаптар 000 001 010 011 100 101 110 111
Екiншi жагынан, бул кестеден ондык позициялы санау жуйеа жэне екiлiк позициядагы санау жуйеа арасындагы сэйкестiк кестесiн керш отырмыз. Сонымен катар мынаны байкау киын емес: 0 жэне 7 арасындагы сандардыц жиыныныц орнына 8 хабардан туратын жиынды узындыгы 3 ке тец жэне 0 мен 1 ден туратын пзбекпен кодтауга болатыны керiнiп тур. Егер мунан да узын екiлiк тiзбектi пайдалансак, онда кез-келген хабарлар жиынын кодтауга болады.
Шындыгында, узындыгы 3 ке тец екшк т1збектщ саны 23=8 (олардыц барлыгы таблицада келтiрiлдi), узындыгы 4 ке тец екшк -пзбектщ саны ею есе кеп 24=16. Сонымен, узындыгы п ге тец екшк "пзбектщ саны 2п. Сол себепп, 125 хабарды 0 жэне 1 аркылы кодтау керек болса, ол ушш узындыгы 7 ге тец екшк тiзбектерi артыгымен жетедi (бiздiц карамагымызда 27 = 128 бар). Соцгы мысалдан мынаны тусшдш: М хабарды 2п > М немесе п > log2M болганда гана узындыгы п болатын екшк пзбекпен кодтауга болады.
Хабарды, мэлiметтi кодтауды терец тYсiну Yшiн мына мысалды карастырайык.
2 мысал. Белгш бiр мемлекетте автомобильдердiц номерi 7 символдан турады. Бул символдар бас эрштерден (26 эрiп) жэне кез-келген тэртшпен жазылатын ондык позициядагы цифрдан турады. Эрбiр символ бiрдей жэне негурлым аз битпен кодталган. Ал эрбiр немiр бiрдей жэне негурлым аз байтпен кодталган. Осы автомобильдердщ немiрi компьютерге енгiзiлген. Мемлекетте шамамен 2 миллиондай жецiл автомобиль бар. Осы автомобильдердщ немiрiн сактауга бiр компьютердiц жадысыныц келемi жеткiлiктi ме?
1) 26 эрш +10 цифр = 36 символ колданылады.
2) 36 вариантты кодтау уиин 6 бит аппарат керек, ейткеш 25=32 □ П36 < 2б=64, ягни 5 бит жетпейдi (онымен 32 вариантты кодтауга болады).
3) Сонымен эрбiр символга 6 бит акпарат керек (ец аз акпарат мелшерi)
4) Толык немiр 7 символдан турады, олардыц эркайсысына 6 бит акпарат кажет, демек бiр немiрге 6x7=42 бит акпарат керек.
5) Тапсырма шарты бойынша эрб1р нем1р байттыц бутш сандарымен кодталады (5\р байтта 8 бит бар), сондьщтан 61 р немерге 6 байт аппарат мелшер1 кажет (5x8=40 42 < 6x8=48), ал бес байт жетпевд, ал алты - ец аз аппарат мелшер1
6) 2 миллион номерге 20x6=120 байт 2х10бПх6=1,2х107 байт = 12 Мбайт аппарат мелшерiн компьютер жадысынан белу керек.
7) Компьютер жадысыныц келемi жеткiлiктi.
Казац тшндегг хабарламаны кодтау мэселеЫ. ^азак тшнде 42 алфавит бар. Сонымен катар 9 тыныс белгiлерi жэне 10 цифр хабар болады. Сонда 61 тYрлi элементтер мэтiнде кездеседь Осы элементтердiц барлыгы тец ыктималдыкты деп алсак, жэне оларды 0 жэне 1 символдарымен белгiлесек (26 = 64) узындыгы 6 га тец 64 екшк пзбек жеткшкп. Ягни 6 бит акпарат жеткшкп. Ал мэтiн п эрiптен турса, онда 6 п бит информация кодталган мэтiндi тасымалдауга жеткiлiктi.
^азак тiлiндегi 61 тYрлi элементтiц акпараттык энтропиясы log2 61 = 5,9312 битке тец. Бул шама 6 биттан аз. Сонымен катар, казак тшндеп алфавиттердiц, тыныс белгiлерiнiц жэне цифрлардыц колданылу жиiлiгi де эр тYрлi, ягни тец емес ыктималдык жагдайында болады. Мысалы «а» эртнщ мэтiнде пайда болу ыктималдыгы 0,091 болса, «Ь> эрпiнiц пайда болу ыктималдылыгы 0,007 ге тец. Демек, Бодо кодын колдансак информацияныц байланыс каналымен тасымалдануы Yнемдi болмауы мYмкiн. Бул жагдайда шеннондык информация ец Yлкен шамада болады. Сондыктан, жишп Yлкен элементтердi (мысалы, «а» эрш ) сипаттайтын кодтыц узындыгы аз, ал сирек пайда болатын элементтердщ («Ь> эрпi) коды узын болуга тиiс. Нэтижесiнде кодтык мэтiн орташа алганда кыска болады, ал оны байланыс каналдарымен тасымалдауга аз уакыт кетедi.
Осы бiр карапайым идеяны бiрiншi рет американдык инженер Морзе колданган едь Ол езiнiц элiппесiн жасау Yстiнде типографияга барып, дайын эрiптердiц жэне тыныс белгiлерiнiц литерлерiн санаган. Кай эрiптiц литерлерi уяшыкта кеп болса (бул эрттер мэттде жиi кездесед^, осы эрiп Yшiн кодты кыска жасаган, ал сирек кездесетiн эрт Yшiн код узын болган. Мысалы, орыс тiлiндегi Морзе элiппесiнде пайда болу ыктималдыгы Yлкен «е» эрт Yшiн -нYкте, ал «ц» эрпiне терт символдыц тiзбегiн берген.
Казак тiлiнiц эрiптерiнiц мэтiндердегi кездесу ыктималдыктарын табу макстатында кешендi тэжiрибе жасалды. 500-1000 сезден туратын бiрнеше мэтiн жасалды. Эр мэтiн казак эдебиетшщ накты бiр жанрына тиесш болды. Мынандай жанрлар камтылды: ертек, эцпме, повесть немесе роман, елец жэне поэма, гылыми-техникалык мэтiн жэне т.б. Эрбiр мэтiндегi эрiптердiц жшлтн табу процесiн автоматтандыру максатында Delphi ортасында арнаулы багдарлама жасалды 1а суретте осы багдарламаныц интерфейсi керсетшген [4]. Ал сурет 1б да эр эрштщ мэтiнде кездесу ыктималдылыгы арасындагы байланысты сипаттайтын график бершген.
Ку »< (1ШЫ шуак ауилсрлм оцн I анаьай ауаы Ajoiowmi мпуош жпипшы llypi akintbl биПммлаы кыоауында <Л> Ошвам аоианары им (мак IM. асП жсрпсрлс ишн i^uki шыккан кпыък Дрлшрынла. кыра> жсркрлс hi и» карааак.
imuic i vp'" «cuuwtai сари iii шиквииныл. »"лен lacacii аса К«Р" wuap;»ai ли жаниракнц>и captаЛын. oypuiiKicpi кышрмп, кунламары >уим iiiiuikmi I i»<iu<p.Dii «пи I у «дерти« одмиц»«! кы ыл момшащаЛ. cabwiaiaM i yfbic чсрл<Н ьомп. шиурьпшар (uivvui K>miii ioM.iinaiiiiip.ii.Di жасыл n.nuit capiafani купы «ан Октан кара суларлмн аоиаларавиииы «царски
акафым Mpiana wuniptii. «ары умд«А bo/Mi uapiafbati К«мыч ар.в.в| »лсш сыЬдмрлман жапырашары да (ары ала Ьощаи.Мапн ciniaio
Мэтшдеп символдар саны Кечдесетш символдар саны;
728 38
Eccimy
d
■■L 1 Я4777*7АЛММ*
68 0.081829121540312'
52 0.062575210589651
48 0.057761732851985.
40 0.0481347773766541
36 0.043321299638989
35 0.042117930204572:
35 O.OI211793020-1572:
29 0.034897713598074'
26 0.031287605294825
25 0.030084 2 3 5 860409
24 0.028880866425992
17 0.020457280385078
0 17 0.020-157280385078
15 0.018050541516245
14 0.016847172081829
13 0.015643802647412:
12 0.014440433212996-
12 0,014440433212996
й II 0.01323706377858
II 0.01323706377858
К) 0.012033694344163
10 0.012033694344163
9 0.010830324909747,
\ 0.0060168-17172081
э < 0.006016847172081
Y 4 0.00-1813477737665-
а) б)
Сурет 1 - Delphi ортасында жасалган багдарлама жэне эрбiр эрiптiц жэне тыныс белгшершщ мэтiнде кездесу ыктималдылыгыныц графигi
2 кестеде жасалган кешендi тэжiрибенiц нэтижесi керсетшген. Кестеде тек эрштердщ мэтшде пайда болу ыктималдылыгын гана есептедiк.
Кесте - 2. Казак тштц алфавиттерiнiц мэттдердеп кездесу ыктималдыщтары
№ Эрт Эрт жшлт № Эрт Эрт жшлт № Эрт Эрт жшлт № Эрт Эрт жшлт
1 а 0,1371 11 i 0,0436 21 з 0,0166 31 ю 0,0018
2 ы 0,0783 12 б 0,0312 22 п 0,0127 32 х 0,0056
3 е 0,0631 13 д 0,0307 23 ¥ 0,0124 33 h 0,0002
4 т 0,0616 14 к 0,0278 24 Ц 0,0109 34 в 0,0002
5 л 0,0543 15 м 0,0251 25 г 0,0108 35 Ф 0,0001
6 и 0,0500 16 ш 0,0250 26 Y 0,0107 36 щ 0,0001
7 К 0,0488 17 F 0,0201 27 в 0,0098 37 э 0,0001
8 Р 0,0487 18 й 0,0192 28 и 0,0090 38 ь 0,0000
9 у 0,0486 19 ж 0,0178 29 э 0,0059 39 ц 0,0000
10 с 0,0478 20 о 0,0166 30 я 0,0030 40 ъ 0,0000
Тиiмдi кодтау эдттерт талдау. Сонымен, казак мэтiнiндегi эрбiр элементтщ (эрiп, тыныс белгiсi, цифр) пайда болу ыктималдыктарын ескере отырып олардыц кодын жасасак,
онда п эрштен туратын мэтiндi тасымалдау Yшiн 6п бит аппарат емес, мысалы 5п бит аппарат кажет болуы мYмкiн. Бул Yшiн Бодо кодына Караганда Yнемдi болатын код жасау керек. Мiне осы шарттарды Р.Фано коды орындай алады. Фано коды бойынша байланыс каналдарымен тасымалданатын хабарламаларда оныц эрбiр элементш оныц мэтiнде пайда болу ьщтималдьщтарын ескере отырып жасалган. Нэтижесiнде хабардьщ тасымалдануы тез, ыцгайлы жэне сенiмдi болды. Хабардыц акпараттык энтропиясы ец аз шамага дейiн темендеген [5,6].
Мысал 3. А1, А2, Аэ, А4 казак тiлiндегi хабарламалардыц ыктималдыктары Р(А1) = /, Р(А2) = 1/4, Р(Аз) = Р(А4) = 1/8 болсын. Бул мэлiметтердi былай тYсiну керек: 1000 хабарламалар жасалган соц 500 рет А1 хабарлама пайда болады, 250 рет А2 - хабарлама, ал Аэ жэне А4 хабарламалардыц эркайсысы 125 рет пайда болады. Бул хабарламаларды Бодо эдiсiмен кодтаймыз:
Кесте 3 - Бодо эдiсiмен ыктималдыктары эр тYрлi хабарламаларды 0 жэне 1 символдарымен тацбалау _
А1 А2 Аз А4
00 01 10 11
Бодо эдiсiмен кодтау кезшде барлык хабарламаларга бiрдей узындыктагы код берiлген ^ркалыпты код). Бiрак мундай кодтау кезiнде хабарламаныц пайда болу ыктималдыгы есепке алынбайды. Кодтауды баскаша жасаймыз. Хабарламаларды екi ыктималдыктары бiрдей топтарга бeлемiз: бiрiншi топка Ai хабарлама, ал екiншi топка А2, Аз, А4 хабарламалар жатады. Бiрiншi топты 0, ал екiншiсiн 1 символымен белгiлеймiз (Кесте 4). Кестенщ екiншi графасына эр хабарламаныц ыктималдыктары енпзшген.
Кесте 4- Хабарламаларды ыктималдыктары бiрдей екi топка белу процедурасы
А1 1/2 0
А2 1/4 0
Аз 1/8 1 1 0
А4 1/8 1
Сонымен катар, А2, A3, А4 хабарламалар да ыктималдыктары бiрдей екi топка бeлiнген. Сол сиякты, Аз, А4 хабарламалар да ыктималдыктары бiрдей екi топка бeлiнген. «Хабарлама бiрiншi топка жатады ма?» сурагына 0 символы, немесе «иэ» жауабы сэйкес келедi, 1 символы немесе «жок» жауабына сэйкес болады.
А1 хабарламасы талдаудыц бiрiншi адымында ак «жеке топ» жасап алды. Жэне оган 0 символы берiлдi жэне осы тацба хабарламаныц коды болады. Талдаудыц екiншi адымында А2 хабарламасы жеке топка кештг бiрiншi адымда хабарлама 1 символына ие болса, екiншi адымнан кейiн 0 символын алды. Сондыктан бул хабарламаны 10 тацбасымен кодтаймыз. Аз жэне А4 хабарламалар Yшiн сэйкесiнше 110 жэне 111 кодтарын беремiз. Нэтижесiнде темендепдей кесте жасаймыз.
Кесте 5 - Фано эдiсiмен ыктималдыктары эр тYрлi хабарламаларды 0 жэне 1 символдарымен тацбалау _
А1 А2 Аз А4
0 10 110 111
5 кестеде бершген кодтау эдiсiн американдык математик Фано усынган едi. Фано эдiсiмен кодтау кезiнде барлык хабарламалардыц узындыктары олардыц ыктималдыктарына сэйкес эр тYрлi болады (бiркалыпсыз код). Ыктималдылыгы Yлкен хабарламаныц узындыгы аз, ал ыктималдылыгы Yлкен боласа узын болады. Бодо кодымен салыстырганда Фано кодыныц артыкшылыгы бар. Осы артыкшылыкты тYсiну Yшiн мынандай мысалды карастырайык. 1000 хабарды байланыс каналы аркылы тасымалдау керек. Осы 1000 хабар шшде А1 хабар 500 рет, А2 хабар 250 рет, Аз жэне А4 хабарлар 125 реттен пайда болады. Алдымен узындыгы екiге тец бiркелкi Бодо кодын колдансак, онда 2000 екшк символды тасымалдауга тура келедь Ендi Фано кодын колданамыз. А1 хабарды бiр символмен, А2 хабарды ею символмен, ал Аз жэне А4 хабарларды 3 символмен кодтаймыз. С онда жалпы кодтауга жумсалган символдьщ саны 500+2П250+(3□ 125+3□ 125)=1750 символ. Эркелю Фано кодын пайдалана отырып хабарды байланыс каналы аркылы тасымалданганда уакыттыц сепзден бiр белiгiн Yнемдедiк.
Осы мысалдардан бiз мынандай корытынды жасаймыз: бiркалыпсыз кодтыц Yнемдiлiгi немесе тиiмдiлiгiн жеке кодтык тацбалардыц узындыгы емес, олардыц «орташа» узындыгы I сипаттайды. Бiркалыпсыз кодтыц орташа узындыгы мынандай тецдеумен сипатталады:
N
L = Z
kP(Ai)
i=i
Мундагы /j - Ai хабарламаныц кодтык тацбасыныц узындыгы, P(Ai) -Ai хабарламаныц ыктималдыгы, N - хабарламаныц жалпы саны.
Ец Yнемдi кодтыц орташа узындыгы минимал шама болу керек. Ендi 4 кестеде бершген бiркалыпсыз кодтыц орташа узындыгын табайык.
I = 1 x 0,5 + 2 x 0,25 + з x 2 x 0,125 = 1,75 3 кестедеп карастырылган бiркалыпты кодтыц орташа узындыгы I = 2 «Артыц» ацпарат угымы жэне оныц кодтау амалындагы орны. Бiз жогарыда хабарга енетш белгiлер тец емес ыктималдыкта болса, онда оныц акпараттык энтропиясы азаятынын айтып кеткенбiз. Шеннон салыстырмалы акпаратты енгiздi. Ол Н1/Нт шамага тец. Мундагы Н1 хабар аркылы жеткен информация мелшер^ ал Нт хабарды курайтын барлык белгiлер тец ыктималды болган жагдайда хабармен жететiн акпарат мeлшерi. Егер белгiлер саны n болса Нт = log2n болады. Ал салыстырмалы информацияны бiр санына толыктыратын R шаманы «артык» акпарат деп атады.
R=1 - ^
нт
Кейбiр тiлдердегi артык акпарат казiрri уакытта аныкталып отыр: француз тшнде 55% артык акпарат бар, ал орыс тiлiнде артык акпарат 50%-т курайды. Тiлдегi артык акпарат канал аркылы тасымалданатын хабардыц кодыныц узын болуына экелiп согады, дегенмен тшдщ бул касиетiнiц аркасында хабар беру кезшдеп кателiктер де аз болады. Жюль Верннiц «Капитант Гранттыц балалары» атты романыныц кейiпкерлерiнiц бастан кешкен килы окигаларыныц сэттi аякталуы да тiлдегi артык акпараттыц бар болуына да байланысты [7].
^азак тiлiндегi артык акпаратты аныктау барысында жYргiзген кешендi зерттеуiмiздiц нэтижесiнде тiлiмiздегi артык акпарат 60%-тi курайтынын аныктадык. Тeмендегi 10%
граматикалык белriлерi алынып тасталган мэтш бершген. Сонда да осы хабарды окып шыгуга жэне тусшуге болады.
МугПл1м: Аскар, айтшС, erDp 6ip косу 6ip eDi, ал eici к Псу eDi терт, ал терт к Dey те Dt каншй боладО ?
АСкар: БуП эдшШтсШздж, мугПл1м. БаскП окушСларга оцай сурСк коясСз, ал магйн тек киын сурОктПр гана кал ад ы.
Эр тYрлi жанрларды камтитын 50 мэтш жасалды. 40%, 50%, 55% жэне 60% белriлерi алып тасталган жэне 300-500 белгшерден туратын тапсырмаларды мектептщ 11 сынып окушылары мен жогары оку орны студенттерiне бердш. Алгыр окушылар мен талантты студенттердщ аз тобы 60 пайыз мелшердеп эрiптерi жетпейтiн тапсырмаларды орындап шы;ты.
Шындыгында, эр тYрлi кателiкке толы мэтiндi киналмай-ак окып жэне магынасын тYсiнiп алатынымыз да тiлдегi артык акпараттыц болуына тiкiлей байланысты. ^аз1рп кезде галымдар Yнемдiлiк максатында тшдеп артык акпаратты тYгел алып тастамай белгш бiр шекке дейiн азайтып, хабар тасымалдаудыц тиiмдi жагдайын жуык болса да тауып отыр [8].
^аз1рп уакытта хабарда кетiп калган кателердi тауып алатын жэне оны тYзететiн арнайы кодтар негiзiнде жумыс iстейтiн автоматтандырылган жYЙелер пайда болды. Олардыц жумыс iстеу принципi тшдердеп артык акпарат факторына негiзделген.
Корытынды
Элемдiк когамдастык акпараттык кезецге аяк басып отырган жагдайда акпараттыц когамдык карым-катынастагы, экономикадагы жэне гылымдагы релi жэне орны ерекше болып отыр. «Юм акпараттыц иес болса, ол барлык дуниенщ иесЬ> тYрiнде айтылган канатты сездiц магынасымен казiр ешюм дауласа алмайды.
Математика жэне компьютерлш гылымдардыц Yлкен салалаларыныц бiрi акпарат теориясыныц негiзiн курайтын орташа акпаратты елшеуге арналган тецдеудiц (Шеннон тецдеу^ хабарламаларды тыгыздау максатында кодтау процедурасын зерттей отырып темендегiдей нэтижелер алдык:
-Кодтау технологиясыныц акпараттарды тасымалдаудагы релi мен орны аныкталды;
-^азак тшндеп эрiптердiц мэтiнде пайда болу жишш (ыктималдыгын) есептелдi;
-Мэтiндi курайтын элементтердi Yнемдi тYPде кодтауда жэне байланыс каналдарымен тиiмдi тасымалдау мэселесiн шешуде орташа акпаратты елшеуге арналган тецдеу колданылды;
-^азак тiлiндегi артык акпаратты аныктауга арналган зерттеу жасалды.
Алынган теориялык жэне практикалык нэтижелердi математикада, информатикада, казакша жазылган мэтiндердi кодтау Yдерiсiнде пайдалануга болады. Алдагы уакытта кодтау теориясынын баска салаларын, атап айтканда казакша хабарламаларды купияландыру жэне хабарламалардагы кездейсок кателердi табу жэне тузету мэселелерiн зерттеудi максат койып отырмыз.
ПАЙДАЛАНЫЛГАН ЭДЕБИЕТТЕР Т1З1М1:
1. Шеннон К. Работы по теории информации и кибернетике. - М.: Изд-во иностранной литературы, 1963. - 830 с.
2. Вернер М. Основы кодирования. - М.: ТЕХНОСФЕРА, 2004. - 288 с.
3. Хэмминг Р.В. Теория кодирования и теория информации. - М.: Радио и связь, 1983. - 176 с.
4. Мукушев Б.А.,Турдина А.Б., Мукушев С.Б. Компьютерный метод определения относительных частот букв казахского, русского и английского языков (программа для ЭВМ). Авторское свидетельство. Астана: Министерство юстиции Республики Казахстан. №874. 21 июнь 2012 г.
5. Жанабаев З.Ж., Мукушев Б.А.,Турдина А.Б., Мукушев С.Б. Использование информационной энтропии при контроле учебной деятельности обучающегося // Информатика и образование. - 2008. - №10.- С.120-12з.
6. Mukushev B.A., Zheldybaeva B.S., Musatayeva I.S., Mukushev B.A., Kariev K.U., Turdina A.B. Formation of the scientific worldview in schoolchildren based on the inclusion of synergetic ideas in the content of education // Integratsiyaobrazovaniya = Integration of education. 2018. T.22, No. 4. Pp. 6з2-646.) DOI: 10.15507 / 1991-9468.09з.022.201804.6з2-647.
7. Урок-исследование «Поиск информации по различным информационным источникам» https://урок.рф/library/urokissledovanie_poisk_informatcii_po_razlichnim_inf_201450.html
8. Шавенько Н.К. Основы теории кодирования и сжатия сообщений: учебно-методическое пособие. - М.: МИИГАиК, 2020. - 87 с.