A different view on the natural development of writing on the basis of information theory (in the case of Turkish)
Citation
Yılmaz, Ç., Sancar, Y. (2020). A different view on the natural development of writing on the basis of information theory (in the case of Turkish), Journal Of Studies In Turkology, 48, 65-82.Abstract
İletilerdeki karakterlerin (harflerin veya rakamların) yazı dizgesindeki işlevlerini onların
kullanım sıklıklarıyla ve buna bağlı olarak bilgi değerleriyle ilişkilendiren bilgi kuramı, bir yandan
ölçülebilir (ve karşılaştırılabilir) veriler sunarken diğer yandan yazı dizgesinin gelişimi üzerine
öngörüde bulunma imkânı sağlıyor. Ancak bunun için öncelikle standart bir alfabedeki karakterlerin
iletilerdeki kullanım sıklıklarını gösteren veriler gerekiyor. Bu sebeple standart Türk alfabesindeki
karakterlerin (“w”, “x”, “q” ve boşluk karakteri (–) ile birlikte) ve karakter permütasyonlarının (2’li,
3’lü, 4’lü, 5’li, 6’lı, 7’li ve 8’li permütasyonlar) son 10 yılda yayımlanmış 100 adet metinden seçilen
pasajlarla oluşturulan derlemdeki kullanım sıklıkları tespit edildi. Sonrasında bu sıklık değerleri
üzerinden iletilerde kullanılan her karakter ve karakter bloğunun bilgi değeri hesaplandı. Bilgi
değerlerine ilişkin elde edilen verilerle, söz konusu karakter ve karakter bloklarının işaretlenme
aşamaları açıklanmaya çalışıldı. Ulaşılan sonuçlar, Türkçedeki sözcüklerinin günümüz konuşma ve
yazı dilindeki kullanımıyla ve tarihî metinlerdeki şekilleriyle ilişkilendirildi. The information theory, which associates the functions of the characters (letters or numbers) in
the messages in the writing system with their frequency of use and accordingly with the information
values, provides the opportunity to make predictions on the development of the writing system on the
one hand. However, this requires data that shows how often characters in a standard alphabet are
used in messages. For this reason, the frequency of use of characters and character permutations (2s,
3s, 4s, 5s, 6s, 7s and 8s permutations) in the standard Turkish alphabet (with “w”, “x”, “q” and the
space character (–)) in the compilation created by passages selected from 100 texts published in the
last 10 years have been determined. Then, the information values of each character and character block
used in the messages have been calculated over these frequency values. With the data obtained from the information values, it has been tried to explain the stages of the character and character blocks in
question. The results reached have been associated with the use of Turkish words in today's spoken
and written language and their shapes in historical texts.