Giriş
1968 yılında Doerfer tarafından keşfine kadar Halaç Türkçesi, Doerfer’in öncülleri tarafından (Minorsky, 1940) yanlışlıkla İran’da konuşulan Güney Azerbaycan Türkçesinin bir varyantı olarak sınıflandırılmıştır. Birçokları ise Divânu Lügati’t-Türk’te geçen Doerfer ve ark.na göre (1971) Argu dilinin günümüzdeki değişkesi olan Halaç Türkçesinin varlığından haberdar dahi değildi. Aynı dil ekolojisi içerisinde birbirine son derece yakın bir coğrafyada konuşulan Halaç Türkçesi ve Güney Azerbaycan Türkçesi, İran diyalektolojisi uzmanı Moghaddam’in (1939) ve Minorsky’nin (1940) sunmuş oldukları Azerbaycan Türkçesiyle karışık verilerle yayımlanmıştı. Doerfer’in 1968 yılında bu verilere erişimiyle Göttingen’de masabaşında gerçekleştirmiş olduğu (yeniden) keşif ve sonrasında İran’ın Halaç Türkçesi konuşulan bölgelerinde ekibiyle gerçekleştirdiği Göttingen alan araştırması (1969-1971) neticesinde söz konusu bu değişkenin Azerbaycan Türkçesinden farklı bir değişke olduğu, derlemeler ve dil bilimsel incelemeler yoluyla sarih bir şekilde ortaya konmuştur (Doerfer ve ark., 1971; Doerfer, 1987, 1988). Tekin (1989) bu doğrultuda “Türk Dil ve Diyalektlerinin Yeni Bir Tasnifi” başlıklı sınıflandırmasında Halaç Türkçesini hadaq grubu içerisinde tek başına bir grup oluşturacak şekilde tasnif etmiştir.
Biçim birim, ses birim ve söz varlığı açılarından sergilediği eskicil özellikler ile Türk dili değişkeleri arasında farklı bir yerde duran Halaç Türkçesinin içerisinde bulunduğu dil ekolojisi bağlamında diğer değişkelerle uzaklığı, güncel dil bilimsel ölçütlerle henüz tam anlamıyla incelenmemiştir. Halaç Türkçesinin ağızları arasındaki uzaklıkla ilgili Doerfer’in verilerine dayalı bir çalışma yayımlanmış olsa dahi İran’da konuşulan Türk dili değişkeleri arasındaki uzaklığı güncel konuşma verilerine dayalı olarak saptamayı amaçlayan bir çalışma ilgili alan yazında henüz neşredilmemiştir. Bu sebeple bu çalışma alan yazında söz konusu açığı sözlüksel bağlamda “hesaplamalı diyalektoloji” (İng. computational dialectology) yöntemlerinden Levenshtein uzaklık algoritması ve Dijkstra algoritmasını kullanarak kapatmayı hedeflemektedir. Bu çalışma, ilgili alan yazında Dijkstra algoritmasını “hesaplamalı diyalektoloji” alanında kullanan ilk çalışma olması hasebiyle Türk diyalektoloji alan yazınına bir katkı sunmayı amaçlamaktadır.
Halaç Türkçesi Dil Ekolojisi Görünümü
Orta İran’da Merkezī ve Kum vilayetlerinde konuşulmakta olan Halaç Türkçesinin içerisinde bulunduğu çok dilli dil ekolojisi dâhilinde İrani dillerin yanı sıra farklı Türk dili değişkeleri de konuşulmaktadır. Bu minvalde ilgili dil ekolojisinde İrani dillerden Farsça, Tatça, konargöçerlik dönemlerinde Luri konuşulmaktayken Türk dili değişkelerinden ise Şahseven Türkçesi, Merkezī ve Kum vilayetlerinde konuşulan Güney Azerbaycan Türkçesi değişkeleri, konargöçerlik dönemlerinde Kaşkay Türkçesi sayılabilir. Şekil 1, Halaç Türkçesinin ve Couzeh değişkesinin İran’da konuşulduğu alanı işaretlemektedir.
Dolayısıyla her ne kadar oldukça dar bir coğrafyada sınırlı sayıda dil topluluğu tarafından kullanılan bir dil olsa da Halaç Türkçesi birçok dil ve/ veya dil değişkesiyle etkileşim hâlinde görünmektedir.
Yukarıda dilsel manzarası tavsif edilen bölgeyi gösteren haritada işaretlenen çok dilli dil ekolojisi içerisinde yok olma tehlikesi altında bulunan ve bu durumdaki hemen her dilde tanıklandığı üzere varyantlaşmanın arttığı Halaç Türkçesi üzerindeki etkinin sözlüksel boyutları, bu çalışmanın temel konusunu teşkil etmektedir.
Bu bağlamda Halaç Türkçesi dil ekolojisi bünyesinde Halaç Türkçesini etkilediği düşünülen ilk dil, İran İslam Cumhuriyeti’nin resmî dili Farsçanın bölgede konuşulan ağızlarıdır. Farsça, geniş Hint-Avrupa dil ailesinin İrani diller grubunda yer almakta ve Orta İran’dan Horasan’ın doğusuna kadar geniş bir coğrafyada ana dil olarak konuşulmaktadır. Deri ve Tacikçeyle göreceli karşılıklı anlaşılırlığa rağmen söz konusu diller, dil sınıflandırmalarında Farsçadan ayrı diller olarak tasnif edilmektedir (Ethnologue, 2022). Ana dil olarak konuşulmasının yanında Farsça, İran’da yaşayan Farsçadan farklı ana dile sahip dil topluluklarınca (Azerbaycan Türkleri, Halaçlar, Türkmenler, Horasan Türkleri, Araplar, Beluçlar, Tatlar, Talışlar vb.) da ikinci dil olarak kullanılmaktadır. Halaç Türkçesinin konuşulduğu coğrafyada dengeli Halaç Türkçesi-Farsça iki dilliliğin yaygın olduğu bu minvalde ilgili alan yazında sıklıkla vurgulanmıştır (Doerfer ve ark., 1971).
Halaç Türkçesinin olduğu coğrafyada konuşulan diğer bir İrani dil Tatçadır (ISO 639-3 kodu: tks). Tatça, İran’ın kuzeydoğusunda konuşulan Hint-Avrupa dil ailesinin İrani dalına mensup bir dildir. Tatça, Halaç Türkçesi konuşulan coğrafyanın kuzeydoğusunda Amore gibi köylerde konuşulmaktadır.
Konargöçer dönemlerden Luri (ISO 639-3 kodu: lrc) dilli topluluklarla Halaçlar arasında iletişime dair bilgiler hem tarihî veriler hem hâlihazırda halkın toplumsal hafızasında yer alan hikâyelerle doğrulanmaktadır. Dil bilimsel veriler açısından ise Halaç Türkçesi Luri etkileşimini Kuribayashi (2012) Luri dilinden Halaç Türkçesine giren bir biçim birim örneğinde tanıklamıştır. Lurinin Halaç Türkçesinde biçim bilgisel düzeyde bir değişime neden olabilmesi için Halaç Türkçesi konuşurları ile Luri konuşurlarının tarihlerinin belli bir döneminde bir ortak yaşam sürmesi beklenmektedir. Luri, Windfuhr ve Perry (2009, s. 418) tarafından “Luri türevli” değişkeler olarak tanımlanmıştır. Luri ağızları, güneybatı İran’da tarihsel olarak Güney Erken Yeni Farsçadan evrilmiş birçok dil bilgisel yapıyı barındırdığı için “Farslaşmış” (İng. Perside) olarak tavsif edilmektedir. Bu noktada Luri diliyle ilgili alan yazında esas olarak Merkezī Luri, Bahtiyari, Boyer Ahmedi ve Mamasani-Kuhgeluye ağızları tasnif edilmektedir. Anonby (2012), Luri konuşur sayısının 4 milyon ila 5 milyon arasında olduğunu belirtmektedir.
Güney Azerbaycan Türkçesi (ISO 639-3 kodu: azb) genel olarak Halaç Türkçesi konuşulan dil coğrafyasının kuzeyine tekabül eden köylere yakın bölgelerde sayıca büyük bir Türk dilli nüfus tarafından konuşulmaktadır. Halaç coğrafyası içerisinde Telkhab, Himmetabad, Esfid, Muşekiye gibi köylerde Azerbaycan Türkçesi konuşurlarının sayısının yıldan yıla arttığı kaydedilmektedir. Bu nedenle özellikle kuzeyde Azerbaycan Türkçesi konuşulan bölgeye yakın Halaç köylerinde Oğuzcanın göreceli olarak etkili olduğu belirtilebilir.
Şahseven Türkçesi, İran’ın kuzeybatı bölgelerinde konuşulan ve Güney Azerbaycan Türkçesinin bir kolu olarak kaydedilen ve zaman zaman Türkiye Türkçesinin doğu grubu ağızlarına yakınsayan özelliklere sahip bir değişke olarak tanımlanır (Çam, 2021). Bu nedenle ISO kodu Güney Azerbaycan Türkçesi dâhilinde değerlendirilmektedir. Erdebil ve Zencan bölgesi Şahseven ağızları üzerine çalışmalar yapılmışsa da Merkezī ve Kum vilayetlerinde Halaç Türkçesi konuşulan bölgeye yakın kullanılan Şahseven ağızları üzerine henüz kapsamlı bir karşılaştırmalı çalışma yayımlanmamıştır.
Diyalektometri Çalışmaları
Ekseriyetle tarihsel dil bilimde kullanılmış olan leksikoistatistik (=glottochronology) çalışmalarıyla art zamanlı başlayan nicel ölçüm çalışmaları (Gudschinsky, 1956), 21. yüzyıla gelindiğinde makine öğrenimi (İng. machine learning) ve yapay zekâ (İng. artificial intelligence) çalışmalarındaki algoritmik gelişmelere uygun olarak gelişmiştir.
Ağızların birbirleriyle ilişkilerini tek bir üst yapıya bağlamadan saptamak için “diyalektometri” adı verilen bir yöntem kullanılmaktadır (Szmrecsanyi, 2013). İlk defa Fransız lehçe bilim çalışmalarının bir hediyesi olarak Séguy (1973, s. 1) tarafından alan yazına kazandırılmış olan “dialectométrie” kavramı, derlenmiş verilerin varyasyon yoğunluğuna bir çözüm olarak nicelleştirilmesi amacıyla kullanılmıştır. Hesaplamalı diyalektometri yöntemlerinden “kategorik karşılaştırmalar”dan (İng. categorical comparisons) biri “göreceli özdeşlik değeri”dir (İng. Relative Identity Value). Séguy (1973) ve ekibi iki komşu ağız arasındaki dil bilimsel mesafeyi, üzerinde anlaşamadıkları “uzak(lık)” ögelerinin sayısı temelinde saptamışken Goebl (1982), farklılıklar yerine benzerlikleri ölçmüş ve buna “Göreceli Özdeşlik Değeri” adını vermiştir. Benzerlik ve uzaklık kategorileri temelinde geliştirilmiş olan bu göreceli değer yaklaşımı sonradan geliştirilmiş olan hesaplamalı diyalektometriye yön vermiştir.
Regensburg-Salzburg Diyalektometri (RS-DM) ekibi bilgisayar yöntemlerini kullanarak ses bilgisi temelinde haritalandırılmış ağızlararası benzerlik temelli çalışmalarıyla diyalektometri çalışmalarına kuramsal ve uygulamalı katkılar sağlamıştır (bkz. Goebl, 2017). Bu çalışmalar sonucunda göreceli özdeşlik değerinin yanı sıra belli birtakım dilsel özelliklerin “daha önemli”, diğerlerinin göreceli olarak “daha az önemli” olduğunu savlayan “Ağırlıklı Özdeşlik Değeri” (İng. Weighed Identity Value) mefhumunu da alan yazına tanıtmıştır.
Bir diğer hesaplamalı diyalektometri yöntemi “sıklık temelli yöntemler” (İng. frequency-based method) olarak gruplandırılan sessel ve ses bilimsel özelliklerin kullanım sıklığını dikkate alan yöntemlerdir (Heeringa ve Prokić, 2017). Sessel özellikler yanında Szmrecsanyi (2008) Freiburg İngilizce Derlemini (FRED) kullanarak İrlanda dışındaki Büyük Britanya İngilizcesinde sözdizimsel özellik sıklıklarını incelemiş ve Öklid uzaklığını kullanarak aralarındaki farkları saptamayı amaçlamıştır.
Diyalektolojinin Avrupa ekolünce Romen dillerinin (Goebl, 1982) veya Felemenkçe ağızlarının (Nerbonne ve Heeringa, 2010) akrabalık ilişkilerinin saptanmasında nicel yöntemler uyarlanmaya ve geliştirilmiş olan algoritmalardan yararlanılmaya başlanmıştır. Toplum dilbilimsel etkenleri görmezden geldiğini savunanlar tarafından bilimsel eleştiriye tabi tutulan söz konusu algoritma temelli nicel diyalektometri yöntemleri ağız ve lehçeler arası uzaklık ölçümlerinde günümüzde sıklıkla kullanılmaya devam etmektedir.
Bu ölçüm tekniklerine genel olarak Dizge Düzen Uzaklığı (İng. String Edit Distance) adı verilmektedir. Bu teknikler arasında ağızlararası uzaklığın ölçümünde ilgili alan yazında en çok kullanılanı Levenshtein Uzaklık Algoritması ve n-Gram Ağırlıkları (İng. n-Gram Weights) olmuştur. Bu ölçüm teknikleri göreceli (İng. relative) ve mutlak (İng. absolute) uzaklıkları ölçüp ölçmeme konusunda farklı paradigmaları göstermektedir.
Alan yazında Türk dili değişkeleri içerisinde sadece Halaç Türkçesi ağızları (güney, kuzey ve kuzeydoğu) arasındaki uzaklığın saptandığı bir çalışma olduğu görülmektedir. Söz konusu çalışmada kuzey ağızlarının birbirlerine sözlüksel olarak yakınsadığını güney ağzı ile ise göreceli bir uzaklığın olduğunu ileri sürülmüştür. Bu ağızların birbirleriyle uzaklık ilişkisini diyagram ve algoritma temelinde gösterme konusundaki eksiklik ise eldeki bu çalışmanın yapılmasını gerekli kılmıştır.
Bu yönüyle bu çalışma üç ve üçten fazla ağzın ölçüldüğü durumlarda en kısa yoldan bu ağızlar arasında merkeze alınan ağızla ilişkileri alan yazına tanıtacak Dijkstra algoritmasının diyalektoloji çalışmalarında kullanımının uygunluğunu tartışmaya açması açısından da özgündür.
Veri Toplama ve Analiz Yöntemi
Bu çalışma kapsamında İran’ın Kum vilayetinde birbirine komşu coğrafyada konuşulan bir Güney Azerbaycan Türkçesi değişkesi (Couzeh) ile Halaç Türkçesi arasındaki sözlüksel uzaklığın saptanması amaçlanmaktadır.
Araştırma Bağlamı: Alan Araştırması
Bu çalışma kapsamında güvenilir (İng. trustworthy) sözlü veri toplamak maksadıyla İran İslam Cumhuriyetinin Merkezī ve Kum sancaklarına Temmuz-Eylül 2021’de araştırma gezisi düzenlenmiştir.
Alan araştırması sırasında veri derlenmiş olan Halaç Türkçesi ve Güney Azerbaycan Türkçesi konuşulan yerleşim birimlerinin bağlı bulunduğu sancak, vilayet ve ilçenin adları ile birlikte bu birimlerin coğrafi koordinatları aşağıdaki tabloda sunulmuştur:
Tablo 1, Doerfer’in (1998) belirlemiş olduğu 7 Halaç Türkçesi ağız bölgesinden bu çalışmada verisi kullanılan 7 Halaç yerleşim birimini ve karşılaştırma için aynı dil ekolojisi içerisinde konuşulan GAT değişkesi Couzeh ağzını göstermektedir. Bunlar sırasıyla Mensurabad (Merkez doğu ağzı bölgesi), Behāristan (Merkez ağzı bölgesi), Şaneg (Güney ağzı bölgesi), Mehr-i Zemin (Kuzey ağzı bölgesi), Kheltabad (Batı ağzı bölgesi), Karasu (Ana ağız bölgesi), Muşekiye (Kuzey doğu ağzı bölgesi) ve Couzeh (GAT).
Kum ve Merkezī sancaklarından çalışmaya katılan kaynak kişilerin demografik bilgileri aşağıdaki tabloda sunulmuştur:
Tablo 2’deki verilerin işaret ettiği üzere çalışmaya katılan kaynak kişilerin büyük çoğunluğu erkeklerden (N=8) müteşekkil iken İran’ın kendine has toplumsal normlarının da etkisiyle sadece bir kadın (N=1) çalışmaya katılabilmiştir. Tüm katılımcılar içerisinde en genç kaynak kişinin yaşı 29 olarak belirlenmiştir. Çalışmanın yapıldığı zaman kayıt alınan en yaşlı kaynak kişi ise 85 yaşından gün almaktaydı. Tüm katılımcıların ortalama yaşı ise 59,55 olarak hesaplanmıştır. Katılımcıların eğitim düzeylerine gelince, kaynak kişilerden kadın olanın eğitim almadığı tespit edilmiştir. Kaynak kişilerin kahir ekseriyeti ya ilköğretim (N=6) veyahut ortaöğretim (N=2) seviyesinde eğitim aldıklarını belirtmişlerdir. Katılımcıların isim bilgilerinin yayımlanması için gerekli onamlar ve Etik Kurul izinleri alınmıştır.
Veri Toplama Aracı: Leipzig-Jakarta Sözcük Listesi
Ağızlararası uzaklığı ölçmek ve sözlüksel ögelerin nicel bir çözümlemesini sunabilmek adına “ödünçlemeye direnç”, “evrensellik”, “sadelik” ve “istikrar” gibi değişkenler dikkate alınarak Tadmor ve Haspelmath tarafından geliştirilmiş olan ve “Leipzig-Jakarta Listesi” (EK 1) olarak tesmim olunan 100 maddelik temel bir sözcük listesi oluşturulmuştur (bkz. Tadmor, 2009).
Bu listede 49 ad, 17 önad (sıfat), 24 eylem, 2 belirteç (zarf), 6 adıl ve 1 edat bulunmaktadır. Bu çalışma kapsamında tüm sözlüksel ögeler Levenshtein algoritması temelli olarak -makalede sayfa kısıtlamaları nedeniyle- incelenemeyeceğinden her bir dil bilgisi kategorisinden bir örnek çözümleme sunulmuştur.
Bu liste alan gezilerine başlamadan önce Behāristan köyünden kılavuz kişiler Omid (Afshin) Arabgol ve Azer Arabgol tarafından gözden geçirilmiş, değerlendirmelerden sonra sözlük maddeleri Farsçaya çevrilmiştir. Çeviriler Farsça yeterliği olan kılavuz kişilerce kontrol edilmiştir. Gerekli düzenlemeler yapıldıktan sonra liste, alt alan adlarının Loanword Typology (LWT) listesinde yer alış sırasına göre 6 gruba ayrılmıştır. Bu doğrultuda, fiziksel dünya, akrabalık, hayvan ve vücut bölümleri gibi somut sözcük ögeleri konuşurlarca kolayca görselleştirebilmesi amacıyla PowerPoint sunumu biçiminde hazırlanmıştır. Sözcük listelerinin ortaya çıkartılması için görsel ipuçları yanında soyut mefhumlar için Farsça karşılıkları sözlü ipucu olarak kullanılmıştır.
Bu amaçla bölgeden derlenen veriler LUA aracılığıyla incelenmiştir. Güney Azerbaycan Türkçesi değişkesi ile Halaç Türkçesi ağızları arasındaki LUA ile yapılan ölçümler birer kenar yükü ve ilgili değişke ve ağızlar birer köşe kabul edilerek Dijkstra algortiması yardımıyla kaynak olarak alınan bir ağızdan diğerlerine minimum yollar elde edilerek bu ağızlar arası bir ağaç oluşturulması hedeflenmiştir.
Veri Çözümleme Yöntemi I: Levenshtein Uzaklık Algoritması
Dilbilimde özellikle karşılıklı anlaşılırlık çalışmaları ve algısal çok dillilik temelinde de kullanılan bir metrik olan LUA, dil yakınlığı (İng. language proximity) veya iki dil değişkesi ve ağız arasındaki yakınlık/uzaklık durumunu ölçmek için kullanılmaktadır. Bu algoritma, ağız varyantlaşmasının saptanmasında dünya üzerinde birçok dile başarıyla uygulanmıştır: Hollandaca (Heeringa, 2004; Wieling vd. 2007), Sardunyaca (Bolognesi ve Heeringa, 2002), Norveççe (Gooskens ve Heeringa 2004), Almanca (Nerbonne ve Siedle, 2005) ve Bulgarca (Osenova vd. 2009). Geçmişe nazaran bilgiye çok daha kolay ulaşılan 21. yüzyılda bilgisayar ve genel ağ teknolojisinin dil ve dil verilerinin çözümlenip yorumlanmasına katkısı yadsınamaz bir gerçek olarak karşımıza çıkmaktadır. Bilgisayar ve genel ağ teknolojisinin temelinde yatan gerçek ise algoritmalardır. Anlaşılması güç ve zaman alan birçok problem, çok sayıda koşulun ve sorunun iç içe yer aldığı birçok problem algoritma şemalarına aktarılarak çözümlenebilir hale gelmektedir. Özellikle 21. yüzyılın bir konusu olan algoritmalar geçmişten günümüze daha net ve daha hızlı sonuçlar vermesi adına sürekli geliştirilmektedir. Bu bağlamda sayısallaştırılmış olan dil verilerinin algoritmik ölçümlerinin bilimsel nesnellik açısından sağladığı katkı göz ardı edilemeyecek denli önemli görülmektedir. Özellikle diyalektolojinin Avrupa ekolünün alanda uygulamaya geçirdiği ve geliştirmeye devam ettiği algoritma ve dizge düzen uzaklığı temelli çalışmaları bu alanda öncü rol oynamıştır.
Çalışmanın bu kısmında verili iki dizgi arasında, bir dizgenin diğer dizgeye dönüştürülmesi için minimum işlem sayısını veren LUA algoritması incelenmektedir. Algoritma adını 1965 yılında verili iki dizge arasındaki mesafeyi ölçen Sovyet matematikçi Vladimir Levenshtein’dan almıştır. Bir dizgeyi diğer bir dizgeye dönüştürmek için yapılabilecek işlemler ekleme, silme ve değiştirmedir. LUA algoritmasında birden fazla yöntem vardır. Bunlar arasında en sık kullanılanı dinamik programlama yöntemidir. Dinamik programlama yöntemi iki aşamadan oluşmaktadır. İlk aşamada verilen iki dizge arasında değerler matrisi oluşturulur. Bu adımda bir dizgenin diğer dizgeye benzemesi için kaç değişikliğe ihtiyaç duyulduğuna karar verilir. İkinci aşamada ise bu değişikliklerin nasıl tanımlanacağına karar verilir. Diğer bir deyişle ekleme, silme ve değiştirme işlemleri tanımlanır. Bu tanımlamada ilk sözcüğün ve ikinci sözcüğün son seslerinin LUA ölçümlerinden köşegen üzerinde geri izleme yapılır. Köşegen üzerinde değişmeyen ölçümler bir işlem yapılmaması gerektiği anlamına gelir. Köşegen üzerinde değişen ölçümler değiştirme işlemine, sola doğru azalan ölçümler silme işlemine ve yukarı yönlü azalan ölçümler ise ekleme işlemine karşılık gelir.
Algoritmanın uygulanmasında dizgeler çapraz olarak bir matrise yerleştirilir. Dizgelerin başına boş satır ve sütun açılır. Satır olarak yazılan dizgenin seslerine 1’den başlayarak numaralar verilir. Birinci sözcüğün ilk sesinden son sesine kadar her ses ikinci sözcüğün sesleri ile eşleştirilir. Eşleşmede eğer sesler aynı ise çaprazda bulunan sayının üstündeki, solundaki ya da sol üstteki sayıdan küçük olanı değer olarak alır, aksi takdirde sayının üstündeki, solundaki ya da sol üstündeki sayıların değeri 1 artar bu durumda küçük olanı değer olarak alır. Örneğin a dizgesi i sayıda ses ve b dizgesi j sayıda ses içersin. a ve b dizgeleri arasındaki matrisin (i,j) elemanının değerini veren LUA ölçümü aşağıdaki gibi verilebilir:
Genel olarak iki dizge arasındaki LUA ölçümü Şekil 2’de gösterilen algoritma ile verilir:
Şekil 2’de yazılmış olan algoritmada görüldüğü üzere, Levenshtein uzaklığının birkaç alt ve üst sınırı vardır. Bu sınırlar, en az iki dizginin farkı olarak bulunmaktadır. En fazla ise uzun dizginin uzunluğuna denk gelmektedir. Sadece iki dizgi birbirine eşitse sayısal değer sıfır olarak saptanmaktadır. Aynı dizgiler birbirine denkse ekleme, silme ve değiştirme işlemlerinden herhangi biri işlem değeri olarak kabul edilmemektedir. Ekleme, silme veya değiştirme gibi işlemlerin gerçekleştirildiği her bir adımda ise uzaklığın sayısal değeri 1 artmaktadır. Basit algoritmik işlemler açısından örneğin “[akar]”, “[eker]” dizgeleri arasındaki uzaklık 2’dir çünkü ilk ve ikinci /a/ sesleri /e/ sesleri ile değişmiştir. “[akar]”, “[akar]” dizgeleri arasındaki uzaklık ise 0’dır çünkü birbirlerinin aynı ses ve biçim özelliklerine sahip bu iki sözcüğün birbirlerine benzeşmesi için herhangi bir işlem yapılması gerekmemektedir. Dolayısıyla LUA algoritmasına göre bu iki dizge arasında herhangi bir uzaklık bulunmamaktadır. Bununla birlikte, aşağıda örneklendirildiği gibi, birtakım sözcükler arasındaki işlem farkları daha karmaşık olabilmektedir. Levenshtein algoritması, değişim değerini saptamak üzere iki boyutlu bir dizi temelinde sözcüklerin değişik olan sesleri için sayısal değerin artırımına gitmektedir. Bu bağlamda örnek olması için, Tablo 3, Halaç Türkçesinin farklı ağızlarında “yumurta” anlamına gelen [jumurta] dizgisi ile [numurqa] dizgisi arasındaki uzaklığın LUA temelinde çözümleme yolunu sunmaktadır.
Tablo 3 “yumurta” ve “numurqa” sözcükleri arasındaki mesafeyi LUA ölçümüne göre işlemsel olarak sunmaktadır:
Tablo 3’teki işlemin işaret ettiği üzere, “yumurta” ve “numurqa” dizgeleri arasındaki LUA ölçümü 2’dir.
Dinamik programlamada ikinci işlem, “yumurta” dizgesini “numurqa” dizgesine dönüştürmek için hangi işlemlerin yapılacağına karar vermektir. Bu sözcüklerin son seslerinin LUA ölçümünden köşegen üzerinde geri izleme yapılırsa iki defa ölçümde azalma görülür. Bunlar değiştirme işlemleri olarak tanımlanır. Şekil 3 ise, Güney Azerbaycan Türkçesinin Couzeh ağzı ile Halaç ağızları arasındaki sırasıyla Türkiye Türkçesinde
“bir” sayı önadı (GAT Couzeh: /bi:/; Halaç Türkçesi: /bi:/),
“ne” soru adılı (GAT Couzeh: /næ/; Halaç Türkçesi: /nɛsɛ/),
“ateş” adı (GAT Couzeh: /od/; Halaç Türkçesi: /huot/),
“düşmek” (GAT Couzeh: /diʃmæk/; Halaç Türkçesi: /tiʃmæk/) eylemi,
“ben” adılı (GAT Couzeh: /mæn/; Halaç Türkçesi: /mæn/) ve
“dün” (GAT Couzeh: /dʏnen/; Halaç Türkçesi: /ængir/) zaman belirteci anlamına gelen sözlüksel ögelerin program aracılığıyla işlem çözümleme sonuçlarını göstermektedir.
Veri Çözümleme Yöntemi II: Dijkstra Algoritması
Bilgisayar ve genel ağ teknolojisinin temelinde yatan algoritmalar insanoğlunun yaşamını kolaylaştırmakta ve teknolojik gelişmeler doğrultusunda algoritmaları geliştirme süreçleri devam etmektedir. Algoritmalar sonuç değil sonuca giden yolu veren şemalardır. Kullanılacak algoritmanın seçimi problemin türüne göre farklılık gösterir. 1959 yılında W. E. Dijkstra tarafından önerilen algoritmada verili köşeler arasında keyfi iki köşe arasındaki minimum uzunluk ya da belirli iki köşe arasındaki minimum uzunluğun bulunması amaçlanır. Dijkstra (1959) ve Whiting ve Hillier (1960) tarafından tanımlanan algoritmalar bu amaçla tanımlanan en verimli algoritmalardır (Dreyfus, 1969). Bu algoritmada köşeler ve köşeler arası kenarlar vardır, bu nedenle doğal olarak graflar üzerinde çalışılır. Kenarlar yönlü ya da yönsüz olabilir. Kenarlar pozitif yüklü olmalıdır. Negatif yüklü olması durumunda Dijkstra algoritması çalışmaz. Dijkstra algoritmasında köşeler geçici ve kalıcı değerler alır. Minty, Pollack ve Wiebenson tarafından Dijkstra algoritmasının uygulanmasında köşelerin kalıcı değerlerinin elde edilmesi için tanımlanmıştır (Dreyfus, 1969).
Dijkstra algoritmasında ilk önce kaynak bir köşe seçilir. Kaynak köşenin değeri 0 diğer köşelerin değerleri belirsiz olduğu için ∞ (sonsuz) değerini alır. Burada kaynak köşenin değeri kalıcı diğer köşelerin ∞ değerleri geçicidir. Kaynak köşeden grafın yönlenişine göre ulaşılabilecek olan ilk köşelere kenarlardaki yükler değer olarak atanır. Bu köşelere daha önce atanan ∞ değerleri ile yeni atanan değerler arasında kıyaslama yapılır, her türlü yeni değerler ∞’dan küçük olacağından yeni değerler olarak atanır. Grafın yönlenişine göre tüm graf dolaşılır ve verili iki köşe ya da kaynak köşeden diğer köşelere minimum uzunluklar hesaplanarak minimum yollar elde edilir.
Dijkstra algoritmasının akış şeması aşağıdaki gibi verilebilir:
a ve b birer köşe olmak üzere ikisi arasındaki uzaklık x(a,b) olsun. a Köşesinin değeri v(a) olmak üzere, Dijkstra algoritması köşeleri geçici ve kalıcı olarak etiketlediğinden a köşesinin etiket değerleri
olarak tanımlansın. Kaynak köşe s olmak üzere, v(a); s−a uzunluğunun en küçük değeri olarak tanımlanabilir. Eğer burada a’nın öncülü varsa
olarak alınsın.
1. Adım: Kaynak köşe için v(s)→0 ve l(s)=1 değerleri elde edilir.
Grafın diğer tüm a köşeleri için v(a)→∞, l(a) = 0, τ(a)→0 olarak bulunur.
d grafta bir köşe olmak üzere s→d olduğunu kabul edelim.
2. Adım: (d,a) kenarı için l(a)=0 ve v(a)>v(d)+x(d,a) olarak alınsın.
Buradan v(d)+x(d,a)→v(a),τ(a) → d elde edilir.
3. Adım: l(a*)=0,v(a*)<∞ ve v(a*)= minl(a)=0 {v(a)} koşulunu sağlayan a*bulalım. Böylece l(a*)→1 ve a*→d elde edilir.
Bu adımda verildiği şekilde a* köşesinin olmaması s‘den a’ya bir yönlü yol olmadığı anlamına gelir ve algoritmanın çalışması durdurulur.
4. Adım: h Bir köşe olmak üzere, eğer d ≠ h ise, 2. adıma gidilir.
5. Adım: Dur. (Ruohonen, 2008).
Graflar ve Uygulamaları Hakkında Bazı Bilgiler
Graflar köşeler ve kenarlardan oluşur ve Graf Teorisi’nin temelini oluşturur. Graf Teorisi’nin oluşturulmasında esas olarak birkaç varsayım ileri sürülür. Bunlardan ilki Platon’a dayandırılır. Platon’un düzgün cisimlerinin açılması sonucu köşeler ve köşeler arası kenarlar oluşur.
İkinci varsayım ise Euler’e dayandırılır. Kaliningrad kasabasından geçen Königsberg nehri üzerinde kurulan 7 (yedi) köprüden geçme olayına dayalı bir oyun, 1783 yılında matematikçi Euler tarafından “Königsberg’in 7 (yedi) köprüsü” isimli çalışmayla matematik literatürüne kazandırılmıştır. Buradaki oyun, “Köprünün bir köşesinden başlayarak ve geçilen bir köprüden tekrar geçilmeden aynı köşeye gelinebilir mi?” sorusuna yanıt bulmaya dayanmaktadır. Burada köprülerin uçları köşeler ve köprüler ile köprüler arası mesafeler kenarlar olarak temel alınmıştır.
Graf Teorisi’nde kullanılan bazı tanımlar aşağıdaki gibi özetlenebilir:
Bir kenarın iki ucunda yer alan noktalara köşe, iki köşe arasında yer alan uzunluğa ise kenar denir. Bir grafta eğer kenarlar yön bilgisi içeriyorsa yönlü graf, içermiyorsa yönsüz graf olarak adlandırılır. Bir grafta kenarların hepsi yön bilgisi içerir ya da hiçbirisi yön bilgisi içermez. Bir grafta, bir köşeden diğerine gidilirken izlenen kenarların toplamı yolu verir ve bir köşeden diğerine gidilirken minimum uzunlukların toplamı minimum yolu verir. Grafta mevcut bir köşeden başlayıp yine aynı köşeye dönen ve bir köşeden iki kez geçmeyen grafa döngü denir. Döngü içermeyen bir grafa ise ağaç denir.
Örnek. Tablo 1’de verilen Halaç Türkçesi ve Güney Azerbaycan Türkçesi ağızları arasındaki diyalektik farklar yüz (100) sözcük üzerinden LUA algoritmasına göre ölçülmüştür. İki ağız arasındaki fark ise
aritmetik ortalaması ile hesaplanmıştır.
Veri Analizi: Levenshtein ve Dijkstra Algoritması Çözümlemeleri
Buradan ilgili ağızlar arasındaki LUA algoritmasına göre ölçülen ağız farkları Tablo 4’te gösterildiği şekilde hesaplanmıştır:
Tablodaki veriler ışığında, Levenshtein algoritmasına göre Couzeh ağzına sözlüksel uzaklığın en az olduğu Halaç Türkçesi ağzının Muşekiye (kuzey doğu) ağzı (LUA=1,99) olduğu görülmektedir. Sonrasında Couzeh ağzına en çok yakınsayan ağız LUA=2,04 sonucuyla Karasu (ana ağız) ağzı olarak saptanmıştır. Beharistan (merkezi ağzı) ağzı ile Couzeh ağzı uzaklık sonucu 2,14 olarak belirlenmiştir. Mensurabad (merkez doğu) ağzı (LUA=2,35) ve Şaneg (güney) ağzı (LUA=2,38) birbirine yakın değerlerle sözlüksel uzaklık bağlamında Couzeh ağzı ile göreceli olarak uzaklaşırken Mehr-i Zemin (kuzey) (LUA=2,48) ve Kheltabad (batı) (LUA=2,54) ağızları ise en uzak ağızlar olarak hesaplanmıştır. Levenshtein algoritması iki dizge arasındaki farkı ve/ya benzerliği incelediği için bu çözümlemede çok boyutlu çözümleme ile tüm Halaç Türkçesi ağızlarının Couzeh ağzı ile ilişkisini tespit etmek üzere söz konusu veriler Dijkstra algoritmasıyla da incelenmiş ve graf örneği çıkartılmıştır. Burada vurgulanması gereken nokta Levenshtein algoritması iki ağız arasındaki uzaklığı ortaya çıkartırken Dijkstra algoratması ise GAT değişkesi Couzeh merkezinde yedi Halaç Türkçesi ağzı arasındaki ilişkiyi incelemektedir.
Bu bağlamda öncelikle bu çalışmada, Tablo 4’te sunulan verilerin Dijkstra algoritmasına uyarlanması için ağızlar köşe, ağızlar arası farklar ise iki köşe arası kenarlar olarak alınmıştır. Bu minvalde Dijkstra algoritması temelinde Tablo 4’te sunulmuş olan Halaç Türkçesi ağızları ve GAT ağzı Couzeh arasında toplam 28 yol vardır. Bu çalışmada bu yollardan sadece 10 tanesi kullanılarak Şekil 4’te örneklendirilen bir graf örneği oluşturulabilir. Bu oluşturulan grafta ağızların konuşulduğu konumlar -bu çalışmanın odağı coğrafi uzaklığın ağız ilişkisi olmadığından dolayı- dikkate alınmadığı için graf herhangi bir geometrik şekil ifade etmemektedir.
Şekil 3’te işlemlenmiş olan Dijkstra algoritmasında merkez olarak bir Güney Azerbaycan Türkçesi değişkesi olan Couzeh ağzı temel alınmıştır. Bu temel çerçevesinde Dijkstra algoritması temelli işlem adımları şu şekilde oluşmuştur:
1. Adım: Dijkstra algoritmasının uygulanmasından Couzeh ağzının köşe değeri 0, Couzeh ağzından doğrudan ulaşılabilen ağızların değerleri LUA algoritmasına göre aralarındaki ölçülen değerlerdir. Couzeh ağzı ile doğrudan bağlantılı olmayan ağızlar ise ∞ değerini alır. Sonsuz ifadesi henüz yolun minimal uzaklığının saptanmadığı anlamına gelir. O halde aşağıdaki tablo verilebilir:
2. Adım: Couzeh ağzı ile Muşekiye ağzı arasındaki uzaklığa bakıldığında Muşekiye ağzından doğrudan ulaşılabilen ağızlar Couzeh, Karasu ve Beharistan ağızlarıdır (bkz. Şekil 4). Muşekiye ve Couzeh ağızları arası fark 1,99 dur. Fakat daha önce Couzeh ağzı 0 değeri aldığından ve yeni değer 0<1,99 olduğu için Couzeh ağzının köşe değerini artıracağından Couzeh ağzı için köşe değeri değiştirilmez.
Bu bağlamda, Muşekiye ağzından Karasu ağzına gidilmesi için farklar toplamı Couzeh-Muşekiye-Karasu arası farklar toplamı olup bu değer 1,99+0,86=2,85>2,04 olarak karşımıza çıkar ve yeni değer Karasu köşesinin değerini artırır dolayısıyla bu ağızda işlem yapılmaz.
Muşekiye ağzından doğrudan ulaşılabilen Beharistan ağzına uzaklıklar toplamı 1,99+0,95 = 2,94 < ∞ olduğundan Beharistan köşesinin yeni değeri 2,94 olarak karşımıza çıkar. Bu işlemler sonucunda adım değerleri Tablo 6’da gösterildiği biçimde güncellenebilir:
3. Adım: Muşekiye ağzı ile Beharistan ağzı arasındaki uzaklık incelendiğinde Beharistan ağzından doğrudan ulaşılabilen ağızlar Şanegh ve Kheltabad ağızlarıdır. Şanegh ağzı için kenarlar Couzeh-Muşekiye-Beharistan-Şanegh olup bu ağızlar arasındaki farklar toplamı 1,99+0,95+1,52 = 4,46 < ∞ olup Şanegh ağzının yeni değeri 4,46 olarak karışımıza çıkar.
Kheltabad ağzı için ise kenarlar Couzeh-Muşekiye-Beharistan-Kheltabad olup bu ağızlar arasındaki farklar toplamı 1,99+0,95+1,14 = 4,08 < ∞ olup Kheltabad ağzının yeni değeri 4,08 olur. Böylece bu hesaplar sonrasında ortaya çıkan adım değerleri tablosu aşağıdaki gibi güncellenebilir:
4. Adım: Beharistan ağzı ile Kheltabad ağzı arasındaki uzaklık incelendiğinde Kheltabad ağzından doğrudan ulaşılabilen ağız Mehr-i Zemin’dir. Mehr-i Zemin için kenarlar Couzeh-Muşekiye-Beharistan-Kheltabad-Mehr-i Zemin olup bu ağızlar arasındaki farkın toplamı 1,99+0,95+1,14+1,28=5,36 < ∞’dur. Buradan Mehr-i Zemin için yeni değer 5,36 olur ve bu ağza ilişkin bilgiler Tablo 8’deki gibi güncellenir:
5. Adım: Mehr-i Zemin ağzından ulaşılabilen tek ağız Mensurabad’dır. Mehr-i Zemin’in değerinin 5,36 olduğu dikkate alınırsa Mensurabad köyünün değeri 5,36+1,24=6,6 olur. Mensurabad’ın değeri daha önce 2,35 olarak bulunmuştu. Bu değer ilk değerden büyük olduğundan işlem yapılmaz.
6. Adım: Mensurabad ağzı açısından durum incelendiğinde bu ağızdan doğrudan ulaşılabilen ağızlar Couzeh ve Karasu ağızlarıdır. Mensurabad ile Couzeh ve Karasu ağızları arasındaki uzaklık farkının toplamı ise Couzeh ve Karasu ağızlarının değerlerini artırır. Dolayısıyla işlem yapılması mümkün olmaz.
7. Adım: Bu işlemler içerisinde yukarıda 2. adımda Couzeh ağzı ile Muşekiye ağzı arasındaki uzaklık hesaplanmıştı. Bu adımda da Couzeh ağzı ile Karasu ağzı arasındaki uzaklığın incelendiği durumda Karasu ağzından doğrudan ulaşılabilen Couzeh, Muşekiye ve Mensurabad ağızlarına değerler daha önce ulaşılan değerlerden büyük olacağından bu noktada işlem yapılmaz.
8. Adım: Burada da yine bu işlemler içerisinde yukarıda 2. adımda Couzeh ağzı ile Muşekiye ağzı arasındaki uzaklık hesaplanmıştı. Bu adımda da Couzeh ağzı ile Mensurabad ağzı arasındaki uzaklığın hesabında Mensurabad ağzından Mehr-i Zemin ve Karasu ağızlarına gidilebilir.
Karasu için elde edilen yeni değer ilk değerden büyük olacağından işlem yapılması mümkün görünmemektedir.
Mehr-i Zemin ağzı için ise Couzeh-Mensurabad-Mehr-i Zemin ağızları arasındaki farkın toplamı 2,35+1,24=3,59 olup ilk değerden küçüktür. Bu Mehr-i Zemin için yeni değer anlamına gelmektedir.
Dolayısıyla tablo aşağıdaki şekilde güncellenmiştir:
9. Adım: 3. Adımda Muşekiye ağzından Beharistan ağzına minimal uzaklık ölçülmüştür. Bu adımda Muşekiye ağzı ile Karasu ağzı arasındaki uzaklık ölçüldüğünde ve Muşekiye’den Karasu ağzına ulaşılmaya çalışılması durumunda 7. adımda olduğu gibi Karasu ağzından doğrudan ulaşılabilen Couzeh, Muşekiye ve Mensurabad ağızlarındaki değerler daha önce ulaşılan değerlerden büyük olacağından bu noktada da işlem yapılmaz.
Tüm bu veriler ışığında Dijkstra algoritması çözümlemesi sonucunda ağızlar arasındaki ilişki tüm işlemlerin neticesinde elde edilen son adımda Şekil 4’te ulaşılabilen ağaç grafiğiyle somutlaştırılmıştır:
Şekil 4’te ortaya çıkan ağaç, Şekil 3’te sunulmuş olan grafın Dijkstra algoritmasına uygulanmış adımlarının neticesidir.
Tartışma ve Sonuç
Bu çalışma, İran’ın Merkezī ve Kum vilayetlerinde konuşulmakta olan iki Türk dili değişkesinin -Halaç Türkçesi ve Güney Azerbaycan Türkçesisözlüksel uzaklığını Leipzig-Jakarta çekirdek sözcük listesindeki (Tadmor ve Haspelmath, 2009) maddeler temelinde ağız ölçümsel (diyalektometrik) ve algoritmik yöntemler ışığında saptamayı amaçlamıştır.
Bu bağlamda Levenshtein uzaklık algoritması temelinde GAT Couzeh ağzının Halaç Türkçesi ağızları arasındaki uzaklığı şu sırayla ortaya çıkmıştır:
Muşekiye (kuzey doğu) ağzı: d(Couzeh,Muşekiye) =1 ,99;
Karasu (ana ağız) ağzı: d(Couzeh,Karasu) = 2.04;
Beharistan (merkezi ağzı) ağzı: d(Couzeh,Beharistan) = 2,14;
Mensurabad (merkez doğu) ağzı: d(Couzeh,Mensurabad) = 2,35;
Şanegh (güney) ağzı: d(Couzeh,Şanegh) = 2,38;
Mehr-i Zemin (kuzey) ağzı: d(Couzeh,Mehr-i Zemin) = 2,48;
Kheltabad (batı) ağzı: d(Couzeh,Kheltabad) = 2,54.
Bu çözümlemede Couzeh ağzı ile Halaç Türkçesinin Muşekiye (kuzey doğu) ağzı (=1,99) arasındaki sözlüksel uzaklık en az iken Kheltabad ağzı ile uzaklığın en çok (=2,54) olduğu belirlenmiştir. Batı ağzının konuşulduğu bölge her ne kadar İran’da Azerbaycan Türkçesinin konuşulduğu bölgeye yakın olsa da Couzeh ağzı ile uzaklığı daha çok hesaplanmıştır. Bu durum Couzeh ağzının Halaç Türkçesi konuşulan bölgenin ortasında kalmasından kaynaklanmış olabilir. Couzeh’nin bu konumda olması Halaç Türkçesinin kenarda kalan ağızları ile uzaklığının daha fazla olmasında da etkili olmuş olabilir
Halaç Türkçesi ağızlarının Couzeh ağzı ile ilişkisini tespit etmek üzere söz konusu Levenshtein algoritma verileri sonrasında Dijkstra algoritmasıyla da incelenmiş ve ilişkili graf örneği (bkz. Şekil 3) ağaç (Şekil 4) çıkartılmıştır. Burada vurgulanması gereken nokta Levenshtein algoritması iki ağız arasındaki uzaklığı ortaya çıkartırken Dijkstra algoritması ise GAT değişkesi Couzeh merkezinde yedi Halaç Türkçesi ağzı arasındaki ilişkiyi incelemektedir. Dolayısıyla bu çalışma, üç ve üzeri değişkenin arasındaki ilişkinin incelenebilmesi için Dijkstra algoritmasının ağız çalışmalarına uyarlanmasının bir örneğini teşkil etmiştir. Bu yönüyle söz konusu bu çalışma çağdaş Türk lehçelerinin ağızları arasındaki uzaklığı ve algoritmik ilişkilerini disiplinlerarası bir yaklaşımla çözümlemeyi amaçlaması bağlamında yenilikçi bir yaklaşım benimsemiştir. Tüm bu veriler ışığında Dijkstra algoritması çözümlemesi sonucunda ağızlar arasındaki ilişki tüm işlemlerin neticesinde elde edilen son adımda ulaşılabilen ağaç grafiğiyle somutlaştırılmıştır:
Bu yönüyle son dönemde algoritma temelli incelemelerin ağız ölçümsel (diyalektometrik) incelemeleri, hızla gelişmekte olan yapay zekâ (İng. artificial intelligence) çalışmalarıyla desteklenmeye açık hâle gelecektir. Bu çalışma; Türk dili, matematik ve yapay zekâ disiplinlerini dil inceleme alanına tanıtma potansiyeline sahip olması açısından özgün bir yere sahiptir.
Kaynakça
Anonby, E. (2012). Lori language ii. Sociolinguistic Status of Lori. Encyclopædia Iranica. https://iranicaonline.org/articles/lori-language-ii
Bolognesi, R. ve Heeringa, W. (2002). De invloed van dominante talen op het lexicon en de fonologie van Sardische dialecten. Gramma/TTT, 1: tijdschrift voor taalwetenschap, 9(1), 45-84.
Çam, A. (2021). Şahseven Türkçesi [Yayımlanmamış doktora tezi]. İstanbul Kültür Üniversitesi.
Dijkstra, E. W. (1959). A note on two problems in connexion with graphs. Numerische Mathematik, 1, 269-271.
Doerfer, G. Hesche, W., Scheinhardt, H. ve Tezcan, S. (1971). Khalaj materials. Indiana University Press.
Doerfer, G. (1987). Lexik und Sprachgeographie des Chaladsch. 2 Volumes. Harrassowitz.
Doerfer, G. (1988). Grammatik des Chaladsch (Turcologica 4). Harrassowitz.
Doerfer, G. (1998). Turkic languages of Iran. L. Johanson & É. Á. Csató (Eds.) içinde, The Turkic Languages (s. 273-282). Rotledge.
Dreyfus, S. E. (1969). An appraisel of some shortest-path algorithms. Operations research, 17, 395-412.
Eberhard, D. M., Gary F. S. & Charles D. F. (Eds.). (2022). Ethnologue: Languages of the world. Twenty-fifth edition. SIL International. Online version: http:// www.ethnologue.com.
Goebl, H. (1982). Dialektometrie; Prinzipien und Methoden des Einsatzes der Numerischen Taxonomie im Bereich der Dialektgeographie. Akademie der Wissenschaften.
Goebl, H. (2017). Dialectometry. Ch. Boberg, J. A. Nerbonne & D. Watt (Eds.), The Handbook of Dialectology içinde (s. 123-142). Wiley-Blackwell.
Gooskens, C. & Heeringa, W. (2004). Perceptive evaluation of Levenshtein dialect distance measurements using Norwegian dialect data. Language Variation and Change, 16(3), 189-207.
Gudschinsky, S. C. (1956). The ABC’s of lexicostatistics (glottochronology). Word, 12(2), 175-210.
Haspelmath, M. & Tadmor, U. (Eds.). (2009). Loanwords in the World’s Languages: A Comparative Handbook. Walter de Gruyter. https://doi. org/10.1515/9783110218442.55
Heeringa, W. J. (2004). Measuring dialect pronunciation differences using Levenshtein distance. Unpublished Doctoral Dissertation. University Library Groningen.
Heeringa, W. & Prokić, J. (2017). Computational dialectology. C. Boberg, J. A. Nerbonne, & D. Watt (Eds.), The Handbook of Dialectology içinde (s. 330- 347). Wiley-Blackwell.
Kuribayashi, Y. (2012). Grammaticalized topics in Kashkay: The implication for the relativization of Turkic languages. Studia Uralo-Altaica, 49, 311-318.
Minorsky, M. (1940). The Turkish Dialect of the Khalaj, Bulletin of the Society of Oriental and African Studies 10, 417-37.
Moġäddäm, M. (1318). Guyešha̬-ye Wäfs wä Täfräš, Ira̬n-Kudé 11 (Teheran, h.š.).
Nerbonne, J. & Heeringa, W. (2010). Measuring dialect differences. P. Auer & J. E. Schmidt (Eds), An International Handbook of Linguistic Variation. Theories and Methods Volume 1 içinde (s. 550-566). De Gruyter Mouton. https://doi. org/10.1515/9783110220278
Nerbonne, J. & Siedle, C. (2005). Dialektklassifikation auf der Grundlage aggregierter Ausspracheunterschiede. Zeitschrift für Dialektologie und Linguistik, 129-147.
Osenova, P., Heeringa, W. & Nerbonne, J. (2009). A quantitative analysis of Bulgarian dialect pronunciation. Zeitschrift für slavische Philologie, 66(2), 425-458.
Séguy, J. (1973). La dialectométrie dans l’Atlas linguistique de la Gascogne. Revue de linguistique romane, 37, 1-24.
Ruohonen, K. (2008). Graph theory. Tampere University of Technology.
Szmrecsanyi, B. (2013). Grammatical variation in British English dialects: A study in corpus-based dialectometry. Series: Studies in English Language. Cambridge University Press.
Tadmor, U. (2009). Loanwords in the world’s languages: Findings and results. M. Haspelmath & U. Tadmor (Eds.), Loanwords in the World’s Languages: A Comparative Handbook içinde (s. 55-75). Walter de Gruyter. https://doi. org/10.1515/9783110218442.55.
Tekin, T. (1989). Türk dili diyalektlerinin yeni bir tasnifi. Erdem, 5(13), 141-168.
Whiting, P. D. & Hillier, J. A. (1960). A method for finding the shortest route through a road network, Operations Research Quarterly, 11, 37-40.
Wieling, M., Prokić, J. & Nerbonne, J. (2009). Evaluating the pairwise string alignment of pronunciations. Proceedings of the EACL 2009 Workshop on Language Technology and Resources for Cultural Heritage, Social Sciences, Humanities, and Education (LaTeCH–SHELT&R 2009) içinde (s. 26-34).
Windfuhr, G. (Ed.). (2009). The Iranian languages. Routledge.
Windfuhr, G. & Perry, J. R. (2009). Persian and Tajik. G. Windfuhr (Ed.) içinde, The Iranian Languages (s. 416-545). Routledge.