Web Analytics
Kelime Korsanı | Can Başkent

Can Başkent

KELİME KORSANI

Can Başkent

Manifold'da dil üzerine birkaç defa yazdım [1]. Çünkü benim açımdan meselenin ilgi çeken yanı, dil ile matematik arasındaki benzerlik. Dahası, bizimki gibi devlet müdahalesine alışık bir dil, siyasi açıdan da ilgimi çekiyor. Çünkü, memleketin siyasi tarihini dil ve dil kullanımı üzerinden okumak mümkün.

Dile dair tüm eşelemelerimde daima bir duvara tosladım durdum. Türkçenin sentaksından tutun da, onomastiğe, adımın ne zaman ortaya çıktığını öğrenme merakıma, dek tosladığım bu duvarın adı devletti. Adımın ne zaman ortaya çıktığını sordum, tosladım. Adımın, beynelmilel bağlamlarda nasıl yazılması, okunması gerektiğini sordum, tosladım. Bu toslamalarla beraber, adımın Türkçedeki tarihine, onomastiğe ilgim arttı giderek.

Nişanyan yakın bir zamanda bu soruna harika bir çözüm üretti. Nişanyan Adlar Sözlüğü çevrimiçi yayına başlamış [2]. Duvara toslamaya alışığım ya, ilk aklıma gelen bu veritabanını nasıl edinildiğiydi. Türkiye’de insan isimlerinin frekansına ve tarihçeine zira erişmek mümkün değil. Ben bu duvara tosluyorsam, Nişanyan hayli hayli toslar diye düşünüyordum ne de olsa.

Sorunun cevabını Nişanyan vermiş, alıntılamadan duramayacağım [2]:

“Nüfus kayıtları resmi kaynaklarca yayınlanmamıştır. Ancak 2009 yılında, o tarihte 18 yaşını doldurmuş olan tüm TC vatandaşlarının nüfus bilgileri internete sızdırılmıştır. Sitede kullandığımız veriler, güvenilir nitelikte olduğu kanısına vardığımız bu kaynağa dayalıdır.”

Dolayısıyla, Türkiyenin ve Türkçenin ilk onomastik sözlüğünü mümkün kılanlar (Nişanyan’ın yanında) bir avuç hacker. Hatırlarsınız, bu hackerlar sayesinde kimlik numaraları dahil nüfus idaresinin genişçe bir veritabanı internete sızdırılmıştı, kolayca torrent ağından indirilebiliyordu. İroni gerçekten trajik. Muazzam bir eser, kimlik numarası çalmaya çalışanların işleri sonucu ortaya çıkmış.

Bu basit anekdot, dilin ne kadar politik olduğunu bize tekrar hatırlatıyor. Bilhassa onomastik meselesinde, isimlerin frekansını ve tarihçesini devlet duvarı bize açıklamıyor. Bu devasa veritabanını işlemediği gibi, kimsenin de işlemesine izin vermiyor. Bu veritabanını koruyor. Daha doğrusu koruduğunu sanıyor. Onbir yıl önce hackerlar bu veritabanını çalıyor, torrent ağlarında “paylaşıma” açıyor. Duvar, böyle bir şey olmamış gibi davranıyor. Binlerce, belki onbinlerce kişi bu veriyi indiriyor. Farklı farklı meraklarla bu veritabanını işlemek isteyenler de, hackerlardan medet ummak zorunda kalıyor. Çünkü memleketteki her ilerleme duvara rağmen oluyor. O duvara kafa ata ata oluyor.

Matematiksel düşünce, daha doğrusu algoritmik düşüncenin memlekette ilerlemesi de benzer bir döngü takip ediyor. Düşünerek, elde kalem kağıt kimi kavramsal sorunları çözmeye çalışıyorsanız, yine bir duvara tosluyorsunuz. Trafik sorunundan tutun da, gelir dağılımını ve vergi sistemini düzeltmeye çalışanlara dek, türlü türlü örnek akla geliyor. Keza veri madenciliğini de bir dilbilimci yapıyor. Çünkü, bir üniversitede falan çalıntı verilere dayanarak bilim yapmak isteseniz, ne kadar işlevseller tahmin etmek zor elbette aslında, etik komisyonundan onay almak imkansız olacak.

Veriyle ilişkimiz çarpık. Eldeki yasal ve etik veriler bir işe yaramıyor. Manalı bir proje üretmek istiyorsanız “bir şekilde” verilere ele geçirmeniz gerekiyor. Bu korumacılık, dedim, memlekette bir geleneksel siyaset yapma şekli. Çünkü mülk devletin. Çünkü biz mülkümüze sahip çıkmıyoruz.

Verinin yeniçağda sadece bir değer (para) değil, bir siyaset aracı (yani iktidar) olduğunu görmek zor değil. Veriye sahip olan zenginleşir, veriye sahip olan yönetir.

Bu meseleyi çözmek isteyen özyönetimcilerin veriyi kamusallaştırması gerekecektir. WikiLeaks’ten biliyoruz, bu kamusallaşmanın da zararları ve riskleri var, insan hayatını tehdit edecek kadar. Zaten verinin iktidara dönüşmesi, iyi niyetli ellerde olsa dahi, burada tekrar beliriyor. Hangi verinin ne kadar kamusallaşması gerektiğine karar vermek, yeni duvarlar, yeni devletler yaratacaktır. Yeni bir şey söylemiyorum aslında, veri güçtür.

Veriyi güç yapan aslında, mercimekle, mercimek köftesi arasındaki ilişkiye benzer. Liberaller bu emeği, sahiplenmenin temelinde görür. Mercimek tabiatındır, ama çorba yaparsan, çorba senindir.

Bu mantıktan kaçış yok. Veriyi, işleyenlerin sahiplenmesinin riski tam da bu. Buna en güzel cevabı Nişanyan vermiş. Adlar Sözlüğü kullanıma tamamen açık, ücretsiz. Aylarca, belki yıllarca süren bir emeğin doğru dürüst bir maddi karşılığı olmayacak. Dahası veri başkalarının kullanımına da uygun olacak.

Verileri paylaşmak bizi komünizme mi yaklaştırdı yoksa?

Notlar

1. “4982’in 7, 9 ve 21’i, 6698’in 4, 5, 6 ve 8’i”, CB, Manifold, https://manifold.press/4982-in-7-9-ve-21-i-6698-in-4-5-6-ve-8-i ve “Kutu Kola”, CB, Manifold, https://manifold.press/kutu-kola

2. turkadlar.com

Kullandığımız tek çerez, anonim ziyaretçi istatistikleri içindir. Bu site hiçbir kişisel veri toplamamaktadır.

The only cookie we use is for visitor analytics. We do not collect any personal information at all.