Twitter'ın Türkçe Canavarı ile tanıştınız mı?

Abone ol

Twitter'da Türkçe imla hatalarını düzelten bir hesap var: @TurkceCanavari. Rengin Arslan, hesabın yaratıcısı Batuhan Kantarcı ile konuştu.

Sosyal medyada yazarken dili özenli kullanmaya dikkat ediyor musunuz? Ya da bir yazım yanlışı yaptığınızda sizi uyaran arkadaşlarınız var mı? Ya da ayıplayanlar?

Yaklaşık beş yıldır Twitter kullanan biri olarak kendimi tutamayıp en az beş kere "doğru ayrılmamış -de -da" ekleri konusunda arkadaşlarımı uyardığımı itiraf etmeliyim.

Fakat Twitter'ın "hata bulan insanı" olmayı kim ister? Bir süre sonra "mütevazı" kelimesinin doğru yazılamamasına alışmasanız bile kızmamayı öğreniyorsunuz.

Sosyal medyanın çok rahat bir ortam olduğunu, Türkçe'yi en iyi haliyle kullanmaya çabalamanın anlamlı olmadığını düşünlerin sayısı az sayılmaz.

Türkçe'de gittikçe yaygınlaşan ve yaygınlaştığı oranda "doğru" kabul edilmeye başlanan kullanımlara sık sık rastlanıyor artık.

Bazıları bunu "Twitter dili" olarak kullanırken, bazıları kelimelerin doğru yazılışlarını gerçekten bilmiyor.

Bunları birbirinden ayırt edemese de, asla kaçırmayan robot bir hesap var Twitter'da.

Bu hesap birine ait ama düzeltmeleri otomatik olarak gönderiyor.

Yaklaşık 100 kelimelik bir listesi var ve bu kelimelerde yapılan pek çok yazım hatasını yakalayıp, bu hatalı kelimeyi yazan kişinin o tweetine yanıt olarak kelimenin doğru yazılışını gönderiyor.

Örneğin "bir de" yerine "bide"; "bir şey" yerine "birşey" yazdıysanız bu sistemin mesajlarıyla karşılaşmış olmanız muhtemel.

Her gün binlerce yanlış yazım

Hesabın adı da yaptığı iş gibi. Pek sevimli sayılmaz: @TurkceCanavari. Bir de internet sitesi var. "Canlı yayın"da içinde yanlış kelime geçen tweetleri yayımlıyor.

Bazen aynı anda o kadar çok hatalı kelime içeren tweet atılıyor ki, akışı takip etmek zorlaşıyor.

Bir de sayacı var: Üç ay önce açılan sistem, bu kadar kısa bir sürede yaklaşık 2,5 milyon hatalı kelime içeren mesaj yakalamış.

Ama elbette bu robot hesabın ve sistemin arkasında arkasında bunu tasarlayan biri var: 22 yaşındaki bilgisayar mühendisliği öğrencisi Batuhan Kantarcı.

Buluşmaya gitmeden önce, elinde Büyük Türkçe Sözlüğü bulmayı mı yoksa koltuğunun altında bir bilgisayar görmeyi mi umduğumu soruyorum kendime.

Bilgisayara yüzde 51 ihtimal vermiştim, öyle de oluyor, bilgisayarı ile geliyor.

Önce böyle bir hesabı açmaya, bu siteyi kurmaya nasıl karar verdiğini soruyorum.

Batuhan okulda teorik olarak öğrendiği her şeyi hayata geçirmek için çeşitli programlar yazmayı sevdiğini söylüyor.

Yine böyle bir gün okulda geldiğinde kardeşinin yakınmasıyla karşılaşmış: "Kardeşim Seydihan yeni medya bölümünde okumak için üniversite sınavlarına hazırlanıyor. Şu an sürekli test çözüyor. Testlerde ve sınavda tabii ki anlatım bozukluğu, yazım yanlışı soruları soruyorlar. Ama bir yandan yakınıyordu, 'Kimsenin umurunda değil bu hatalar, niye soruyorlar' diye. Bunu dediğinde ben de öğrendiğim bir tekniği uygulamaya karar verdim."

Mobil cihazlardan gönderilen tweetlerde daha çok hata var

Sistem yakaladığı her tweete uyarı göndermiyor. Bu kadar çok sayıda mesaj atmak Twitter tarafından engelleniyor çünkü, günlük bir sınırı var hesabınızdan atabileceğiniz mesajların.

Bu nedenle bazen 10, bazen 15, bazen 20 yanlışta bir otomatik olarak düzeltme tweeti gönderebiliyor.

Batuhan'ın aktardığı verilere göre Twitter'da yanlış yazılan ilk beş kelime "- bide, birşey, herşey, saol ve hergün."

Hatalı tweetlerin büyük çoğunluğu ise mobil cihazlardan atılmış.

Bugüne kadar tespit edilen 2,5 milyon tweetin 1 milyon 750 bini, hataların mobil cihazlarda daha yaygın olduğunu gösteriyor.

Batuhan'ın kendisi ise Türkçeyi özenli kullanmaya dikkat eden biri olsa da, pek çoklarının düşünebileceği gibi bir dil bilgisi veya yazım gurusu değil.

Bazı kelimelerin doğru yazılışlarını bu sistemi kurarken öğrendiğini söylüyor. Kendisinin yanlış yazılmasından en şikayetçi olduğu kelime ise "eşofman".

Batuhan, "Nasıl oluyor da eşortman yazıyorlar inanamıyorum!" diyor. Bir diğeri ise "felan".

'Rezil ettin beni'

Sistemin sanal bir zekası olmadığı için örneğin -de -da eklerinin doğru ayrılıp ayrılmadığını ve aynı şekilde soru eklerini de algılayamıyor.

Peki ya tepkiler?

"Arkadaşlarım hiç sevmiyorlar bu hesabı. Onların yanlışlarını düzelttiğim zaman kızıyorlardı. Örneğin birbirleriyle sohbet ediyorlar. Araya Türkçe Canavarı giriyor. O zaman çatıyorlardı bana" diyor.

Bu yüzden onların hesaplarına tweet göndermeyi engellemiş sistemin içinde.

Türkçe Canavarı ile tanışan ama Batuhan'ı tanımayan çoğunluğun ise tepkileri çeşitli.

"Bazıları gerçekten rencide oluyor" diyor Batuhan: "Örneğin hoşlandığı bir kız var ve ona bir şey yazarken hata yapmış, sistem onun hatasını düzelten tweet atmış ama hoşlandığı kız da görüyor. 'Rezil ettin beni' diye yanıt yazdı hesaba."

İnsanların yanlışlarının görünür olmasından hoşlanmadıklarını ve bunun anlaşılabilir olduğunu da söylüyor. "Twitter birbirini takip etmeyen insanlara da 'direkt mesaj' atmaya izin verseydi oradan uyarı göndermeyi tercih ederdim" diyor.

Düzeltmeye teşekkür edenlerin sayısı da hiç az sayılmaz.

Yanlış yazıma dikkat çeken insanların, "Böyle yazılmamalı" dedikleri örnekleri yakalayıp onlara uyarı gönderdiğinde tepki alıyor. Örneğin, "orjinal değil, onun doğrusu orijinal" diye tweet atan birine de uyarı gönderebiliyor.

O zaman Twitter kullanıcıları "Ben de tam onu diyordum!" diye yanıt verebiliyor. Bu, sistemin bir eksiği olarak görülebilir.

Binlerce hesaptan saldırı

Ayrıca bir kere de "insan olmayan bot hesaplar" tarafından saldırıya uğramış sistem.

"Nasıl oldu bu saldırı?" diye sorduğumda Batuhan, "Aynı anda binlerce hesaptan yanlış yazılmış kelime içeren binlerce tweet atıldı ve sistem neredeyse kilitlenmek üzereydi" diyor. Böyle bir saldırı ile niye karşılaştığını ise hâlâ anlamıyor.

Peki yarattığı sistem ve attığı mesajlar gerçekten karşılık buluyor mu? "Selam, şu kelime(ler)de hata yapmışsın. Umarım düzeltirsin :)" mesajını ciddiye alanlar da var mı?

Batuhan, Türkçe Canavarı'nın gönderdiği bu mesaj üzerine, tweetini silip, yanlış yazılmış kelimeyi düzelterek tweeti tekrar atan kişilerin de olduğunu söylüyor. Teşekkür edenlerin de.

Sistemdeki sayaç 10 milyon hatayı tespit ettiğinde bir analiz yapacak olan Batuhan, kaç kişinin bu uyarı üzerine tweetini sildiğini de yayımlayacak.

Şu ana kadar Türkçe Canavarı ile karşılaşmadıysanız dört seçenek var: Ya Twitter kullanmıyorsunuz, ya tweet yazarken hata yapmıyorsunuz, ya Türkçe Canavarı'nın yaygın yanlışlar olarak tespit ettiği kelimelerden birinde hata yapmadınız, ya da sistemin yüzlerce tweet atmasını engelleyen Twitter sayesinde bu hatanın yüzünüze vurulmasından kurtuldunuz.

Batuhan'ın şu ana kadar sağladığı istatistikler bile kıymetli ama bakalım sayaç 10 milyona vardığı zaman, Twitter'ı en çok kullanan ülkeler arasında olan Türkiye'nin en azından belli kelimeler açısından yazım bilgisi karnesi ne olacak?

Günün Önemli Haberleri