Doğal Dillerin Geometrisi

Her cümle aslında kelimelerden kelimelere bir yolculuk:

wordnw1Cümleleri peşpeşe ekleyerek yazıp çizdiğimiz düşünceler, hikayeler de aslında kelimeler uzayında bazı kelimeleri birbirine bağlayarak oluşturduğumuz kelime ağları.

 

 

nw2

Bu yüzden her hikayenin, her düşünce akışının bir geometrisi var. E o zaman bir metnin içerisinde gizli anlamlar dünyasını matematiğe çekip orada deşifre etmek mümkündür belki. Misal acaba bir konuşmadaki en önemli cümleleri, konuşmanın oluşturduğu ağı inceleyerek bulabilir miyiz?

Alalım bir metni, çizelim oluşturduğu kelime ağını. Sonra bu ağın içindeki önemli kelimeleri geometrik olarak bulmaya çalışalım. İlk akla gelen şey, kelimelerin ne kadar “merkezi” olduğu. Sıklıkla olduğu gibi ilk akla gelen fikir çok da iyi çalışmıyor. En merkezi kelimelerin en önemli kelimeler olduğunu söylemek zor. Genelde dolgu kelimeler her yerde çıktıkları için en merkezi yerleri tutmuş oluyorlar, en önemli değil en önemsizleri bulmuş olabilirsin. Ama buradan başlayarak ilerlemek mümkün, bir algoritma geliştirdik, dilden bağımsız olarak bütünlüklü bir metinde (bir hikaye, bir gazete haberi, ders notları vs) en önemli cümleleri tespit ediyor. İngilizce ve Türkçe metinlerde oldukça iyi çalışıyor. Acaba Çince bir hikayede de işe yarıyor mudur?

Peki ya Türkçe bir metni alıp İngilizce’ye çevirsek, sonra da aynı metnin hem Türkçe hem İngilizce geometrisine baksak? Bu metinler aynı düşünceyi temsil ettiğine göre oluşturdukları kelime ağları da birbirine benzer mi acaba? Bir metnin çevirisinin başarılı olup olmadığını bu iki ağı karşılaştırarak anlayabilir miyiz? Soru çok.

 

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*

Şu HTML etiketlerini ve özelliklerini kullanabilirsiniz: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>