Information Gain (Bilgi Edinimi) nedir? Google'ın içeriklerde özgünlüğü nasıl ölçtüğünü ve arama sonuçlarını nasıl sıraladığını patent analizleriyle keşfedin.
- Aynı Soruya Aynı Cevabı Veren Yüz Sayfa
- Information Gain Nedir
- Google Patentinin Söylediği Şey
- LLM Çağında Information Gain'in Yükselişi
Bir konuyu Google'da aratıyorsunuz. İlk on sonuçta tamamen aynı tanımı, aynı sırayla, sadece kelimeleri biraz değiştirilmiş halde okuyorsunuz. Biri "1996 yılında kuruldu" diyor, diğeri "1996'da temelleri atıldı" diyor. Bilgi aynı, dil farklı.
Şimdi şu soruyu sorun. Eğer Google bu on sayfanın hepsini eşit değerli görseydi, neden birini diğerinin üzerine sıralıyor olsun? Cevap, çok az kişinin adını duyduğu bir patentte saklı. Information Gain.
Bu yazıda, Google'ın bir içeriğin "yeni bilgi katıp katmadığını" nasıl ölçtüğünü, neden bu ölçümün LLM çağında daha da kritik hale geldiğini ve içeriğinizi bu skora göre nasıl konumlandırmanız gerektiğini anlatacağım. SEO uzmanıysanız stratejik bir filtre kazanacaksınız. İçerik üreticisiyseniz tekrar etmenin neden sıralamayı çökerttiğini somut olarak göreceksiniz.
Aynı Soruya Aynı Cevabı Veren Yüz Sayfa
İnternet bilgi açısından bolluk içinde, özgünlük açısından ise tehlikeli bir kıtlık içinde. Bir konuda yazılan ilk birkaç güçlü kaynaktan sonra, gerisi büyük ölçüde aynı bilgiyi farklı kelimelerle tekrar ediyor.
"SEO nedir" araması yaparsanız, ilk yirmi sonucun yaklaşık yarısı şu kalıba oturur. Tanım, kısa tarihçe, on madde halinde temel teknikler, sonuç paragrafı. Bilgi aynı, sıralama aynı, hatta örnekler bile çoğu zaman benzer.
Bu durum eski Google için bir sorun değildi. Çünkü eski Google, hangi sayfanın daha fazla link aldığına, sayfada hangi anahtar kelimenin geçtiğine bakıyordu. Ama bir noktada Google şu soruyu sormaya başladı.
"Bu sayfa, bir önceki on sayfada söylenmemiş ne söylüyor?"
İşte Information Gain bu sorunun cevabını skorlayan sistem.
Information Gain Nedir
Information Gain, bir içeriğin daha önce mevcut içerikler tarafından söylenmemiş, kullanıcıya ek değer sağlayan yeni bilgi içerip içermediğini ölçen bir skorlama mantığıdır.
Üç parçada düşünebiliriz.
- Önceki Bilgi: Aynı konuda zaten dizine alınmış içeriklerin toplam bilgi havuzu.
- Yeni İçerik: Şu an değerlendirilen sayfanın taşıdığı bilgi.
- Skor: Yeni içeriğin önceki havuza eklediği orijinal bilginin oranı.
Bir sayfa havuza yeni bir veri, yeni bir perspektif, yeni bir örnek, yeni bir karşılaştırma getiriyorsa Information Gain skoru yüksektir. Aynı bilgiyi farklı kelimelerle tekrar ediyorsa skor düşüktür, hatta sıfıra yaklaşır.
| Sayfa / İçerik Türü | Konu | Information Gain Skoru |
|---|---|---|
| Konuyu ilk açıklayan tanımsal kaynak | SEO Nedir | Yüksek |
| Aynı tanımı yeniden yazan blog | SEO Nedir | Çok Düşük |
| Tanıma vaka analizi ekleyen kaynak | SEO Nedir | Yüksek |
| Sektör verileriyle tanımı zenginleştiren kaynak | SEO Nedir | Yüksek |
| Tanımı kopyalayıp listeye çeviren kaynak | SEO Nedir | Sıfıra Yakın |
Skorun mantığı şu. Google bir kullanıcıya zaten bildiği şeyi tekrar göstermek istemez. Kullanıcı zaten ilk sonucu okuduysa, ikinci sonucun ona ek bir şey vermesi gerekir.
Google Patentinin Söylediği Şey
Information Gain kavramı havadan üretilmiş bir teori değil. Google, 2018 yılında US 2018/0341686 A1 numaralı "Contextual estimation of link information gain" başlıklı patent başvurusunu yaptı ve patent sonraki yıllarda onaylandı. Patent metninde sistem, "bir kullanıcının halihazırda gördüğü bir veya daha fazla doküman seti göz önünde bulundurularak, yeni bir dokümanın o kullanıcıya sağlayacağı ek bilginin tahmini" üzerine kurulu olarak tanımlanır.
Patentin temel iddiası şu. Bir arama motoru, kullanıcının zaten okuduğu içeriklerden sonra ona göstereceği bir sonraki içeriği, o içeriğin yeni bilgi miktarına göre seçmelidir.
Patent dokümanından çıkarılabilecek üç temel mekanizma var.
- Sistem, kullanıcının daha önce gördüğü içerikleri bir referans havuzu olarak işaretler.
- Aday içerikler bu havuza göre değerlendirilir. Aynı bilgileri içerenler düşük skor alır.
- Yeni bilgi katsayısı yüksek olanlar bir sonraki sırada gösterilir.
Patent her ne kadar arama oturumu içindeki ardışık sonuçlar için tasarlanmış gibi görünse de, mantığı sıralama algoritmasının genel felsefesini açıklar. Google, bilgi çeşitliliğini ödüllendiren bir sistem inşa ediyor.
SEO analist Bill Slawski, SEO by the Sea blogunda yayımladığı detaylı patent analizinde, bu skorun arama sonuçlarındaki "ikinci, üçüncü, dördüncü sıralı" içeriklerin seçiminde belirleyici rol oynadığını vurguluyor. Yani patent, ilk sırayı değil, ilk sıradan sonraki tüm pozisyonların hangi mantıkla doldurulduğunu açıklıyor.
LLM Çağında Information Gain'in Yükselişi
Bu kavramı şimdi konuşmamızın bir sebebi var. Generative AI ve LLM tabanlı arama motorları, Information Gain mantığını klasik aramanın çok ötesine taşıdı.
Bir LLM, bir soruya cevap üretmek için yüzlerce kaynağı tarar ve hangilerini alıntılayacağına karar verir. Bu karar verme süreci, doğası gereği Information Gain hesaplamasına dayanır. Çünkü model, aynı bilgiyi söyleyen on kaynaktan birini seçmek zorundadır.
Pranjal Aggarwal ve arkadaşlarının KDD '24 konferansında yayımlanan "GEO. Generative Engine Optimization" makalesi, generative arama motorlarının kaynak seçim mantığını analiz ediyor. Çalışma, özgün istatistik ve özgün alıntı içeren içeriklerin alıntılanma görünürlüğünde yüzde 30 ile yüzde 40 arasında artış sağlayabildiğini gösteriyor. Yani LLM'ler, yeni bilgi taşımayan kaynakları algoritmik olarak elemekte.
OpenAI, Perplexity ve Google'ın AI Overviews sistemi gibi modellerin alıntı seçim mantığı incelendiğinde şu desen ortaya çıkar.
- Aynı tanımı veren kaynakların yalnızca biri ya da ikisi alıntılanır.
- Kaynaklar arası farklılaşma yüksekse her birine ayrı atıf verilir.
- Özgün veri, özgün vaka ya da özgün tablo içeren kaynaklar daima öncelikli alıntılanır.
Pratik anlamı şu. Klasik aramada düşük Information Gain skoruyla yine de sıralanabilirdiniz, çünkü on sonuç vardı ve sekizinci sıra da görünürlük getirirdi. LLM cevaplarında genellikle iki ya da üç kaynak alıntılanır. Information Gain skoru düşükse görünürlüğünüz sıfırdır.
Aynı İçeriği Tekrar Etmek Neden Sıralamada Geriye Düşürür
İçerik üretim dünyasının en yaygın hatası, başarılı bir kaynağı taklit etmektir. Bir konuda iyi sıralanan bir yazıyı görüyorsunuz, benzerini yazıyorsunuz, biraz daha uzun tutuyorsunuz, sıralamaya gireceğinizi umuyorsunuz.
Bu yaklaşım Information Gain mantığına tamamen ters çalışır. Çünkü Google'a şunu söylersiniz. "Ben de tam olarak bu kaynağın söylediğini söylüyorum."
Google'ın size verebileceği cevap basittir. "Zaten o kaynağa sıralama veriyorum, sana ne gerek var."
Üç sık karşılaşılan tekrar tuzağı var.
- Tanımsal Tekrar: Aynı sözlük tanımını farklı kelimelerle yazmak. "X bir Y'dir" cümlesinin yüz versiyonu.
- Yapısal Tekrar: Aynı H2 başlıklarını aynı sırayla kullanmak. Skyscraper tekniği genellikle bunu üretir.
- Örneksel Tekrar: Konu hakkında daima aynı meşhur örnekleri kullanmak. SEO yazılarındaki Amazon, Apple, Coca-Cola örnekleri gibi.
Her bir tekrar türü, sayfanızın Information Gain skorunu düşürür. Üçü bir aradaysa skor neredeyse sıfırdır.
Yüksek Information Gain Skoru Olan İçerik Nasıl Görünür
Skoru yüksek tutan içeriklerin ortak özellikleri var. Bunları gözlemlemek için Perplexity'nin alıntıladığı kaynakları ya da Google AI Overviews'da öne çıkan referansları incelemek yeterli.
Yüksek skorlu içerikler genellikle şunları taşır.
- Birincil Veri: Kendi yürüttüğünüz bir anket, kendi sitenizden çıkardığınız bir istatistik, kendi vaka analiziniz.
- Yeni Sentez: Mevcut bilgileri daha önce kurulmamış bir şekilde birleştiren bir çerçeve. Örneğin iki ayrı disiplinin kavramlarını birbirine bağlamak.
- Spesifik Sayılar: Genel ifade yerine spesifik veri. "Kullanıcıların büyük çoğunluğu" yerine "kullanıcıların yüzde 73'ü" gibi.
- Karşı Görüş: Yaygın kabul edilen bir bilgiyi sorgulayan, çürüten ya da nüanslandıran perspektif.
- Pratik Detay: Teorik bir konuya operasyonel ayrıntı eklemek. "Schema markup ekleyin" demek yerine, hangi tipte hangi alanları kullanacağınızı göstermek.
Bu beş öğeden en az ikisini taşıyan içerikler, alıntılanma olasılığı en yüksek içerikler kategorisine girer.
Information Gain Üretmenin Pratik Yolları
Teorik çerçeveyi pratiğe taşımak için izleyebileceğiniz somut bir akış var.
- Mevcut Kaynakları Haritalayın: Hedef sorgunuzun ilk yirmi sonucunu açın. Her birinden çıkarılan üç ana iddia listesi yapın. Bu sizin "önceki bilgi havuzunuzdur."
- Boşlukları Bulun: Bu yirmi sayfanın hiçbirinin söylemediği, soramadığı, örneklemediği şey nedir? İçeriğinizin omurgası bu boşluk olmalıdır.
- Veri Üretin ya da Toplayın: Kendi müşteri datanızdan, sektör raporlarından, akademik kaynaklardan henüz bloglarda dolaşıma girmemiş sayılar toplayın.
- Yeni Bir Çerçeve Önerin: Konuyu daha önce kullanılmamış bir metaforla, sınıflandırmayla ya da modelle açıklayın. Bu yazıdaki "üç tekrar tuzağı" çerçevesi gibi.
- Karşı Pozisyon Alın: Yaygın kabul gören bir argümana karşı argüman geliştirin. Bu, makinenin sizi farklı bir veri kaynağı olarak işaretlemesini sağlar.
Bu beş adımı disiplinli uygulayan bir içerik, ilk yayınlandığı andan itibaren yüksek Information Gain skoru taşır.
Ölçülemeyen Ama Algoritmanın Hissettiği Bir Sinyal
Information Gain'in en zor yanı şu. Açık bir metrik değildir. Google Search Console size bir "Information Gain skoru" göstermez. Ahrefs ya da Semrush bu skoru raporlamaz. Yine de etkisi her sıralama sonucunda gözlemlenebilir.
Google Search Liaison hesabının resmi açıklamalarında, Google'ın "people-first content" rehberi içerisinde "değer katma" ilkesi defalarca vurgulanır. Resmi dokümantasyonda geçen "Does your content provide substantial value when compared to other pages in search results?" sorusu, doğrudan Information Gain mantığının uygulamalı karşılığıdır. Google bu skoru bir metrik olarak adlandırmasa da, içerik kalitesi değerlendirmesinin merkezine yerleştirir.
Skorun varlığını dolaylı sinyallerden anlayabilirsiniz.
- İlk sayfaya giren ama orada kalıcı olamayan içerik, muhtemelen düşük Information Gain skoruna sahiptir.
- Dwell time yüksek ama bounce rate de yüksekse, içerik ilgi çekiyor ama yeni bir şey söylemiyor demektir.
- Aynı sorguda LLM cevaplarında alıntılanmıyorsanız, klasik aramada üst sıralarda olsanız bile, Information Gain skorunuz model için yetersizdir.
Bu sinyalleri okumak, doğrudan bir metrik takip etmekten daha değerlidir. Çünkü algoritmanın ne hissettiğini anlama becerisi geliştirirsiniz.
İçerik Stratejinizi Bu Skor Üzerine Kurmak
Information Gain bir taktik değil, bir stratejik filtredir. Her yeni içerik fikrini şu soruyla geçirmeniz gerekir.
"Bu konuda zaten yazılmış olan içeriklerin söylemediği ne var, ben onu söyleyebiliyor muyum?"
Cevap "hayır" ise o içeriği yazmamalısınız. Çünkü yazsanız bile sıralamaya girme şansınız düşüktür ve LLM alıntılarında görünmezsiniz. Cevap "evet" ise, taşıdığınız yenilik sinyalini içeriğin başına, ilk paragrafa, alt başlıklarına ve schema markup'ına yansıtmalısınız.
Stratejik bir uygulama örneği. Bir sektörde "X nedir" tarzı tanım içerikleri zaten doymuştur. Bu yüzden yeni bir blog'un bu tip içerikle başlaması çoğu zaman boşa emektir. Yerine "X'in son üç yılda nasıl değiştiği" ya da "X'i sektörümüze özel veriyle yeniden ölçtüğümüzde ne çıkıyor" gibi içerikler her zaman yüksek skor üretir.
Information Gain düşünmek, içerik üretmeden önce ne üretmemek gerektiğini bilmektir.
Kapanış. Tekrar Etmek Değil, Eklemek
SEO'nun ilk on yılı kelime yoğunluğu üzerine kuruluydu. İkinci on yılı bağlantı otoritesi üzerine kuruluydu. Şu an içinde olduğumuz dönem ise farklı bir kavram üzerine kuruluyor. Katkı.
Google ve LLM'ler giderek daha açık biçimde şunu sorguluyor. Bu içerik bilgi havuzuna ne ekliyor? Eğer hiçbir şey eklemiyorsa, var olmasının da algoritmik bir karşılığı yok.
Information Gain bu yeni dönemin sessiz kurucu sinyalidir. Görünmezdir, raporlanmaz, fakat her sıralama kararının arkasında bir yerde durur.
Ve sorunun cevabı her zaman üç kelimedir:
Ne ekliyorum, ne tekrar ediyorum, ne öneriyorum.
Bu üç soruyu her içeriğin başında sormak, SEO çağından GEO çağına geçişin en küçük ve en güçlü pratiğidir.
Kaynaklar
-
•Kaynak LinkiGoogle LLC. (2018). Contextual estimation of link information gain. US Patent Application No. 2018/0341686 A1.
-
•Kaynak LinkiAggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. (2024). GEO: Generative Engine Optimization. KDD '24, Proceedings of the 30th ACM SIGKDD Conference.
-
•Kaynak LinkiGoogle Search Central. Creating helpful, reliable, people-first content. Google Developers.

