AI Arama Optimizasyonu için Embeddings Entity ve Semantic İçerik Yapısı
Seocular veye website sahipleri yıllardır web sitelerini, Google’ın ilk sayfasına girmek ve o 10 linkten birisi olmak için çok uğraştılar. Yeni AI döneminde arama motorları, artık websiteleri sadece sıralama için değil, internetteki bilgiyi 10 siteden daha fazla siteden anlık olarak tarayan, parçalayan, ve kendi cümleleri ile yeniden üreten, bir sentez motorudur. Yani ilk etkileşim bir web sayfasıyla değil, sentezlenmiş bir cevapla gerçekleşiyor.
Bu Yazıda Neler Var?
ToggleEskiden bir kullanıcı yazdığı sorgusu ile ilgili 4,5 farklı siteye tıklardı ve bu farklı siteler arasında gezinerek istediği bilgiyi kendisi birleştiriyor. Bugün yapay zeka asistanları (Gemini, ChatGpt, Grok vs) bu 4,5 değil daha fazla siteleri çok az bir zamanda açıyor, okuyor ve kullanıcının sorgusuna alakası olmayanları eliyor ve kullancıya bir özet yazıyor.
Eskiden doğru anahtar kelimelere ve hızlı bir siteye sahip olmak yeterliydi. Daha doğrusu, arama motorları web sayfalarını tarıyordu, belgeleri indeksliyordu ve sonuçları alaka düzeyi, otorite ve bağlantı sinyallerine göre sıralıyordu. Vector Space ve Generative Synthesis gibi kavramların ve bir AI websitenizi kaynak olarak göstermeye değer bir “varlık” olarak görüp görmediğini de düşünmeniz gerekiyor.
Klasik SEO’da amaç, meta title ve description ile kullanıcının gözünü boyayıp ve siteye tıklatıp CTR’ı artırmaktı. AI Retrieval dünyasında ise artık kullanıcıyla doğrudan temas kuran meta tile gibi bilgiler değil, aradaki yapay zekadır. Yeni nesil SEO da, kullanıcının tıklamasını beklemek değil, yapay zekanın yanıt ekranına en kaliteli, en yoğun ve en doğru veri girişi (Data Feeding) olarak girmektir.
Yeni arama ekosisteminde kullanıcılar artık sizin sitenize gelmiyorlar (tıklamıyorlar) yapay zeka, sitenizdeki bilgiyi paketleyip kullanıcıya teslim ediyor.
Google AI Overviews, Bing, Grok veya ChatGPT gibi AI sistemleri artık kullanıcıya gitmesi gereken yolları (linkleri, wbsiteler) göstermiyor, o yollardan kendisi gidip, sorgu ile ilgili bilgiyi toplayıp, kendi cümleleriyle sentezleyerek kullanıcıya, AI kendi ekranında sunuyor ve kullandığı o yolları da referans olarak gösteriyor.
Sıralama sistemlerinden otomatik veri erişim sistemlerine geçişin temel dinamiklerini inceleyelim.
Bu sentez odaklı arama dünyasında hayatta kalmak ve başarı elde etmek için, geleneksel içerik oluşturucular gibi düşünmeyi bırakıp, retrieval (bilgi erişim) odaklı düşünmeye başlamalıyız. Bu yeni mimariye uyum sağlamak için derin yapısını analiz etmemiz gerekiyor.
Query Fan Out, passage (metin parçaları) bulma, anlamsal paragraflar ve bağlamsal eşleştirme (contextual matching) gibi kavramlar, AI arama sistemlerinin işleyişini anlamak, AI destekli arama deneyimlerinde görünürlük elde etmek isteyen markalar için, giderek daha önemli hale geliyorlar.
SEO’nun geleceğini anlamak için öncelikle modern AI arama sistemlerinin gerçekte nasıl çalıştığını anlamamız gerekiyor.
Sıralama Sistemlerinden Retrieval Sistemlerine Geçiş
Ranking Sistemleri ile Retrieval Sitemlerin Farkı
Şimdiye kadar arama sistemleri, sıralama üzerine kurulmuştu. Arama sistemlerinin işleri nerdeyse çok basitti:
Web sayfalarını tarıyorlardı, sonra indeksleme yapıyorlardı, alaka düzeyi sinyallerini değerlendirmek ve backlink, anahtar kelimeler, güncelliği, otorite ve kullanıcı sinyalleri gibi diğer faktöre göre sayfaları sıralıyorladı.
Arama motorları şunu belirlemeye çalışıyorlardı:
Eski Nesil Arama Sistemleri ve BM25
Bir kullanıcı sorgusu için en iyi sonuç (website) hangisidir?
Geleneksel arama sistemleri bunu başarmak için klasik ters indeksleme yöntemleri ve anahtar kelime ağırlıklandırma (BM25, Best Matching 25) modellerine dayanıyordu.
Geleneksel arama motorları büyük ölçüde, Ters Dizin (Inverted Index) adı verilen bir veri yapısına dayanıyor. Inverted Index’i kalın bir ders kitabının arkasındaki olan dizin gibi düşünebilirsiniz. Bu yapı, belirli anahtar kelimeleri tam olarak hangi web sayfalarında geçtiğini gösterir.
Bir kullanıcı bir sorgu aradığında, BM25 gibi geleneksel algoritmalar, anahtar kelimenin sıklığına dayanarak bir formül kullanıyordu ve sonuçları değerlendirebiliyordu.
Web Sayfası doğru anahtar kelime yoğunluğuna, H taglari ve yeterli backlink otoritesine sahip ise, sıralama sistemi web sayfasını SERP’in en üstüne çıkarırdı. En önemlisi sistem içeriği anlamıyordu, sadece tokenleri eşleştiriyordu ve sıklığını değerlendiriyordu.
Yeni Nesil Arama: Vektör ve Passage Arama
Modern AI sistemleri, bir içerikte anahtar kelimenin kaç kez tekrarlandığını önemsemez. Ters dizin yerine, Vector Retrieval (Vektör Arama) ve Semantic Retrieval (Anlamsal Arama) sistemlerini kullanırlar.
İçeriğinizi yayınladığınız anda, AI sistemleri o içerikteki cümleleri ve paragrafları sayısal vektörlere (vector embeddings) dönüştürür. Bu sayısal vektörler, içeriğinizin gerçek anlamını ve bağlamını çok boyutlu bir alanda (semantic space) haritalandırır. Yani içerik artık kelimelerden oluşan yazı değil, sayılarla dolu bir alan hâline gelir.
Örnek:
“Istanbul Airport Lounge 2026”
LLM’lerin Oluşturduğu Vector Embedding:
[0.87, -0.34, 0.92, 0.65, -0.21, …, 0.78] → 1536 boyut
Bu vektör şu anlamları matematiksel olarak kodlar:
- İstanbul Havalimanı (IST)
- Lounge hizmeti
- Havayolları
- Konfor, yemek, duş, sessizlik, fiyat, kalite
- Güncel (2026) bilgi
- Premium yolcu deneyimi
AI sistemi bunu nasıl analiz eder?
Bir kullanıcı şu sorulardan herhangi birini sorduğunda:
- Istanbul airport lounge price
- IST CIP Lounge?
- Best napzone area in Istanbul airport?
- Turkish Airlines lounge pass?
Vector Retrieval devreye girer ve sistem, sorgunun vektörü ile sizin içeriğinizin vektörü arasındaki benzerliği sayısal olarak ölçer. Eğer benzerlik yüksek ise AI sistemi bu içeriği o kullanıcıya alakalı bir içerik olarak sunar.
Bir içerik vector Embedding sayesinde, sadece kelimelerden oluşan yazıdan çıkar ve anlamın rakamlar ile temsil edildiği hale gelir.
Bir içerikte Lounge kelimesi geçmez ise bile, “Istanbul Airport comfortable waiting area” yazan bir sorguda bile o içerik bulunabilir.
LLM sistemleri Neden İçeriği Chunk’lar (parçalar) Halinde Okur?
Eskiden SEO yaparken sayfanın tüm içeriği bir anahtar kelime için optimize ediliyordu. LLM’ler (Gemini, ChatGPT, Perplexity, Grok) sayfanın tamamını okumuyor. Sayfayı chunk’lara bölüyor ve sadece ilgili chunkları çekip kullanıyor.
Neden AI taramaları sayfa değil de chunklara inmiş?
AI çağında eski SEO’cuların yaptığı en büyük hatalardan biri, bir web sayfasının içeriğini tek parça halinde, bölünmez bir bütün olarak optimize etmeye çalışırlar.
Tokenleştirme:
LLM’ler içerkleri token (kelime, veya cümle) denen küçük parçalar halinde işler. Bir AI modelin tek seferde anlayıp ve işleyebileceği maksimum etin miktarı vardır. AI bu maksimum token’e ulaştığında artık başka bilgi okumaz, okursa bile önce okuduklarını siler.
Örnek:
- GPT-4o’nun context window’u yaklaşık 128.000 token civarındadır.
- Claude 3.5’in bazı versiyonları 200.000 token’a kadar çıkabiliyor.
- Gemini Pro (standart) 1.000.000 token
3000 kelimelik bir sayfayı komple (header, footer, menü, içerikl, fotoğraflar vs.) sokmak hem çok pahalı hem de verimsizdir.
Semantic Chunking (Anlamsal Parçalama):
AI sistemleri, sayfaları alakasız verilerin işlenmesini önlemek için, sayfa içeriğini temiz ve mantıklı parçalara (genellikle 100-500 kelime) böler. Her chunk kendi başına bağımsız bir embedding (vektör) haline gelir.
Doğru Semantic Matching:
Bir kullanıcı sorgu sorduğunda sistem tüm sayfayı çekmez. Milyonlarca chunk arasından (farklı websitelerin içerikleri dahil) o sorguya anlamsal olarak en ilgili eşleşme olanı bulur ve cevabı sadece o parçadan üretir.
Eğer bir içerik kötü yapılandırılmış (paragraflar arası bağlam kötü veya anlamlı chunklar yok ise) ise AI için cezalı bir içerik sayılıyor.
Örnek: Istanbul Airport Transfer
Kötü olan:
Chunk 1:
İstanbul Havalimanı’ndan şehir merkezine transfer olmak oldukça popüler. Birçok seçenek mevcut.
Chunk 2:
Özellikle taksi fiyatları son dönemde arttı. Havaalanı taksileri genellikle sarı taksi oluyor.
Chunk 3:
En rahat seçeneklerden biri de özel transfer hizmeti. Şoför sizi terminalde karşılıyor ve bagaj yardım ediyor.
Chunk 4:
Transfer süresi trafik durumuna göre 45 dakika ile 90 dakika arasında değişiyor.
Sorun:
AI sadece Chunk 3’ü çekerse (chunk 2,4 de bağlı) Hangi havalimanından bahsediyoruz, ne kadar sürüyor” diye tam anlayamayabilir. Parçalar birbirine çok bağlı ve kendi başına yetersiz.
İyi olan:
Chunk 1:
İstanbul Havalimanı’ndan Şehir Merkezine En Ucuz Transfer Yöntemi
2026 itibarıyla İstanbul Havalimanı’ndan Taksim, Sultanahmet veya Kadıköy’e en ekonomik transfer seçeneği Havaist otobüsleridir. Tek yön kişi başı fiyatı yaklaşık 320 ₺ ile 426 ₺ arasındadır. Bagaj hakkı da ücretsizdir.
Chunk 2:
İstanbul Havalimanı Özel Transfer Fiyatları
Özel araçla transfer yapmak isteyenler için 2026 fiyatları şu şekildedir:
- 1-3 kişi (Sedan): 3.600 – 4.200 TL
- 4-6 kişi (Minivan): 4.800 – 6.400 TL Fiyata terminal karşılama, bagaj yardımı ve su, internet gibi ikramlar dahildir.
Chunk 3:
İstanbul Havalimanı Transfer Süresi ve Trafik
İstanbul Havalimanı’ndan şehir merkezine transfer süresi trafik durumuna göre değişir. Normal şartlarda 50-70 dakika sürer. Sabah ve akşam saatlerinde bu süre 90 dakikaya kadar trafikten dolayı çıkabilir. En rahat ulaşım genellikle 10:00-14:00 ve 22:00-07:00 arasıdır.
Chunk 4:
İstanbul Havalimanı’ndan Transferde Dikkat Edilmesi Gerekenler
Havalimanında resmi taksi duraklarını kullanın. Uygulamalar üzerinden (Uber, BiTaksi, iTaksi) araç çağrabiliyorsunuz. Özel transfer şirketlerinde önceden rezervasyon yaptırmak gecikme ve yanlış yönlendirme riskini azaltır ve daha az uğraşırsınız.
Neden İyi Oldu?
- Her chunk (farklı alt konu) kendi başına okunduğunda anlamlı ve eksiksiz.
- Chunklar tamamı ana konu (Istanbul Airport Transfer) altında kalıyor.
- AI bir soruya cevap verirken sadece ilgili chunk’ı çekip güzel bir cevap üretebiliyor.
- kullanıcı da tek bir bölümü okusa bile gereken bilgiyi sahip oluyor.
AI sistemleri cevapları bulmak için içerikleri artık bağımsız chunk’lara ayırıp ve sayısal vektörlere dönüştürdüğünü biliyoruz. Bu durumda AI aramdalarda içeriği chunk seviyesinde optimize etmeliyiz.
AI motorlarının sayfaları bağımsız parçalara (chunk’lara) ayırıp, vektör embedding’lere (chunk’in anlamını temsil eden sayısal vektörlere) dönüştürdüğünü artık biliyoruz.
AI motorlarının cevapları bulmak için sayfalarınızı bağımsız, vektör haritalı parçalara ayırdığını artık bildiğimize göre, yeni bir soru ortaya çıkıyor: Bir kullanıcı bir sorgu yazdığında bu sistemler bu parçaları tam olarak nasıl buluyor?
Peki yeni soru şu:
Bir kullanıcı sorgu sorduğunda, AI sistemleri milyonlarca chunk arasından tam olarak istediği parçayı nasıl buluyor?
Bu süreci anlamak için AI sistemlerinin retrieval (geri getirme) algoritmalarının web’de nasıl çalıştığını ve hangi mekanizmaları kullandıklarını incelememiz gerekiyor.
Vektör Dizileri (Vector Arrays) ve Anlamsal Yakınlık (Semantic Proximity)
AI Kelimeleri Okumadan Anlamı Nasıl Eşleştiriyor?
AI sistemleri bir içerikte kelimeleri harf harf veya anahtar kelime olarak okumadığını, bunun yerine metni sayısal koordinatlara (vektörlere) dönüştüryor.
Yani bir LLM için bir cümle veya paragraf, artık kelimelerden oluşan bir yazı değil, LLM metine yazı olarak bakmıyor, metine sayısal bir vektör olarak bakıyor.
Bu dönüşüm sayesinde AI, kelimelerin tam olarak aynı olmasını aramak yerine, anlamların birbirine ne kadar yakın olduğunu (semantic proximity) ölçebiliyor. Eskiden optimizasyon “Anahtar kelime” odaklıyken, artık anlam ve vektörel yakınlık odaklı hale geliyor.
Buda AI arama dünyasının, geleneksel SEO’dan tamamen ayıran en kritik noktadır.
Bir web sitesine içerik (paragraflar) yazdığınızda, AI bunu olduğu gibi okumuyor. Bunun yerine embedding modeli denen bir sistem devreye giriyor ve içeriği tamamen sayısal bir formata dönüştürüyor.
Düşünün ki normal haritada X ve Y koordinatı vardır (2 boyutlu). OpenAI’nin text-embedding-ada-002 modeline göre, AI’yin kullandığı harita 768 ila 1536 boyut arasındadır. Her boyut Anlam, kavram, duygu, ilişki gibi bilgileri gösteriri.
Yazdığınız bir paragraf bu büyük ve çok boyutlu haritada belirli bir koordinata (noktaya) yerleştiriliyor. Bu koordinat, o paragrafın tam anlamını gösterir.
Bir kullancıcı google’e veya bir AI’ya bir sorgu sorduğunda, sistem şu adımları yapar:
- Kullanıcının sorgusunu vektöre çevirir (chunk’ları çevirdiği gibi)
- Eski SEO’daki gibi kelimelerin sayfa içinde kaç kez geçtiğine bakmaz.
- Kullanıcının sogru vektörü ile sitenizdeki her chunk’ın vektörü arasındaki uzaklığa bakar.
Örnek, bir kullanıcı sorgusu: Istanbul Airport Fast Track
Bu sorgunun vektörü (örnek olarak):[0.82, 0.67, -0.12]
Sitenizdeki Chunk 1 (İyi eşleşme):
The Istanbul Airport arrival fast track service allows you to bypass long immigration and passport control queues → Chunk vektörü: [0.79, 0.71, -0.09]
Sitenizdeki Chunk 2 (Zayıf eşleşme):
The airport is a public space in which many people come and go → Chunk vektörü:
[0.31, -0.45, 0.88]
AI bu vektörler arasındaki benzerlik açısını ölçüyor (Cosine Similarity).
Sonuçlar şöyle çıkabilir:
- Chunk 1 ile sorgu arasındaki benzerlik → %94 (Çok yakın)
- Chunk 2 ile sorgu arasındaki benzerlik → %25 (Çok uzak)

Rakamların büyük veya küçük olması önemli değil.
Önemli olan vektörlerin yönünün birbirine ne kadar paralel olması.(birbirine açı olarak yakın olması)
Semantic Proximity (Anlamsal Yakınlık)
Burada Anlamsal Yakınlığın kavramını iki tane örnekle anlatayım:
1. Yüksek Yakınlık (İyi Durum)
Örnek:
- Kullanıcı soruyor: “How to get from Istanbul Airport to Taksim quickly?”
- Sizin içeriğiniz: “The fastest way from Istanbul Airport to Taksim is using the Havaist shuttle or a private transfer service. The journey usually takes 50-70 minutes depending on traffic.”
Bu chunk’da:
Burada sorgu ve chunk için vektörlar çok yakın koordinatlara düşüyor. AI onları açısı yakın oldukları için uzakta da yan yana görüyor. Bu yüzden sorguya cevap verirken sizin içeriğinizi kolayca bulup getiriyor.
2. Düşük Yakınlık (Kötü Durum)
Örnek:
- Kullanıcı aynı sorguyu soruyor: “How to get from Istanbul Airport to Taksim quickly?”
- Sizin içeriğiniz: “Experience unparalleled comfort and world-class transportation solutions with our premium services.”
Bu chunk’da:
Bu tür genel ve boş pazarlama cümleleri vektör olarak çok belirsiz ve anlamdan uzak bir alana düşüyor. AI’nin vektör haritasında “hiçbir yere” yakın durmuyor. AI bu içeriği görmezden geliyor çünkü anlamsal mesafe çok uzak (açı çok büyük).
Kelime Eşleştirme yerine Anlam Eşleştirme artık ön planda.
AI tam anahtar kelimeleri aramıyor. Bunun yerine paragrafların gerçek anlamını ve kullanıcı sorgusunun amacı ile eşleştiriyor.
Örnek:
Eski Yöntem (Keyword Matching):
Sayfanızı “Sabiha Gökçen Airport sleep pod” olarak optimize ederseniz, kullanıcı “Sabiha Gökçen Airport resting capsule” aradığında eski arama sistemleri içeriğinizi bulamayabilirlerdi.
Yeni Yöntem (Semantic Vector Retrieval):
AI, “sleep pod” ile “resting capsule” aynı anlama geldiğini bilir. AI bu iki kavramı vektör uzayında çok yakın görür. Kullanıcı farklı kelimelerle arasa bile AI, içeriğinizin anlamını anlayıp ilgili chunkı (paragrafı) direkt çeker.
AI sistemleri metinleri vektör uzayına yerleştirmesini anlamak yeterli değil. Çünkü gerçek hayatta kullanıcıların sorduğu sorgular genellikle kısa, dağınık ve eksik oluyor.
Bu sorunu çözmek için AI sistemleri sadece kullanıcının yazdığı soruyu olduğu gibi almıyor. Bunun yerine tek bir sorguyu birçok farklı gizli sorguya dönüştürüyor (parçalıyor). Buna Query Fan Out (Sorgu Yayılımı) deniyor.
Yani AI, bir kullanıcı sorgusunu yazdığında, aslında neyi bilmek istiyor? diye düşünüp, orijinal sorguyu genişleterek (Query expansion) daha iyi sonuçlar bulmaya çalışıyor.
AI Sorguları Nasıl Genişletiyor?
Birçok kişi Google arama motoruna veya bir yapay zeka aracına bir sorgu yazdığında, sadece arama yaptığını düşünür. Çoğu SEO uzmanı da sadece bu yazılan kelimeleri optimize etmenin yeterli olduğunu düşünür. Halbuki arka planda çok daha büyük ve karmaşık bir sistem çalışıyor.
Bir kullanıcı sorgu yazdığı anda, sistem bu sorguyu alır ve anında o sorguyu parçalara ayırır. AI sistemleri tek bir sorgudan onlarca yeni, farklı sorgu üretir. Bunlara “sentetik sorgular” (üretilmiş yapay sorgular) denir.
Bu teknik, AI arama mühendisliğinde Query Fan Out, Multi-Query Retrieval veya Query Generation olarak bilinir.
Kullanıcı tek bir gözden bakar, ama AI aynı anda onlarca farklı gözle bakar. Böylece arama çok daha derin ve kapsamlı hale gelir.
Örnek:
Sorgu:”Istanbul Airport Meet and Greet”
AI bu ana sorguyu alır ve otomatik olarak şu sorguları üretebilir:
- Istanbul Airport VIP Meet and Greet services 2026
- IST Airport arrival fast track and meet and greet packages
- Best meet and greet companies at Istanbul Airport
- Istanbul Airport private transfer with meet and greet
- Sabiha Gökçen vs Istanbul Airport meet and greet comparison
- Istanbul Airport meet and greet price and reviews
- Luxury arrival service Istanbul Airport terminal
Gördüğünüz gibi, tek bir kısa ve net sorgu, sistem tarafından 7 farklı açıdan yeniden yazılıyor.
AI Sorguyu Nasıl Çoğaltıyor (Multi-Query Retrieval)?
İnsanların arama şekli genellikle yetersiz kalır. Çoğu zaman sektörün teknik terimlerini veya tam aradıkları şeyi bilmezler. Bu yüzden kısa ve genel ifadeler kullanırlar.
Bu sorunu çözmek için modern yapay zeka arama sistemleri ve Google’ın ileri seviye altyapısı, kullanıcının yazdığı ham sorguyu tek başına kullanmaz. Bunun yerine onu Seed Query olarak kabul eder.
AI bu Seed Query’ni, kendi içindeki güçlü bir yapay zeka modeline gönderir. Bu modelin tek görevi Query Expansion (Sorgu Genişletme) yapmaktır. Model (LLM), sorgunun gerçek amacını, içerdiği unsurları ve gizli ihtiyaçları analiz ederek birçok yeni Sentetik Sorgu (yapay sorgu) üretir.
LLM sorguyu incelerken şu noktalara dikkat eder:
- Gerçek Amaç (Intent): Kullanıcı ne yapmak istiyor? (Bilgi almak, karşılaştırma yapmak, fiyat öğrenmek, en iyi olanı bulmak vs.). Bu aşamada farklı niyetleri göre yeni sorgular üretir.
- Varlıklar (Entities): Önemli isimler, yerler, markalar (örneğin: Istanbul Airport, VIP, Meet and Greet, IST, Sabiha Gökçen). Bu aşamada farklı varlıklara göre yeni sorgular üretir.
- Gizli / Örtülü İhtiyaçlar: Kullanıcı açıkça yazmasa bile muhtemel ihtiyaçlar (fiyat, yorum, karşılaştırma, lüks hizmet, 2026 güncel bilgi vs.). Bu aşamada gizli ihtiyaçlara göre yeni sorgular üretir.
- Farklı Açılar: Konunun farklı yönleri (lokasyon, operasyonel detay, premium hizmet, karşılaştırma vs.). Bu aşamada farklı açılara göre yeni sorgular üretir.
Neden bu önemli?
Eğer birisi web sayfasında sadece “Istanbul Airport Meet and Greet” kelimesini tekrar tekrar yazıyorsa, sistemin ürettiği bir sürü diğer sorguları kaçırabilir. İçeriğiniz, LLM sisteminin sorduğu tüm bu farklı soruları da doğal bir şekilde cevaplamalıdır.
Bu yaklaşım teorik değil. Google’ın patentlerinde ve birçok arama mühendisliği makalesinde aktif olarak kullanılan bir yöntemdir. Amaç, insanların basit sorgusunu alıp, teknik ve detaylı içeriklerle buluşturmaktır.
Eğer LLM’ler her sorguyu bu şekilde onlarca farklı sorguya dönüştürüyorsa, tek bir anahtar kelimeye odaklanmak artık yetersiz kalmıyor, hatta zararlı ve görünmez bir içeriğe dönüşüyor.
Peki bu yeni AI dünyasında bir web sayfasını nasıl güçlü hale getireceğiz?
AI Aramada İçerik Optimizasyonu için Chunking Stratejisi ve Parça Bağımsızlığı
Eskiden SEO’da bütün sayfayı optimize ederdik. Ama artık AI sistemleri sayfayı baştan sona okumuyor. Bunun yerine sayfadan en ilgili paragrafları (passage veya chunk) çekip alıyor. Bu yüzden her bölümün kendi başına güçlü ve anlaşılır olması gerekiyor, ve içeriği ona göre optimize etmeliyiz.
Eskiden SEO çok basitti:
Bir sayfayı tek bir anahtar kelimeye, uzun, akıcı olarak optimize ederdik, backlink alır ve bütün sayfayı güçlü hale getirmeye çalışırdık. Amacımız, sayfayı tek bir bütün olarak o ilgili anahtar kelimede sıralamaktı.
LLM’ler bir sayfadan sadece şu parçalardan birini alabilir:
- Tek bir paragraf
- Tek bir başlık + açıklama
- Tek bir örnek veya cevap
Sayfanın tamamı hiç okunmaz (özellikle sayfa uzun olursa, tamamını okumak çok maliyetli), sadece en iyi parçası alır.
Chunk Independence (Parça Bağımsızlığı) Nedir?
Her bölüm kendi ayakları üzerinde durabilmeli.
AI sayfadan sadece bir paragrafı çekip aldığında, o paragraf tek başına mantıklı, yararlı ve anlaşılır olmalı. LLM, her bölüm için, bu ne hakkında diyor? sorusunun cevabını başka bölümlere bakmadan bulabilmeli. Buna Semantic Chunking deniyor.
Örnek:
Kötü örnek:
Query fan-out sistemi çok önemlidir.
İyi örnek:
Query Fan-Out, LLM arama sistemlerinde kullanıcının tek bir sorgusunu birden fazla güçlü sorguya otomatik olarak dönüştürmesi tekniğidir.
Semantic Isolation (Anlamsal Bağımsızlık)
Birçok içerikte “bu yöntem”, “bu sistem”, “bu ürün” veya “bu hizmet” gibi belirsiz ifadeler kullanılır. İnsanlar bağlamdan anlayabilir ama yapay zeka bağımsız parça aldığında bu bağlamları anlayamayabilir.
Bu yüzden her bölümde:
- Konu net bir şekilde tanımlanmalı,
- Önemli kavramlar (Entity’ler) açıkça yazılmalı,
- Anlam bütünlüğü korunmalı.
Section Level Optimization (Bölüm Seviyesi Optimizasyon)
Günümüz SEO’sunda artık sadece sayfa değil, her bölüm optimize edilmeli.
İyi yapılandırılmış bir bölüm şu özelliklere sahip olmalı:
- Çok açıklayıcı ve net başlıklar
- Konuyu hemen anlatan giriş cümleleri
- Zengin ve anlamlı içerik
- Bağımsız olarak anlaşılabilir açıklamalar
Artık içerikleri hem insanlara hem de yapay zekânın parçaları çekme mantığına göre yazmamız gerekiyor.
Bir içerikte her bölümü, sayfadan koparılırsa bile kendi başına anlamlı ve bağlamsal olarak (konu net tanımlanmalı) tam parçalar oluşturmak, AI Retrieval SEO’nun temelidir. Ancak yapı ne kadar iyi olursa olsun, parçaların içi boş ve yüzeysel olursa hiçbir işe yaramaz.
Bir sonraki bölümde AI’nın bu parçaları nasıl kalite filtresinden geçirdiğini ve geleneksel pazarlama yazılarını nasıl acımasızca tıklama kaybettiğini inceleyeceğiz.
Operasyonel Gerçekçilik ve Güven Filtreleri
AI Sistemleri Pazarlama Boş Lafını Nasıl Eliyor?
İçerik ajansları (başka sektörlerde olabilir), mevcut pazarlama broşürlerini olduğu gibi web sitelerine koyduklarında, insanlar bunları sever diyerek, LLM’lerinde kullanacağını düşünüyorlar.
AI retrieval sistemleri bunları dijital çöp olarak görür. Modern AI modelleri (LLM’ler) çok katı filtreler kullanır.
Bilgi Yoğunluğu (Information Density) vs. Boş Laf (Fluff)
AI, web siteden aldığı bir metin parçasını incelerken Bilgi Yoğunluğu metriğini kullanır.
- İçinde somut veri, teknik detay, sayı, yöntem veya uygulanabilir yöntem, olmayan metinler “düşük bilgi yoğunluğu” veya “boş laf” olarak algılar.
- AI, pazarlama sıfatlarıyla olan cümleleri kolayca tanır (örneğin: yenilikçi, dünya standartlarında, eşsiz, rakipsiz gibi kelimeler). Bu tür cümlelerde gerçek bilgi neredeyse sıfırdır.
- Eğer bir paragrafın bilgi-kelime oranı düşükse, sistem o parçaya düşük kalite puanı verir ve hemen eler.
Kurumsal Boş İfadeler
LLM filtreleri, aşağıdaki türden işe yaramaz ve somut olmayan ifadeleri tespit etmek ve cezalandırmak üzere eğitilmiştir:
Örnekler:
- “Sektör lideri, yenilikçi çözümler sunuyoruz” (Hiçbir teknik detay veya parametre yok)
- “Ekibimiz eşsiz sinerji yaratır ve dünya standartlarında müşteri deneyimi sunar” (Hiçbir operasyonel gerçeklik yok)
- “İşletmenizin potansiyelini maksimuma çıkaran öncü hizmet sağlayıcısıyız” (Hiçbir somut veri veya ölçüm yok)
Yapay zeka bu tür cümleleri okuduğunda şunu görüyor: Sıfır bilgi. Sadece içerik 3000 kelime olsun diye yazılmış. LLM sistemi bu sayfa yerine gerçek teknik detaylari veren rakip sayfalarını tercih ediyor.
Operasyonel Gerçekçilik (Operational Realism) Nedir?
Yapay zekada referans olarak çıkmak istiyorsanız yazım tarzınızı tamamen değiştirmelisiniz.
Pazarlama dili ve süslü reklam cümleleri yerine Operasyonel Gerçekçilik dilini kullanmalısınız. Yani bir mühendis, doktor, operatör veya uzman gibi net, somut ve teknik yazmalısınız.
Örnek:
1. Düşük Bilgi Yoğunluklu Pazarlama Yazısı:
Dünya standartlarında lojistik lideri olarak, işletmenize özel optimize edilmiş yenilikçi tedarik zinciri çözümleri sunuyoruz. Premier filomuz kesintisiz nakliye ve maksimum verimlilik garantisi verir. Bu sayede global şirketlerin gerçek potansiyelini açığa çıkarmak için tercih edilen ortak oluruz.
Neden başarısız?
Hiçbir sayı, teknik detay, ölçüm veya somut yöntem yok. Tamamen boş ve süslü laflardan oluşuyor.
2. Yüksek Bilgi Yoğunluklu Operasyonel Gerçekçilik:
Tedarik zinciri ağımızda soğuk zincir reefer konteynerleri kullanıyoruz. Bu konteynerlerde sıcaklık, IoT sensörleri ile gerçek zamanlı takip ediliyor ve -2°C ile +4°C arasında sabit tutuluyor. Avrupa-Asya deniz rotalarında, tıkanıklık yaşayan boğazlarda alternatif limanlar kullanarak rota değişikliği yapıyoruz. Ortalama transit güvenilirlik oranımız %94,2 seviyesindedir.
Neden başarılı?
İçinde somut veriler var.
Maksimum görünürlük için bu yoğun teknik verileri, yapay zekanın anlayabileceği anlamlı bir yapı haline getirmemiz gerekir.
AI Aramada İçerik Optimizasyonu için Varlık Mimarisi ve Semantik Ekosistem
Bu bölümde, LLM sistemlerinin web sitelerini nasıl algıladığını, içerikleri nasıl analiz ettiğini ve bilgiyi nasıl retrieve ettiğini anlatacağım. Ve AI arama sistemlerinde görünür olabilmek için içeriklerin neden bu yapılara göre optimize edilmesi gerektiğini açıklayacağım. Eskiden SEO’da uzmanlar sayfalar ve anahtar kelimeler üzerinden düşünürken, LLM’ler varlıklar (entities) ve bunlar arasındaki ilişkilerden oluşan bir Bilgi Grafiği (Knowledge Graph) oluşturuyor.
Artık makale yazmak yetmiyor, semantik bir ekosistem kurmanız gerekiyor.
Tüm web siteni tek bir büyük harita gibi görür. Bu haritada her şey varlık (Entity) olarak işlenir ve birbirleriyle ilişkilendirilir.
AI, tüm web sitesini tek bir büyük harita gibi görür veya ayrı ayrı sayfalar olarak görmez. Bunun yerine bir Bilgi Grafiği (Knowledge Graph) oluşturur. Bu grafikte her şey varlık (Entity) olarak işlenir. Bu entitiler birbirleriyle ilişkilendirilir.
Varlık (Entity) Nedir?
Kişiler, lokasyonlar, kavramlar, ürünler, hizmetler, teknolojiler gibi somut unsurlar. Örneğin: Istanbul Airport, Meet and Greet hizmeti, VIP terminal, soğuk zincir lojistiği vb.
Yapay zeka bu varlıkları ve aralarındaki ilişkileri (semantic relations) haritalandırır. Eğer siteniz sadece rastgele yazılmış makalelerden oluşuyorsa, bu grafikte görünmezsiniz.
Başarılı olmak için yapmanız gereken değişim:
Artık sadece “makale yazmayı” bırakıp, tam bir semantik ekosistem kurmalısınız.
Yani sitenizdeki her içerik, birbiriyle mantıklı şekilde bağlı varlıklar ve ilişkiler içermeli. Yapay zeka sitenizi bir bütün olarak anlayabilsin ve bilgi grafiğinde güçlü bir yere oturtabilsin.
Özetle:
Geleneksel SEO = Kelimeleri ve sayfaları optimize etmek.
AI Retrieval SEO = Varlıkları ve anlam ilişkilerini mimari olarak doğru tasarlamak.
AI Bilgi Grafiğinin Anatomisi
Bilgi Grafiği (Knowledge Graph), verilerin düğümler (nodes) ve ilişkiler şeklinde organize edildiği çok boyutlu bir yapıdır.
Örneğin yapay zeka “Apple” kelimesini basit bir kelime olarak saklamaz. Onu şöyle haritalandırır:
Apple (Varlık) → Üretiyor (İlişki) → iPhone (Varlık)
Yapay zeka (retrieval sistemleri) bir web sayfasını değerlendirirken Topikal Derinlik (aynı sayfanın konusunun ne kadar derin işlendiği) ölçer. Siteniz sadece yüzeysel kelimelerle mi kalıyor, yoksa konunun etrafındaki tüm operasyonel ekosistemi mi kapsıyor?
Herhangi bir sayfa konunun öncesindeki girdileri, sonrasındaki sonuçları ve gerçek operasyonel detayları içermiyorsa, yapay zeka o sayfayı eksik olarak işaretler ve kendi cevabında kullanmaz.
Örnek:
Düz Kelime Odaklı Yaklaşım:
Bir sayfa sadece “London Heathrow Airport Lounge” kelimesine odaklanıyor. “En iyi lounge”, “rahat koltuklar”, “ücretsiz yemek” gibi genel ifadeler yazıyor.
Entity Architecture Yaklaşımı:
Sayfa şu varlıkları ve ilişkileri doğal şekilde bağlıyor:
- London Heathrow Airport (Terminal 5)
- Lounge Erişim Yöntemleri: Priority Pass, Business Class, Lounge Pass
- Hizmet Kalitesi: Gerçek zamanlı doluluk oranı, Wi-Fi hızı, duş imkanı
- Operasyonel Detaylar: Açılış-kapanış saatleri, yemek menüsü kalitesi, sessiz çalışma alanı
- Downstream Etkiler: Uçuş gecikmelerinde lounge kullanımı, transfer süresi
Semantik Ekosistem Nasıl İnşa Edilir?
İçerik stratejiniz, sektörünüzdeki gerçek operasyonel akışa benzemelidir. Sadece Operasyon,ürün, hizmeti değil, onun öncesini ve sonrasını da anlatmalısınız.
London Heathrow Airport Lounge örneğinde güçlü bir içerik şöyle bağlar kurar:
- Heathrow Havalimanı’ndaki lounge’ların hangi terminallerde olduğu
- Priority Pass ile giriş kuralları ve limitleri
- Lounge’larda sunulan gerçek zamanlı uçuş bilgilendirme sistemi
- Güvenlik prosedürleri deki güncellemeler
- Terminal 5’teki lounge’dan bağlantılı uçuşlara transfer süresi
Bu şekilde yazdığınızda, yapay zeka sadece “lounge” aramalarında değil, “Heathrow’da uzun bekleme nasıl değerlendirilir?”, “Priority Pass Heathrow deneyimi” gibi birçok ilgili sorguda da sizi bulur.
Bilgi Grafiği Yarışını Kazanmak
LLM sistemleri hangi sitenin daha otoriter olduğuna tahminle karar vermez. Bunu varlık yoğunluğu (Entity Density) ve kendi başına anlaşılır (Contextual Completeness) üzerinden hesaplar.
Rakibiniz konunun tüm operasyonel zincirini detaylı şekilde haritalandırırken, siz sadece “en iyi lounge” kelimesine odaklanırsanız, yapay zeka sürekli rakibinizi tercih eder.
Peki tüm bu ileri seviye kavramları tek bir akıcı çalışma sistemine nasıl dönüştüreceğiz?
Retrieval Uyumlu Kodun (Yazılım) Teknik Yapısı
Bu bölüm, konumuzun teknik ve mühendislik odaklı kısmıdır.
İçeriğiniz ne kadar kaliteli olursa olsun, eğer kod tarafı (HTML yapısı) kötü ve karmaşıksa, AI botları onu zor okur ve öncelik vermez.
Yapay Zeka Botları İçin Temiz ve Okunabilir Kod Yapısı
Eğer bir sayfanın, veya websitenin yazılımsal olarak kötü kodlara sahipse, en iyi varlık ekosistemini kursanız, en yoğun ve kaliteli içeriği yazsanız bile, yine AI tarafından kolayca görülemez ve kullanılmaz.
Eskiden SEO’da genellikle sayfa hızı (LCP, Page Speed) gibi metrikler ön plandaydı. Bunlar insan kullanıcı deneyimi için önemliydi.
LLM destekli arama sistemleri bambaşka bir kriter getiriyor: Computational Parsing Cost (İşlem Maliyeti, Ayrıştırma Maliyeti).
JavaScript Hacminin ve DOM Karmaşıklığının Gerçek zaraları
AI botları veya LLM veri alma sistemleri sitenizi ziyaret ettiğinde, içeriği okumak için DOM (Document Object Model) yapısını ayrıştırmak zorundadır.
Eğer sitenizde:
- Çok fazla JavaScript (Client-Side Rendering),
- Gereksiz JavaScript framework’lar,
- Derin iç içe geçmiş <div> yapıları
Eğer altyapı bu şekildeyse LLM sistemleri, bir cümleyi okumak için fazla işlem gücü harcar.
[Karmaşık kod Yapısı] → Yüksek CPU Yükü → Parsing Zaman Aşımı → Parça Atılır
[Temiz Semantic HTML + JSON-LD] → Fazladan Yük Olmaz → Hızlı İşleme
AI sistmelri, maliyeti minimize etmek için agresif kısaltma yöntemleri kullanır. DOM ağacınız çok karmaşıksa, bot sayfanın ortasında okumayı bırakabilir ve en önemli kısımlarınızı kaçırabilir. Çünkü AI sistemlerinin her milisaniyesi, harcanan elektrik ve işlem ücreti demektir.
Temiz Semantic HTML kod örneği:
<article>
<section>
<h2>Başlık</h2>
<p>İçerik…</p>
</section>
</article>
Şimdi tüm bu parçaları bir araya getirip, uygulanabilir bir stratejiye dönüştürme zamanı.
AI Arama Sistemleri İçin İçerik Optimizasyonu Checklist’i
Aşağıdaki 7 maddenin tamamını uyguladığınızda, içeriğiniz yapay zeka arama sistemleri için optimize edilmiş olur:
- Query Fan-Out Eşleştirme: Kullanıcının sorgusundan yapay zekanın üretebileceği farklı sorguları önceden belirleyin ve hepsini içeriğinizde kullanın.
- Semantik Parça Bölümleme: Her konuyu mantıklı ve bağımsız parçalara (chunk) ayırın. Her bölüm kendi başına anlamlı olsun.
- Parça Seviyesinde Bağlamsal Netlik (Contextual Clarity): Her parçanın tek başına okunduğunda tam olarak anlaşılır olmasına özen gösterin. Belirsiz ifadeleri kulanmamaya özen gösterin.
- Operasyonel Gerçekçilikle Yazım: Boş pazarlama laflarını kullanmayın. Somut veri, sayı, teknik detay ve operasyonel gerçekler kullanın.
- JSON-LD ile Varlık Güçlendirme: Önemli varlıkları (Organization, Service, Offer, Location gibi) schema tiplerini doğru kullanın. Ve AI sistemlerinin okunabilir şekilde tanımlayın.
- Cevaba Öncelikli İçerik Yapısı: Her bölümde en önemli cevabı en başta verin, ardından detaylandırın.
- Citation-Ready Parça Oluşturma: Her önemli parçayı, yapay zekanın doğrudan alıntı (citation) yapabileceği kadar net, eksiksiz ve güvenilir yazın.
Geleceğin Arama Motoları Retrieval Motorlar Olacak
SEO’nun geleceği artık sadece Google’da üst sıralarda çıkmakla ilgili değil. Arama motorları hızla Retrieval Engine’lere (Bilgi Çekme Motoru) dönüşüyor. Yani artık önemli olan,AI’ların seni kolayca bulup kullanabilmesi.
SEO’nun geleceğini şekillendirecek en önemli trendleri:
1. AI Overview (AI Özetleri)
AI’lar artık arama sonuçlarında kendi özetlerini oluşturuyor. Kullanıcı sorguyu sorduğunda, Google, Perplexity, ChatGPT gibi araçlar birçok kaynaktan bilgi çekip tek bir cevap veriyor.
2. Agentic Search (Ajanlı Arama)
Gelecekte AI’lar sadece cevap vermekle kalmayacak, senin adına görev yapacak.
Örnek: “Bana İstanbul’da 3 günlük tatil planı yap, uçak bileti bul, otel rezervasyonu öner.”
Bu tür ajanlar birçok kaynaktan bilgi çekip karar verecek. İçeriğin bu ajanlar için net, güvenilir ve aksiyon odaklı olması gerekecek.
3. Conversational Retrieval (Konuşma Tarzı Bilgi Çekme)
Tek seferlik arama yerine uzun sohbetler aranacak.
Kullanıcı “Bunu biraz daha detaylandır”, “Önceki yazdığınla bun arasında fark var mı?” gibi devam eden sorular soracak.
İçeriğin bağlamı koruyan, mantıksal akışı güçlü ve derinlikli olması bu yüzden çok kritik.
4. Answer Engines (Cevap Motorları)
Gemini, Grok, ChatGPT, Claude gibi cevap motorları, link vermek yerine doğrudan cevap veriyorlar. Bu yüzden içeriğinin doğrudan cevap verebilir ve alıntılanabilir yapıda olması gerekiyor.
5. Generative Retrieval (Üretken Bilgi Çekme)
AI’lar artık statik sayfaları ezberlemek yerine, soruya özel yeni cevaplar üretecek.
Yani içeriğin temel yapı taşları (bilgi, veri, bakış açısı) ne kadar temiz, net ve iyi organize edilmiş ise, AI’lar o kadar kaliteli çıktı üretebilecek.
Gelecek, Retrieval Dostu Markalara Ait
Yirmi beş yıl boyunca dijital dünya çok basit bir oyun üzerine kuruluydu:
Kullanıcı kelime yazar, arama motoru link sıralar, markalar da tıklama için yarışırdı.
O oyun artık bitti.
Artık statik web sayfalarından oluşan eski bir dizinde sıralama peşinde değiliz.
Akıllı ajanlardan oluşan bağlı bir ekosistemde var olmak zorundayız.
Arama motorları klasik “indeksle ve sırala” yapısından çıkıp “bul ve sentezle” motorlarına dönüştü.
Artık kelime yoğunluğu, basit backlink veya yüzeysel optimizasyonlarla kandırılamıyorlar.
Modern bir AI arama motoru bir sorguya cevap verirken tamamen farklı bir yöntem kullanıyor:
- Ham kelimeleri eşleştirmek yerine bağlam çekiyor.
- Düz başlıkları taramak yerine varlıkları (entities) anlıyor.
- Şüpheli içerikler yerine güvenilir ve net markaları tercih ediyor.
Arama Otoritesi için Retrieval Optimizasyonu
Sıralama optimizasyonundan retrieval optimizasyonuna geçtik.
Eğer siteniz parçalı içeriklerden, boş sloganlardan ve şişirilmiş kodlardan oluşuyorsa, yeni nesil arama sistemleri sizi kolayca es geçecek.
Kazananlar, içeriklerini makine tarafından okunabilir, net, yoğun ve yapılandırılmış hale getiren markalar olacak.
Her paragraf, her alt başlık ve her kod satırı, AI ajanlarının kolayca çekip güvenebileceği bir veri parçası olarak düşünülmeli.
Gelecek en boş pazarlama dilinde içerik yazanlara veya en çok backlink satın alanlara ait değil.
Gelecek, retrieval dostu olan markalara ait.

Yunus Meran, önde gelen SEO ajanslarından Bilişimsayar’ın kurucusudur. 8 yılı aşkın SEO deneyimine sahip olan Yunus, anlamsal SEO, modern arama motoru teknolojileri ve müşteri yolculuğu yönetimi konularında uluslararası düzeyde tanınan bir SEO uzmanıdır. Yunus, dünya genelindeki işletmelere kurum içi ekipler için pratik SEO stratejileri, danışmanlık hizmetleri ve arama motoru pazarlama uygulamaları sunmaktadır.


