Konular

XML Site haritası yapmak

XML Google ve Yahoo uyumlu site haritası yapmak aslında çok basit, bilmeniz gereken sadece site haritası için xml kodları
www.dijitalders.com

Örnek site haritası; 

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.google.com/schemas/sitemap/0.84 http://www.google.com/schemas/sitemap/0.84/sitemap.xsd">
<url>
<loc>http://www.bilgiportal.com.com/</loc>
      <lastmod>2007-04-23</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.5</priority>
   </url>
  <url> 
 <loc>http://www.bilgiportal.com.com/makaleler.php</loc>
      <lastmod>2007-04-23</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.5</priority>
   </url>
</urlset>

 

<urlset> gerekli
<url> gerekli 
<loc> sayfanın adresi - gerekli
<lastmod> tarih - isteğe bağlı
<changefreq> değerler; always, hourly, daily, weekly, monthly, yearly, never - isteğe bağlı
<priority> varsayılan olarak 0.5 - isteğe bağlı

 

Notlar;

Sitemap oluştururken listeye subdomainleri eklemeyin, domainin sonuna / ekleyin örnek; www.bilgiportal.com/  yada www.bilgiportal.com/dizin/  

Google sitemap adresi: http://www.google.com/webmasters/sitemaps/  


Site Haritası Protokolü, arama motorlarına web sitelerinizdeki taranabilir URL'ler hakkında bilgi vermenizi sağlar. Site Haritası Protokolünü kullanan bir Site Haritası, en basit haliyle sitenin URL'lerini listeleyen bir XML dosyasıdır. Protokol üst düzeyde ölçeklendirilebilir şekilde yazıldığından, her boyuttaki site için kullanılabilir. Ayrıca, arama motorlarının siteyi daha akıllı şekilde tarayabilmesi için web yöneticilerinin her URL'yle ilgili daha fazla bilgiye (son güncellenme zamanı, ne sıklıkta değiştiği ve sitedeki diğer URL'lere göre ne kadar önemli olduğu) yer vermesine de olanak tanır.

Site haritaları, kullanıcıların taranabilir bir arayüz aracılığıyla web sitesinin tüm alanlarına ulaşamadığı durumlarda özellikle yararlıdır. (Genel olarak bu, kullanıcıların bağlantıları izleyerek sitenin bazı sayfalarına veya bölgelerine ulaşamadığı durumlardır). Örneğin, belirli sayfaların yalnızca arama formu yoluyla erişilebildiği sitelerde Site Haritası oluşturmak ve bunu arama motorlarına göndermek yararlıdır.

Bu belge Site Haritası dosyalarına ilişkin biçimleri açıklar ve ayrıca arama motorlarının alabilmeleri için Site Haritası dosyalarınızı nereye göndermeniz gerektiği hakkında bilgi verir.

Site Haritası Protokolünün, arama motorlarının URL'leri bulmak için kullandıkları tarama tabanlı düzenekleri tamamladığını ancak onların yerini almadığını lütfen unutmayın. Bir arama motoruna bir Site Haritası (veya Site Haritaları) göndererek, söz konusu arama motoru tarayıcılarının sitenizi daha iyi taramasına yardımcı olursunuz.

Bu protokolü kullanmak, web sayfalarınızın arama dizinlerine eklenmesini garanti etmemektedir. (Bu protokolü kullanmanın sayfalarınızın Google tarafından nasıl sıralandığını etkileyemeyeceğini unutmayın.)

Google, sitemaps.org tarafından zorunlu tutulan Site Haritaları Protokolü 0.9’a uymaktadır. Bu nedenle Google için Site Haritaları Protokolü 0.9 kullanılarak oluşturulan Site Haritaları, sitemaps.org standartlarını benimseyen diğer arama motorlarıyla uyumludur.

XML Site Haritası Biçimi [İçindekiler]

Site Haritası Protokolü biçimi XML etiketlerinden oluşur. Site Haritasındaki tüm veri değerleri entity-escaped olmalıdır. Dosyanın kendisi UTF-8 olarak kodlanmış olmalıdır.

Yalnızca bir URL içeren ve isteğe bağlı tüm etiketlerin kullanıldığı örnek bir Site Haritası aşağıda gösterilmiştir. İsteğe bağlı etiketler italik yazılmıştır.

  <?xml version="1.0" encoding="UTF-8"?>
< urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   < url>
    < loc>http://www.ornek.com.tr/</loc>
   < lastmod>2005-01-01</lastmod>
    < changefreq>her ay</changefreq>
    < priority>0,8</priority>

   </url>  
</urlset>

Site Haritası şu özellikleri taşımalıdır:

  • Bir açılış <urlset> etiketiyle başlamalı ve bir kapanış </urlset> etiketiyle bitmelidir.
  • Her bir URL için, bir ana XML etiketi olarak bir <url> girişi içermelidir.
  • Her bir <url> ana etiketi için bir <loc> alt öğe girişi içermelidir.

XML etiketi tanımları

Kullanılabilir XML etiketleri aşağıda açıklanmıştır.

<urlset>
gerekli Dosyayı kapsüller ve geçerli protokol standardını referans olarak kullanır.
<url>
gerekli Her bir URL girişine ilişkin ana etiket. Geri kalan etiketler, bu etiketin alt öğeleridir.
<loc>
gerekli Sayfanın URL'si. Bu URL protokolle (http gibi) başlamalı ve sunucunuz gerektiriyorsa bir eğik çizgiyle sona ermelidir. Bu değer, 2048 karakterden az olmalıdır.
<lastmod>
isteğe bağlı Dosyada yapılan son değişikliğin tarihi. Bu tarih W3C Datetime biçiminde olmalıdır. Bu biçim, isterseniz saat bölümünü çıkarmanıza ve YYYY-AA-GG biçimini kullanmanıza olanak sağlar.
<changefreq>
isteğe bağlı

Sayfanın olası değişme sıklığı. Bu değer, arama motorlarına genel bir bilgi sağlar ve sayfayı tarama sıklıklarıyla tam olarak ilişkili olmayabilir. Geçerli değerler şunlardır:

  • always (her zaman)
  • hourly (her saat)
  • daily (her gün)
  • weekly (her hafta)
  • monthly (her ay)
  • yearly (her yıl)
  • never (hiçbir zaman)

Her erişildiklerinde değişen belgeleri tanımlamak için "always" (her zaman) değeri kullanılmalıdır. Arşivlenen URL'leri açıklamak için "never" (hiçbir zaman) değeri kullanılmalıdır.

Bu etiketin değerinin bir komut olarak değil, bir ipucu olarak düşünüldüğünü lütfen unutmayın. Arama motoru tarayıcıları karar verirken bu bilgileri dikkate alsa da, "hourly" (her saat) olarak işaretlenmiş sayfaları ondan daha seyrek ve "yearly" (her yıl) olarak işaretlenmiş sayfaları ondan daha sık tarayabilirler. Ayrıca, sayfalardaki beklenmeyen değişiklikleri işleyebilmeleri için, tarayıcıların "never" (hiçbir zaman) olarak işaretlenmiş sayfaları düzenli olarak taramaları da olasıdır.

<priority>
isteğe bağlı

Sitenizdeki diğer URL'lere göre bu URL'nin önceliği. Geçerli değerler 0,0 ile 1,0 arasında değişir. Bu değerin, diğer sitelerdeki sayfalarla karşılaştırıldığında, sizin sayfalarınız üzerinde hiçbir etkisi olmaz ve yalnızca, sayfalarınızın taramasını sizin istediğiniz sıralamaya göre yapabilmeleri için arama motorlarının sayfalarınızdan hangilerinin sizin için en önemli sayfalar olduğunu bilmelerine olanak sağlar.

Bir sayfanın varsayılan önceliği 0,5'tir.

Bir sayfaya atadığınız önceliğin, arama motorunun sonuç sayfalarındaki URL'lerinizin konumu üzerinde hiçbir etkisinin bulunmadığını lütfen unutmayın. Arama motorları aynı sitedeki URL'ler arasında seçim yaparken bu bilgileri kullanabileceğinden, daha önemli sayfalarınızın bir arama dizininde yer alması olasılığını artırmak için bu etiketi kullanabilirsiniz.

Ayrıca lütfen, sitenizdeki tüm URL'lere yüksek bir öncelik atamanın size bir yardımı dokunmayacağını da unutmayın. Öncelik göreli olduğundan, yalnızca sitenizdeki URL'ler arasında seçim yapmak için kullanılır; sayfalarınızın önceliği, diğer sitelerdeki sayfaların önceliğiyle karşılaştırılmaz.

'Varlık kaçış' kodları kullanma

Bizim için Site Haritası dosyanızın UTF-8 olarak kodlanmış olması gerekir (bunu genellikle dosyayı kaydederken yapabilirsiniz). Tüm XML dosyalarında olduğu gibi, aşağıdaki tabloda listelenen karakterler için tüm veri değerlerinin (URL'ler dahil) 'varlık kaçış' kodları kullanması gerekir.

Karakter Escape Kodu
Ve işareti & &amp;
Tek Tırnak İşareti ' &apos;
Çift Tırnak İşareti " &quot;
Büyüktür İşareti > &gt;
Küçüktür İşareti < &lt;

Buna ek olarak, tüm URL'ler (Site Haritanızın URL'si de dahildir) bulundukları web sunucusu tarafından okunabilirlik açısından kodlanmalı ve 'URL-escaped' olmalıdır. Öte yandan, URL'lerinizi oluşturmak için herhangi bir türde komut dosyası, araç veya günlük dosyası (URL'leri elle yazmak dışında herhangi bir şey) kullanıyorsanız, bu çoğunlukla sizin yerinize yapılır. Site Haritanızı gönderir ve Google'ın bazı URL'lerinizi bulamadığını belirten bir hata alırsanız, URL'lerinizi kontrol edip bunların URI'ler için RFC-3986 standardına, IRI'ler için RFC-3987 standardına ve XML standardına uygun olduğundan emin olun.

Aşağıdaki örnekte, ASCII olmayan bir karakterle (ü) 'entity escape' gerektiren bir karakterin (&) kullanıldığı bir URL gösterilmiştir:

http://www.ornek.com.tr/ümlat.html&q=ad

Aynı URL, ISO-8859-1 kodlanmış (o kodlamayı kullanan bir sunucuda barındırılması için) ve 'URL escaped' olarak aşağıdadır:

http://www.ornek.com.tr/%FCmlat.html&q=ad

Aynı URL, UTF-8 kodlanmış (o kodlamayı kullanan bir sunucuda barındırılması için) ve 'URL escaped' olarak aşağıdadır:

http://www.ornek.com.tr/%C3%BCmlat.html&q=ad

Aşağıdaki URL, 'entity escaped' özellikli olarak aynı URL'dir:

http://www.ornek.com.tr/%C3%BCmlat.html&amp;q=ad

Örnek XML Site Haritası

Aşağıdaki örnekte, XML biçiminde bir Site Haritası gösterilmiştir. Örnekteki Site Haritası, her biri <loc> XML etiketi kullanılarak tanıtılan az sayıda URL içerir. Bu örnekte, her bir URL için farklı bir isteğe bağlı parametre seti kullanılmıştır.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

   <url>
      <loc>http://www.ornek.com.tr/</loc>
      <lastmod>2005-01-01</lastmod>
      <changefreq>her ay</changefreq>
      <priority>0,8</priority>
   </url>
   <url>
      <loc>http://www.ornek.com.tr/catalog?item=12&amp;desc=tatil_bodrum</loc>
      <changefreq>her hafta</changefreq>
   </url>
   <url>
      <loc>http://www.ornek.com.tr/catalog?item=73&amp;desc=tatil_yeni_zelanda</loc>
      <lastmod>2004-12-23</lastmod>
      <changefreq>her hafta</changefreq>
   </url>
   <url>
      <loc>http://www.ornek.com.tr/catalog?item=74&amp;desc=tatil_newfoundland</loc>
      <lastmod>2004-12-23T18:00:15+00:00</lastmod>
      <priority>0,3</priority>
   </url>
   <url>
      <loc>http://www.ornek.com.tr/catalog?item=83&amp;desc=tatil_abd</loc>
      <lastmod>2004-11-23</lastmod>
   </url>
</urlset>

Site Haritası dosyalarınızı gzip kullanarak sıkıştırabilirsiniz. Site Haritası dosyalarınızı sıkıştırmanız bant genişliği gereksiniminizi azaltacaktır. Sıkıştırılmamış Site Haritası dosyanızın 10MB’tan büyük olamayacağını lütfen unutmayın.

Site Haritası dizin dosyalarını kullanma (birden fazla site haritası dosyasını gruplandırmak için) [İçindekiler]

Birden fazla Site Haritası dosyası gönderebilirsiniz, ancak gönderdiğiniz her bir Site Haritası dosyası en fazla 50.000 URL içermelidir ve sıkıştırıldığında 10MB'tan (10.485.760) büyük olmamalıdır. Bu limitler, web sunucunuzun çok büyük dosyalar sunması nedeniyle kilitlenmemesini sağlar.

50.000'den fazla URL listelemek isterseniz, birden fazla Site Haritası dosyası oluşturmanız gerekir. Site Haritanızın 50.000'den fazla URL içerecek veya 10MB'tan fazla olarak şekilde büyük olacağını öngörüyorsanız, birden fazla Site Haritası dosyası oluşturmayı düşünmelisiniz. Birden fazla Site Haritası gönderdiğinizde, onları bir Site Haritası dizin dosyasında listeleyebilirsiniz. Site Haritası dizin dosyalarında 1.000'den fazla Site Haritası listelenemez.

Bir Site Haritası dizin dosyasının XML biçimi, bir Site Haritası dosyasının XML biçimine çok benzer. Site Haritası dizin dosyasında aşağıdaki XML etiketleri kullanılır:

Not: Bir Site Haritası dizin dosyası, yalnızca Site Haritası dizin dosyasıyla aynı sitede bulunan Site Haritalarını belirtebilir. Örneğin, http://www.siteniz.com.tr/sitemap_index.xml, http://www.siteniz.com.tr'deki Site Haritalarını içerebilir, ancak http://www.örnek.com.tr veya http://anamakineniz.siteniz.com.tr'dekileri içeremez. Site Haritalarında olduğu gibi, Site Haritası dizin dosyanız UTF-8 olarak kodlanmış olmalıdır.

Örnek XML Site Haritası Dizini

Aşağıdaki örnekte, XML biçiminde bir Site Haritası dizini gösterilmiştir. Site Haritası dizininde iki Site Haritası listelenmektedir:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
      <loc>http://www.ornek.com.tr/siteharitasi1.xml.gz</loc>
      <lastmod>2004-10-01T18:23:17+00:00</lastmod>
   </sitemap>
   <sitemap>
      <loc>http://www.ornek.com.tr/siteharitasi2.xml.gz</loc>
      <lastmod>2005-01-01</lastmod>
   </sitemap>
</sitemapindex>

Not: XML dosyalarınızdaki tüm değerler gibi, Site Haritası URL'leri değerleri entity-escaped olmalıdır.

Site Haritası Dizini XML Etiketi Tanımları

  • <loc> etiketi gereklidir ve Site Haritasının yerini belirtir.

  • <lastmod> etiketi, ilgili Site Haritası dosyasının değiştirildiği saati tanıtan isteğe bağlı bir etikettir. Site Haritasında listelenen sayfalardan herhangi birinin değiştirildiği saate karşılık gelmez. lastmod etiketinin değeri W3C Datetime biçiminde olmalıdır.

    Son değiştirme zaman damgasını sağlayarak, arama motoru tarayıcılarının dizindeki Site Haritalarının yalnızca bir alt kümesini almasını sağlarsınız; diğer deyişle, bir tarayıcı yalnızca belirli bir tarihten bu yana değiştirilen Site Haritalarını alabilir. Bu artımlı Site Haritası alma düzeneği, çok büyük sitelerde yeni URL'lerin hızlı bir şekilde keşfedilmesine olanak sağlar.

  • <sitemap> etiketi, tek bir Site Haritası ile ilgili bilgileri kapsüller.

  • <sitemapindex> etiketi, dosyadaki tüm Site Haritaları ile ilgili bilgileri kapsüller.

Site Haritası Dosyalarının Yeri [İçindekiler]

Site Haritası dosyasının yeri, o Site Haritasına eklenebilecek URL kümesini belirler. http://ornek.com.tr/catalog/siteharitasi.gz adresinde bulunan bir site haritası dosyası http://ornek.com.tr/catalog/ ile başlayan tüm URL’leri içermesine karşın, http://ornek.com.tr/images/ ile başlayan URL’leri içermemektedir.

http://ornek.org/path/siteharitasi.gz üzerinde değişiklik yapma izniniz varsa, http://ornek.org/path/ önekine sahip URL’ler için bilgi sağlama izninizin bulunduğunu varsaymak yerinde olacaktır. http://ornek.com.tr/catalog/siteharitasi.gz dosyasında geçerli kabul edilen URL örnekleri şunlardır:

	http://ornek.com.tr/catalog/show?item=23
http://ornek.com.tr/catalog/show?item=233&user=3453

http://ornek.com.tr/catalog/siteharitasi.gz dosyasında geçerli olduğu düşünülmeyen URL'ler şunları içerir:

	http://ornek.com.tr/image/show?item=23
http://ornek.com.tr/image/show?item=233&user=3453
https://ornek.com.tr/catalog/page1.html

Geçerli olmadığı düşünülen URL'ler daha fazla dikkate alınmaz. Site Haritanızı web sunucunuzun kök dizinine yerleştirmeniz önemle tavsiye edilir. Örneğin, web sunucunuz ornek.com.tr sitesindeyse, Site Haritası dizin dosyanız http://ornek.com.tr/siteharitasi.gz adresinde olur. Belirli durumlarda, farklı yollar için farklı Site Haritaları üretmeniz gerekebilir; örneğin, kuruluşunuzdaki güvenlik izinlerinin farklı dizinlere yazma erişimini bölümlendirmesi durumunda.

Site Haritanızı Doğrulama [İçindekiler]

Google, Site Haritası dosyanızda görünebilecek öğeleri ve öznitelikleri tanımlamak için bir XML şeması kullanır. Bu şemayı, aşağıdaki bağlantılardan indirebilirsiniz:

Site Haritaları için: http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd
Site Haritası dizin dosyaları için: http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd

Site Haritanızın yapısını bu şemaya göre doğrulamanıza yardımcı olacak bazı araçlar vardır. XML ile ilgili araçların listesini aşağıdaki yerlerde bulabilirsiniz:

http://www.w3.org/XML/Schema#Tools
http://www.xml.com/pub/a/2000/12/13/schematools.html

Site Haritanızı veya Site Haritası dizin dosyanızı bir şemayla karşılaştırarak doğrulamak için, XML dosyası ek başlıklara gerek duyar. Site Haritası Oluşturucu kullanıyorsanız, bu başlıklar zaten eklenmiştir. Site haritalarınızı oluştururken başka bir araç kullanıyorsanız, XML dosyasındaki başlık aşağıdaki örneklere benzer olmalıdır.

Site Haritası:

	<?xml version='1.0' encoding='UTF-8'?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">

<url>
...
</url>
</urlset>

Site Haritası dizin dosyası:

	<?xml version='1.0' encoding='UTF-8'?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd">

<sitemap>
...
</sitemap>
</sitemapindex>

 

Sık Sorulan Sorular [İçindekiler]

S: URL'leri Site Haritasında nasıl gösterebilirim?

Tüm XML dosyalarında olduğu gibi, aşağıdaki karakterler için tüm veri değerlerinin (URL'ler dahil) entity escape kodları kullanması gerekir: ve işareti (&), tek tırnak ('), çift tırnak ("), küçüktür (<) ve büyüktür (>). Ayrıca, tüm URL'lerin URI'lar için RFC-3986 standardına, IRI'lar için RFC-3987 standardına ve XML standardına uyduğundan emin olmalısınız. URL'lerinizi oluşturmak için komut dosyası kullanıyorsanız, bu komut dosyasının bir parçası olarak genelde bunları 'URL escape' olarak belirleyebilirsiniz. Yine de bunları 'entity escape' olarak belirlemeniz gerekecektir. Örneğin, aşağıdaki python komut dosyası http://www.ornek.com.tr/view?widget=3&count>2 URL'sini 'entity escape' olarak belirler.

	$ python
Python 2.2.2 (#1, Feb 24 2003, 19:13:11)
>>> import xml.sax.saxutils
>>> xml.sax.saxutils.escape("http://www.ornek.com.tr/view?widget=3&count>2")

Yukarıdaki örnekte oluşan URL:

	http://www.ornek.com.tr/view?widget=3&amp;count&gt;2	

S: Site Haritası dosyalarımı oluşturmak için hangi karakter kodlama yöntemini kullandığım önemli mi?

Evet. Site Haritası dosyalarınızda UTF-8 kodlaması kullanılmalıdır.

S: Zamanı nasıl belirtebilirim?

lastmod zaman damgaları ve bu protokoldeki tüm diğer tarihler ve saatler için W3C Datetime kodlamasını kullanın. Örneğin, 2004-09-22T14:12:14+00:00.

Bu kodlama, ISO8601 biçiminin saat bölümünü çıkarmanıza olanak sağlar; örneğin, 2004-09-22 de geçerlidir. Bununla birlikte, siteniz sık sık değişiyorsa, tarayıcıların sitenizle ilgili daha eksiksiz bilgiye sahip olmaları için saat bölümünü eklemeniz tavsiye edilir.

S: Son değiştirme tarihini nasıl hesaplayabilirim?

Statik dosyalar için, bu gerçek dosya güncelleme tarihidir. Bu tarihi almak için UNIX date komutunu kullanabilirsiniz:

	$ date --iso-8601=seconds -u -r /home/foo/www/bar.html
>> 2004-10-26T08:56:39+00:00

Birçok dinamik URL için, gerideki verilerin ne zaman değiştirildiğine dayalı olarak veya düzenli güncellemelere (varsa) dayalı bazı tahminler kullanarak, bir son güncelleme tarihini kolayca hesaplayabilirsiniz. Bir tahmini tarih veya zaman damgası kullanmak bile, tarayıcıların değiştirilmemiş olan URL'leri taramaktan kaçınmalarına yardımcı olabilir. Bu, web sunucularınız için bant genişliğini ve CPU gereksinimlerini azaltır.

S: Site Haritamı nereye yerleştirebilirim?

Site Haritanızı HTML sunucunuzun kök dizinine yerleştirmeniz önemle tavsiye edilir; diğer deyişle,http://ornek.com.tr/siteharitasi.xml.gz adresine yerleştirin.

Bazı durumlarda, örneğin kuruluşunuzdaki güvenlik izinleri farklı dizinlere yazma erişimini bölümlendirirse, sitenizdeki farklı yollar için farklı Site Haritaları üretmek isteyebilirsiniz.

http://ornek.com.tr/path/siteharitasi.xml.gz dosyasını karşıya yükleme izniniz varsa, meta verileri http://ornek.com.tr/path/ altında raporlama izniniz olduğunu da varsayarız.

S: Site Haritam ne kadar büyük olabilir?

Site Haritaları sıkıştırılmamış olduklarında 10MB’tan (10.485.760 bayt) uzun olmamalı ve en fazla 50.000 URL içermelidir. Bu, siteniz 50.000'den fazla URL içeriyorsa veya Site Haritanız 10MB'tan büyükse, birden çok Site Haritası dosyası oluşturmanız ve bir Site Haritası dizin dosyası kullanmanız gerektiği anlamına gelir. Küçük bir siteniz olsa bile, 50.000'den fazla URL içerecek veya dosya büyüklüğü 10MB’ı aşacak şekilde büyütmeyi planlıyorsanız, Site Haritası dizin dosyası kullanmalısınız.

S: Sitemde on milyonlarca URL var; yalnızca yakın zamanda değişenleri göndermem mümkün mü?

Az sayıdaki Site Haritalarında güncellenen URL'leri listeleyebilir, ardından söz konusu Site Haritası dosyalarını tanıtmak için Site Haritası dizin dosyanızda lastmod etiketini kullanabilirsiniz. Arama motorları daha sonra, yalnızca değiştirilen Site Haritalarını artımlı olarak tarayabilir.

S: Site Haritamı ürettikten sonra ne olur?

Site Haritanızı ürettikten sonra, arama motorlarına Site Haritasının yerini bildirmeniz gerekir. Bildirimde bulunduğunuz arama motorları Site Haritanızı alabilir ve URL'leri tarayıcılar için kullanılabilir duruma getirebilir.

S: URL'lerin Site Haritası'nda tam olarak belirtilmesi gerekir mi?

Evet. URL'nize protokolü (örneğin, http) de eklemeniz gerekir. Web sunucunuz gerektiriyorsa, URL'nizin sonuna bir eğik çizgi de eklemeniz gerekir. Örneğin, http://www.google.com.tr/bir Site Haritası için geçerli bir URL'dir, www.google.com.tr ise geçerli değildir.

S: Sitem, URL'lerin hem "http" hem de "https" versiyonunu içeriyor. Her ikisini de listelemem gerekiyor mu?

Hayır. Lütfen Site Haritalarınızda URL'nin tek bir sürümünü listeleyin. URL'lerin birden fazla sürümünün eklenmesi, sitenizin eksik taranmasına neden olabilir.

S: Sitemdeki URL'ler oturum kimlikleri içeriyor. Onları çıkarmam gerekir mi?

Evet. Oturum kimliklerini URL'lere eklemek, sitenizin eksik ve gereksiz yere taranmasına neden olabilir.

S: Bir URL'nin bir Site Haritasındaki konumu kullanımını etkiler mi?

Hayır. URL'nin Site Haritası içindeki konumu, arama motoru tarafından kullanılma ve değerlendirilme şeklini etkilemez.

S: Sitemizdeki bazı sayfalar çerçeve kullanır. Çerçeve kümesi URL’lerini mi yoksa çerçeve içeriklerinin URL’lerini mi eklememiz gerekir?

Lütfen her iki URL'yi de ekleyin.

S: Site Haritalarımı zip'leyebilir miyim, yoksa gzip'lenmeleri mi gerekir?

Site Haritalarınızı sıkıştırmak için lütfen gzip kullanın.

S: XML Site Haritasındaki "öncelik" ipucu, sayfalarımın arama sonuçlarındaki sıralamasını değiştirir mi?

Hayır. Site Haritanızdaki "öncelik" ipucu, yalnızca belirli bir URL'nin kendi sitenizdeki diğer URL'lere göre önemini belirtir.

S: XML Site Haritamı doğrulamak için kullanabileceğim bir XML şeması var mı?

Site Haritası dosyaları için bir XML şeması http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd adresinde ve Site Haritası dizin dosyaları için bir şema http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd adresinde bulunur. Burada Site Haritanızı doğrulama hakkında daha fazla bilgi edinebilirsiniz.

Sorun Giderme

Bu protokole göre oluşturduğunuz bir Site Haritası gönderdiyseniz ve çözümleme hataları veya protokolle ilişkili başka hatalar alırsanız, Site Haritanızı XML şemasına göre doğrulayın. Genel olarak, doğrulama işlemi sırasında Site Haritası ile ilgili belirli sorunlar hakkında ek bilgi edinebilirsiniz.

Site Haritanızı gönderir ve Google'ın bazı URL'lerinizi bulamadığı şeklinde bir hatayla karşılaşırsanız, URL'lerin doğru şekilde URL olarak kodlanmış ve escape kodunun kullanılmış olmasına dikkat edin.


Kaynaklar  http://www.sitemaps.org/protocol.php www.google.com/webmasters/tools/docs/tr/protocol.html#sitemapValidation    www.bilgiportal.com

Yorumunuzu Ekleyin
?ref= saldırısı ve çözümleri

Ref saldırıların zararları sitenizin sandbox' a girmesine, filtreye düşmesine veya keywords larda sıralamalardan düşmesine yol açmaktadır.

20,130 Okunma 0 Yorum 06/03/2009 00:29:48

Robots.txt Dosyası Kullanım Robotları Yölendirme Kontrol

Robots.txt dosyası arama motorları ve örümceklere sitenizdeki dosya ve klasörleri gezip kayıt etmeleri için izin veren ya da engelleyen dosyadır.Dosya kendi başına normal bir text dosyasından farksızdır ve basit şekilde Notepad ile hazırlanabilir.Anasayfanızın ya da sitenizin bulunduğu ana klasöre koyulmalıdır

15,005 Okunma 0 Yorum 05/10/2007 02:08:05 13/12/2014 02:08:23

Yükleniyor...