wordpress, joomla, hazır scriptler, temalar, photoshop, javascript, CSS, SEO, hit, SMF, blog, google, alexa, para kazanma, meta,keywords, DMOZ, Pagerank
23 Eki
Robots.txt dosyası arama motorları ve örümceklere sitenizdeki dosya ve klasörleri gezip kayıt etmeleri için izin veren ya da engelleyen dosyadır…. Dosya kendi başına normal bir text dosyasından farksızdır ve basit ÅŸekilde Notepad ile hazırlanabilir. Anasayfanızın ya da sitenizin bulunduÄŸu ana klasöre koyulmalıdır…
Neden robots.txt dosyasına ihtiyacım var?
Tüm önemli arama motorları, sitenize girer girmez öncelikli olarak bir robots.txt dosyası arar. Sitenizin herhangi bir bölümüne, örümceklerin girmesini istemiyorsanız ya da girmelerini engellemek istemiyorsanız bile bir robots.txt dosyası bulundurmak her zaman için yararlıdır. Çünkü bu dosya örümcekler için bir karşılama dosyası, menü gibi görev yapar.
Neden örümcekleri engellemek isteyebilirim?
1. Site henüz tamamlanmamış olabilir. Ya da henüz tam oalrak bitmemiş sayfalar içeriyor olabilir. Ve bu durumda sitenizin ya da sayfalarınızın yarım yamalak kayıt edilmesini istemeyebilirsiniz.
2. Şifrelemeye gerek duymadığınız ama yine de sizin için özel olan bir içeriğe ya da sitenizde bir bölüme sahip olabilirsiniz ve bunun arama motorları tarafından kayıt edilmesini ve aramalarda çıkmasını istemeyebilirsiniz.
3. Hata sayfalarının, cgi-bin gibi klasörlerin ya da teÅŸekkür ettiÄŸiniz, içinde sadece “tamam” gibi kısa mesajlar bulundurduÄŸunuz dosya ve klasörlerinizin kayıt edilmesi kimsenin iÅŸine yaramayacaktır.
4. Birbirine benzeyen, geçişli sayfalarınız varsa bütün robotların aynı şeyi kaydetmesini istemeyebilirsiniz. Bu spam riski doğurabilir.
5. Yer almak istemediğiniz arama motorlarından ya da e-mail toplayan zararlı örümceklerden robots.txt dosyası aracılığıyla kurtulabilirsiniz.
Robots.txt dosyası oluşturmak
Robots.txt dosyasını herhangi bir text editor ya da notepad ile oluşturabilirsiniz. Temelde içeriği şu şekildedir :
User-Agent: [Örümcek ya da Bot ismi]
Disallow: [Klasör ya da Dosya ismi]
Robots.txt ile belirli bir dosyayı belirli bir bottan korumak
Mesela “Haberler” diye bir bölüm oluÅŸturuyorsunuz ve henüz tamamlanmadan robotların gelip kayıt etmesini istemiyorsunuz. Bu durumda, hedef tüm robotlar olduÄŸu için özellikle robot ismi belirtmek yerine yıldız iÅŸareti “*” kullanmalısınız. Bu tüm robotları kapsayacaktır.
User-Agent: *
Disallow: /haberler/
KoruduÄŸunuz bölüm isminin başına ve sonuna slah iÅŸareti “/” koymanız o klasördeki tüm dosyaları kapsayacaktır.
Tüm robotlara kayıt izmi vermek
Hedefimiz yine tüm robotlar olduÄŸu için yıldız “*” iÅŸareti kullanarak Disallow bölümünü boÅŸ bırakıyoruz.
User-agent: *
Disallow:
Tüm robotları dosya ve klasörlerinizden uzak tutmak
Yukarıdaki koda çok benzeyen ama ufak bir değişikliği olan bir kod ile tüm robotları dosya ve kalsörlerinizden uzak tutabilir, kayıt etmelerini engelleyebilirsiniz.
User-agent: *
Disallow: /
Robots.txt ile birden fazla klasör engellemek
Ayarları dikkatli bir ÅŸekilde yapmalısınız. Yoksa istemediÄŸiniz dosya ve klasörleri kayıt ettirebilir, istediklerinizi engelleyebilirsiniz. Diyelim ki “cgi-bin” klasörünüzün içindeki bazı dosyaların kayıt edilmesini istemiyorsunuz.
User-agent: *
Disallow: /cgi-bin/
Disallow: /_borders/
Disallow: /_derived/
Disallow: /_fpclass/
Disallow: /_overlay/
Disallow: /_private/
Disallow: /_themes/
Disallow: /_vti_bin/
Disallow: /_vti_cnf/
Disallow: /_vti_log/
Disallow: /_vti_map/
Disallow: /_vti_pvt/
Disallow: /_vti_txt/
Her klasör için ayrı bir komut yazmak en verimlisidir.
Sadece Altavista örümceğinin girmesini istemediğimiz klasörümüze, Altavista robotunun ismi olan Scooter ı ekliyoruz.
User-Agent: Scooter
Disallow: /
Google’ın resim dosyalarımızdan uzak durmasını istiyorsak :
User-Agent: Googlebot-Image
Disallow: /images/
EÄŸer dosyalarınız “images” klasöründe deÄŸil ve dağınık olarak deÄŸiÅŸik yerlerdeyse o zaman :
User-Agent: Googlebot-Image
Disallow: /
-Bu yazı toplam 1125 kez okunmuş. -Şu an okuyanlar 1 kişi. -Bu yazı bugün 2 kez okunmuş. -En son 2008-11-22 11:46:51 tarihinde okunmuş. 'Robots.txt Dosyası Kullanımı ve Robotları Yölendirme' isimli yazı 23 Eki 2007 tarihinde, saat: 22:47 'de ByM tarafından gönderilmiş |
Bu yazı ile ilgili yorumunuzu buraya yazın