SEO – Search Engine Optimization

12. srpna 2003

O tvorbě webových stránek již byly sepsány stohy návodů, příruček, knih a množství webů. Všude se popisují technologie jako (X)HTML, CSS, JavaScript, Flash a další, ale o jejich správné optimalizaci pro vyhledávače se začalo mluvit až v poslední době. A právě ona je jednou z nejdůležitějších součástí kvalitní webové prezentace.

Můžete mít výborný obsah, ale když ho nikdo nenajde, je vcelku k ničemu. Takový extrém většinou nehrozí, pokud je obsah opravdu dobrý, vyhledávač si k vám cestu najde, ale s rostoucí konkurencí začne být SEO čím dál tím důležitější.

Vyhledávače

Vyhledávače se dělí na dva základní druhy:

  1. katalogové – stránku přidáte po jednoduché registraci a většinou čekáte týden (někdy také měsíc, nebo se vůbec nedočkáte) než vám ji editor schválí. V Čechách například katalog Seznamu, Centra a Atlasu. Ze zahraničních jsou nejznámější DMOZ a Yahoo.
  2. fulltextové – web do nich nelze „normální“ cestou přidat. Každý fulltextový vyhledávač má svého robota, který prochází všechny stránky na internetu a přidává si je do indexu. To znamená, že když na vaši stránku nevede žádný odkaz, tak ji robot (většinou) nenajde. Většina fulltextových vyhledávačů obsahuje příkaz „Přidat stránku“, který by měl urychlit indexaci. U nás jsou nejvýznamnější Jyxo a Morfeo, v zahraniční pak nejlepší a nejkvalitnější fulltext vůbec – Google.

Optimalizace pro první skupinu vyhledávačů je docela jednoduchá. V podstatě záleží jenom na třech věcech – titulku, popisu a klíčových slovech (ty nejsou vždy vyžadovány). O to důležitější je jejich řádná příprava. Katalogový vyhledávač totiž při hledání prochází jenom tyto tři údaje. Některé katalogy už ale začínají zkoumat také obsah stránek, například u editoři DMOZu ručně prochází zadané stránky a přidávají jenom některé. Ale zde se snaha mnohonásobně vyplatí, protože obsah DMOZu přebírá velké množství webů. A díky tomu má pak stránka vyšší PR (PageRank). Důležité je, aby popisek obsahoval hodně klíčových slov, nejlépe v prvním pádu a osobě, ale aby také zaujal případné návštěvníky.

Podstatnější je ale pro nás optimalizace pro druhou skupinu vyhledávačů, fulltexty. Katalogy jsou sice pěkná věc, ale na množství dotazů nás nemusí výsledek hledání uspokojit. Toto pochopily i samy katalogy, a proto obsahují také většinou kvalitní fulltext. Takže optimalizace pro něj se stává klíčovou.

Google

Fulltextových vyhledávačů je celá řada, my se ovšem zaměříme na nejlepší z nejlepších – Google. Optimalizační kroky uvedené pro něj budou do velké míry platit i pro ostatní.

Google používá robota, který se jmenuje Googlebot. Ten prochází internet a pomocí odkazů se dostává na další a další stránky. A pokud narazí na novou nebo změněnou stránku, tak si ji uloží. K hodnocení stránek používá svoji vlastní technologii PageRank, která je ovlivněna více než stem faktorů. Každá jednotlivá stránka má svůj vlastní PageRank (PR). Jeho přesný výpočet není znám a Google ho pro větší objektivitu často mění. Přibližný návod jeho výpočtu najdete na stránkách firmy IPR Computing Ltd. V kostce záleží na počtu stránek, které na vás odkazují, na velikosti jejich PR a počtu odkazů, které obsahují. Čím více zpětných odkazů, tím, samozřejmě, lépe. Pokud hodně kvalitních (s vysokým PR) webů odkazuje na určitou stránku, tak to pro Google znamená, že i ona stránka bude pravděpodobně něčím zajímavá.

Bohužel, nebo možná bohudík, není PR veřejný, takže ho nelze nijak zjistit. Jedinou možností je orientace podle Toolbar PR, který zjistíte na Google Toolbaru a v Google Directory. Toolbar PR se pohybuje v rozsahu od nuly do desítky. Toolbar PR je pouze zástupná a nijak nezaručená hodnota skutečného PR.

Každý měsíc probíhá na Google velká aktualizace databáze, zvaná Google Dance. Na SEO Chat můžete zjistit, jestli právě probíhá aktualizace. To se zjišťuje tak, že se porovná množství zpětných odkazů nějakého velkého serveru (Yahoo, Microsoft a podobně) poskytnutých servery www.google.com, www2.google.com a www3.google.com. Pokud se jejich počet liší, pak s největší pravděpodobností probíhá Google Dance. V tuto dobu můžete na svůj dotaz dostat každých pět minut jiný výsledek – záleží to na tom, kterému serveru byl dotaz položen. V době Google Dance vám nedoporučuji zjišťovat Toolbar PR webů, protože můžete dostávat nepřesné výsledky.

V poslední době se ale zdá, že se Google uchýlí k průběžným aktualizacím a index bude doplňovat neustále. Google Dance by se tak stal minulostí. Poslední Google Dance proběhl 15. června 2003 a od té doby probíhají průběžné aktualizace.

Další věcí, o kterou se Google snaží, je rozpoznat typ webu. A zabránit tak například u diskusních fór guestbook spammingu, kdy uživatelé posílají stovky příspěvků s odkazem na svůj web, ve snaze si tak zvýšit svůj PR. Odkazy z diskusních fór mají být ignorovány.

Off-page faktory hodnocení stránek

Hodnocení stránek se dělí na dva základní druhy, na on-page a off-page faktory. Do off-page faktorů patří především již zmíněné zpětné odkazy. Obecně jsou to ty vlastnosti, které nemůžeme přímo na své stránce ovlivnit. I když i to je relativní, jeden výborný způsob existuje – psát zajímavý obsah! Obsah, na nějž budou ostatní rádi odkazovat. Zde mají nekomerční projekty do jisté míry zjednodušenou úlohu, protože vzájemné odkazování probíhá o hodně jednodušeji. U komerčních projektů je důležitá důkladná registrace do většiny katalogů, nejlépe ruční. Dobrým způsobem je na komerčních stránkách psát také nekomerční obsah. Například webdesignerská firma uvolní část svého know-how a na svých stránkách bude vydávat CSS příručku, tím zvýší svoji popularitu, PR svého webu a bude mít větší množství zakázek. Můžete se také domluvit s webmastrem cizího webu (třeba z úplně jiného oboru) s tím, že si vzájemně vyměníte odkazy. Zde si ale dávejte pozor na link exchange.

Nebo-li když stránka A odkazuje na stránku B a stránka B zpátky na A. Podstatu problému vysvětlím na příkladu. Máme stránku www.A.cz, která má PR 1 a stránku www.B.cz, taktéž s PR 1. Obě stránky obsahují 10 odkazů. Stránka A předá B 0,1 svého PR a B zpátky A taktéž 0,1 svého PR. To znamená, že výsledný efekt bude nulový.

V praxi to samozřejmě nefunguje přesně takto, takže i link exchange mají svůj význam, nelze ho však přeceňovat. Lepší by bylo, kdyby obě stránky obsahovaly samostatnou stránku odkazy.htm, kde by byly umístěny všechny odkazy na ostatní weby.

Link trading je placená služba. Jedná se vlastně o obchod s PR, což se samozřejmě Google nelíbí. Není se co divit, PR má udávat kvalitu dané stránky. Některé firmy nabízí, že za určitý poplatek na vás budou odkazovat. V rozumné míře, pokud si u nějakého webu koupíte odkaz, se pravděpodobně nic nestane. Ale při využití služeb firmy, která se link tradingem živí, můžou nastat problémy. Google tuto snahu trestá, takže výsledný efekt může být přesně opačný – penalizovaný web.

Text v odkazu je velmi důležitý, je to jeden z významných faktorů, který Google používá k hodnocení stránek. Protože text mezi tagy <a> a </a> většinou udává, co na dané stránce je. Proto je důležité před registrací stránky do katalogů vymyslet takový titulek stránky, který bude obsahovat klíčová slova, pro než chcete stránku optimalizovat, protože právě titulek se většinou používá jako odkaz na stránku. A pokud si s jiným webem vyměňujete vzájemně linky, používejte také raději textovou formu, než oblíbené ikonky.

A samozřejmě, na celém webu byste měli používat smysluplný text v odkazu, nejlépe zoptimalizovaný na důležitá klíčová slova. Úplně se vyvarujte odkazům jako více zde, dále, pokračujte a podobným. Raději použijte další informace o <a>výrobku bla bla</a>.

Důkazem efektivity této metody je web firmy Corel. Na celé stránce se nevyskytuje ani jednou slovo „draw“, ale díky vysokému PR (8) a velkému množství zpětných odkazů, které povětšinou slovo „draw“ obsahují, je web Corelu na dotaz „draw“ na prvním místě ze současných 10 500 000 stránek.

Zjišťování zpětných odkazů

Zjišťování zpětných odkazů je také jedna z důležitých technik. Umožňuje ji většina zahraničních vyhledávačů. Nejjednodušší je dát hledat adresu své stránky a potom kliknout na „zpětné odkazy“ (backward links). Zjistíte tak, které stránky na vás odkazují. Nelekněte se u Googlu, ten zobrazuje pouze odkazy ze stránek s PR 4 a vyšší.

Dále dejte na Google vyhledat klíčové slovo, pro které svoji stránku optimalizujete. A u všech konkurentů se podívejte a zanalyzujte jejich zpětné odkazy. Můžete tak například narazit na nový seznam firem nebo katalog webů z určitého oboru, kde si svůj web můžete také zaregistrovat. Konkurenty hledejte na Googlu, ale vlastní vyhledávaní zpětných odkazů provádějte raději na AlltheWeb, vrací všechny zpětné odkazy.

On-page faktory hodnocení stránek

On-page faktory jsou všechny ty, které můžete na stránce ovlivnit. Začněme pěkně od začátku. Nejdůležitější je psát dobře přístupný kód. Jestliže chcete vidět to, co uvidí Googlebot, tak si svou stránku otevřete v libovolném textovém prohlížeči bez obrázků, CSS, JavaScriptu, DHTML, Flashe a dalších „vymožeností“. U dobře navržených stránkách zjistíte, že kromě grafiky vám nic nechybí. Pokud ovšem polovinu prezentace neuvidíte kvůli chybějící podpoře obrázků a druhou z důvodu chybějícího Flashe a navigace bez JavaScriptu také nefunguje, měli byste přemýšlet o restrukturalizaci celého webu.

Ještě lepší způsob je využití volně dostupného spideru Poodle. Po zadání odkazu na stránku vám spider vrátí celou hlavičku a text, který pak Google používá k indexaci. Text je barevně rozdělen na odkazy, emaily, nadpisy, popisky obrázků a vlastní text.

Struktura webu

Struktura webu je jednou z nejdůležitějších součástí kvalitní prezentace. Začněme hned u titulní stránky – http://www.stranka.cz, http://stranka.cz, http://www.stranka.cz/index.htm a http://stranka.cz/index.htm jsou pro Google čtyři rozdílné stránky. Proto doporučuji důsledné používání jenom jedné varianty, nejlépe http://www.stranka.cz. A to nejenom v katalozích, ale samozřejmě také na všech stránkách mimo titulku celého webu. S tím souvisí i pravidlo, že byste nikdy neměli na více doménách provozovat stejný obsah. Google si vybere jenom jednu doménu, pro něj tu nejdůležitější (například podle počtu zpětných odkazů) a ostatní bude do jisté míry ignorovat, nebo dokonce vaše stránky potrestá. Proto je nejlepší na všech ostatních doménách posílat hlavičku 301-Moved Permanently:

<?php
header(‚HTTP/1.1 301 Moved Permanently‘);
header(‚Location: http://www.novastranka.cz/‘);
header(‚Connection: close‘);
?>

U rozsáhlejších webů je dobrým způsobem rozdělit ho do určitých kategorií a na každé stránce zobrazit strukturu zanoření. Každá stránka by přitom měla odkazovat na titulku webu. Nepsaným pravidlem je, že „klikací“ logo stránky vede na titulní stránku celého webu.

Další výborná věc pro uživatele a pro vyhledávače je mapa webu, hlavně u rozsáhlých a těžce indexovatelných projektů (například při použití rámců). Zde si ale dejte pozor na omezení Google na maximum 100 odkazů na jednu stránku. Proto u opravdu rozsáhlých stránek musíte mapu webu rozdělit ještě do kategorií. Díky ní se mohou uživatelé, kteří se ztratili, opět zorientovat a vyhledávače lépe zaindexují váš web. Doporučuji uvést odkaz na mapu webu na chybové stránce 404-Document Not Found.

Navigace v rámci vašeho webu by měla probíhat nejlépe vždy textovou formou, ne s pomocí obrázků. To platí i pro všechny další odkazy, kvůli inbound link relevance, jak bylo zmíněno výše.

Statické weby

U statické webů je každá stránka reprezentována vlastním HTML dokumentem, takže žádný problém nehrozí. Velký důraz a pozor byste si měli dát na plánování struktury všech URL. Protože jak má stránka jednou své URL, tak je dáno a je neměnné. Zatím neexistuje způsob, jak beze ztráty vybudovaného postavení přejmenovat stránku A.htm na B.htm. Do jisté míry nám může pomoci 301-Moved Permanently, ale ani toto řešení není stoprocentní. Proto musíme celou strukturu URL dobře promyslet.

Google přikládá určitou váhu i textu v URL a také uživatelé se podle něj mohou orientovat. Z tohoto důvodu byste jenom z URL měli pochopit, co na stránce najdete. Například http://ww.firma.cz/koberce/nazev-vyrobku.htm. Měli byste se vyvarovat používání podtržítka “_“ v URL, protože Google ho používá pro spojení slov.

Někteří uživatelé internetu s oblibou umazávají části URL a doufají, že se tak budou po něm jednoduše pohybovat. Také některé browsery už implementují funkci „O úroveň výš“. U výše zmíněného příkladu by návštěvníci odmazali nazev-vyrobku.htm a doufali-by, že http://www.firma.cz/koberce/ vede na úvodní stránku o kobercích. Proto je dobré jim tento způsob procházení webu umožnit.

Dynamické weby

U dynamických webů samozřejmě platí všechny pravidla pro weby statické a několik dalších omezení navíc. Pokud celá dynamičnost vašeho webu souvisí pouze s koncovkou „.php“, můžete zůstat v klidu. Jestliže ale generujete nový obsah z databáze a jednotlivé stránky se liší jenom parametry za otazníkem, nastává problém. Google a ostatní fulltexty s rostoucím počtem parametrů za otazníkem stránky méně ochotně indexují. Maximální rozumný počet podle Google jsou dva parametry. A parametr id Google neindexuje vůbec, protože údaje v něm považuje za identifikátor session.

Ideálním nástrojem, který takové problémy řeší, je mod_rewrite. Pak bude URL vypadat třeba jako http://www.stranka.cz/parametr1/parametr2/stranka.htm, ale díky mod_rewrite bude tato stránka ukazovat například na http://www.stranka.cz/index.php?dat=parametr1&kat=parametr2&page=stranka. V současnosti je toto považováno za jedno z nejlepších řešení. (Návod k použití mod_rewrite v českém jazyce najdete například na Sově v síti.)

Problém nastane, pokud server, na kterém hostujete své stránky, mod_rewrite neposkytuje. Můžete se pokusit přesvědčit administrátory nebo strukturu zajistit ručně.

Robots.txt

Robots.txt je jednoduchý textový soubor, umístěný v kořenovém adresáři, ve kterém jsou uloženy pokyny, jakým způsobem má vyhledávač procházet váš web. Přesný popis možných příkazů (v angličtině) najdete na The Web Robots Pages. Ke kontrole správnosti zápisu můžete použít Robots.txt Validator. Pokud chcete, aby vyhledávač indexoval vše, použijte tento zápis:

User-agent: *
Disallow:

Vlastní stránka

Konečně se dostáváme k vlastní tvorbě stránky. Rozhodně nedoporučuji používat rámce, a to z několika důvodů – vyhledávače jimi těžko procházejí, URL je pořád stejné (to znamená, že ostatní webmasteři budou jenom těžko odkazovat na určitou stránku) atd.

Titulek

Titulek je to základní na každé stránce. Vyhledávače na něj kladou velkou váhu, proto by měl obsahovat smysluplný text s pěti až sedmi klíčovými slovy. Na každé stránce používejte odlišný titulek, zlepšuje to o hodně orientaci uživatele i posílení klíčových slov u vyhledávače.

Elementy meta

Pro vyhledávače jsou důležité hlavně následující meta elementy:

  • Language – zaručuje zobrazení textu ve správném kódování. Proto je jeho uvedení velmi důležité i bez jakékoliv SEO optimalizace.
  • Description – obsahuje malé shrnutí obsahu stránky. Vyhledávače v něm hledají, proto je dobré v něm uvést dostatek klíčových slov. Někdy je také vyhledávači použit jako popisek k vaší stránce při zobrazování výsledků hledání.
  • Keywords – o meta elementu keywords se vedou diskuze, jestli má vůbec smysl ho používat. Google ho s největší pravděpodobností ignoruje úplně. Ale jeho uvedením rozhodně nic nezkazíte.
  • Robots – meta element robots určuje způsob, jakým bude vyhledávač pracovat se stránkou. Podle jeho hodnot můžete vyhledávači zakázat nebo povolit indexování. Implicitní hodnota je „vše povoleno“.

Meta element Googlebot

Google uvedl speciální meta element, aby umožnil autorům stránek ovlivňovat své chování. Zápis vypadá následovně:


<meta name=“googlebot“ content=“snippet/nosnippet, archive/noarchive“ />

Meta element Googlebot pracuje se dvěma parametry:

  • Archive – zakazuje nebo povoluje ukládání stránky do Google archivu. Výchozí hodnota je „ukládání povoleno“.

    archive Povoluje ukládání stránky do archivu Google. Výchozí volba.
    noarchive Je zakázáno ukládání stránky do archivu Google.
  • Snippet – určuje, co bude zobrazeno uživateli ve výsledcích hledání. Jestli obsah elementu Description nebo text „před a za“ hledaným slovem. Výchozí hodnota je „text před a za“.

    snippet Zobrazuje se „text před a za“. Výchozí volba.
    nosnippet Je zobrazen obsah meta elementu Description.

Archiv stránek je výborná funkce a mnoha lidem se určitě líbí. Pokud je nějaký web zrušen a přestane fungovat, můžete se přesto díky archivu na něj podívat. Pokud ale jeho autor chce web z análů vymazat kompletně, stačí, aby do hlavičky uvedl meta element archiv, kde zakáže archivování svého webu. Potom musí počkat až Google zaindexuje novou verzi stránek a jeho web z archivu zmizí.

Je ovšem možné využít zákazu archivování i při běžném provozu webu. Například u stránky, kde je generován dynamický obsah a jejíž starší obsah je úplně nerelevantní – to může být případ kurzů měny. Zde archiv stránky ztrácí smysl.

Určitě by se ale zakazování nemělo přehánět. Je totiž plno případů, kdy nám může archiv pomoci. Pokud má web výpadek, mnoho jiných způsobů, jak se k důležitým informacím dostat, není. Další případ může být web, kde je starší obsah posouván mimo hlavní stránku a nahrazován novým obsahem. Potom by vyhledání informace mohl být problém, ale s využitím archivu je vše otázkou několika vteřin.

Snippet je část stránky kolem hledaného slova, kterou Google zobrazí v jejím popisku na stránce s výsledky hledání. Někdy je tato informace užitečná, ale někdy se zobrazuje například část menu nebo jiné nezajímavé údaje. Proto dal Google webmasterům možnost zvolit si, co se bude jako popisek zobrazovat.

Použití meta elementu Description má své výhody i nevýhody. Například webmasteři firemních prezentací mohou přesně oslovit a zaujmout uživatele, zatímco u konkurence se zobrazí jakási podivnost. Na druhou stranu si představte, že hledáte nějakou komerční firmu a ve výsledku hledání se zobrazí nabídka patnácti firem, kde se v každém popisku dozvíte, že každá firma je ta nejlepší a nabízí nejkvalitnější služby. To rozhodně není ideální.

Pokud se přesto rozhodnete, že chcete zobrazovat meta elementy Description namísto „textu před a za“, dbejte na jejich důkladnou přípravu. Musí uživatele zaujmout a dát mu jasný obraz toho, co na dané stránce najde. Každá stránka musí obsahovat jiný popis, charakteristický právě pro ni. Uživateli se nemůže stát nic horšího, než když klikne na odkaz „více stránek z vašeho webu“ a u každé stránky se mu zobrazí stejný popis.

I zde ale existují případy, kde bych použití Description nedoporučoval. U odborných textů by bylo velmi těžké napsat dobrý popis. Pokud budu hledat odborný výraz, který se na stránce vyskytuje jenom dvakrát a v popisu o něm není ani zmínka, jak zjistím, že daný odkaz obsahuje to, co hledám? Obecně jsem spíše zastáncem „textu před a za“, i když Description může mít při správném použití svůj efekt, chce to ale hodně práce a testování účinku, nejlépe na typických uživatelích.

Google ale ještě nosnippet nepodporuje úplně. I při jeho uvedení někdy vrátí „text před a za“. S noarchive problémy nejsou a Google stránku z archivu opravdu odstraní.

Nadpisy

Pro všechny nadpisy důkladně používejte elementy h1 až h3. A zapomeňte na oblíbený zápis <div class="nadpis">, ten vyhledávači nic neřekne, zato při použití h1 se vyhledávač dozví, že text je nadpis stránky, a dá mu větší váhu.

Popisy u obrázků

Další věcí, na kterou klade Google váhu, jsou popisy u obrázků (atribut alt). Proto u každého obrázku používejte popisek, konec konců, je to i v normách W3C. Doporučuji používat klíčová slova, pro která chcete svoji stránku optimalizovat.

Zvýrazněný text

Pokud chcete nějakou část textu zvýraznit, použijte k tomu sémantické elementy strong a em.

Obsah

Definice dobrého obsahu bohužel neexistuje, přesto je tím nejdůležitějším na každé stránce. Obsah pište pro uživatele a nesnažte se jej zběsile optimalizovat pro vyhledávače. Pamatujte si, že důvod, proč na vás někdo odkáže, je zajímavý a kvalitní obsah.

Podvádění

Jakákoli forma podvádění je špatná, neetická a výsledný efekt je přesně opačný. Vyvarujte se tedy generování zvláštní verze stránek pro vyhledávače, „skrytého“ textu (černý na černém pozadí), uvádění neplatných údajů v meta elementech a dalších…

Zlaté pravidlo

Doufám, že jsem vám aspoň trochu poradil se správnou tvorbou stránek, ale pokud i přesto budete mít s něčím problém, řiďte se heslem Marka Prokopa: „Co je dobré pro uživatele, je dobré i pro vyhledávače!“

Starší komentáře ke článku

Pokud máte zájem o starší komentáře k tomuto článku, naleznete je zde.

Předchozí článek dysmusax.cz
Další článek Optimalizace pro weblogy
Štítky: Články

Mohlo by vás také zajímat

Nejnovější

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *