Všiml jsem si, že se začíná objevovat stále více článků, námětů a diskusí kolem fulltextů, katalogů, placených odkazů a dalších věcí s tím souvisejících. Možná jsme na počátku nějaké změny, nikoliv malé. Spíše to vypadá na evoluci, než na revoluci.:-) Bude to jen pozvolné, ale vyhledávací stroje i katalogy se postupně začnou brzy měnit.
Dnes vychvalovaný google zdá se býti přežitý. Ač je na výsluní slávy a vydělává pěkné penízky, je v té podobě jak ho známe ve fázi útlumu . Vývoj fulltextů by se dal přirovnat k vývoji procesorů. První, co vývojáře napadne pro zrychlení, je zvýšení pracovní frekvence. To znamená přitlačit na pilu a nadopovat obvody jak se dá. Skutečné systémové zvýšení výkonu ale vždy leží v novém přístupu nebo ve zcela nové architektuře.
Podobně jako u procesorů to bude s fulltexty. Tím, že většina z nich vydělává na placených odkazech, stávají se z nich obyčejné dynamické katalogy. Ale rubriky jsou chaoticky určované tím, jaká klíčová slova si klienti zaplatí. Ceny půjdou dolů, placených odkazů bude přibývat a budeme tam, kde jsme byli před érou placených odkazů. Velké množství výsledků, které sice obsahují naší frázi, ale které se týkají naprosto něčeho jiného, než my hledáme.
Příklad: Hledám podle slova „Aquila“ a chci vše o balené pitné vodě. Ale najdu na prvním místě firmu prodávající čerpadla, dále firmu čístící bazény a na třetí pozici punkovou skupinu složenou ze samých punkerek. Děkuji, ale toho se nenapiju. Upřesnění dotazu může pomoci, ale leckdy ani to nepomůže. Jak se tedy dostat k relevantnímu výsledku?
Napadá mě, spojit obě technologie – fulltext a katalog. Každému dotazu uživatel při vyhledávání přiřadí jednu či více kategorií z katalogu. Stroj poté vyhledá stránky, které odpovídají zadanému slovu (slovnímu spojení) a zároveň zvolené kategorii. Úzkým místem budou ale samotné kategorie. Kde je vzít a zachovat nějaký řád?
Jak na kategorie pro fulltexty?
Rozhodně by se to nemělo nechat na (z)vůli autorů vyhledávacích robotů. Existuje velké množství již hotových a prověřených standardizovaných číselníků. Po potřeby internetu by je stačilo ještě mírně rozšířit a nakonec „standardizovat“ (resp. měl by je protlačit silný hráč na trhu fulltextů). Každá kategorie má v takovém číselníku jednoznačné číslo (víceúrovňové), které je unikátní a neměnné.
A tímto číslem stačí pak vybavit stránku. Pokud bude dobře navržen algoritmus fultextového katalogu, lze v něm definovat i procento okolí, ve kterém má hledat i počet přeskoků z podkategorie do nadkategorie nebo obráceně a další vychytávky.
Kategorizační číslo (vlastně ID kategorie) by si pak autor stránek jednoduše umístil ve formě speciální meta informace do svých stránek a nechal zaindexovat fulltexty. Jen provozovatelé vyhledávačů by měli trochu práce s překopáním svých fulltextových ratolestí.
Není to zcela nová technologie, ale za relativně málo práce by se získalo poměrně dost koláčů – několikanásobně vyšší relevance hledané informace. A o to jde především.
Samozřejmě, že cesta „kategorií“ není jedinou cestou, jak přimět fulltexty, aby hledali v oboru, který mě zajímá. Ale zdá se mi to natolik jednoduché, že by se vznik takovýchto fulltextových katalogů mohl ujmout.
K této úvaze mě přivedl článek Co opravdu očekáváme od vyhledávačů?, který vyšel na Lupě v rámci znovuotevřeného worshopu pod vedením Jiřího Donáta. Zejména v diskusi se objevilo pár zajímavých postřehů a dokonce i jeden podnikatelský záměr. Kdo ví, třeba bude (nejen) český internet po Vánocích bohatší o fulltextový vyhledávač nové generace…