Vyhledávání nebo nalezení informací? (Vilém Sklenák)
Podle slov Viléma Sklenáka z Fakulty informatiky a statistiky na VŠE lze vyhledávání informací přirovnat k sbírání hub. Jako první je třeba stanovit si cíl - například "chci uvařit bramboračku". Nelze napsat dobrý článek bez informací, stejně jako nelze uvařit bramboračku bez hub. Máme dvě možnosti - koupit nebo najít. A z toho pak vychází otázka kam jít a jak postupovat.
Prostorem webu lze bloumat, brouzdat, surfovat, ale pravděpodobně to nepřinese výsledky; snad leda náhodou. Pokud se chceme zabývat hledáním jako takovým, záleží na nás, jaký máme způsob, jaké máme předchozí zkušenosti a podobně. Ale ani náš oblíbený způsob nemusí přinést pouze relevantní výsledky - stejně jako si z lesa nepřineseme všechny houby, na které cestou narazíme (taková muchomůrka tygrovaná se dá chápat jako spam). Najdeme i výsledky, které z neznalosti zamítneme, nebo výsledky, které hrozí nevolností a zavedením jinam...
Samozřejmě všichni máme svá oblíbená místa, cestičky... Z toho plyne, že vyhledávání není přímočarý proces, nemusí být vždy rychlé a bezchybné, ale bude pravděpodobně rychlejší, pokud se budeme pohybovat v prostředí, které známe. Ne všechno co nelzeneme je to, co hledáme. A naopak, občas se vyplatí porušit svoje zvyklosti a jít do neznáma - i tam na nás může čekat zajímavá informace.
Musíme si také ujasnit základní pojmy, jako například relevantní dokument a relevantní informace. Formální relevance je shoda formulace rešeršního dotazu a výsledku, hodnotí se. Míra relevance má ale subjektivní charakter, co je pro jednoho zajímavé, druhému neřekne vůbec nic, přestože oba položili stejný dotaz.
K zajištění úspěchu je třeba, aby fungovaly obě strany - vyhledávače i uživatelé. Uživatelé ale většinou vyhledávají jen dle jednoduchých klíčových slov, nevyužívají možnosti pokročilého vyhledávání a většinou spěchají, tj. málokdy se dívají jinam než na první stranu výsledků. Tyto zvyky se bohužel v čase moc nemění.
Toto konzervativní chování uživatelů je nekonečnou výzvou pro vyhledávací stroje. Nutí je zlepšovat algoritmy vyhledávání - např. Google jen během dubna provedl ve svých algoritmech 52 změn, které se snaží lépe hodnotit kvalitu stránek. Vyhledavače nabízejí také zadávání příkladem (např. u obrázků vložením jednoho obrázku), ovládání hlasem (které je primárně pro mobilní zařízení), či vyhledávání podle kontextu a souvislotí (viz nový projekt Google Knowledge Graph).
Proces vyhledávání ovlivňuje samotný růst webu, generační vývoj vyhledávacích strojů. Očekávat můžeme optimalizaci vzhledem k zařízení, vyhledávat na notebooku je něco jiného než vyhledávat v chytrém mobilu, jsou tam jiné úmysly, jiná očekávání, jiné ovládání; stále silněji se také prosazuje sociální vyhledávání a technologie sémantického webu.
Říká se, že “Jak se do lesa volá, tak se z lesa ozývá” nebo “kdo hledá, ten najde” a to v tomto případě platí dokonale.
(vk)