Principy vyhledávačů. Vyhledávače na internetu

Na internetu je na různých místech uživateli nabídnuto velké množství různých informací. Chcete-li získat potřebné informace, vyhledá odpovědi na otázky vytvořené vyhledávači. Po slyšení této fráze mnoho lidí myslí na Google, "Yandex". Vyhledávače na internetu jsou však mnohem větší.

Co je to vyhledávač

Vyhledávač je považován za software, který sestává z databáze dokumentů. Uživatelům je k dispozici speciální rozhraní, které umožňuje zadávat požadované dotazy a získávat odkazy na příslušné informace. Na prvních místech ve výsledcích vyhledávání jsou vždy dokumenty, které jsou shodné s tím, co hledá konkrétní osoba.


Provedení vyhledávání, které je vytvořeno v souladu s zadaným dotazem, obvykle obsahuje různé typy výsledků. Může obsahovat webové stránky, video a audio soubory, obrázky, soubory PDF, konkrétní produkty (pokud hledají prostřednictvím internetového obchodu).

Klasifikace vyhledávačů

Stávající vyhledávače jsou rozděleny do několika typů. Nejprve je třeba zavolat tradiční vyhledávače. V těchto vyhledávačích jsou principy práce zaměřeny na nalezení informací o obrovském množství stávajících míst. Vyhledávače jsou stále na samostatných internetových zdrojích:
  • v internetových obchodech (najít správné zboží);
  • na fórech a blogy (vyhledávání zpráv);
  • na adreseinformačních stránek (najít články pro požadované téma zpráv) atd.
  • Vyhledávače jsou stále rozděleny podle geografického prvku. V této klasifikaci existují 3 skupiny vyhledávačů:


  • Globální. Vyhledávání probíhá po celém světě. Vedoucím v této skupině je vyhledávač Google. Dříve existovaly vyhledávače jako Inktomi, AltaVista a další
  • Regional. Hledání se provádí podle země nebo skupiny zemí, které mají jeden jazyk. Regionální vyhledávače jsou rozšířené. Jejich příkladem v Rusku je "Yandex, Rambler.
  • Místní. Vyhledávání probíhá v konkrétním městě. Příkladem takového vyhledávače je Tomsk.ru.

    Složky vyhledávačů

    V každém vyhledávači můžete vybrat 3 prvky, které definují principy vyhledávače:
  • práce (indexer, pavouk, stylus);
  • databáze;
  • dotazovač.
  • Robot je speciální program, jehož účelem je vytvořit databázi. Databáze ukládá a třídí všechny shromážděné informace. Požadovaný procesor, nazvaný klient, který pracuje se speciálními požadavky. Má přístup do databáze. Klient není vždy umístěn ve stejném počítači. Ovladač dotazů je rozložen do několika fyzicky nesouvisejících počítačových systémů.

    Zásady vyhledávačů

    Všechny stávající systémy fungují na jediném principu. Zvažte například fungování tradičních vyhledávačů určených pro internet. Provoz robota je podobný akcí uživatele. Tento programpravidelně obchází všechny weby, přidává do databáze nové stránky a internetové zdroje. Tento proces se nazývá indexování.
    Když uživatel zadá dotaz do vyhledávacího pole, klient začne pracovat. Program odkazuje na existující databázi a vygeneruje extrakci klíčových slov. Referenční vyhledávač poskytuje uživateli určitou sekvenci. Jsou seřazeny podle relevance, tj. Je zohledněna relevance. Každý vyhledávač má svůj vlastní způsob určení relevance. Pokud uživatel odešle konkrétní požadavek do různých systémů, neobdrží stejný výstup. Algoritmus pro určení relevance je uchován v tajnosti.

    Další informace o relevantnosti

    Slovem je jednoduchá slova tzv. Korespondence slov zapsaných do vyhledávání nebo kombinace slov konkrétních odkazů v emisi. Umístění dokumentů v seznamu ovlivňuje několik nuancí:
  • přítomnost slov zadaných v hledání, v dokumentech. Tento nuance je zřejmý. Pokud dokument obsahuje slova z dotazu zadaného uživatelem, znamená to, že dokument odpovídá vyhledávacím dotazům.
  • Frekvence výskytu slov. Více běžně používaných klíčových slov v dokumentu, tím více bude v seznamu výňatků. Nicméně není všechno tak jednoduché. Příliš často je použití slov jako znamení nízkokvalitního obsahu pro vyhledávač.
  • Algoritmus pro určení relevantnosti je poměrně komplikovaný. Před několika lety by do tohoto problému mohly být zahrnuty odkazy na příslušná klíčová slova, ale neodpovídající jejich obsahu. V současné době jsou principy vyhledávačů komplikované. Nyní může práce zcela analyzovat celý text. V práci vyhledávačů zaznamenalo obrovské množství různých faktorů. Z tohoto důvodu je vydávání vydáno z nejkvalitnějších relevantních odkazů.

    Jak správně uspořádat žádosti

    Dokonce i ve škole jsme se naučili správně klást otázky. Záleží na tom, jaké odpovědi obdržíme. Toto pravidlo však nemusí být při používání vyhledávačů respektováno. U moderních vyhledávačů není role, jaké číslo nebo případ napsal osoba ve svém dotazu. V každém případě bude problém obsahovat stejné výsledky. Pro vyhledávače není požadováno jasné znění. Uživatel musí správně vybrat klíčová slova. Zvažte příklad. Potřebujeme nalézt text píseň "Den bez tebe" provedený známou fenkou "Via-Gra". Při použití na vyhledávač nepotřebujete nutně volat skupinu, uveďte, že jde o píseň. Stačí napsat "den bez tebe". Pro uchovávání registrů nejsou interpunkční znaménka vyžadována. Tyto nuance nejsou počítány vyhledávači.

    Celosvětové hodnocení vyhledávačů

    Google je přední vyhledávač na světě. Byla založena v roce 1998. Systém je velmi populární, což potvrzují analytické údaje. Asi 70% žádostí, které přicházejí online, zpracovává společnost Google. Základna vyhledávače je obrovská. Indexoval více než 60 bilionů různých dokumentů. Google přitahuje uživatele snadnorozhraní. Hlavní stránka obsahuje logo a vyhledávací panel. Tato funkce umožňuje volat Google jeden z nejvíce minimalistických vyhledávačů.

    Na druhém místě v žebříčku populárních vyhledávačů je Bing. Objevila se ve stejném roce jako Google. Tvůrcem tohoto vyhledávače je známá mezinárodní společnost Microsoft. Baidu, Yahoo !, AOL, Excite, Ask zabírají nižší pozice v žebříčku.

    Co je v Rusku populární

    Mezi vyhledávače v Rusku patří nejoblíbenější Yandex. Tato služba se objevila v roce 1997. Poprvé se angažovali v ruské společnosti CompTek International. O něco později se objevila společnost "Yandex", která se i nadále zabývala vyhledávačem. Vyhledávač získal obrovskou popularitu v průběhu let. Může vyhledávat v několika jazycích - ruštině, běloruštině, ukrajinštině, tataru, kazaši, angličtině, němčině, francouzštině, turečtině. Ze statistik je známo, že "Yandex" je zajímavé pro více než 50% uživatelů Runetu. Více než 40% lidí preferuje Google. Přibližně 3% uživatelů zvolilo Mail.ru - internetový portál ruského jazyka.

    Chráněné vyhledávače

    Obvyklé vyhledávače, které jsou pro nás společné, nejsou zcela vhodné pro děti. Mladí uživatelé internetu mohou náhodou najít nějaké materiály pro dospělé, informace, které mohou poškodit psychiku. Z tohoto důvodu byly vytvořeny speciální zabezpečené vyhledávací nástroje. Pouze bezpečný obsah pro děti je uložen ve svých databázích.
    Příklad jednoho takového vyhledávače -"Sputnik.Diti". Tato služba je poměrně mladá. To bylo vytvořeno Rostelecom v roce 2014. Hlavní stránka vyhledávače je jasná a zajímavě navržená. Představuje širokou škálu domácích i zahraničních karikatur pro děti různého věku. Navíc na domovské stránce jsou informativní odkazy vztahující se k několika kategorií - „sport“, „Chci vědět všechno“, „DIY“, „Games“, „technologie“, „škola“, „příroda“. Dalším příkladem chráněného vyhledávače pro děti - Agakids.ru. To je naprosto bezpečný zdroj. Jak funguje vyhledávač? Robot je konfigurován tak, že projde pouze ty stránky, které se vztahují k dítěti, zatímco objekty jsou užitečné pro rodiče. V základu vyhledávače spadají zdroje s karikatury, knihy, vzdělávací literatura, hry, barvení. Rodiče, kteří používají Agakids.ru, si mohou pro sebe najít stránky pro výchovu, zdraví dětí.
    Závěrem je třeba poznamenat, že vyhledávače jsou složité systémy. Před nimi je mnoho problémů - problém definice spam příslušných dokumentů chudý obsah screening a analýzu dokumentů, které obsahují textové informace. Z tohoto důvodu vývojáři představují nové přístupy, algoritmy, které jsou obchodním tajemstvím práce internetových vyhledávačů.

    Související publikace