utorak, 14. veljače 2012.

Kako tražilice rade?

Tražilice se sastoje od pet zasebnih softverskih komponenti
  •  Sustav za izdavanje rezultata (izvlači rezultate pretraživanja iz baze podataka)
  • Pauk (Spider) je program koji downloadira web stranice. On radi isto kao i browser kada se Vi spajate na web i preuzimate web stranicu.
  • Crawler je program koji automatski pronalazi sve linkove na stranici i označava ih. Njegov zadatak je utvrditi kuda bi „pauk“ trebao dalje ići. Crawler slijedeći pronađene linkove pronalazi nove dokumente koji još nisu poznati tražilici.
  • Indeksator (Indexer) vrši podjelu web stranice na sastavne dijelove i provodi njihovu analizu. Elementi kao što su naslovi stranica, naslovi u tekstu stranice, linkovi, tekstovi, i sl. analiziraju se odvojeno.

Nema komentara:

Objavi komentar