Tražilice se sastoje od pet zasebnih softverskih komponenti
- Sustav za izdavanje rezultata (izvlači rezultate pretraživanja iz baze podataka)
- Pauk (Spider) je program koji downloadira web stranice. On radi isto kao i browser kada se Vi spajate na web i preuzimate web stranicu.
- Crawler je program koji automatski pronalazi sve linkove na stranici i označava ih. Njegov zadatak je utvrditi kuda bi „pauk“ trebao dalje ići. Crawler slijedeći pronađene linkove pronalazi nove dokumente koji još nisu poznati tražilici.
- Indeksator (Indexer) vrši podjelu web stranice na sastavne dijelove i provodi njihovu analizu. Elementi kao što su naslovi stranica, naslovi u tekstu stranice, linkovi, tekstovi, i sl. analiziraju se odvojeno.
- Baza podataka (Database) je skladište svih podataka koje tražilica preuzima i analizira.
http://edu-udzbenik.carnet.hr/2/pogl_03_lekc_02.htm
http://www.vincitur.com/optimizacija/upis-u-trazilice.php
http://computer.howstuffworks.com/internet/basics/search-engine.htm
http://searchenginewatch.com/article/2065173/How-Search-Engines-Work
Nema komentara:
Objavi komentar