Rabu, 14 Agustus 2013

CARA KERJA MESIN PENCARI

  
Mesin pencarian akan dioperasikan dengan urutan berikut : 
1. Web Crawling
2. Indexing
3. Searching

Sebagian mesin pencari seperti google, Google menyimpan seluruh atau sebagian halaman sumber (yang disebut cache) maupun informasi tentang halaman web itu sendiri.
Selain halaman web, Mesin pencari juga menyimpan dan memberikan informasi hasil pencarian berupa pranala yang merujuk pada file, seperti file audio, file video, gambar, foto dan sebagainya, serta informasi tentang seseorang, suatu produk, layanan, dan informasi beragam lainnya.

Berikut ini adalah cara kerja mesin pencarian :

1. Web Crawling 
Web Crawling sering dikenal sebagai web spider atau web robot. Ini merupakan program yang menelusuri World Wide Web. Web Crawlers sering digunakan untuk membangun salinan dari semua halaman-halaman web yang sudah dikunjungi untuk pemrosesan lebih lanjut oleh mesin pencarian, dimana program ini akan memberi indeks pada halaman-halaman yang di download sehingga mempercepat pencarian. Crawlers dapat digunakan untuk pemeliharaan otomatis suatu situs web, seperti memeriksa link atau validasi kode HTML. Mesin pencarian web akan bekerja dengan menyimpan informasi banyak halaman web yang diterima melalui www. Halaman-halaman ini akan diterima oleh web crawler, web browser otomatis yang mengikuti semua link yang dijumpai. 

2. Indexing 
Indexing adalah proses pengumpulan kata-kata atau kalimat pada suatu halaman web oleh googlebot yang telah ter-crawling sebelumnya. Setelah spider sudah mengumpulkan semua informasi blog Anda maka akan disimpan pada database . Penyimpanan ke database ini menggunakan index yang juga mencantumkan alamat URLnya. Penyimpanan ini dilakukan secara berkala untuk mempercepat proses pencarian.Dalam prosesnya, konten inilah yang digunakan oleh google sebagai sumber pencarian untuk selanjutnya ditampilkan sebagai hasil pencarian berdasarkan kata kunci (keywords) yang kita cari. Namun perlu diingat bahwa tidak semua konten dapat diproses oleh googlebot ini. Umumnya konten tersebut adalah link url, judul, tag, nama file, tipe file, isi halaman (tidak semua) dan beberapa informasi halaman lainnya.
3. Searching 
Proses terakhir ini dilakukan berdasarkan perintah pengguna search engine. Ketika user melakukan search terhadap keyword tertentu, yang dilakukan search engine bukanlah menelusuri internet untuk keyword tersebut, tetapi hanyalah mencarinya di database indexing yang telah dimiliki.Search engine akan memeriksa database index dan memberikan hasil yang paling sesuai dengan keyword yang dimasukkan user. Hasil ini akan dilengkapi dengan judul situs, cuplikan isi halaman, dan URLnya.

  


Tidak ada komentar:

Posting Komentar