Friday, March 18, 2011

Pengenalan Search Engine


Search Engine atau mesin pencari adalah suatu program komputer yang dirancang untuk membantu user menemukan file-file atau dokumen yang terdapat pada komputer atau pada sebuah server umum di internet. Mesin pencari memungkinkan kita untuk meminta konten media dengan kriteria yang spesifik (biasanya yang berisi kata atau frasa yang kita tentukan) dan memperoleh daftar file yang memenuhi kriteria tersebut.



Mesin pencari web bekerja dengan cara menyimpan informasi tentang banyak halaman web. Halaman-halaman tersebut diperoleh dari pengumpulan yang dilakukan oleh web crawler yaitu browser web otomatis yang mengikuti setiap pranala yang dilihatnya. Isi setiap halaman lalu dianalisis untuk menentukan cara mengindeksnya. Data tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari, seperti google, menyimpan seluruh atau sebagian halaman sumber (yang disebut cache) maupun informasi tentang halaman web itu sendiri.



Intinya mesin pencari memiliki tahap-tahap dalam melakukan pencarian mulai dari melakukan crawl terhadap halaman web sampai menampilkan hasil pencarian yang memberikan informasi yang relevan. Tahap-tahap tersebut diantaranya :

1.Melakukan crawl terhadap halaman web

Untuk melakukan crawl pada tiap-tiap halaman web, sebuah mesin pencari dilengkapi dengan program otomatis yang dinamakan spider yang berfungsi mengumpulkan dokumen-dokumen halaman web di internet menggunakan mekasisme struktur hyperlink.

2.Melakukan indeks terhadap dokumen

Ketika suatu halaman web telah di crawl kemudian akan diindeks dan disimpan didalam database yang besar yang kemudian dilakukan pengurutan terhadap dokumen-dokumen tersebut.

3.Pemrosesan Query

Sebuah search engine menerima ratusan juta permintaan terhadap query setiap harinya, data-data tersebut diambil dari database yang telah diindeks. Kemudian dilakukan pencocokan terhadap query yang diminta.

4.Ranking result

Hasil yang ditampilkan oleh sebuah search engine harus relevan terhadap query yang diminta, tiap-tiap search engine memiliki cara tersendiri dalam menampilkan hasil dari pencariannya. Google memiliki mekanisme page rank untuk mengkategorikan seberapa peting sebuah halaman web untuk ditampilkan.

Ada empat bagian dari suatu mesin pencari yang dibutuhkan untuk melakukan indek terhadap halaman web :

a.Spider, merupakan program yang berfungsi mengumpulkan halaman-halaman web di internet.

b.Database, tempat dimana spider menyimpan data-data tentang halaman web yang dikumpulkannnya.

c.Website mesin pencari, dimana merupakan tempat user melakukan pencarian terhadap informasi yang ingin dicari.

d.Algoritma, yaitu program yang mengatur query dalam menampilkan hasil pencarian kepada user.

Ada dua cara agar website/situs yang kita miliki dapat masuk kedalam database yang kemudian diindex oleh mesin pencari yaitu :

a.Spider akan secara otomatis menemukan halaman dari website atau situs yang kita miliki.

b.Melakukan submit url secara manual ke search engine agar website/situs kita lebih cepat diindeks oleh search engine.







Gambar 1. Gambaran Dari Suatu Search Engine



Relevance dan Popularity

Search engine modern saat ini sudah mengacu pada bidang information retrieval. Pada awal perkembangan mesin pencari, para pengembang information retrieval menyadari bahwa ada dua komponen penting yang dibuat oleh sebagian besar fungsi pencarian yaitu :

1.Relevance, merupakan derajad dimana isi dokumen yang ditemukan dalam pencarian cocok/relevan pada permintaaan query dari user. Relevansi sebuah dokumen akan meningkat jika muncul beberapa kali dan ditampilkan pada judul atau subheader.

2.Popularity, mengukur pentingnya suatu dokumen mengacu pada dokumen lain yang menjadi referensinya. Popularity akan meningkat sejalan dengan makin banyaknya dokumen yang menjadi referensinya.

Search Engine Result Page (SERP)

SERP merupakan suatu halaman hasil mesin pencari yang memuat daftar halaman web yang dikembalikan oleh mesin pencari akibat dari query atau permintaan kata kunci yang diinputkan ke dalamnya. Hasil yang ditampilkan berupa halaman web dengan judul beserta link ke halaman dan penjelasan singkat tentang isi halaman web tersebut. Search Engine Result Page (SERP) dapat merujuk ke satu halaman atau kumpulan link tergantung dari query yang diminta.



Search engine biasanya akan menyimpan cache SERP untuk pencarian yang memiliki frekuensi tinggi untuk meningkatkan performa search engine. Search engine juga secara periodik memperbaharui SERP untuk memperhitungkan halaman baru dan memodifikasi peringkat suatu halaman di search engine.







Gambar 2. Search Engine Result Page



Pentingnya bagi suatu website/situs untuk dapat diindeks oleh search engine yaitu meningkatkan trafik kunjungan ke website karena sebagian besar orang pada jaman modern kini menggunakan internet khususnya search engine untuk menemukan barang atau informasi yang mereka inginkan lewat internet. Melalui survei yang dilakukan oleh Jupiter Matrix bahwa 42% dari responden memilih menggunakan daftar pencarian dari search engine untuk menemukan barang atau informasi yang mereka cari. Website/situs yang diindeks dengan baik oleh search engine sangat dibutuhkan untuk hal ini karena suatu website yang diindeks dengan baik disertai memiliki relevansi yang tinggi tentunya lebih akan dipilih oleh pengunjung untuk didatangi sehingga meningkatkan jumalah trafik kunjungan. Berikut merupakan hasil surveinya :







Gambar 3. Search Engine dipilih Sebagai Rujukan Mencari Informasi



Page Rank

Banyak cara digunakan search engine dalam menentukan kualitas/rangking sebuah halaman web, mulai dari penggunaan META Tags, isi dokumen, penekanan pada konten dan masih banyak teknik lain atau gabungan teknik yang mungkin digunakan. Page Rank merupakan salah satu aspek utama dalam pencarian google yang berfungsi situs/website mana yang lebih penting/popular yang kemudian akan menentukan posisinya pada hasil pencarian. Page rank memiliki skala 1-10, sebuah web yang memiliki page rank tinggi akan diletakkan lebih dahulu pada daftar pencarian google (SERP) daripada web yang memiliki page rank rendah.



Pagerank memiliki konsep dasar yang sama dengan link popularity, tetapi tidak hanya memperhitungkan jumlah inbound dan outbound link. Pendekatan yang digunakan adalah sebuah halaman akan diangap penting jika halaman lain memiliki link ke halaman tersebut. Sebuah halaman juga akan menjadi semakin penting jika halaman lain yang memiliki rangking (pagerank) tinggi mengacu ke halaman tersebut. Sebuah situs/website akan semakin populer jika semakin banyak situs lain yang meletakkan link yang mengarah ke situsnya. Backlink atau link yang masuk ke website/situs yang kita miliki sangat berpengaruh terhadap nilai page rank yang didapat tentunya akan berpengaruh terhadap posisi situs/website pada hasil pencarian







Gambar 4. Perhitungan Page Rank Menggunakan Backlink







--------------------------------------------------------------------------------

untuk mengetahui lebih lanjut hub:http://www.ittelkom.ac.id/library/index.php?option=com_content&view=article&id=711:searchengine&catid=6:internet&Itemid=15

No comments: