Skip to main content

Cara Mesin Pencari Bekerja

Ada tiga bagian dasar dari mesin pencari yaitu crawling, indexing, dan sorting.

1. Crawling
Sebelum bisa menampilkan hasil pencarian, mesin pencari harus dapat menemukan terlebih dahulu di mana lokasi halaman web tersebut. Untuk itu mesin pencari memerlukan software yang disebut Web Crawler. Web Crawler juga disebut spider atau robot. Biasanya proses penelusuran dimulai dari halaman web yang popular. Begitu web tersebut ditemukan, Crawler akan mengindeks konten dan atribut di halaman tersebut, serta melakukan identifikasi. Setiap menemukan link dalam satu halaman, Crawler akan menuju halaman yang ditunjuk link tersebut, dan kembali mengindeks dan mengidentifikasi halaman. Halaman web dan dokumen diibaratkan sebagai titik, dan link menggambarkan hubungan antar titik tersebut. Web Crawler mengunjungi dari titik ke titik melalui jaringan yang menghubungkan titik tersebut.
Identifikasi halaman yang dijelajahi dilakukan dengan mengenali bagian dan konten halaman. Kata-kata yang berupa judul halaman, subjudul, meta tags, alamat URL dan bagian lain yang diaanggap penting untuk menentukan kategori dan keyword halaman akan diindeks. Obyek yang dapat diindeks oleh Web Crawler hanya teks. Karena itu, isi obyek lain seperti gambar, frame, atau flash, tidak akan dikenali oleh mesin pencari. Penting untuk membuat website berbasis teks, bukan flash atau yang lain.

2. Indexing
Informasi yang didapat ketika crawling harus dapat disimpan agar bisa digunakan. Di sinilah proses indexing berperan. Proses ini dimulai saat Web Crawler melemparkan hasil penelusurannya ke bagian program yang berfungsi untuk mengindeks. Informasi yang diikutkan dalam indeks tidak hanya tentang halaman, seperti konten, judul, meta tag, alamat URL, karena ini akan membuat kerja mesin pencari terbatas. Mesin pencari juga menyimpan informasi tentang berapa kali halaman sudah tampil di hasil pencarian dan juga informasi terkait dengan sistem pembobotan tiap halaman, yang menentukan urutan di hasil pencarian. Kombinasi ukuran indeks yang ramping dan metode dalam mengindeks menentukan seberapa cepat mesin pencari menemukan apa yang dicari oleh pengguna.

3. Sistem Ranking
Ketika pengguna melakukan pencarian, katakanlah mencari "elektro". Maka mesin pencari akan mencari halaman di indeksnya yang mengandung kata tersebut dan menampilkannya. Kelihatannya sederhana? Mungkin, namun bayangkan mesin pencari seperti Google harus mencari kata tersebut dalam 25 milyar halaman di indeksnya, dan halaman yang ditemukan bisa saja ada ribuan atau jutaan. Jika hanya diurutkan begitu saja atau berdasar abjad, pengguna mungkin harus mencari lagi dalam waktu lama dalam jutaan hasil pencarian.
Karena itulah, sistem pe-rangking-an menjadi hal penting untung mendapatkan hasil yang relevan. Untuk itu perlu dilakukan pembobotan untuk tiap halaman. Setiap mesin pencari memiliki metode pembobotan yang berbeda. Misalnya Google, salah satu cara yang digunakan dalam pembobotan adalah pagerank. Pagerank ini ditentukan dari jumlah link yang masuk (inbound link) dan link yang keluar (outbound link) yang ada dalam halaman website. Reputasi dari halaman yang dituju oleh inbound dan outbound link juga mempengaruhi bobot. Jika reputasi halaman tujuan link adalah buruk maka halaman kita juga ikut terpengaruh reputasinya. Selain itu, relevansi dari tema halaman yang dituju link dengan halaman kita sendiri juga harus baik. Misalnya jika tema halaman kita 'elektro' maka link yang baik adalah link yang menuju ke halaman bertema 'elektro' juga. 


Referensi : 
Jurus SEO Gaet Pengunjung Situs - Adnan H.P.

Comments

Popular posts from this blog

Upgrading PHP 5 to PHP 7 in Ubuntu

PHP 7 comes with a new version of the Zend Engine, numerous improvements and new features such as: Improved performance: PHP 7 is up to twice as fast as PHP 5.6 Significantly reduced memory usage Abstract Syntax Tree Consistent 64-bit support Improved Exception hierarchy Many fatal errors converted to Exceptions Secure random number generator Removed old and unsupported SAPIs and extensions The null coalescing operator Return and Scalar Type Declarations Anonymous Classes Zero cost asserts Today (12 April 2016), latest Ubuntu release doesn't include PHP 7. You can install PHP 7 from third-party repository such as PPA. PPAs are not bound by the release schedules or policies of Ubuntu so they are free to change versions more frequently, among other things. Ondrey PPA is a popular way of staying more up to date with PHP. Ondrey is the official owner of the PHP tree in Debian, which is upstream from Ubuntu. To install PHP 7 in Ubuntu you can do the following: 1.

Configuring Swap Memory on Ubuntu Using Ansible

If we maintain a Linux machine with a low memory capacity while we are required to run an application with high memory consumption, enabling swap memory is an option. Ansible can be utilized as a helper tool to automate the creation of swap memory. A swap file can be allocated in the available storage of the machine. The swap file then can be assigned as a swap memory. Firstly, we should prepare the inventory file. The following snippet is an example, you must provide your own configuration. [server] 192.168.1.2 [server:vars] ansible_user=root ansible_ssh_private_key_file=~/.ssh/id_rsa Secondly, we need to prepare the task file that contains not only the tasks but also some variables and connection information. For instance, we set /swapfile  as the name of our swap file. We also set the swap memory size to 2GB and the swappiness level to 60. - hosts: server become: true vars: swap_vars: size: 2G swappiness: 60 For simplicity, we only check the exi

Rangkaian Sensor Infrared dengan Photo Dioda

Keunggulan photodioda dibandingkan LDR adalah photodioda lebih tidak rentan terhadap noise karena hanya menerima sinar infrared, sedangkan LDR menerima seluruh cahaya yang ada termasuk infrared. Rangkaian yang akan kita gunakan adalah seperti gambar di bawah ini. Pada saat intensitas Infrared yang diterima Photodiode besar maka tahanan Photodiode menjadi kecil, sedangkan jika intensitas Infrared yang diterima Photodiode kecil maka tahanan yang dimiliki photodiode besar. Jika  tahanan photodiode kecil  maka tegangan  V- akan kecil . Misal tahanan photodiode mengecil menjadi 10kOhm. Maka dengan teorema pembagi tegangan: V- = Rrx/(Rrx + R2) x Vcc V- = 10 / (10+10) x Vcc V- = (1/2) x 5 Volt V- = 2.5 Volt Sedangkan jika  tahanan photodiode besar  maka tegangan  V- akan besar  (mendekati nilai Vcc). Misal tahanan photodiode menjadi 150kOhm. Maka dengan teorema pembagi tegangan: V- = Rrx/(Rrx + R2) x Vcc V- = 150 / (150+10) x Vcc V- = (150/160) x 5

Installing VSCode Server Manually on Ubuntu

I've ever gotten stuck on updating the VSCode server on my remote server because of an unstable connection between my remote server and visualstudio.com that host the updated server source codes. The download and update process failed over and over so I couldn't remotely access my remote files through VSCode. The solution is by downloading the server source codes through a host with a stable connection which in my case I downloaded from a cloud VPS server. Then I transfer the downloaded source codes as a compressed file to my remote server through SCP. Once the file had been on my remote sever, I extracted them and align the configuration. The more detailed steps are as follows. First, we should get the commit ID of our current VSCode application by clicking on the About option on the Help menu. The commit ID is a hexadecimal number like  92da9481c0904c6adfe372c12da3b7748d74bdcb . Then we can download the compressed server source codes as a single file from the host.

Resize VirtualBox LVM Storage

VirtualBox is a free solution to host virtual machines on your computer. It provides configuration options for many components on our machine such as memory, storage, networking, etc. It also allows us to resize our machine storage after its operating system is installed. LVM is a volume manager in a Linux platform that helps us to allocate partitions in the system and configure the storage size that will be utilized for a specific volume group. There are some points to be noticed when we work with LVM on VirtualBox to resize our storage. These are some steps that need to be performed. 1. Stop your machine before resizing the storage. 2. Set new storage size using GUI by selecting " File > Virtual Media Manager > Properties " then find the desired virtual hard disk name that will be resized. OR , by running a CLI program located in " Program Files\Oracle\VirtualBox\VBoxManage.exe ".  cd "/c/Program Files/Oracle/VirtualBox" ./VBoxManage.exe list

Generate API Documentation Using Swagger Module in NestJS

Swagger provides us a standard to generate API documentation based on the Open API specification. If we use NestJS for building our API providers, we can utilize a tool provided by NestJS in the  @nestjs/swagger  module to generate the documentation automatically in the built time. This module also requires the swagger-ui-express module if we use Express as the NestJS base HTTP handler. Set Swagger configuration First, we need to define Swagger options and instantiate the documentation provider on the main.ts file. import { DocumentBuilder, SwaggerModule } from '@nestjs/swagger'; // sample application instance const app = await NestFactory.create(AppModule); // setup Swagger options const options = new DocumentBuilder() .setTitle('Coffee') .setVersion('1.0') .setDescription('Learn NestJS with coffee') .build(); // build the document const document = SwaggerModule.createDocument(app, options); // provide an endpoint