Skip to main content

Cara Mesin Pencari Bekerja

Ada tiga bagian dasar dari mesin pencari yaitu crawling, indexing, dan sorting.

1. Crawling
Sebelum bisa menampilkan hasil pencarian, mesin pencari harus dapat menemukan terlebih dahulu di mana lokasi halaman web tersebut. Untuk itu mesin pencari memerlukan software yang disebut Web Crawler. Web Crawler juga disebut spider atau robot. Biasanya proses penelusuran dimulai dari halaman web yang popular. Begitu web tersebut ditemukan, Crawler akan mengindeks konten dan atribut di halaman tersebut, serta melakukan identifikasi. Setiap menemukan link dalam satu halaman, Crawler akan menuju halaman yang ditunjuk link tersebut, dan kembali mengindeks dan mengidentifikasi halaman. Halaman web dan dokumen diibaratkan sebagai titik, dan link menggambarkan hubungan antar titik tersebut. Web Crawler mengunjungi dari titik ke titik melalui jaringan yang menghubungkan titik tersebut.
Identifikasi halaman yang dijelajahi dilakukan dengan mengenali bagian dan konten halaman. Kata-kata yang berupa judul halaman, subjudul, meta tags, alamat URL dan bagian lain yang diaanggap penting untuk menentukan kategori dan keyword halaman akan diindeks. Obyek yang dapat diindeks oleh Web Crawler hanya teks. Karena itu, isi obyek lain seperti gambar, frame, atau flash, tidak akan dikenali oleh mesin pencari. Penting untuk membuat website berbasis teks, bukan flash atau yang lain.

2. Indexing
Informasi yang didapat ketika crawling harus dapat disimpan agar bisa digunakan. Di sinilah proses indexing berperan. Proses ini dimulai saat Web Crawler melemparkan hasil penelusurannya ke bagian program yang berfungsi untuk mengindeks. Informasi yang diikutkan dalam indeks tidak hanya tentang halaman, seperti konten, judul, meta tag, alamat URL, karena ini akan membuat kerja mesin pencari terbatas. Mesin pencari juga menyimpan informasi tentang berapa kali halaman sudah tampil di hasil pencarian dan juga informasi terkait dengan sistem pembobotan tiap halaman, yang menentukan urutan di hasil pencarian. Kombinasi ukuran indeks yang ramping dan metode dalam mengindeks menentukan seberapa cepat mesin pencari menemukan apa yang dicari oleh pengguna.

3. Sistem Ranking
Ketika pengguna melakukan pencarian, katakanlah mencari "elektro". Maka mesin pencari akan mencari halaman di indeksnya yang mengandung kata tersebut dan menampilkannya. Kelihatannya sederhana? Mungkin, namun bayangkan mesin pencari seperti Google harus mencari kata tersebut dalam 25 milyar halaman di indeksnya, dan halaman yang ditemukan bisa saja ada ribuan atau jutaan. Jika hanya diurutkan begitu saja atau berdasar abjad, pengguna mungkin harus mencari lagi dalam waktu lama dalam jutaan hasil pencarian.
Karena itulah, sistem pe-rangking-an menjadi hal penting untung mendapatkan hasil yang relevan. Untuk itu perlu dilakukan pembobotan untuk tiap halaman. Setiap mesin pencari memiliki metode pembobotan yang berbeda. Misalnya Google, salah satu cara yang digunakan dalam pembobotan adalah pagerank. Pagerank ini ditentukan dari jumlah link yang masuk (inbound link) dan link yang keluar (outbound link) yang ada dalam halaman website. Reputasi dari halaman yang dituju oleh inbound dan outbound link juga mempengaruhi bobot. Jika reputasi halaman tujuan link adalah buruk maka halaman kita juga ikut terpengaruh reputasinya. Selain itu, relevansi dari tema halaman yang dituju link dengan halaman kita sendiri juga harus baik. Misalnya jika tema halaman kita 'elektro' maka link yang baik adalah link yang menuju ke halaman bertema 'elektro' juga. 


Referensi : 
Jurus SEO Gaet Pengunjung Situs - Adnan H.P.

Comments

Popular posts from this blog

Rangkaian Sensor Infrared dengan Photo Dioda

Keunggulan photodioda dibandingkan LDR adalah photodioda lebih tidak rentan terhadap noise karena hanya menerima sinar infrared, sedangkan LDR menerima seluruh cahaya yang ada termasuk infrared. Rangkaian yang akan kita gunakan adalah seperti gambar di bawah ini. Pada saat intensitas Infrared yang diterima Photodiode besar maka tahanan Photodiode menjadi kecil, sedangkan jika intensitas Infrared yang diterima Photodiode kecil maka tahanan yang dimiliki photodiode besar. Jika  tahanan photodiode kecil  maka tegangan  V- akan kecil . Misal tahanan photodiode mengecil menjadi 10kOhm. Maka dengan teorema pembagi tegangan: V- = Rrx/(Rrx + R2) x Vcc V- = 10 / (10+10) x Vcc V- = (1/2) x 5 Volt V- = 2.5 Volt Sedangkan jika  tahanan photodiode besar  maka tegangan  V- akan besar  (mendekati nilai Vcc). Misal tahanan photodiode menjadi 150kOhm. Maka dengan teorema pembagi tegangan: V- = Rrx/(Rrx + R2) x Vcc V- = 150 / (150+10) x Vcc V- = (150/160) x 5

Setting Up Next.js Project With ESLint, Typescript, and AirBnB Configuration

If we initiate a Next.js project using the  create-next-app tool, our project will be included with ESLint configuration that we can apply using yarn run lint . By default, the tool installs eslint-config-next and extends next/core-web-vitals in the ESLint configuration. The Next.js configuration has been integrated with linting rules for React and several other libraries and tools. yarn create next-app --typescript For additional configuration such as AirBnB, it is also possible. First, we need to install the peer dependencies of eslint-config-airbnb . We also add support for Typescript using eslint-config-airbnb-typescript . yarn add --dev eslint-config-airbnb eslint-plugin-import eslint-plugin-jsx-a11y eslint-plugin-react eslint-plugin-react-hooks yarn add --dev eslint-config-airbnb-typescript @typescript-eslint/eslint-plugin @typescript-eslint/parser After that, we can update the .eslintrc.json file for the new configuration. { "extends": [ "airb

Configuring Swap Memory on Ubuntu Using Ansible

If we maintain a Linux machine with a low memory capacity while we are required to run an application with high memory consumption, enabling swap memory is an option. Ansible can be utilized as a helper tool to automate the creation of swap memory. A swap file can be allocated in the available storage of the machine. The swap file then can be assigned as a swap memory. Firstly, we should prepare the inventory file. The following snippet is an example, you must provide your own configuration. [server] 192.168.1.2 [server:vars] ansible_user=root ansible_ssh_private_key_file=~/.ssh/id_rsa Secondly, we need to prepare the task file that contains not only the tasks but also some variables and connection information. For instance, we set /swapfile  as the name of our swap file. We also set the swap memory size to 2GB and the swappiness level to 60. - hosts: server become: true vars: swap_vars: size: 2G swappiness: 60 For simplicity, we only check the exi

Raspberry Pi Bluetooth Connection

Raspberry Pi 3 provides a built-in Bluetooth module. The latest Raspbian has been bundled with tools for enabling Bluetooth connection. The Bluetooth icon will be shown up on the top right corner of the desktop. It's a tool to discover available Bluetooth devices and connect Pi with Bluetooth devices. It is easy to connect any Bluetooth-enabled electronic device with Pi. But, sometimes Pi will fail to connect, especially for Bluetooth device that has no standardized services. From a terminal, we can use the  bluetoothctl tool to scan and connect with a Bluetooth device. You should make sure that the BlueZ protocol stack has been installed by running $ apt-get install bluez Run bluetoothctl to enter the tool command window Turn the power on by running power on (Optional) You can set AutoEnable=true in /etc/bluetooth/main.conf if you want to make the Bluetooth auto power-on after reboot. Run devices to see which devices have been paired Run scan on if your desired d

Installing Multiple Instances of Linux Distributions in WSL

By support of WSL (Windows Subsystem for Linux), you can install any Linux distros in a Windows machine. Recommended method from WSL documentation is by downloading the distribution from Microsoft Store or find .appx installation file available in Microsoft website. For running multiple instances of same Linux distribution, you can duplicate the data using export-import procedure, as I have mentioned in another post . Another method that might be more beneficial is by utilizing Docker. Currently, Docker has already had variety of images of Linux distributions in its registry. You can also store your own costumized distribution in Docker registry that can be distributed to any machines instantly. After you had WSL 2 and an installed Linux distribution from Microsoft Store, you are ready to have more Linux instances in your Windows. 1. List all installed distributions in your Windows. wsl --list -v 2. Run the distribution you desired from terminal, for example, you have insta

Generate API Documentation Using Swagger Module in NestJS

Swagger provides us a standard to generate API documentation based on the Open API specification. If we use NestJS for building our API providers, we can utilize a tool provided by NestJS in the  @nestjs/swagger  module to generate the documentation automatically in the built time. This module also requires the swagger-ui-express module if we use Express as the NestJS base HTTP handler. Set Swagger configuration First, we need to define Swagger options and instantiate the documentation provider on the main.ts file. import { DocumentBuilder, SwaggerModule } from '@nestjs/swagger'; // sample application instance const app = await NestFactory.create(AppModule); // setup Swagger options const options = new DocumentBuilder() .setTitle('Coffee') .setVersion('1.0') .setDescription('Learn NestJS with coffee') .build(); // build the document const document = SwaggerModule.createDocument(app, options); // provide an endpoint