Skip to main content

Pemrograman Paralel dengan CUDA

CUDA (Compute Unified Device Architecture) adalah suatu skema yang dibuat oleh NVIDIA agar NVIDIA selaku GPU (Graphic Processing Unit) mampu melakukan komputasi tidak hanya untuk pengolahan grafis namun juga untuk tujuan umum. Jadi, dengan CUDA, kita dapat memanfaatkan cukup banyak processor yang dimiliki oleh NVIDIA untuk berbagai perhitungan. GPU yang ada  saat ini seperti ATI pun sudah memiliki banyak processor di dalamnya. Pada ATI, skema yang mereka bangun disebut ATI Stream. Saat ini pemrograman paralel menjadi sangat penting karena kebutuhan kemampuan komputasi komputer yang terus meningkat seperti kemampuan multitasking dan pengolahan grafis yang andal. Metode saat ini dalam peningkatan peforma komputer juga berbeda dengan masa lampau dimana peningkatan clock dari processor yang diutamakan. Peningkatan clock juga dibatasi oleh kemampuan fisik dari perangkat digital yaitu persoalan daya dan panas. Pada 2005 berbagai industri komputer mulai menawakan komputer dengan beberapa core mulai dari 2, 3, 4, 6, dst. Pada awal perkembangan GPU dengan banyak core, pemanfaatan GPU hanya dapat dilakukan dengan antarmuka seperti OpenGL dan DirectX dimana antarmuka tersebut dikhususkan hanya untuk pengolahan grafis. 
Seri-seri terbaru dari NVIDIA saat ini telah mendukung CUDA tepatnya keluaran setelah tahun 2006.  Untuk daftar dari seri yang mendukung CUDA dapat dilihat pada http://nvidia.com/cuda. Sebagai tahap awal dalam belajar pemrograman paralel dengan memanfaatkan CUDA sebaiknya menggunakan bahasa pemrograman C atau C++. CUDA C telah menjadi bahasa pemrograman khusus pertama yang dikembangkan oleh suatu perusahaan GPU untuk memfasilitasi general-purpose computing pada GPU. Beberapa hal yang perlu dipersiapkan dalam penggunaan CUDA C untuk membuat suatu aplikasi adalah sebagai berikut.
  • CUDA-enabled graphics processor 
  • NVIDIA device driver
  • CUDA development toolkit
  • Standard C compiler
Kebutuhan seperti toolkit dan driver dapat diunduh di http://developer.nvidia.com/cuda-downloads. CUDA C menyediakan kebutuhan tersebut untuk Windows, Linux, dan Mac. Jika telah memasang CUDA toolkit pada komputer Anda maka akan ada aplikasi compiler yang dapat Anda gunakan yaitu nvcc. Selain itu, jika Anda menggunakan Windows sebaiknya Anda juga memasang Visual Studio untuk kemudahan pembuatan aplikasi dan ada program bernama cl.exe dari Visual Studio yang diperlukan dalam kompilasi.
Hal khusus dalam kode program yang menggunakan CUDA C adalah adanya kernel call. Sebagai contoh adalah cuplikan kode berikut.


#include 
__global__ void kernel( void ) {
}
int main( void ) {
    kernel<<<1>>>();
    printf( "Hello, World!\n" );
    return 0;
}

Penambahan variabel __global__ pada fungsi kernel()berfungsi untuk menunjukkan pada compiler bahwa program tersebut dikompilasi untuk berjalan pada device dan bukan pada host. Selanjutnya kita akan melihat contoh program lagi dimana terdapat bagian pengiriman nilai.

#include 
#include "book.h"
__global__ void add( int a, int b, int *c ) {
    *c = a + b;
}
int main( void ) {
    int c;
    int *dev_c;
    HANDLE_ERROR( cudaMalloc( (void**)&dev_c, sizeof(int) ) );
    add<<<1>>>( 2, 7, dev_c );
    HANDLE_ERROR( cudaMemcpy( &c, dev_c, sizeof(int), cudaMemcpyDeviceToHost   ) );
    printf( "2 + 7 = %d\n", c );
    cudaFree( dev_c );
    return 0;
}


Variabel dev_c adalah variabel yang akan digunakan untuk menampung nilai yang akan dilewatkan dari host ke  device dan setelah itu nilai tersebut akan diambil dari device dan dikirim ke host. Metode pengalokasian memori memanfaatkan fungsi cudaMalloc() yang fungsinya mirip malloc() pada C. Untuk mengambil nilai dari device memanfaakan fungsi cudaMemcpy().
Sekarang bagaimanakah paralel pada GPU? Kita lihat program penjumlahan vektor berikut ini.

#include "../common/book.h"
#define N 10

__global__ void add( int *a, int *b, int *c ) {
 int tid = blockIdx.x; 

 // handle the data at this index
 if (tid < N) {
  c[tid] = a[tid] + b[tid]; 
 }
}

int main( void ) { 
int a[N], b[N], c[N]; 
int *dev_a, *dev_b, *dev_c; 

// allocate the memory on the GPU 
HANDLE_ERROR( cudaMalloc( (void**)&dev_a, N * sizeof(int) ) ); 
HANDLE_ERROR( cudaMalloc( (void**)&dev_b, N * sizeof(int) ) );
HANDLE_ERROR( cudaMalloc( (void**)&dev_c, N * sizeof(int) ) ); 

// fill the arrays 'a' and 'b' on the CPU 
for (int i = 0; i < N; i++) { a[i] = -i; b[i] = i * i; } 

// copy the arrays 'a' and 'b' to the GPU 
HANDLE_ERROR( cudaMemcpy( dev_a, a, N * sizeof(int), cudaMemcpyHostToDevice ) ); 
HANDLE_ERROR( cudaMemcpy( dev_b, b, N * sizeof(int), cudaMemcpyHostToDevice ) );

add<<< N,1 >>>( dev_a, dev_b, dev_c );

// copy the array 'c' back from the GPU to the CPU 
HANDLE_ERROR( cudaMemcpy( c, dev_c, N * sizeof(int), cudaMemcpyDeviceToHost ) ); 

// display the results 
for (int i = 0; i < N; i++) { printf( "%d + %d = %d\n", a[i], b[i], c[i] ); } 

// free the memory allocated on the GPU 
cudaFree( dev_a ); cudaFree( dev_b ); cudaFree( dev_c ); return 0; 

Program yang dapat dijadikan paralel adalah program yang digunakan untuk menghasilkan satu nilai dimana nilai keluarannya tersebut tidak dipengaruhi oleh nilai lain dari komputasi dengan fungsi yang sama. Contohnya adalah dalam program penjumlahan vektor ini. Dalam penjumlahan vektor nilai c(0) adalah penjumlahan antara a(0) dan b(0) dan tidak dipengaruhi oleh nilai c(1), c(2), dst.
Pada program ini juga terdapat bagian yang bertuliskan add<<<N,1>>>. Bagian ini menunjukkan bahwa program memanfaatkan N buah thread. Nilai N buah ini diperoleh dari :
N buah block x 1 thread per block
Untuk menentukan jumlah thread yang akan digunakan dapat  diatur dengan mengubah kedua nilai tersebut. Fungsi add<<<1,N>>> akan menghasilkan penggunaan jumlah thread yang sama dengan fungsi ini add<<<N,1>>>. Jumlah block dan thread per block tentu saja terbatas dan untuk setiap device akan berbeda jumlahnya. Anda dapat melihatnya menggunakan fungsi properti dari CUDA. Program di atas juga hanya menggunakan 1 thread pada setiap block. Oleh karena itu identifikasi posisi cukup dengan mengambil posisi block yang menjalankan komputasi dengan memanggil variabel blockIdx.x.

Hal lain yang akan menjadi penting dalam pemanfaatan CUDA ada kemampuan untuk merepresentasikan array 2D atau 3D dalam array 1D. Kemampuan ini akan mempermudah kita dalam pembuatan program untuk pengalokasian memori serta pengaturan jumlah thread. Untuk belajar lebih jauh lagi tentang pemrograman paralel dengan CUDA dapat mempelajari berbagai bahan untuk belajar yang disediakan oleh NVIDIA seperti pada http://developer.nvidia.com//suggested-reading dan http://developer.nvidia.com/cuda-training.


Popular posts from this blog

Beli Bahan Tekstil dan Jasa Jahit di Bandung

Acara wisuda akan dilaksanakan pada Juli 2012 dan untuk acara tersebut saya memerlukan jas. Saya langsung googling untuk mencari tempat yang menjual jas. Sebelumnya saya sempat berpikir untuk menyewa jas saja namun karena tampaknya jas akan cukup penting nantinya dan harga penyewaan yang umumnya tidak murah maka saya memutuskan membeli. Saya mencari tempat yang menjual jas yang murah di Bandung. Hasilnya beberapa artikel menyebutkan Pasar Baru Bandung menjual berbagai bahan tekstil dan pakaian termasuk jas. Saya langsung membuka Google Maps dan mencari lokasi Pasar Baru Bandung. Berikut adalah lokasi Pasar Baru Bandung.

View Pasar Baru Bandung in a larger map

Setelah mengetahui lokasi tersebut, saya memutuskan pergi sendiri ke Pasar Baru Bandung. Tidak lupa saya menyiapkan GPS berhubung sangat lemah soal arah jalan. Alhasil, setelah sampai di dekat jembatan, sebelum jalan Suniaraja saya sempat mengambil arah yang salah dan akhirnya berputar-putar di daerah sekitar Pasar Baru (Jalan St…

Sariawan dan Vitamin B12

Beberapa hari yang lalu, saya yang kebetulan sedang sariawan diminta teman saya di FKG UNPAD yang sedang mencari pasien sariawan, untuk datang ke tempat praktek FKG yang berada di Sekeloa (dekat Dipati Ukur). Awalnya sempat malas, tapi karena saat itu saya sedang tidak ada pekerjaan dan FKG tampaknya cukup 'menarik', akhirnya saya memutuskan pergi ke sana sendiri. Saya mendaftar jadi pasien di rumah sakit FKG terlebih dahulu, kemudian baru saya diajak ke tempat prakteknya. Saat ditanya apa penyebab sariawan saya, saya tidak ingat. Mulut saya pun kemudian diperiksa dan 'diacak-acak'. Kaca mulut, sonde, pinset, dll sudah masuk ke mulut saya. Beberapa kali seriawan saya  tersentuh. Seorang temannya Gema membantu mencatat data hasil pemeriksaan. Setelah itu, giliran dosennya yang memeriksa mulut saya. Pada bagian akhir sariawan saya diberi suatu obat cair. Pesan dari Gema untuk memperbanyak minum air dan konsumsi vitamin B12.
Menurut Dosen Gizi dari Departemen Gizi Masyar…

Rangkaian Sensor Infrared dengan Photo Dioda

Keunggulan photodioda dibandingkan LDR adalah photodioda lebih tidak rentan terhadap noise karena hanya menerima sinar infrared, sedangkan LDR menerima seluruh cahaya yang ada termasuk infrared.
Rangkaian yang akan kita gunakan adalah seperti gambar di bawah ini.


Pada saat intensitas Infrared yang diterima Photodiode besar maka tahanan Photodiode menjadi kecil, sedangkan jika intensitas Infrared yang diterima Photodiode kecil maka tahanan yang dimiliki photodiode besar.
Jika tahanan photodiode kecil maka tegangan V- akan kecil. Misal tahanan photodiode mengecil menjadi 10kOhm. Maka dengan teorema pembagi tegangan:
V- = Rrx/(Rrx + R2) x Vcc V- = 10 / (10+10) x Vcc V- = (1/2) x 5 Volt V- = 2.5 Volt
Sedangkan jika tahanan photodiode besar maka tegangan V- akan besar (mendekati nilai Vcc). Misal tahanan photodiode menjadi 150kOhm. Maka dengan teorema pembagi tegangan:
V- = Rrx/(Rrx + R2) x Vcc V- = 150 / (150+10) x Vcc V- = (150/160) x 5 Volt V- = 4.7 Volt
Sekarang kita akan melihat trimp…

How To Use Git in Netbeans

Git is a popular version control application nowadays. Recently I have created a note about its differences with SVN and how to use it in Eclipse. There are many Git client tools. But I just want to show how to use Netbeans built in Git tools. It makes development process easier because it has been integrated with the IDE.
Create Remote Git Repository We need remote Git repository so everyone can store or receive any revision or updated files through the networks. We can setup our own Git server or use public Git server like Github. In this note, I use Github. 1. Create an account in Github and create an empty Git repository
2. Get the remote repository link
Create a New Project in Netbeans and Create Local Git Repository After we have a remote Git repository, we can create a project which will be stored to remote repository. We also need to create local repository before we can push any revision and files to remote repository. 1. Create a project. For example, I create PHP Application…

Beautiful Rain (JDorama)

Saya selalu tertarik dengan film-film inspirasional, baik movie atau pun serial drama. Akhir-akhir ini saya tertarik untuk menonton drama serial jepang. Saya googling dengan keyword "inspirational japan dorama" kemudian saya dapati sejumlah review beberapa film bagus dari sejumlah netizen. 
Salah satu yang kemudian saya tonton adalah Beautiful Rain. Setiap episode film ini selalu membuat saya sangat terharu sampai meneteskan air mata. :' Yah, ini mungkin saja karena saya yang terlalu melankolis. Hahaha.

Ini sedikit review dari saya tentang film ini.