|
JUDUL
|
Aplikasi
Data Mining untuk Menampilkan Tingkat Kelulusan Mahasiswa dengan Algoritma
Apriori
|
|
PENULIS
|
Benni
R Siburian
|
|
TAHUN
|
2014
|
|
JURNAL
& VOL
|
ISSN
(2301-9425) Volume VII – No. 2, Agustus 2014
|
|
REVIEWER
|
Muhammad Andri Wardika (1441177004174)
|
Abstrak :
Pertumbuhan yang pesat dari
akumulasi data telah menciptakan kondisi kaya akan data tapi minim informasi.
Data mining merupakan penambangan atau penemuan informasi baru dengan mencari
pola aturan tertentu darisejumlah data dalam jumlah besar yang diharapkan dapat
mengatasi kondisi tersebut.
Dengan memanfaatkan data induk
mahasiswa dan data kelulusan mahasiswa, diharapkan dapat menghasilkan informasi
tentang tingkat kelulusan dengan data induk mahasiswa melalui teknik data
mining.
Kategori tingkat kelulusan di ukur
dari lama studi dan IPK. Algoritma yang digunakan adalah algoritma apriori,
informasi yang ditampilkan berupa nilai support da nconfidence dari
masing-masing kategori tingkat
kelulusan.
1.
INTRODUCTION
Data Mining
adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data
berupa pengetahuan yang selama ini tidak diketahui secara manual. Patut diingat
bahwa kata mining sendiri berarti usaha untuk mendapatkan sedikit barang
berharga dari sejumlah besar material dasar.
Tujuan dari penelitian ini adalah
untuk menerapkan konsep Data Mining untuk menampilkan tingkat kelulusan
mahasiswa dan juga menerapkan Algoritma Apriori untuk menampilkan hal tersebut
sekaligus merancang Aplikasi dengan Data Mining.
Tujuan dari penggunaan teknik
Algoritma Apriori adalah algoritma paling terkenal untuk menemukan pola
frekuensi tinggi. Pola frekuensi tinggi adalah polapola item di dalam suatu
database yang memiliki frekuensi atau support di atas ambang batas tertentu
yang disebut dengan istilah minimum support. Pola frekuensi tinggi ini
digunakan untuk menyusun aturan assosiatif dan juga beberapa teknik data mining
lainnya.
2.
LITERATURE REVIEW
Han menjelaskan Data mining adalah
kegiatan menemukan pola yang menarik dari data dalam jumlah besar, data dapat
disimpan dalam database, data warehouse, atau penyimpanan informasi lainnya.
Data mining berkaitan dengan bidang ilmu – ilmu lain, seperti database system,
data warehousing, statistik, machine learning, information retrieval, dan
komputasi tingkat tinggi. Selain itu, data mining didukung oleh ilmu lain
seperti neural network, pengenalan pola, spatial data analysis, image database,
signal processing.
Davies membagi karakteristik data
mining sebagai berikut :
a. Data mining berhubungan dengan penemuan
sesuatu yang tersembunyi dan pola data tertentu yang tidak diketahui
sebelumnya.
b. Data mining biasa menggunakan
data yang sangat besar. Biasanya data yang besar digunakan untuk membuat hasil
lebih dipercaya.
c. Data mining berguna untuk membuat
keputusan yang kritis, terutama dalam strategi.
Han juga menjelaskan beberapa
tahapan pada data mining, tahap-tahap tersebut bersifat interaktif, pemakai
terlibat langsung atau perantaraan knowledge base. Dan berikut adalah
tahap-tahao dalam data mining : Pembersihan data (data cleaning), Integrasi
data (data integration), Seleksi Data (Data Selection), Transformasi data (Data
Transformation), Proses mining, Evaluasi pola (pattern evaluation), Presentasi
pengetahuan (knowledge presentation).
3.
METODOLOGI
Ada beberapa algoritma yang sudah
dikembangkan mengenai aturan asosiasi, namun ada satu algoritma klasik yang
sering dipakai yaitu algoritma apriori. Ide dasar dari algoritma ini adalah
dengan mengembangkan frequent itemset. Dengan menggunakan satu item dan secara
rekursif mengembangkan frequent itemset dengan dua item, tiga item dan
seterusnya hingga frequent itemset dengan semua ukuran.
Untuk mengembangkan frequent set
dengan dua item, dapat menggunakan frequent set item. Alasannya adalah bila set
satu item tidak melebihi support minimum, maka sembarang ukuran itemset yang
lebih besar tidak akan melebihi support minimum tersebut. Secara umum,
mengembangkan set dengan fc-item menggunakan frequent set dengan k – 1 item
yang dikembangkan dalam langkah sebelumnya. Setiap langkah memerlukan sekali
pemeriksaan ke seluruh isi database.
Dari jumlah besar aturan yang
mungkin dikembangkan, perlu memiliki aturanaturan yang cukup kuat tingkat
ketergantungan antar item dalam antecedent dan consequent. Untuk mengukur kekuatan
aturan asosiasi ini, digunakan ukuran support dan confidence. Support adalah
rasio antara jumlah transaksi yang memuat antecedent dan consequent dengan
jumlah transaksi. Confidence adalah rasio antara jumlah transaksi yang meliputi
semua item dalam antecedent dan consequent dengan jumlah transaksi yang
meliputi semua item dalam antecedent.
S = 
Keterangan :
S = Support
(+) = Jumlah transaksi yang
mengandung antecedent dan consequencent
Σ() = Jumlah transaksi
C = 
C = Confidence
(+) = Jumlah transaksi yang
mengandung antecedent dan consequencent
Σ() = Jumlah transaksi yang mengandung
antecedent.
5.
KESIMPULAN
Algoritma
apriori ini dapat diimplementasikan dalam perancangan aplikasi menggunakan Data
Mining. Metode yang diusulkan untuk membuat merancang aplikasi data mining
menggunakan aplikasi Microsoft Visual Basic Net 2008 dapat mudah dipahami oleh
programmer bahkan yang pemula. Dan metode ini dapat menampilkan informasi tingkat
kelulusan secara efektif
0 komentar:
Posting Komentar