Wednesday, 26 July 2017

Apa itu Pemogramman Event Driven?

PEMROGRAMAN BERBASIS EVENT ( EVENT-DRIVEN PROGRAMMING )


         Event-Driven Programming adalah salah satu teknik pemogramman, yang konsep kerjanya tergantung dari kejadian atau event tertentu. misalnya ketika tombol A diklik maka nilai label 2 di tambah nilai label 3 dibagi nilai label 4.  tapi jika tombol A diklik dan ternyata label satu berisikan penjumlahan. maka program yang dijalankan label 2 ditambah label 3.
         Konsep Event-Driven Programming sama seperti konsep pemogramman menggunakan Procedure.  pemograman yang memiliki input, proses dan output. Namun, ada satu penambahan yang berbeda, yaitu konsep pemilihan untuk mengeksekusi proses programnya. Event-Driven programming juga bisa dibilang suatu paradigma pemrograman yang alur programnya ditentukan oleh suatu event / peristiwa yang merupakan keluaran atau tindakan pengguna atau bisa berupa pesan dari program lainnya. 

         Menurut Berson, 1992, Sistem Event-Driven adalah satau sistem objek yang saling berinteraksi satu dengan yang lain dengan menggunakan mekanisme pesan. Mekanisme ini dikontrol oleh satu komponen berbeda yang biasanya disebeut event dispatcher.
        Data yang dikomunikasikan disebut dengan event dan data tersebut dapat dimulai dari masukan yang tidak diproses di raw event ( peristiwa mentah) atau data tersebut mendapatkan hasil komunikasi di antara objek. Objek dapat menerima event yang berbentuk pesan event, secara khusus yang disusun dari jenis event dan parameter event. 

         Berikut adalah komponen pemograman berbasis event (Event-Driven Programming)

  • Event
    Event / kejadian adalah sebuah aksi yang muncul pada sebuah sistem. Kejadian atau aksi ini bisa dipicu oleh misalkan penekanan tombol mouse, penekanan sebuah tombol keyboard atau timer
  • Trigger
    Trigger adalah sebuah fungsi yang mempunyai kesesuaian dengan kejadian. contoh gampangnya adalah fungsi ketika tombol mouse ditekan : onMouseClick(). Tujuannya dari Trigger tidak lain adalah sebagai atau untuk memicu komponent event handler
  • Event Handler
    Event Handler adalah komponen yang melakukan aksi ketika terjadi sebuah event.
  • Event Loop
    Event Loop berfungsi mencari event-event yang ada pada sebuah sistem berbasih event. Proses event loop berlangsung secara terus menerut (loop), sampai sebuah aksi atau event muncul yang mengakhiri proses event loop tersebut. 
        Beberapa kelebihan pemrograman berbasis event dapat dilihat pada ilustrasi berikut :
        Suitable for GUI
          Pemrograman berbasis event sangat mudah dijumpai atau dilakukan pada pembuatan aplikasi berbasis GUI dimana pada aplikasi berbasis GUI aktivitasnya berdasarkan pada sebuah event contohnya penekanan tombol mouse dan penekanan tombol pada menu.

         Simplicity of Programming
     Pemrograman berbasis event berfokus hanya pada komponen Event Handlers, sehingga memudahkan pembuatan aplikasi yang responsif dengan proses yang dinamis.
        Ease of Development
       Kemudahan dalam melakukan penulisan program akan berdampak pada kemudahan dalam melakukan pengembangan aplikasi, dikarenakan aplikasi dipecah ke dalam handler untuk setiap event dan mendukung pembuatan aplikasi yang reusable.
         Service Oriented
       Aplikasi berbasis event dapat terdiri dari beberapa layanan (services) yang kesemuanya tergabung dalam membentuk sebuah aplikasi.
           Time Driven
            Aplikasi berbasis event dijalankan oleh pewaktu (time) dibandingkan oleh perintah.
            Flexibility
            Aplikasi berbasis event sangat mudah untuk dimodifikasi.
Berikut adalah beberapa bahasa pemrograman yang mendukung dalam pembuatan aplikasi berbasis event

  1. Visual Basic / VB.Net
  2. C#
  3. C++
  4. Java
  5. ColdFusion
  6. Python

Read more »

Saturday, 13 May 2017

K-MEANS

1.1  K-Means
       Dalam statistik dan mesin pembelajaran, pengelompokan K-Means merupakan metode analisis kelompok yang mengarah pada pemartisian N objek pengamatan ke dalam K kelompok (cluster) dimana setiap objeck pengamatan dimiliki oleh sebuah kelompok dengan mean (rata-rata) terdekat, mirip dengan algoritma Expectation-Maximization untuk Gaussian Mixture dimana keduanya mencoba untuk menemukan pusat dari kelompok dalam data sebanyak iterasi perbaikan yang dilakukan oleh kedua algoritma. K-Means merupakan salah satu metode pengelompokan dan nonhierarki (sekatan) yang berusaha mempartisi data yang ada ke dalam bentuk dua atau lebih kelompok. Metode ini mempartisi data kedalam kelompok sehingga data berkarakteristik sama dimasukan kedalam satu kelompok yang sama dan data yang berkarakteristik berbeda dikelompokan ke dalam kelompok yang lain. Adapun tujuan pengelompokan data ini adalah untuk meminimalkan fungsi objektif dalam suatu kelompok dan memaksimalkan variasi antar kelompok.

2.1.1      Metode K-Means
Dari beberapa teknik yang paling sederhana dan umum dikenal adalah clustering k-means. Dalam teknik ini, objek-objek dikelompokan ke dalam K kelompok atau cluster. Untuk melakukan clustering ini, nilai k harus ditentukan terlebih dahulu. Biasanya user atau pemakai sudah mempunyai informasi awal tentang objek yang sedang dipelajari, termasuk berapa jumlah cluster yang paling tepat.
Secara detail dapat digunakan ukuran ketidakmiripan untuk pengelompokan objek. Ketidak miripan dapat diterjemahkan dalam konsep jarak. Jika dua objek atau data titik cukup dekat, maka dua objek itu mirip. Semakin dekat semakin tinggi kemiripannya. Hasil klastering dikatakan baik jika nila interclass similiarity (kesamaan antar kelas/ WVC (withing cluster variation) tinggi dan nilai interclass similarity (kesamaan antar kelas/ BVC (between cluster variation) rendah. Nilai WVC dapat dilihat dari nilai SSE-nya sedangkan BVC dihitung dengan rumus : BVC = d(m1,m2,…,mn) dimana d adalah jarak antara centroid m.
2.1.2      Algoritma K-Means
K-means bertujuan untuk membagi objek-objek atau data data yang diberikan menjadi beberapa cluster sejumlah K cluster-cluster tersebut mempunyai suatu nilai tengah / nilai pusat yang disebut dengan centroid. Tujuan dari algoritma k-means adalah meminimalisir total dari jarak elemen-elemen antar cluster (jarak antar cluster dengan cluster lainnya). Algoritma pengelompokan data dengan k-means dapat diringkas dengan sebagai berikut :
1.     Tentukan jumlah kelompok
2.     Alokasikan data ke dalam kelompok secara acak
3.     Hitung pusat (sentroid/rata-rata) dari data yang ada di masing-masing kelompok
4.     Alokasikan masing-masing data ke sentroid/rata-rata terdekat
5.     Kembali kelangkah 3, apabila masih ada data yang berpindah kelompok, atau apabila ada perubahan nilai sentroid diatas nilai ambang yang ditentukan, atau apabila perubahan nilai pada fungsi objektif yang digunakan masih diatas nilai ambang yang ditentukan.
Pada langkah ke 3, lokasi sentroid (titik pusat) setiap kelompok yang di ambil dari rata-rata (mean) semua nilai data pada setiap fiturnya harus dihitung kembali. Jika M menyatakan jumlah data dalam sebuah kelompok, i menyatakan fitur ke-I dalam sebuah kelompok dan p menyatakan dimensi data, untuk menghitung sentroid fitur ke-I digunakan formula :
CI =
Formula tersebut dilakukan sebanyak p dimensi sehingga I mulai dari 1 sampai p.
Ada beberapa cara yang dapat digunakan untuk mengukur  jarak data ke pusat kelompok, di antaranya Euclidean (Bezdek, 1981), Manhattan/City Block (Miyamoto dan Agusta, 1995) dan Minkowsky (Miyamoto dan Agusta, 1995). Masing-masing cara mempunyai kelebihan dan kekurangan.
Pengukuran jarak pada ruang jarak (distance space) Euclidean menggunakan formula
D(x­2 , x1) = || x2 – x1 ||2 = 2j – x1j 2
D adalah jarak antara data x2 dan x­­1, dan | . | adalah nilai mutlak. Pengukuran jarak pada ruang jarak manhattan menggunakan formula
D(x­2 , x1) = || x2 – x1 ||1 = 2j – x1j
Pengukuran jarak pada ruang jarak Minkowsky menggunakan formula
D(x­2 , x1) = || x2 – x1 |  = 2j – x1j
λ adalah parameter Minkowsky. Secara umum, λ merupakan parameter penentu dalam karakteristik jarak. Jika λ = 1, ruang jarak pada Minkowsky sama dengan manhattan. Jika λ = 2, ruang jaraknya akan sama dengan Euclidean. Jika λ = ∞, ruang jaraknya akan sama dengan ruang jarak Chebyshev. Namun demikian, cara yang paling banyak digunakan adalah Euclidean dan Manhattan. Euclidean menjadi pilihan jika kita ingin member jarak terpendek antara dua titik (jarak lurus). Sedangkan manhattan memberikan jarak terjauh pada dua data. Manhattan juga sering digunakan karena kemampuannya dalam mendeteksi keadaan khusus, seperti keberadaan outlier, dengan lebih baik (Agusta, 2005).
Pada langkah ke 4, pengalokasian kembali data ke dalam masing-masing kelompok dalam metode k-means didasarkan pada perbandingan jarak antara data dengan sentroid setiap kelompok yang ada. Data di alokasikan ulang secara tegas ke kelompok yang mempunyai sentroid dengan jarak terdekat dari data tersebut. Data dialokasikan ulang secara tegas ke kelompok yang mempunyai sentroid dengan jarak terdekat dari data tersebut. Pengalokasian ini dapat dirumuskan sebagai berikut (MacQueen, 1967):
a­­il adalah nilai keanggotaan titik xi ke pusat kelompok Cl, d adalah jarak terpendek dari data x ke K kelompok setelah dibandingkan, dan Cl adalah sentroid (pusat kelompok) ke-l.
fungsi objektif yang digunakan untuk K-means ditentukan berdasarkan jarak dan nilai keanggotaan data dalam kelompok, fungsi objektif yang digunakan adalah sebagai berikut. (MacQueen, 1957):
N adalah jumlah data, K adalah jumlah kelompok, ail adalah nilai keanggotaan titik data xi ke pusat data kelompok Cl, Cl adalah pusat kelompok ke-l, dan D(xi,Cl) adalah jarak titik xi ke kelompok Cl yang diikuti, a mempunyai nilai 0 atau 1. Apabila suatu data merupakan anggota suatu kelompok, nilai ail = 1, jika tidak nilai a­il­ = 0.




Read more »

Monday, 13 June 2016

Drag and Drop Operation

To create an application to demonstrate the drag and drop operation. we need :
1. create a new VC# application.
2. Design the application form.
3. Add code to perform the drag and drop operation.
4. execetu the application and verify the output.


first, creating a new VC# application.



second, designing the application form .
we need 2 label, 1 textbox, 1 treeview and 1 listbox.


set the allow drop property of the listbox1 control to true.
add root and add child
click the ellipse button next to the node0 property of the treeview1 control to open the treeNode Editor dialog box.


and adding code to perform the drag-and-drop operation

and try to debug your application

please watching my video, and subscribe my channel, thanks

Read more »

Sunday, 12 June 2016

how to create simple login form using c# language

To create a login form, you need to perform the following tasks:
1. create a new VC# application.
2. Design the application Form.
3. Add code to validate the user input.
4. Execute the application and verify the output.

task 1 . creating a new VC# Application

to create a new VC# application, you need to perform the following steps:
1. click new project on the start page,

2. click visual C# and click windows form application. change the name application. and choose where do you want to save your application.

3. designing the application form
we need 4 label, 2 textbox and 1 button.
and set the passwordchar property of the textbox 2 control to *.
set the visible property of the label 4 control to false.

4. adding code to validate the user input.


5. and try to debugging.

please watching my video, and subscribe my channel. thanks..

Read more »

Friday, 27 May 2016

Data Minning

1.  Pengertian Data Mining 
Secara defenisi data mining adalah ekstraksi dari suatu informasi yang berguna atau menarik (non-trivial, implicit, sebelumnya belum diketahui, potensial kegunaannya) pola atau pengetahuan dari data yang disimpan dalam jumlah besar. Menurut Tan (2006) “data mining sebagai proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar”. Data mining juga dapat diartikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang membantu dalam pengambilan keputusan.
Dari tinjauan keamanan sistem informasi, data mining memang bagai pisau bermata ganda. Di satu sisi bisa berguna bagi pihak pemilik data untuk hal-hal yang telah disebutkan di atas, namun bisa jadi illegal jika data-data tersebut disalahgunakan untuk hal-hal yang bersifat melanggar privasi orang lain atau bahkan jika pengumpulan data tersebut dilakukan secara tidak etis dan tanpa sepengetahuan pihak yang memiliki informasi.
Data Mining suatu proses kegiatan yang berulang-ulang pada analisis database dalam jumlah besar, dengan tujuan untuk melakukan penggalian informasi dan pengetahuan yang dapat membuktikan keakuratan dan potensi yang berguna bagi pengetahuan pekerja yang terlibat dalam pengambilan keputusan dan pemecahan masalah. Istilah data mining itu merujuk pada keseluruhan proses yang terdiri dari pengumpulan data analisis, pengembangan model pembelajaran induktif dan adopsi keputusan praktis seta tindakan berdasarkan pengetahuan yang diperoleh (Vercilles, 2009).Kegiatan data mining dapat dibagi kedalam dua inti penyelidikan utama, sesuai dengan tujuan utama dari analisis, yaitu: interpretasi dan prediksi (Vercilles, 2009).
1.      Interpretasi
Tujuan interpretasi adalah untuk mengidentifikasi pola yang teratur dalam data dan untuk mengekspresikan data melalui peraturan dan kriteria yang dapat dengan mudah dipahami oleh para ahli dalam domain aplikasi. Contoh; Clustering, Association Rules.
2.      Prediksi
Tujuan dari prediksi adalah untuk mengantisipasi atau memprediksi nilai suatu variable random yang akan menggambarkan kondisi dimasa mendatang atau memperkirakan kemungkinan peristiwa masa depan. Contoh; Classification, Regression, Time Series Analysis.
1.1.1        Latar Belakang Data Mining
Sejarah data mining tidak lepas dari berbagai macam disiplin ilmu. Kehadiran data mining dilatarbelakangi oleh berlimpahnya data (overload data) yang dialami oleh berbagai institusi, perusahaan atau organisasi. Berlimpahnya data ini merupakan akumulasi data transaksi yang terekam bertahun-tahun.
Data mining juga dilatarbelakangi oleh atau adanya ledakan informasi (explotion information) dari berbagai media terutama internet. Delapan puluh persen informasi yang disajikan media internet dalam bentuk tak terstruktur (unstructured information). Internet menyajikan informasi dalam berbagai format file, bahasa, dan bentuk penyajian seperti teks, gambar, suara ataupun video. Kendala lain yang melatarbelakangi adalah tidak dilengkapinya informasi dengan metadata yang terstandarisasi atau bahkan tidak menyertakannya sama sekali.
Pertumbuhan yang pesat dari akumulasi data/informasi itu telah menciptakan kondisi dimana suatu institusi memiliki bergunung-gunung data tetapi miskin informasi yang bermanfaat (“rich of data but poor of information”). Tidak jarang “gunung” data itu dibiarkan begitu saja seakan menjadi “kuburan data” (data tombs). Pertanyaanya sekarang, apakah gunung data tersebut akan dibiarkan tidak berguna lalu dibuang, ataukah dapat ditambang untuk menemukan “emas” yaitu informasi yang lebih bermanfaat. Jawabnya ya, data mining hadir untuk menjawab tantangan tersebut.

Gambar 2.1 Hubungan Data mining dengan Bidang Ilmu Lain
Gambar 2.1 menunjukan bahwa data mining memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistic, database dan information retrieval. Walaupun data mining memiliki sumber dari beberapa bida ilmu, data mining berbeda dalam beberapa aspek dibandingkan dengan bidang ilmu seperti berikut :
1.    Statistik : model statistik dipersiapkan oleh para ahli statistik, sedangkan data mining mengembangkan statistik untuk menangani data berjumlah besar secara otomatis.
2.    Expert system (sistem cerdas) : model pada expert system dibuat berupa aturan-aturan berdasar pada pengalaman-pengalaman para ahli.
3.    Data warehouse (DWH) : sering terjadi kerancuan antara data mining dan data warehouse karena keduanya sering dipakai bersamaan. Pada umumnya data warehouse lebih merujuk pada tempat untuk menyimpan data yang terkonsolidasi sedangkan data mining bisa dianggap sebagai perkakas untuk menganalisa otomatis nilai dari itu.
4.    OLAP : seperti data warehouse, OLAP juga sering dibahas bersama data mining. Tetapi OLAP memiliki tujuan untuk memastikan hipotesi yang sudah diformulasikan terlebih dahulu.
1.1.2   Model dalam Data mining
Terdapat dua tipe atau mode operasi yang bisa digunakan untuk mencari informasi yang dibutuhkan user lewat proses data mining, yaitu :
1.    Model verifikasi
Menggunakan pendekatan top-down dengan mengambil hipotesa dari user dan memeriksa validitasnya dengan data sehingga bisa dibuktikan kebenaran hipotesa tersebut. Penekanan terhadap model ini terletak pada user yang bertanggung jawab terhadap penyusunan hipotesa dan permasalahan pada data untuk meniadakan atau menegaskan hasil hipotesa yang diambi. Jadi, model ini sepenuhnya tergantung pada kemampuan user melakukan analisa terhadap permasalahan yang ingin digali dan diperoleh informasinya.
2.    Model knowledge discovery
       Menggunakan pendekatan bottom-up untuk mendapatkan informasi yang sebelumnya diketahui. Model ini berbeda dengan model verifikasi dimana model ini sistem secara langsung menemukan informasi-informasi penting yang bersembunyi dalam suatu data yang besar. Data-data yang ada kemudian dipilah-pilah untuk menemukan seuatu pola, trend yang ada dan keadaan umum pada saat itu tanpa adanya campur tangan dan tuntunan dari user. Hasil temuan ini menyatakan fakta-fakta yang ada dalam data-data yang ditemukan dalam waktu sesingkat mungkin. Model ini terbagi menjadi dua:
a.    Directed knowledge discovery, data mining akan mencoba mencari penjelasan nilai target field tertentu (seperti mencoba mencari penghasilan, repons, usia dan lain lain) terhadap field-field yang lain.
b.    Undirected knowledge discovery, tidak ada target field karena komputer akan mencari pola yang ada pada data. Jadi, undirected knowledge discovery digunakan untuk mengenali hubungan/relasi yang ada pada data, sedangkan directed knowledge discovery akan menjelaskan hubungan/relasi tersebut (IBM).
1.1.3        Pengelompokan Data Mining
Ada banyak jenis metode berdasarkan fungsi dalam data mining, tapi di sini hanya akan dibahas yang lebih dikenal. Berikut kelompok berdasarkan tugas yang dapat dilakukan, yaitu :
1.        Deskripsi
Terkadang peneliti dan analis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat mengumpulkan keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden. deskripsi dari pola dan kecenderungan sering memberikan kemungkinan penjelesan untuk suatu pola atau kecenderungan.
2.        Estimasi
Estimasi hampir sama dengan klasifikasi, perbedaannya adalah variabel target estimasi lebih ke arah numerik daripada ke arah kategori. Model dibangun dengan menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi.
3.        Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang. Contoh prediksi dalam bisnis dan penelitian adalah: Prediksi harga beras dalam tiga bulan yang akan datang. Prediksi persentase kenaikan kecelakaan lalu lintas tahun depan jika batas bawah dinaikan. Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi.
4.        Klasifikasi
Suatu teknik dengan melihat pada kelakuan dan atribut dari kelompok yang telah didefinisikan. Teknik ini dapat memberikan klasifikasi pada data baru dengan memanipulasi data yang ada yang telah diklasifikasi dan dengan menggunakan hasilnya untuk memberikan sejumlah aturan. Klasifikasi menggunakan supervised learning.
5.        Clustering
Clustering merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan satu dengan yang lainnya memiliki ketidakmiripan dengan record-record dalam kluster lain. Clustering menggunakan unsupervised learning. Teknik yang penulis gunakan dalam penelitian ini adalah clustering. Teknik data mining ini mengelompokan data-data yang sejenis atau mirip yang diharapkan akan membantu untuk dapat memilah tren dari data tersebut.
6.        Asosiasi
Tugas asosiasi atau sering disebut juga sebagai market basket analysis dalam data mining adalah menemukan relasi atau korelasi diantar himpunan item-item dan menemukan atribut yang muncul dalam satu waktu. Asosiasi menggunakan unsupervised learning. Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter, support dan confidence (larose, 2005).
Tujuan dari data mining secara garis besar adalah untuk mendeskripsikan apa yang telah terjadi (descriptive data mining), dan untuk memprediksikan apa yang akan terjadi (predictive data mining). Descriptive data mining mencari pola pada kejadian yang telah lampau yang mempengaruhi kejadian yang terjadi pada masa sekarang. Teknik data mining yang termasuk dalam kategori ini adalah association dan clustering. Sedangkan, predictive data mining mengacu pada kejadian yang telah lampau untuk memprediksikan apa yang terjadi pada masa yang akan datang. Yang termasuk ke dalam kategori predictive data mining ini adalah classification dan estimation.
2.1.4   Proses Data Mining
Salah satu tuntutan dari data mining ketika diterapkan pada data berskala besar adalah diperlukan metodologis sistematis tidak hanya ketika melakukan analisa saja tetapi juga ketika mempersiapkan data dan juga melakukan interpretasi dari hasilnya sehingga dapat menjadi aksi ataupun keputusan yang bermanfaat.
Data mining seharusnya dipahami sebagai suatu proses, yang memiliki tahapan-tahapan tertentu dan juga ada umpan balik dari setiap tahapan ke tahapan sebelumnya. Pada umumnya proses data mining berjalan interaktif karena tidak jarang hasil data mining pada awalnya tidak sesuai dengan harapan analisnya sehingga perlu dilakukan desain ulang prosesnya.
Data-data yang ada, tidak dapat langsung diolah dengan menggunakan sistem data mining. Data-data tersebut harus dipersiapkan terlebih dahulu agar hasil yang diperoleh dapat lebih maksimal, dan waktu komputasinya lebih minimal. Proses data persiapan data ini sendiri dapat mencapai 60% dari keseluruhan proses dalam data mining. Adapun tahapan-tahapan yang harus dilalui dalam proses data mining antara lain :

Gambar 2.2 Tahapan Data Mining
1.    Preprocess Data (Meliputi pembersihan data dan pemeriksaan outliers)
Pada umumnya data yang diperoleh, baik dari database suatu perusahaan maupun hasil eksperimen, memiliki isian-isian yang tidak relevan. Data-data yang telah didapat selanjutnya akan mengalami proses pembersihan. Proses pembersihan data dilakukan untuk membuang record yang keliru, menstandarkan atribut-atribut, merasionalisasi struktur data, dan mengendalikan data yang hilang. Data yang tidak konsisten dan banyak kekeliruan membuat hasil data mining tidak akurat adalah sangat penting untuk membuat data konsisten dan seragam.
Faktor penyebab :
a.    Informasi tidak terkumpul dengan lengkap
Misal : orang menolak menyebutkan umur dan berat badan
b.    Atribut mungkin tidak bisa diterapkan untuk semua kasus
Misal : penghasilan tidak bisa diaplikasikan untuk bayi dan anak kecil
Solusi penanganan :
Mengeliminasi objek data
·      Mengestimasi missinga values
·      Tidak memperhatikan missing values saat analisis
·      Menggantikan dengan semua kemungkinan nilai (pembobotan berdasarkan probabilitasnya)
2.    Transformasi data (data diubah menjadi bentuk yang sesuai untuk diproses dengan model yang dipilih)
Beberapa teknik data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan. Karenanya data berupa angka numerik yang berlanjut perlu dibagi-bagi menjadi interval. Proses ini sering disebut binning. Transformasi dan pemilihan data ini juga menentukan kualitas dari hasil data mining nantinya karena adanya beberapa karakteristik dari teknik-teknik data mining tertentu yang tergantung pada tahapan ini.
3.    Implementasi teknik data mining
Aplikasi teknik data mining sendiri haya merupakan salah satu bagian dari proses data mining. Beberapa teknik data mining sudah umum dipakai. Ada kalanya teknik-teknik data mining umum yang tersedia dipasar tidak mencukupi untuk melaksanakan data mining dibidang tertentu atau untuk data tertentu.
Metode yang digunakan disesuaikan dengan kebutuhan target informasi yang ingin dicapai berdasarkan fungsi yang digunakan dengan kebutuhan target informasi yang ingin dicapai berdasarkan fungsi yang digunakan dan jenis aplikasinya. Macam-macam metode yang digunakan dapat dilihat pada pengelompokan data mining.
4.    Evaluasi pola yang ditemukan (untuk menemukan pola yang menarik/bernilai)
Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai. Bila ternyata hasil yang diperoleh tidak sesuai dengan hipotesa ada beberapa alternatif yang dapat diambil seperti menjadikannya umpan balik untuk memperbaiki proses data mining, mencoba teknik data mining lain yang lebih sesuai, atau menerima hasil ini sebagai hasil diluar dugaan yang mungkin bermanfaat (Han, J. dan M. Kamber, 2006).
2.1.5   Arsitektur Sistem Data mining
Data mining merupakan proses pencarian pengetahuan yang menarik dari data berukuran besar yang disimpan dalam basis data, data warehouse atau tempat penyimpanan informasi lainnya. Dengan demikian arsitektur sistem data mining memiliki komponen-komponen utama (Han dan Kamber, 2006) yaitu:
a.       Database, data warehouse, World Wide Web, atau tempat penyimpanan informasi lainnya: bisa berbentuk satu atau banyak database, data warehouse, spreadsheet, ataupun tempat penyimpanan informasi lainnya. Data Cleaning, Data Integration dan Data Selection dapat dijalankan pada data tersebut.
b.      Database dan data warehouse server. Komponen ini bertanggung jawab dalam pengambilan data yang relevan, berdasarkan permintaan pengguna.
c.       Knowledge Based. Komponen ini merupakan domain knowledge yang digunakan untuk memandu pencarian atau mengevaluasi pola-pola yang dihasilkan. Pengetahuan tersebut meliput hirarki konsep yang digunakan untuk mengorganisasikan atribut atau nilai atribut kedalam level abstraksi yang berbeda. Pengetahuan tersebut juga dapat berupa kepercayaan pengguna (user belief), yang dapat digunakan untuk menentukan kemenarikan pola yang diperoleh.
d.      Data mining engine. Bagian ini merupakan komponen penting dalam arsitektur sistem data mining. Komponen ini terdiri dari modul-modul fungsional seperti karakterisasi, asosiasi, klasifikasi, dan analisis cluster.
e.       Ghrapical user interface (GUI). Modul ini berkomunikasi dengan pengguna dan data mining. Melalui komponen ini, pengguna berinteraksi dengan sistem menggunakan query.


Gambar 2.3 Arsitektur sistem data mining
Read more »
Web Hosting

ADS

DogeMiner - Mine and Earn free Dogecoin

Call Me

Call Me