ishwara.us Think Bigger about Business Intelligence

6Feb/111

Skala Pengukuran pada Statistik

website-statistics1Mungkin terlihat tidak lazim kenapa saya menuliskan blog ini Smile, tidak tampak IT Related.

fokus blog ini saya arahkan kepada Business Intelligence, tentu tidak terlepas dari Data Mining, nah data mining sendiri merupakan perkawinan antara Computer Science dan Statistik. Dalam usaha pencarian informasi dalam data, tentu kita tidak lepas dari disiplin ilmu statistik (disamping disiplin ilmu computer science). karena itu saya ingin mendokumentasikan beberapa skala pengukuran yang nantinya akan kita pakai didalam proses data mining.

Kurang lebih keterkaitannya ada disitu Smile. saya harapkan kita tidak hanya menjadi “operator” sebuah system, tapi juga memahami apa hakikat yang dikerjakan oleh system tersebut, termasuk ketika kita harus melakukan sebuah “klasifikasi” terhadap data tertentu (yg kadang harus kita lakukan secara manual).


student grouping pencils

Skala Nominal

Skala yang mengelompokkan obyek atau peristiwa dalam berbentuk kategori. Skala nominal diperoleh dari pengukuran nominal yaitu suatu proses mengklasifikasian obyek-obyek yang berbeda kedalam kategori-kategori berdasarkan beberapa karakteristik tertentu


Contoh Kasus:

Andre dan Anna bergolongan darah A, adapun Betty bergolongan darah B. Dapat dikatakan bahwa:

  • Golongan darah Andre ‘sama dengan (=)’ golongan darah Anna, dan
  • Golongan darah Andre ‘tidak sama dengan (≠)’ golongan darah Betty.

Terhadap golongan darah Andre dan Betty tidak dapat diajukan pertanyaan berikut:

  1. Manakah yang lebih … (lebih tinggi, lebih besar, lebih dulu, dan seterusnya), golongan darah Andre ataukah golongan darah Betty?
  2. Berapakah jarak antara golongan darah Andre, yaitu A, terhadap golongan darah Betty, yaitu B?
  3. Berapa kalikah besarnya golongan darah Andre dibandingkan golongan darah Betty?



Tidak dapat diajukannya pertanyaan-1

menunjukkan bahwa terhadap data golongan darah belum dapat dikenakan (belum dapat diberlakukan, atau belum dapat diterapkan) operasi urutan (yang biasa disimbolkan dengan tanda <,,> atau ).


Tidak dapat diajukannya pertanyaan-2

menunjukkan bahwa terhadap data golongan darah belum dapat dikenakan (belum dapat diberlakukan, atau belum dapat diterapkan) operasi selisih (yang biasa disimbolkan dengan tanda ‘-‘).


Tidak dapat diajukannya pertanyaan-3

menunjukkan bahwa terhadap data golongan darah belum dapat dikenakan (belum dapat diberlakukan, atau belum dapat diterapkan) operasi perbandingan (yang biasa disimbolkan dengan tanda ‘:‘).


Terhadap data golongan darah hanya dapat dikenakan (dapat diberlakukan, atau dapat diterapkan) operasi kesamaan (yang bisa disimbolkan dengan tanda “=” atau “”).

Data yang terhadapnya hanya dapat dikenakan/diberlakukan/diterapkan operasi kesamaan saja dikategorikan sebagai data berskala nominal.

Data yang juga termasuk kategori berskala nominal antara lain adalah:

  • nama seseorang: Andre, Betty, Cathy …,
  • nama jalan: Asia-Afrika, Braga, Cipaganti, …
  • merk sepeda motor: Honda, Yamaha, Kawasaki, Suzuki, …
  • nomor telepon: 2032700, 2032655, 5202552, 08164201806 …
  • jenis profesi: pedagang, pengemudi, pengkhotbah, guru, politikus, …
  • jenis kelamin : pria, wanita
  • agama resmi di Republik Indonesia: Islam, Katolik, Kristen, Budha, Hindu
  • nama partai peserta Pemilu tahun 2004
  • suku-suku bangsa di dunia : Indonesia, Malaysia, China, India, Eropah, …
  • jenis warna kulit: hitam, putih, kuning, sawo matang, …

ranking-de-sites-mais-visitados-googleSkala Ordinal

merupakan Jenis skala yang menunjukkan tingkat. Skala ini biasanya dipergunakan dalam menentukan peringkat seseorang dibandingkan dengan yang lain.

Contoh kasus

Pada lomba lari sprint 100 meter Pekan Olah Raga SMU tahun 2003 yang lalu Greg mendapat medali emas, Simon mendapat medali perak dan Bill mendapat mendapat perunggu. Dapat dikatakan bahwa:

  • Medali yang diraih oleh Greg dan Simon adalah berbeda/tidak sama, dan
  • Medali emas yang diraih Greg lebih prestisius daripada medali perak yang diraih Simon, dan medali perak Simon lebih prestisius daripada medali perunggu yang diraih Bill.

Terhadap ketiga jenis medali ini tidak dapat diajukan pertanyaan berikut:

  1. Berapakah selisih medali emas terhadap medali perak, antara medali emas terhadap medali perunggu, atau antara medali perak terhadap medali perunggu?
  2. Berapa kalikah prestise medali emas dibandingkan medali perak, medali emas dibandingkan medali perunggu, atau medali perak terhadap medali perunggu?

Tidak dapat diajukannya pertanyaan-1

menunjukkan bahwa terhadap data jenis medali belum dapat dikenakan (belum dapat diberlakukan, atau belum dapat diterapkan) operasi selisih.


Tidak dapat diajukannya pertanyaan-2

menunjukkan bahwa terhadap data jenis medali belum dapat dikenakan (belum dapat diberlakukan, atau belum dapat diterapkan) operasi perbandingan.


Terhadap data medali hanya barulah dapat dikenakan (dapat diberlakukan, atau dapat diterapkan) operasi kesamaan dan operasi urutan.

Data yang terhadapnya hanya dapat dikenakan/diberlakukan/diterapkan operasi kesamaan dan operasi urutan saja dikategorikan sebagai data berskala ordinal.

Data yang juga termasuk kategori berskala ordinal antara lain adalah:

  • jenjang kepangkatan dalam TNI Angkatan Darat: … Letnan Kolonel, Kolonel, Brigjen, Mayjen, Letjen, Jenderal
  • skore IQ,
  • peringkat pada perhotelan: hotel bintang-1, bintang-2 dan seterusnya
  • jabatan pada perusahaan: komisaris, presiden direktur, direktur, manajer , …
  • respons konsumen terhadap suatu produk: sangat puas, puas, cukup puas, tidak puas, sangat tidak puas
  • peringkat prestasi siswa di kelas
  • nomor absensi siswa

math_clipartSkala Interval

merupakan skala yang yang memiliki jarak yang sama antar datanya akan tetapi tidak memiliki nol mutlak. Nol mutlak artinya tidak dianggap ada. Salah satu ciri matematis yang dimiliki skala interval adalah penjumlahan.

Contoh Kasus

Sylvia dan Vivian melamar pekerjaan yang sama. Sylvia dijadwalkan interview besok Senin pukul 8.00 sedangkan Vivian mendapat jadwal pukul 12.00. Dapat dikatakan bahwa:

  • Jam interview Sylvia tidak sama dengan jam interview Vivian,
  • Jam interview Sylvia adalah lebih dulu daripada jam interview Vivian
  • Jam interview Sylvia dan Vivian berselisih 4 jam

Terhadap kedua jam interview ini tidak dapat diajukan pertanyaan berikut:

Berapa kalikah jam interview Vivian dibandingkan jam interview Sylvia? (Apakah pukul 12.00 itu satu setengah kalinya pukul 8.00?)

Tidak dapat diajukannya pertanyaan ini menunjukkan bahwa terhadap data jam interview belum dapat dikenakan (belum dapat diberlakukan, atau belum dapat diterapkan) operasi perbandingan.

Terhadap data jam interview hanya barulah dapat dikenakan (dapat diberlakukan, atau dapat diterapkan) operasi kesamaan, operasi urutan dan operasi selisih.

Data yang terhadapnya hanya dapat dikenakan/diberlakukan/diterapkan operasi kesamaan, operasi urutan dan operasi selisih saja dikategorikan sebagai data berskala interval.

Data yang juga termasuk kategori berskala interval antara lain adalah:

  • Skala temperatur Celcius, Reamur, Fahrenheit (tapi bukan Kelvin)
  • Penanggalan pada kalender: 21 Januari 2004, 22 Januari 2004, …
  • Waktu yang ditunjukkan oleh jam: pkl 08.24, pkl 12.43
  • Nilai hasil ujian: 73, 89, …
  • indeks nilai pada perkuliahan: A, B, C, D, E

Data berskala interval nyaris menjadi data yang sempurna, dalam artian bahwa nyaris semua operasi dasar matematika dapat dikenakan (dapat diberlakukan, atau dapat diterapkan) terhadapnya. Lalu operasi dasar matematika apakah yang belum dapat dikenakan terhadap data jenis ini? Jawabnya adalah: operasi pembagian atau operasi perbandingan.

Mengapa operasi ini belum dapat dikenakan terhadap data berskala interval? Untuk menjawab pertanyaan terakhir ini perlu terlebih dahulu dibahas konsep nilai 0 (nol) mutlak.

Konsep Nilai 0 (nol) Mutlak

Nilai 0 (nol) mutlak adalah nilai 0 (nol) yang benar-benar menyatakan ‘tidak ada’ atau tidak dimilikinya suatu sifat oleh suatu besaran, bila tidak demikian maka nilai 0 (nol) itu bukanlah nilai 0 (nol) mutlak.

Perhatikanlah kasus-kasus berikut ini:

  • pada pengukuran massa benda, 0 kilogram menunjukkan tidak adanya massa yang dimliki oleh suatu benda yang tengah dibicarakan
  • pada pengukuran waktu, 0 detik menunjukkan tidak adanya selang waktu yang diperlukan, misalnya untuk mengedipkan mata atau untuk merasa berbahagia ketika mendengar promosi yang kita dapat
  • pada perhitungan uang di dompet, 0 rupiah menunjukkan tidak adanya sesenpun uang di dompet kita
  • pada temperatur Kelvin, 0 Kelvin menunjukkan tidak adanya sama sekali pergerakan partikel didalam benda.

Pada keempat kasus ini, nilai 0 (nol) adalah nilai 0 (nol) mutlak karena melambangkan tidak dimilikinya suatu sifat oleh suatu besaran. Pada kasus ini berlaku pengertian, misalnya, bahwa 40 adalah dua kali lipatnya 20, artinya:

  • benda bermassa 40 kilogram memiliki massa yang banyaknya 2 kali lipat dari benda yang bermassa 20 kilogram
  • menunggu selama 40 detik adalah 2 kali lebih lama daripada menunggu selama 20 detik
  • uang 40 rupiah adalah dua kali lipat banyaknya daripada uang 20 rupiah
  • pada temperatur 40 Kelvin aktivitas pergerakan partikel adalah 2 kali lipat dibandingkan aktivitas serupa pada temperatur 20 Kelvin.

Sekarang tinjaulah kasus-kasus berikut ini:

  • pada pengukuran suhu, 0 derajat Celcius hanya menunjukkan temperatur ketika air tepat mulai membeku
  • pada penanggalan kalender, tanggal 0 bulan 0 tahun 0 (yaitu 1 Januari tahun 0001 ???) hanya menunjukkan saat Nabi Isa a.s. dilahirkan
  • pada indeks perkuliahan, E yang biasa diberi skor 0, hanya menunjukkan seseorang tidak pantas untuk dinyatakan lulus

Pada ketiga kasus ini, nilai 0 (nol) bukanlah nilai 0 (nol) mutlak karena tidak melambangkan situasi tidak dimilikinya suatu sifat oleh suatu besaran. Pada kasus ini tidak berlaku pengertian, misalnya, bahwa 4 adalah 2 kali lipatnya 2, artinya:

  • suhu 4 derajat Celcius tidaklah berarti 2 kalinya suhu 2 derajat Celcius
  • bulan 4, yaitu April, sama sekali bukan 2 kalinya bulan 2, yaitu Februari
  • nilai indeks A (yang biasa diberi skor 4) sama sekali tidak sama dengan 2 kalinya nilai indeks C (yang biasa diberi skor 2).

Skala Rasio

ratio_rite_cupmerupakan skala pengukuran yang memiliki nol mutlak sehingga dapat dilakukan operasi perkalian dan pembagian.
Misalnya berat badan, tinggi badan, pendapatan dan lain sebagainya. untuk melakukan pengujian hipotesis, maka data yang kita miliki minimal berskala interval. jika data berskala nominal atau ordinal, data tersebut harus ditransfer dulu ke skala interval baru bisa di lakukan pengujian hipotesis


Sumber: disarikan dari materi kuliah Data mining yang pernah di saya terima dari bapak Sani Susanto, Phd. ketika mengambil Magister Sistem Informasi Bisnis di STMIK LIKMI Bandung tahun 2006-2008.

Comments (1) Trackbacks (0)
  1. siph,, mantabs,,,, :)


Leave a comment

No trackbacks yet.

Switch to our mobile site