Mengenal Bidang Statistik Deskriptif Secara Luas

Untuk mengetahui tentang apa itu statistik, anda harus lebih banyak memahami bidang dan motede statistik tersebut. Bagaimana cara anda mengetahui semuanya dengan sangat mudah. Maka anda diwajibkan mengatahui terlebih dahulu bagaimana tentang proses pengumpulan data agar mudah untuk dilakukan.

Pengertian Statistik

Statistik merupakan ilmu yang mengumpulkan, menganalisa, mempresentasikan dan menafsirkan data. Kebutuhan pemerintah untuk data sensus serta informasi tentang berbagai kegiatan ekonomi memberikan banyak dorongan awal bagi bidang statistik.

Saat ini kebutuhan untuk mengubah sejumlah besar data, banyak tersedia di bidang aplikasi menjadi informasi yang bermanfaat untuk mendorong perkembangan teoritis maupun praktis dalam statistik dengan baik. Contohnya:

  1. Statistik penduduk merupakan kumpulan angka yang berkaitan dengan masalah kependudukan
  2. Statistik ekonomi merupakan kumpulan angka  yang berkaitan dengan masalah ekonomi

Bidang statistik deskriptif

Data ialah sebuah fakta dan angka yang dikumpulkan kemudian dianalisis dan diringkas untuk presentasi dan interpretasi. Data dapat diklasifikasikan sebagai kuantitatif atau kualitatif.

  1. Data kuantitatif : data informasi yang digunakan berupa  simbol dan bilangan.
  2. Data kualitatif : data informasi yang disediakan berbentuk kalimat verbal, berupa angka, simbol dan bilangan.

Misalnya, sebuah studi tertentu tertarik pada karakteristik seperti usia, jenis kelamin, status perkaeinan dan pendapatan tahunan untuk sampel dari 100 individu. Karakteristik ini akan disebut variabel penelitian dan nilai data untuk masing-masing variabel akan dikaitkan dengan masing-masing individu.

Dengan demikian, nilai data 28 pria tunggal dan $ 30.000 akan dicatat untuk pria lajang berusia 28 tahun dengan penghasilan tahunan sebesar $ 30.000. Dengan 100 individu dan 4 variabel, kumpulan data akan memiliki 100 × 4 = 400 item. Dalam contoh ini, umur dan pendapatan tahunan adalah variabel kuantitatif nilai data yang sesuai menunjukkan berapa tahun dan berapa banyak uang untuk setiap individu.

Jenis kelamin dan status perkawinan adalah variabel kualitatif. Label laki-laki dan perempuan memberikan data kualitatif untuk jenis kelamin dan label tunggal, menikah, bercerai dan janda menunjukkan status perkawinan. Metode survei sampel digunakan untuk mengumpulkan data dari penelitian observasional dan metode perancang eksperimen yang digunakan untuk mengumpulkan data dari studi eksperimental.

Bidang statistik deskriptif yang paling utama terkait dengan metode penyajian dan interpretasi data dengan menggunakan grafik, tabel dan ringkasan numerik. Setiap kali ahli statistik menggunakan data dari sampel yaitu, sebagian populasi  untuk membuat pernyataan tentang populasi, sehingga mereka melakukan inferensi statistik. Estimasi dan pengujian hipotesis adalah prosedur yang digunakan untuk membuat kesimpulan statistik.

Bidang-bidang seperti perawatan kesehatan, biologi, kimia, fisika, pendidikan, teknik, bisnis dan ekonomi membuat penggunaan inferensi statistik secara luas. Metode probabilitas awalnya dikembangkan untuk analisis permainan perjudian. Probabilitas memainkan peran kunci dalam inferensi statistik. Ini digunakan untuk memberikan ukuran kualitas dan ketepatan kesimpulan.

Inilah metode inferensi statistik yang akan dijelaskan disini. Beberapa metode ini digunakan, terutama untuk studi variabel tunggal, sementara yang lain, seperti analisis regresi dan korelasi, digunakan untuk membuat kesimpulan tentang hubungan di antara dua atau lebih variabel.

Tujuan Statistik Deskriptif

Statistik deskriptif adalah data tabel, grafik dan numerik. Tujuan dari statistik deskriptif adalah untuk memudahkan penyajian dan interpretasi data. Sebagian besar presentasi statistik yang muncul di surat kabar dan majalah bersifat deskriptif.

Metode univariat statistik deskriptif menggunakan data untuk meningkatkan pemahaman tentang satu variabel. Metode multivariat berfokus pada penggunaan statistik untuk memahami hubungan di antara dua atau lebih variabel. Untuk mengilustrasikan metode statistik deskriptif, contoh sebelumnya dimana data dikumpulkan pada umur, jenis kelamin, status perkawinan dan pendapatan tahunan dari 100 individu akan diperiksa.

  • Metode tabular

Ringkasan data tabel yang paling sering digunakan untuk satu variabel adalah distribusi frekuensi. Distribusi frekuensi menunjukkan jumlah nilai data pada masing-masing beberapa kelas nonoverlapping. Ringkasan tabular lainnya, yang disebut distribusi frekuensi relatif, menunjukkan fraksi, atau persentase, nilai data di setiap kelas.

Ringkasan data tabel yang paling umum untuk dua variabel adalah tabulasi silang, analog dua variabel dari distribusi frekuensi. Untuk variabel kualitatif, distribusi frekuensi menunjukkan jumlah nilai data pada masing-masing kategori kualitatif. Misalnya, variabel gender memiliki dua kategori: laki-laki dan perempuan.

Dengan demikian, distribusi frekuensi untuk gender akan memiliki dua kelas nonoverlapping untuk menunjukkan jumlah laki-laki dan perempuan. Distribusi frekuensi relatif untuk variabel ini akan menunjukkan fraksi individu yang laki-laki dan fraksi individu yang perempuan.

Membangun distribusi frekuensi untuk variabel kuantitatif memerlukan perawatan lebih dalam, menentukan kelas dan titik pembagian antara kelas yang berdekatan. Misalnya, jika data usia dari contoh di atas berkisar antara 22 sampai 78 tahun, enam kelas nonoverlapping berikut dapat digunakan: 20-29, 30-39, 40-49, 50-59, 60-69 dan 70- 79.

Distribusi frekuensi akan menunjukkan jumlah nilai data di masing-masing kelas ini dan distribusi frekuensi relatif akan menunjukkan sebagian kecil nilai data di masing-masing kelas. Tabulasi silang adalah tabel dua arah dengan deret tabel yang mewakili kelas dari satu variabel dan kolom tabel yang mewakili kelas variabel lain. Untuk membangun tabulasi silang dengan menggunakan variabel gender dan umur.

Jenis kelamin dapat ditunjukkan dengan dua baris, pria dan wanita dan usia dapat ditunjukkan dengan enam kolom yang sesuai dengan kelas usia 20-29, 30-39, 40-49, 50 -59, 60-69, dan 70-79. Entri di setiap sel tabel akan menentukan jumlah nilai data dengan jenis kelamin yang diberikan oleh judul baris dan umur yang diberikan oleh judul kolom. Tabulasi silang semacam itu bisa membantu dalam memahami hubungan antara jenis kelamin dan usia.

  • Metode grafis

Sejumlah metode grafis tersedia untuk menggambarkan data. Grafik batang adalah perangkat grafis untuk menggambarkan data kualitatif yang telah dirangkum dalam distribusi frekuensi. Label untuk kategori variabel kualitatif ditunjukkan pada sumbu horizontal grafik. Sebuah bar di atas setiap label dibuat sedemikian rupa sehingga tinggi masing-masing batang sebanding dengan jumlah nilai data dalam kategori.

Grafik batang status perkawinan untuk 100 individu pada contoh di atas ditunjukkan. Diagram lingkaran adalah perangkat grafis lain untuk meringkas data kualitatif. Ukuran setiap irisan pie sebanding dengan jumlah nilai data pada kelas yang bersangkutan. Diagram lingkaran untuk status perkawinan dari 100 individu.

Sebuah histogram adalah presentasi grafis data kuantitatif yang paling umum telah dirangkum dalam distribusi frekuensi. Nilai variabel kuantitatif ditunjukkan pada sumbu horizontal. Sebuah persegi panjang ditarik di atas setiap kelas sedemikian rupa sehingga dasar persegi panjang sama dengan lebar interval kelas dan tinggi sebanding dengan jumlah nilai data di kelas.

Jenis Statistik Deskriptif

Statistik deskriptif memungkinkan Anda untuk mengkarakterisasi data Anda berdasarkan propertinya. Ada empat jenis statistik deskriptif:

1. Ukuran Frekuensi: Count, Persen, Frekuensi

  • Menunjukkan seberapa sering sesuatu terjadi
  • Gunakan ini bila Anda ingin menunjukkan seberapa sering respons diberikan

2. Ukuran Kecenderungan Tengah

  • Mean, Median, dan Mode
  • Cari distribusi dengan berbagai titik
  • Gunakan ini saat Anda ingin menunjukkan bagaimana tanggapan rata-rata atau paling umum ditunjukkan

3. Tindakan Penyebaran atau Variasi : Rentang, varians, standar deviasi

  • Mengidentifikasi penyebaran skor dengan menyatakan interval
  • Range = High / Low points
  • Perbedaan atau Standar Deviasi = perbedaan antara nilai dan mean yang diamati

Gunakan ini saat Anda ingin menunjukkan bagaimana “menyebar” datanya. Akan sangat membantu untuk mengetahui kapan data Anda tersebar sehingga mempengaruhi rata-rata

4. Ukuran Posisi

  • Percentile Ranks, Quartile Ranks
  • Menjelaskan bagaimana skor jatuh dalam hubungan satu sama lain. Bergantung pada nilai standar
  • Gunakan ini saat Anda perlu membandingkan skor dengan nilai normalisasi (mis., Norma nasional).

Analisis univariat

Analisis univariat melibatkan pemeriksaan di seluruh kasus satu variabel dalam satu waktu. Ada tiga karakteristik utama dari satu variabel yang cenderung kita lihat:

  • Distribusi
  • Kecenderungan sentral
  • Dispersi

Dalam kebanyakan situasi, disini akan dijelaskan ketiga karakteristik ini untuk masing-masing variabel dalam penelitian sebuah penelitian.

  • Distribusi

Distribusi adalah ringkasan dari frekuensi nilai individu atau rentang nilai untuk variabel. Distribusi yang paling sederhana akan mencantumkan setiap nilai variabel dan jumlah orang yang memiliki nilai masing-masing. Misalnya, cara yang khas untuk menggambarkan distribusi mahasiswa di perguruan tinggi, mencantumkan jumlah atau persentase siswa pada masing-masing empat tahun.

Ini menggambarkan gender dengan mencantumkan jumlah atau persentase pria dan wanita. Dalam kasus ini, variabel tersebut memiliki cukup sedikit nilai yang masing-masing dapat di cantumkan dan rangkum berapa banyak contoh kasus yang bernilai. Tapi apa yang di lakukan untuk variabel seperti pendapatan atau IPK? Dengan variabel-variabel ini, ada sejumlah besar kemungkinan nilai, dengan relatif masing-masing orang.

Dalam kasus ini, ini mengelompokkan nilai mentah ke dalam kategori menurut rentang nilai. Misalnya, kita bisa melihat IPK sesuai dengan rentang nilai huruf. Mengelompokkan pendapatan ke dalam empat atau lima rentang nilai pendapatan. Salah satu cara yang paling umum untuk menggambarkan satu variabel adalah dengan distribusi frekuensi.

Bergantung pada variabel tertentu, semua nilai data dapat diwakili, atau Anda dapat mengelompokkan nilai ke dalam kategori terlebih dahulu (misalnya, dengan variabel usia, harga, atau suhu, biasanya tidak masuk akal untuk menentukan frekuensi untuk setiap nilai. Sebaliknya, nilainya dikelompokkan menjadi rentang dan frekuensi ditentukan). Distribusi frekuensi yang sama dapat digambarkan dalam grafik.

Distribusi juga dapat ditampilkan dengan menggunakan persentase. Misalnya, Anda bisa menggunakan persentase untuk menggambarkan:

  • Persentase orang di berbagai tingkat pendapatan
  • Persentase orang dalam rentang usia yang berbeda
  • Persentase orang dalam rentang nilai tes standar yang berbeda

Kecenderungan Sentral

Kecenderungan sentral distribusi adalah perkiraan “pusat” distribusi nilai. Ada tiga jenis perkiraan utama dari kecenderungan sentral:

  1. Mean
  2. Medium
  3. Mode

Mean atau rata-rata adalah metode yang paling umum digunakan untuk menggambarkan kecenderungan sentral. Untuk menghitung semua rata-rata yang Anda lakukan yaitu untuk menambahkan semua nilai dan membagi dengan jumlah nilai. Misalnya, nilai rata-rata atau rata-rata skor kuis ditentukan dengan menjumlahkan semua nilai dan membagi. Misalnya, perhatikan nilai skor tes:

15, 20, 21, 20, 36, 15, 25, 15

Jumlah dari 8 nilai ini adalah 167, jadi meannya adalah 167/8 = 20,875.

Median adalah skor yang ditemukan di tengah nilai himpunan yang tepat. Salah satu cara untuk menghitung median adalah mencantumkan semua skor dalam urutan numerik dan kemudian cari nilai di bagian tengah sampel. Misalnya, jika ada 500 skor dalam daftar, skor # 250 akan menjadi median. Jika kami memesan 8 nilai yang ditunjukkan di atas, kami akan mendapatkan:

15,15,20,20,21,25,36

Ada 8 nilai dan skor # 4 dan # 5 mewakili titik tengah. Karena kedua skor ini adalah 20, mediannya adalah 20. Jika kedua nilai tengah memiliki nilai yang berbeda, Anda harus melakukan interpolasi untuk menentukan median.

Mode adalah nilai yang paling sering terjadi dalam rangkaian nilai. Untuk menentukan mode, Anda bisa kembali memesan nilai seperti ditunjukkan di atas, lalu menghitung masing-masing. Nilai yang paling sering terjadi adalah mode. Contohnya, nilai 15 terjadi tiga kali dan merupakan modelnya. Dalam beberapa distribusi ada lebih dari satu nilai modal. Misalnya, dalam distribusi bimodal ada dua nilai yang paling sering terjadi.

Perhatikan bahwa untuk rangkaian nilai 8 yang sama, akan mendapat tiga nilai berbeda – 20,875, 20, dan 15 – untuk mean, median dan mode masing-masing. Jika distribusinya benar-benar normal (yaitu berbentuk lonceng), rata-rata, median dan mode sama-sama setara satu sama lain.

  • Dispersi

Dispersi mengacu pada penyebaran nilai-nilai di sekitar kecenderungan sentral. Ada dua ukuran umum dispersi, kisaran dan standar deviasi. Rentang ini hanya nilai tertinggi dikurangi nilai terendah. Dalam distribusi contoh kami, nilai yang tinggi adalah 36 dan yang rendah adalah 15, jadi kisarannya adalah 36 – 15 = 21.

Deviasi Standar adalah perkiraan dispersi yang lebih akurat dan terperinci karena outlier dapat membesar-besarkan rentang (seperti yang terjadi pada contoh di mana nilai outlier tunggal 36 berdiri terpisah dari nilai lainnya. Deviasi Standar menunjukkan hubungan yang set skor memiliki mean sampel. Sekali lagi mari kita mengambil set skor:

15,20,21,20,36,15,25,15

Untuk menghitung standar deviasi, pertama kita temukan jarak antara masing-masing nilai dan mean. Kita tahu dari atas bahwa meannya adalah 20,875. Jadi, perbedaan dari mean adalah:

15 – 20.875 = -5.875
20 – 20.875 = -0.875
21 – 20.875 = +0.125
20 – 20.875 = -0.875
36 – 20.875 = 15.125
15 – 20.875 = -5.875
25 – 20.875 = +4.125
15 – 20.875 = -5.875

Perhatikan bahwa nilai yang berada di bawah rata-rata memiliki perbedaan negatif dan nilai di atas memiliki nilai positif. Selanjutnya, ini  akan menata setiap perbedaan:

-5,875 * -5,875 = 34.515625
-0,875 * -0,875 = 0,765625
+0.125 * +0.125 = 0.015625
-0,875 * -0,875 = 0,765625
15.125 * 15.125 = 228.765625
-5,875 * -5,875 = 34.515625
+4.125 * +4.125 = 17.015625
-5,875 * -5,875 = 34.515625

Di sini, jumlahnya 350,875. Selanjutnya, kita membagi jumlah ini dengan jumlah skor minus 1. Di sini, hasilnya adalah 350.875 / 7 = 50.125. Nilai ini dikenal sebagai varians. Untuk mendapatkan standar deviasi, kita mengambil akar kuadrat varians (ingat bahwa kita mengkuadratkan penyimpangan sebelumnya). Ini adalah SQRT (50.125) = 7.079901129253.

Ringkasan mengenai statistik deskriptif dapat membantu anda dalam mengumpulkan data untuk mengetahui produk dan harus dilakukan dengan benar.