REVIEW BARET & MORGAN 2011 CHAPTER 3 - 4
Beberapa Ukuran Keandalan
Bagian ini menggambarkan beberapa metode untuk menghitung keandalan pengukuran. Penting untuk menilai keandalan data sebelum melakukan statistik inferensial. Jika tes keandalan menunjukkan bahwa data memiliki keandalan yang rendah, hasil dari pengujian inferensial akan dicurigai. Menggunakan langkah-langkah yang ada yang telah diuji dan menunjukkan bahwa data tersebut dapat diandalkan dapat membantu meningkatkan kemungkinan bahwa data baru akan dapat diandalkan.
Asumsi untuk Ukuran Keandalan
Ketika dua atau lebih ukuran, item, atau penilaian dipandang sebagai mengukur variabel dasar yang sama (konstruk), reliabilitas dapat dinilai. Reliabilitas digunakan untuk menunjukkan sejauh mana skor konsisten satu sama lain dan sejauh mana data bebas dari kesalahan pengukuran. Diasumsikan bahwa setiap item atau skor terdiri dari skor sebenarnya yang mengukur konstruk yang mendasarinya, ditambah kesalahan; hampir selalu ada beberapa kesalahan dalam pengukuran. Oleh karena itu, salah satu asumsinya adalah bahwa tindakan atau item terkait secara sistematis satu sama lain secara linier karena diyakini sebagai ukuran dari konstruk yang sama. asumsi kedua adalah bahwa kesalahan (sisa) untuk ukuran atau penilaian yang berbeda tidak berkorelasi. Jika kesalahan dikorelasikan, ini berarti bahwa residual bukan hanya kesalahan; sebaliknya, ukuran yang berbeda tidak hanya memiliki variabel yang mendasari yang diusulkan yang sama, tetapi mereka juga memiliki kesamaan lain yang sistematis dan perkiraan keandalan dapat meningkat.
Kondisi untuk Ukuran Keandalan
Suatu kondisi yang diperlukan untuk mengukur reliabilitas adalah bahwa skor atau kategori yang berhubungan satu sama lain perlu diperbandingkan. Jika menggunakan reliabilitas split-half, maka kedua bagian tes harus setara. Jika menggunakan alfa (yang ditunjukkan dalam bab ini), maka diasumsikan bahwa setiap item mengukur konstruk dasar yang sama. Diasumsikan bahwa responden harus menjawab sama pada bagian yang dibandingkan, dengan perbedaan apapun karena kesalahan pengukuran.
Soal 3.1: Alpha Cronbach untuk Skala Motivasi
Skor motivasi terdiri dari enam item yang dinilai pada skala Likert empat poin, dari sangat atipikal (1) hingga sangat khas (4). Apakah skor untuk item-item ini berjalan bersama (saling berhubungan) dengan cukup baik untuk ditambahkan bersama-sama untuk digunakan di masa mendatang sebagai variabel komposit berlabel motivasi?
3.1. Apa keandalan konsistensi internal dari skala sikap matematika?
Tabel pertama menunjukkan jumlah kasus Valid , yaitu kasus yang tidak data yang hilang pada variabel yang dipilih. Tabel kedua mencantumkan Alpha Cronbach dan Alpha Berdasarkan Item Standar. Di umum, Anda akan menggunakan alfa yang tidak standar kecuali item dalam skala memiliki cara dan deviasi standar yang sangat berbeda, seperti, misalnya, adalah kasus dengan prestasi matematika (M = 12,6, SD = 6,7), nilai (M = 5,7, SD = 1,6), dan visualisasi (M = 5.2, SD = 3.9); jika kita ingin membuat penjumlahan konsep. Cara menulis tentang keluaran ini ditemukan setelah Soal 3.2 dan 3.3. skala menggunakan tiga item, kita akan menggunakan alpha standar. Seperti koefisien reliabilitas lainnya, alpha harus di atas 0,70; Namun, itu adalah umum untuk melihat artikel jurnal di mana satu atau lebih skala memiliki agak alfa yang lebih rendah (misalnya, dalam kisaran 0,60–0,69), terutama jika hanya ada segelintir item dalam skala. Alfa yang sangat tinggi (misalnya, lebih besar dari 0,90) mungkin berarti item tersebut berulang atau Anda memiliki lebih banyak item di skala daripada yang benar-benar diperlukan untuk ukuran yang dapat diandalkan secara internal dari konsep. Cara menulis tentang keluaran ini ditemukan setelah Soal 3.2 dan 3.3. tabel statistik deskriptif untuk setiap item, dihasilkan dengan memeriksa Item pada Gambar 3.2. Tabel keempat adalah matriks yang menunjukkan korelasi antar item dari setiap item dalam skala dengan setiap item lainnya. Tabel berikutnya menyediakan Statistik Item Ringkasan untuk Sarana Ini memberi tahu Anda, misalnya, rata-rata, minimum, dan maksimum dari rata-rata item dan korelasi antar item. Interpretasi Output 3.1 lanjutan Tabel Item Total Statistics, yang menurut kami paling penting, dihasilkan jika Anda mencentang Scale jika item dihapus di bawah Deskriptif untuk di kotak dialog yang ditampilkan pada Gambar 3.2. Tabel ini memberikan lima informasi untuk setiap item dalam skala. Dua yang menurut kami paling berguna adalah Koreksi Item-Total Korelasi dan mantan adalah korelasi setiap item tertentu dengan jumlah / total item lain dalam skala. Jika korelasi ini cukup tinggi atau tinggi, katakanlah, 0,40 atau lebih, item tersebut mungkin setidaknya berkorelasi sedang dengan sebagian besar item lainnya dan akan menjadi komponen yang baik dari skala penilaian yang dijumlahkan ini. Item dengan korelasi item-total yang lebih rendah juga tidak cocok dengan skala ini, secara psikometri. Jika korelasi item-total negatif atau terlalu rendah (kurang dari 0,30), adalah bijaksana untuk memeriksa item untuk masalah kata-kata dan kesesuaian konseptual. Anda mungkin ingin mengubah atau menghapus item tersebut. Anda dapat mengetahui dari kolom terakhir seperti apa alfa jika Anda menghapus item itu. Bandingkan ini dengan alfa untuk skala dengan keenam item yang disertakan, yang diberikan dalam tabel Statistik Keandalan. Menghapus item yang buruk biasanya akan membuat alfa naik, tetapi biasanya hanya akan membuat perbedaan kecil dalam alfa kecuali skala hanya memiliki beberapa item (misalnya, kurang dari lima) karena alfa juga didasarkan pada jumlah
item sebagai interkorelasi rata-rata mereka. Perhatikan bahwa kami telah menggunakan item 04 dan 08 terbalik sehingga semua item akan dinilai dengan motivasi tinggi sebagai angka yang tinggi. Jika kita menggunakan item 04 atau 08, korelasi item-total.
Soal 3.2 dan 3.3: Alpha Cronbach untuk Skala Kompetensi dan Kesenangan
Sekali lagi, apakah masuk akal untuk menambahkan skor untuk item-item ini bersama-sama untuk membentuk ukuran yang dijumlahkan dari konsep kompetensi dan kesenangan?
3.2. Apa keandalan konsistensi internal skala kompetensi? Item untuk membuat output lebih pendek.
3.3. Apa keandalan konsistensi internal dari skala kesenangan?
Contoh Cara Menulis Soal 3.1, 3.2, dan 3.3
Metode Untuk menilai apakah data dari enam variabel yang dijumlahkan untuk membuat
skor motivasi membentuk skala yang dapat diandalkan, alpha Cronbach dihitung.
Alpha adalah 0,79, yang menunjukkan bahwa item membentuk skala yang
memiliki reliabilitas konsistensi internal yang wajar. Demikian pula, alpha untuk
skala kompetensi (.80) menunjukkan konsistensi internal yang baik, tetapi alpha
.69 untuk skala kesenangan menunjukkan keandalan minimal yang memadai.
Soal 3.4: Uji—Uji Ulang Reliabilitas Menggunakan Korelasi
Apakah ada dukungan untuk keandalan tes-tes ulang dari dua tes visualisasi? skor?
Korelasi Pearson dihitung untuk menilai reliabilitas tes-tes ulang dari korelasi kedua skor visualisasi sangat tinggi (r = .89) sehingga ada nilai tes visualisasi, r (75) = 0,89. Hal ini menunjukkan bahwa ada tes yang baik menuji ulang keandalan untuk data ini.
Soal 3.5: Koefisien Korelasi Intraclass (ICC)
ICC melakukan analisis reliabilitas untuk dua atau biasanya lebih hakim atau pengamat yang
menilai perilaku subyektif yang sama. Dalam contoh kami, tes pola mosaik diberikan kepada siswa; kemudian tanggapan terhadap tes tersebut dinilai oleh tiga pengamat, penilai, atau juri yang berbeda. Skor yang dicatat juri ini masing-masing disebut mosaik, mosaik2, dan mosaik3 . Kami ingin melihat apakah ketiga juri memberikan skor yang konsisten dalam hal korelasi di antara peringkat mereka (yaitu, apakah ketiga juri memberi skor tinggi pada siswa yang sama dan siswa lainnya rendah). Selain itu, kita akan mengetahui apakah ketiga juri berbeda dalam hal penilaian rata-rata mereka (yaitu, apakah juri sama ketatnya atau apakah satu atau dua juri memberikan skor yang lebih besar).
3.5 Berapakah koefisien reliabilitas untuk ketiga juri tes pola mosaik? Apakah rata-rata skor
mozaik untuk ketiga juri berbeda?
Koefisien korelasi intrakelas menunjukkan bahwa reliabilitas antar penilai untuk
penilaian ketiga juri terhadap nilai tes pola mosaik siswa adalah 0,95
Soal 3.6: Kappa Cohen Dengan Data Nominal
Ketika kita memiliki dua variabel kategoris nominal dengan nilai yang sama (biasanya
pengamatan atau skor dua penilai menggunakan kode yang sama), kita dapat menghitung kappa Cohen untuk memeriksa keandalan atau kesepakatan antara ukuran. Kappa Cohen lebih disukai daripada kesepakatan persentase sederhana karena mengoreksi kemungkinan bahwa penilai akan setuju karena kebetulan saja. Dalam hsbdataNew, variabel etnisitas adalah etnis siswa seperti yang dilaporkan dalam catatan sekolah. Variabel etnisitas yang dilaporkan oleh mahasiswa adalah etnisitas mahasiswa yang dilaporkan oleh mahasiswa tersebut. Jadi, kita dapat menghitung kappa Cohen untuk memeriksa kesesuaian antara dua peringkat nominal ini.
3.6. Berapa koefisien reliabilitas untuk kode etnis (berdasarkan catatan sekolah) dan etnis yang dilaporkan oleh siswa?
Metode; Kappa Cohen dihitung untuk memeriksa keandalan laporan etnis siswa oleh
siswa dalam kaitannya dengan catatan sekolah. Kappa yang dihasilkan
sebesar 0,86 menunjukkan bahwa catatan sekolah dan laporan siswa
memberikan informasi yang sama tentang etnis siswa.
BAB 4
ANALISIS FAKTOR EKSPLORASI DAN ANALISIS KOMPONEN UTAMA
Analisis Faktor Eksplorasi dan Analisis Komponen Utama Analisis faktor eksploratori (EFA) dan analisis komponen utama (PCA) keduanya adalah metode yang digunakan untuk membantu penyelidik mewakili sejumlah besar hubungan di antara variabel yang terdistribusi normal atau variabel skala dengan cara yang lebih sederhana (lebih hemat). Kedua pendekatan ini menentukan mana, dari satu set item yang cukup besar, "bersama" sebagai kelompok atau dijawab paling mirip oleh para peserta. EFA juga dapat membantu menilai tingkat validitas konstruk (faktorial) dalam kumpulan data mengenai ukuran yang dimaksudkan untuk mengukur konstruk tertentu. Pendekatan terkait, analisis faktor konfirmatori, di mana seseorang menguji model yang sangat spesifik tentang bagaimana variabel terkait dengan konstruksi yang mendasarinya (variabel konseptual), memerlukan perangkat lunak tambahan dan berada di luar cakupan buku ini sehingga tidak akan dibahas.
Perbedaan utama, secara konseptual, antara analisis faktor eksplorasi dan analisis komponen utama adalah bahwa dalam EFA satu mendalilkan bahwa ada satu set lebih kecil dari variabel (laten) yang tidak teramati atau konstruksi yang mendasari variabel yang benar-benar diamati atau diukur (ini biasanya dilakukan untuk menilai validitas) , sedangkan di PCA seseorang hanya mencoba untuk secara matematis menurunkan sejumlah kecil variabel yang digunakan untuk menyampaikan sebanyak mungkin informasi dalam variabel yang diamati/diukur. Dengan kata lain, EFA diarahkan untuk memahami hubungan antar variabel dengan memahami konstruksi yang mendasarinya, sedangkan PCA hanya diarahkan untuk memungkinkan seseorang memperoleh lebih sedikit variabel untuk memberikan informasi yang sama yang akan diperoleh seseorang dari kumpulan variabel yang lebih besar.
Sebenarnya ada sejumlah cara yang berbeda untuk menghitung faktor untuk analisis faktor; dalam bab ini, kita hanya akan menggunakan salah satu dari metode ini, analisis faktor sumbu utama (PA). Perbedaan utama, secara komputasi, antara PCA dan PA adalah bahwa dalam analisis sebelumnya biasanya dilakukan pada matriks korelasi biasa, lengkap dengan korelasi setiap item atau variabel dengan dirinya sendiri. Sebaliknya, dalam analisis faktor PA, matriks korelasi dimodifikasi sedemikian rupa sehingga korelasi setiap item dengan dirinya sendiri diganti dengan "komunalitas”, ukuran hubungan item tersebut dengan semua item lainnya (biasanya korelasi ganda kuadrat). Jadi, dengan PCA peneliti mencoba untuk mereproduksi semua informasi (varians dan kovarians) yang terkait dengan himpunan variabel, sedangkan analisis faktor PA diarahkan untuk memahami hanya kovariasi antar variabel.
Kondisi untuk Analisis Faktor Eksplorasi dan Analisis Komponen Utama
Ada dua kondisi utama yang diperlukan untuk analisis faktor dan analisis komponen utama. Yang pertama adalah bahwa perlu ada hubungan antar variabel. Selanjutnya, semakin besar ukuran sampel, terutama dalam kaitannya dengan jumlah variabel, semakin dapat diandalkan faktor yang dihasilkan. Ukuran sampel kurang penting untuk analisis faktor sejauh komunalitas item dengan item lainnya tinggi, atau setidaknya relatif tinggi dan bervariasi. Analisis faktor sumbu utama biasa tidak boleh dilakukan jika jumlah item/variabel lebih besar dari jumlah partisipan.
Asumsi untuk Analisis Faktor Eksplorasi dan Analisis Komponen Utama
Metode penggalian faktor dan komponen yang digunakan dalam buku ini tidak membuat asumsi distribusi yang kuat; normalitas hanya penting sejauh skewness atau outlier mempengaruhi korelasi yang diamati atau jika uji signifikansi dilakukan (yang jarang terjadi pada EFA dan PCA). Normalitas distribusi dapat diperiksa dengan menghitung nilai skewness. Estimasi kemungkinan maksimum, yang tidak akan kita bahas, memang membutuhkan normalitas multivariat; variabel harus terdistribusi normal dan distribusi gabungan dari semua variabel harus normal.
Karena kedua analisis faktor sumbu utama dan analisis komponen utama didasarkan pada korelasi, pengambilan sampel independen diperlukan dan variabel harus terkait satu sama lain (berpasangan) secara linier. Asumsi linearitas dapat dinilai dengan matriks scatterplots, seperti yang ditunjukkan pada Bab 2. Akhirnya, masing-masing variabel harus berkorelasi pada tingkat yang moderat dengan beberapa variabel lainnya. Analisis faktor dan analisis komponen utama berusaha untuk menjelaskan atau mereproduksi matriks korelasi, yang tidak akan menjadi hal yang masuk akal untuk dilakukan jika semua korelasi berada di sekitar nol. Uji kebulatan Bartlett menjawab asumsi ini. Namun, jika korelasi terlalu tinggi, hal ini dapat menyebabkan masalah dalam memperoleh solusi matematis untuk analisis faktor.
ANALISIS KOMPONEN UTAMA VARIABEL PRESTASI
Analisis komponen utama paling berguna jika hanya ingin mengurangi jumlah variabel yang relatif besar ke sejumlah variabel yang sama. Kita akan melihat solusi awal (tidak diputar) serta solusi yang diputar karena mungkin ingin menggunakan komponen utama pertama yang tidak diputar untuk meringkas semua variabel jika menjelaskan sebagian besar varians daripada menggunakan beberapa, diputar komponen. Ini terutama benar jika plot scree menunjukkan penurunan besar setelah yang komponen pertama dalam varian dijelaskan (nilai eigen).
Matriks Komponen yang tidak diputar tidak boleh ditafsirkan. Namun, jika ingin menghitung hanya satu variabel yang memberikan informasi paling banyak, kombinasi linier dari variabel dengan beban tinggi dari komponen pertama matriks yang tidak diputar akan digunakan.