Psikometride Güvenilirlik ve Tutarlılık

Birisini ya da güvenilir bir şeyi aradığımızda, tutarlı ve güvenilir olduklarını kastediyoruz. Güvenilirlik aynı zamanda iyi bir psikolojik testin önemli bir bileşenidir. Ne de olsa, her zaman tutarsız ve farklı sonuçlar üretse, bir test çok değerli olmazdı. Psikologlar güvenilirliği nasıl tanımlar? Psikolojik test konusunda ne gibi bir etkisi var?

Güvenilirlik , bir önlemin tutarlılığını ifade eder. Aynı sonucu tekrar tekrar elde edersek, bir test güvenilir kabul edilir. Örneğin, bir test, bir öyküyü ( içe dönüklük gibi) ölçmek için tasarlanmışsa, testin bir özneye her verildiği zaman, sonuçlar yaklaşık olarak aynı olmalıdır. Ne yazık ki, güvenilirliği tam olarak hesaplamak imkansızdır, ancak birkaç farklı şekilde tahmin edilebilir.

Test-Tekrar Test Güvenilirliği

Test-tekrar test güvenilirliği, psikolojik test veya değerlendirmenin tutarlılığının bir ölçütüdür. Bu tür bir güvenilirlik, zaman içinde bir testin tutarlılığını belirlemek için kullanılır. Test-tekrar test güvenilirliği, zeka gibi zaman içinde kararlı olan şeyler için en iyi şekilde kullanılır.

Test-tekrar test güvenilirliği, zaman içinde iki farklı noktada bir testin iki kez uygulanmasıyla ölçülür. Bu tür güvenilirlik, ölçülen kalitedeki veya yapıda bir değişiklik olmayacağını varsayar.

Çoğu durumda, testler arasında çok az zaman geçtiğinde güvenilirlik daha yüksek olacaktır.

Test-tekrar test yöntemi, bir ölçümün güvenilirliğini belirlemek için kullanılabilecek yollardan sadece biridir. Kullanılabilecek diğer teknikler arasında ara güvenilirlik, iç tutarlılık ve paralel form güvenilirliği sayılabilir.

Test-tekrar test güvenilirliğinin, mutlaka bir testin tutarlılığına, sonuçların geçerliliğine bağlı olmadığını belirtmek önemlidir.

Inter-rater Güvenilirliği

Bu tür güvenilirlik, iki ya da daha fazla bağımsız hakimin sınava girmesiyle değerlendirilir. Daha sonra puanlar, raters tahminlerinin tutarlılığını belirlemek için karşılaştırılır.

Değerlendiriciler arası güvenilirliği test etmenin bir yolu, her puanlayıcıya her test öğesinin bir puan vermesini sağlamaktır. Örneğin, her bir değerlendirici, 1 ile 10 arasında bir ölçekte puan toplayabilir. Sonra, değerlendiriciler arası güvenilirlik düzeyini belirlemek için iki derecelendirme arasındaki ilişkiyi hesaplarsınız.

Değerlendiriciler arası güvenilirliği test etmenin bir başka yolu da, puanlayıcıların her bir gözlemin hangi kategoriye girdiğine karar vermesi ve daha sonra puanlayıcılar arasındaki anlaşma yüzdesini hesaplamasıdır. Dolayısıyla, yarışmacılar 10 katın 8'ini kabul ederse, testin% 80'lik bir ara güvenirlik oranı vardır.

Paralel Formlar Güvenilirliği

Paralel form güvenirliği, aynı içerik kullanılarak oluşturulan iki farklı testi karşılaştırarak ölçülür. Bu, aynı kaliteyi ölçen ve ardından öğeleri iki ayrı teste ayıran büyük bir test öğeleri havuzu oluşturularak gerçekleştirilir. İki test daha sonra aynı konulara aynı anda uygulanmalıdır.

İç Tutarlılık Güvenilirliği

Bu güvenilirlik şekli, aynı testteki öğelerin sonuçlarının tutarlılığını yargılamak için kullanılır. Esasen, testleri iç tutarlılığı belirlemek için aynı yapıyı ölçen test öğelerini karşılaştırıyorsunuz. Başka bir test sorusuna çok benzeyen bir soru gördüğünüzde, bu iki sorunun güvenilirliği ölçmek için kullanıldığını gösterebilir. İki soru benzer ve aynı şeyi ölçmek için tasarlandığından, test sorumlusu her iki soruyu da aynı şekilde cevaplamalıdır, bu da testin iç tutarlılığı olduğunu gösterir.

Güvenilirliği Etkileyebilecek Faktörler

Bir önlemin güvenilirliği üzerinde etkili olabilecek bir dizi farklı faktör vardır.

Birincisi ve belki de en açıkçası, ölçülen şeyin oldukça istikrarlı ve tutarlı olması önemlidir. Ölçülen değişken düzenli olarak değişen bir şey ise, testin sonuçları tutarlı olmayacaktır.

Test durumunun özellikleri de güvenilirlik üzerinde etkili olabilir. Örneğin, test son derece sıcak bir odada uygulanmışsa, katılımcılar dikkati dağıtabilir ve testi en iyi şekilde tamamlayamazlar. Bu, tedbirin güvenilirliği üzerinde bir etkiye sahip olabilir. Yorgunluk, stres, hastalık, motivasyon, zayıf talimatlar ve çevresel dikkat dağıtıcıları gibi diğer şeyler de güvenilirliği bozabilir.

Güvenilirlik ve Geçerlilik

Bir testin güvenilirliği olduğu için bunun geçerliliğe sahip olduğu anlamına gelmediğine dikkat etmek önemlidir. Geçerlik, bir testin ölçmeyi talep ettiği şeyi gerçekten ölçüp ölçmediğini ifade eder. Güvenilirliği bir doğruluk ölçüsü olarak bir doğruluk ve geçerlilik ölçüsü olarak düşünün. Bazı durumlarda, bir test güvenilir olabilir, ancak geçerli olmayabilir. Örneğin, iş başvurusunda bulunanların belirli bir kişilik özelliğine sahip olup olmadıklarını belirlemek için bir test yaptığını hayal edin. Test tutarlı sonuçlar üretebilirken, aslında ölçmek istediği özelliği ölçmek olmayabilir.