Kuramsal çerçeve ve ilgili araştırmalar

Bu bölümde Matematik testinin ölçme değişmezliğinin ülkelere göre incelenmesi tezinin devamı ve içeriği olan araştırmanın kuramsal temeli kapsamında uluslararası durum belirleme
çalışmaları, geçerlilik, faktör analizi, açıklayıcı faktör analizi, doğrulayıcı faktör analizi,
ölçme değişmezliği ile ilgili bilgilere ve ölçme değişmezliği ile ilgili araştırmalara yer
verilmiştir.
2.1 Uluslararası Durum Belirleme Çalışmaları
Gelişen teknoloji ile birlikte çağın gerekliliklerine ayak uydurmaya çalışan ülkelerde, farklı
rekabet alanları ortaya çıkmaktadır. Özellikle eğitim alanında kendini gösteren küresel
rekabet, ülkelerin uyguladıkları veya uygulamayı tasarladıkları eğitim sistemlerini sürekli
olarak gözden geçirmeyi zorunlu hale getirmektedir (MEB, 2014). Bu kapsamda temel eğitim
seviyesinde yapılan değerlendirmelerin geleceğe yönelik daha sağlıklı yordamalar
yapılmasına yardımcı olacağı düşünülmekte ve bu seviyede eğitim gören öğrenciler için
ölçme değerlendirme çalışmalarına ağırlık verilmektedir.
Eğitim sistemlerinin faydalı ve verimli olup olmadığının kararı verilirken, çoğu zaman
öğrencilere uygulanan standart testlerden elde edilen başarı puanları esas alınmaktadır
(Çakan, 2003). Bu amaçla, uluslararası bazı kuruluşlar periyodik olarak her kıtadan birçok
ülkenin katılımının sağlandığı geniş ölçekli test uygulamaları gerçekleştirmektedir. Bunlar
arasında sonuçları en çok göze çarpan ve ülkelerin eğitim reformlarını şekillendiren
sınavlardan bazıları aşağıda açıklanmıştır.
PISA (Uluslararası Öğrenci Değerlendirme Programı): Ekonomik İşbirliği ve Kalkınma
Örgütü (OECD) tarafından, üçer yıllık periyotlarla 15 yaş grubu öğrencilere uygulanmaktadır.

PISA, öğrencilerin okulda öğrendikleri bilgi ve becerilerin günlük hayatta kullanma yetilerini
ölçmeyi amaçlamaktadır. Öğrencilere bu doğrultuda; matematik okuryazarlığı, fen bilimleri
ve okuma becerileri konu alanlarında başarı testleri uygulamanın yanı sıra, öğrenme ortamları
ve aileleriyle ilgili bilgiler toplamak için anketler uygulamaktadır.
Ülkemiz de bir OECD üyesi olarak, 2000 yılından itibaren gerçekleştirilen PISA
uygulamalarına ilk kez 2003 yılında katılmıştır. Elde edilen sonuçlar ulusal rapor halinde
düzenlenip yayınlanmaktadır.
PIRLS (Uluslararası Okuma Becerilerinde Gelişim Projesi): Uluslararası Eğitim Başarılarını
Değerlendirme Kuruluşu’nun (IEA) bir projesi olan PIRLS, her beş yılda bir 10 yaş grubu
4.sınıf öğrencilerine uygulanmaktadır. Bu uygulamanın amacı standart test ve anketlerle
öğrencilerin dil becerilerini, okuma becerilerini ve okuma alışkanlıklarını belirlemektir. 2001
yılından itibaren yapılan uygulamalara Türkiye yalnızca 2001 yılında katılmıştır.
TIMSS (Uluslararası Matematik ve Fen Eğilimleri Araştırması): Uluslararası Eğitim
Başarılarını Değerlendirme Kuruluşu’nun (IEA) bir diğer önemli projesi olan TIMSS, her dört
yılda bir 4. ve 8.sınıf öğrencilerine uygulanmaktadır. 1995’ten itibaren uygulanan TIMSS’ in
temel amacı, öğrencilerin matematik ve fen bilimleri alanlarında kazandıkları bilgi ve
becerileri değerlendirmektir. Matematik ve fen alanlarında çoktan seçmeli ve açık uçlu
sorulardan oluşan standart başarı testlerinin kullanılmasının yanı sıra; öğrenme ortamları,
öğrenci ve öğretmen özellikleri hakkında veri toplamak amacıyla da anketler
uygulanmaktadır. 60’dan fazla ülkenin katılım gösterdiği uygulamaya Türkiye ilk kez 1999
yılında katılmıştır.
Geniş çaplı katılımın gerçekleştiği uluslararası durum belirleme çalışmaları hem ülkelerin
mevcut eğitim sistemlerinin verimliliğinin gözden geçirilmesi, hem de geliştirilen yeni eğitim
yaklaşımlarının yeterliliğinin değerlendirilebilmesi için önem arz etmektedir.
Geniş ölçekli test uygulamalarının standart olması yapılan karşılaştırmaların anlamlılığı
açısından zorunludur. Standart testlerde bulunması gereken en önemli özellik ise güvenirlilik
ve geçerliliğinin kanıtlanmış olmasıdır. Geçerlilik ile ilgili alanyazına aşağıda yer verilmiştir.
2.2 Geçerlilik
Geçerlilik, testin ölçülmek istenilen özelliği ne kadar doğru ölçtüğüyle ilgilidir. Bir başka
ifadeyle geçerlilik, ölçmeyi gerçekleştirebilme derecesidir (Büyüköztürk, Çakmak, Akgün,
Karadeniz ve Demirel, 2008). Aynı zamanda geçerlilik, ölçmeden elde edilen sonuçların
evrene genellenebilir olmasıdır (Şencan, 2005). Bu bağlamda, bir evreni temsil eden örneklem
üzerinden yapılan çalışmalarla evren hakkında genellemelere ulaşma amacındaki
araştırmalarda geçerliliğin sağlam kanıtlara dayandırılması zorunluluğu ortaya çıkmaktadır.
LoBiondo-Wood ve Haber (2014)’e göre geçerlilik, bir ölçme aracının bir kavramın
niteliklerini ne kadar doğru ölçtüğünün bir ölçüsüdür.
İlgili alanyazın incelendiğinde geçerlilik türleriyle ilgili faklı gruplamalara rastlansa da
genellikle geçerlilik türlerinin üç başlık altında toplandığı görülmektedir. Bunlar, ölçüt
geçerliliği, kapsam geçerliliği ve yapı geçerliliğidir. Ölçme aracının türüne göre bazı
geçerlilik türlerinin daha kullanışlı olacağı görüşü yaygın olsa da, yapı geçerliliğinin diğer
geçerlilik türlerini kapsayıcı nitelikte olduğu görüşü de araştırmacılar tarafından
savunulmaktadır (Messick, 1995). Dolayısıyla yapı geçerliliği kanıtlarının elde edilmesi,
ölçme aracının geçerliliğinin sağlandığı yönündeki bulguları güçlendirmektedir. Yapı
geçerliliğini incelemek için en sık başvurulan tekniklerden biri faktör analizidir. Aşağıdaki
bölümde faktör analizi ilgili bilgiler yer almaktadır.

2.3 Faktör Analizi
Faktör analizi, ölçeklerin yapı geçerliliği kanıtlarını ortaya koymak için araştırmacıların en sık
başvurduğu tekniklerden biridir (Çokluk, Şekercioğlu ve Büyüköztürk, 2010). Ölçeklerin
faktör yapısını ortaya koyan bu teknik diğer analizlere kıyasla daha geniş kapsamlı bilgi
vermektedir. Faktör analizi birbiriyle ilişkili, bir diğer ifadeyle benzer yapıları ölçen
değişkenleri bir araya getirerek gruplama işlemi yapan ve daha az sayıdaki bu gruplarla ölçme
işlemini açıklamaya çalışan çok değişkenli bir istatistiksel yöntemdir (Büyüköztürk, 2002).
Byrne (1998) veri analizinde faktör analizi kullanımını, altta yatan gizli yapılar hakkında bilgi
toplamak ve gözlenen değişkenler arasındaki kovaryansı incelemek için kullanılan en eski
tekniklerden biri olarak tanımlamıştır. Faktör analizi çok değişkenli bir veri kümesinin
karmaşıklığını azaltmayı sağlayan bir teknik olup, araştırmacılara uygulama yapma ve teori
geliştirmede kolaylıklar sağlamaktadır (Huck, 2007).
Faktör analizinde açımlayıcı (exploratory) ve doğrulayıcı (confirmatory) olmak üzere iki çeşit
yaklaşım vardır. Açımlayıcı faktör analizinde veriler üzerinde kesin bir model oluşturmadan
ölçme aracının karakteristik özelliklerini tespit etmek amaçlanırken, doğrulayıcı faktör
analizinde göreceli olarak az sayıda parametre açısından deneysel verileri açıklamak ve
tanımlamak için bir model oluşturulması amaçlanmaktadır (Jöreskog and Sörbom, 1993).
2.3.1 Açımlayıcı Faktör Analizi
Açımlayıcı faktör analizi (AFA) sosyal bilimlerde ölçeklerin yapı geçerliliğini incelemede
yaygın olarak kullanılan ve uygulanan istatistiksel bir tekniktir. Temelde faktör analizi
maddelerin faktör adı verilen yapılar altında gösterdikleri ilişkiye dair bilgi verir (Çokluk ve
diğerleri, 2010). Açımlayıcı faktör analizi gözlenen değişkenlerle gizil değişkenler arasındaki
bağlantıların bilinmediği durumlar için tasarlanmıştır. Analizin amacı gözlenen değişkenlerin
altta yatan faktörlerle nasıl ve ne derecede ilişkili olduğunu ortaya koyma ve gözlenen
değişkenlerin ortaklaştığı asgari faktör sayısını belirlemektir (Byrne, 1998).
Açımlayıcı faktör analizi bir grup değişken arasındaki ortak kovaryansı daha anlaşılır kılar
çünkü faktörler ölçülen değişkenlerden daha az sayıdadır (Brown, 2006). Bu yöntem
araştırmanın başında karşılaşılan; gözlenen değişkenlerin belirli yapılar altında toplanıp
toplanmadığı, kaç adet yapının ortaya çıkacağı ve bu yapıların niteliklerinin nasıl olacağı gibi
sorulara yanıtlar bulunmasına yardımcı olmaktadır.
Faktör analizinde, faktör belirleme veya faktör çıkarma için kullanılan birden çok teknik
bulunmaktadır:
a) Temel bileşenler analizi: Faktör analizinde gözlenen değişkenleri temsil eden ve faktör
gruplanmalarını açıklayan bağımsız bileşenlerin ortaya çıkarılmasına dayanan bir
istatistiki tekniktir.
b) Ortak faktör analizi: Üç veya daha çok değişkenin etkilendiği ortak faktörlerin altında
yatan gizli yapıyı açıklamak ve daha önceden belirlenen faktör yapısını doğrulamak
amacıyla kullanılan bir yöntemdir.
c) Maksimum olasılık yöntemi: Uygun teknikle faktör analizi yapıldıktan ve faktör
yapılarına dair bilgi edinildikten sonra başvurulan bu yöntem, değişkenleri daha iyi
açıklayan farklı bir modelin kurulup kurulamayacağı hakkında bilgi verir. Bu yönüyle
teyit edici faktör analizini andırmaktadır.
d) Ağırlıklandırılmamış en küçük kareler yöntemi: Gözlemlenen ve yeni oluşturulan
korelasyon matrisleri arasındaki farkların karesini en düşük seviyeye getirmeyi
amaçlar.
e) Genelleştirilmiş en küçük kareler yöntemi: Bu yöntem de gözlemlenen ve yeni
oluşturulan korelasyon matrisleri arasındaki farkların karesini en düşük seviyeye

getirmeyi amaçlar, ancak bu yöntemde ağırlıklandırılmamış en küçük kareler
yönteminden farklı olarak her bir değişken asıl faktör değeri ile ağırlıklandırılarak
işleme girer.
f) İmaj faktör analizi yöntemi: Olası faktörlerin birbirleriyle zıt olduklarının tahmin
edildiği çalışmalarda faktör çıkarmada kullanılması önerilen alternatif bir yöntemdir.
g) Alfa faktör analizi: Bu yöntem faktörlerin güvenilirlik katsayılarını en üst düzeye
getirmeyi amaçlar. (Şencan, 2005).
2.3.2 Doğrulayıcı Faktör Analizi
Doğrulayıcı faktör analizi (DFA), gözlemlenen bir kümenin faktör yapısını doğrulamak için
kullanılan istatistiksel bir tekniktir. Ayrıca, gözlenen değişkenler ile altta yatan gizli yapılar
arasında ilişki olduğuna dair hipotezin test edilmesini sağlar (Suhr, 2006). Açımlayıcı faktör
analizi veride açıkça görülemeyen değişkenler arasındaki korelasyonların bile görülmesini
sağlar, bu yönüyle bir keşif analizidir. Diğer yandan, teorik açıdan olması beklenen ilişkilerin
gerçekte de verilerde görünüp görünmediğini test etmeyi sağlar (Jöreskog and Sörbom, 1993).
Şencan’a göre (2005), doğrulayıcı faktör analizinde gözlenen değişkenlerin gizil yapılarla ve
gizil yapıların da birbirleriyle olan ilişkisi ile alakalı tüm öngörüler araştırmacının
dayandırdığı kuramsal temelle bağlantılıdır. Bu doğrultuda elde edilen verilerin kurama bağlı
kalınarak geliştirilen modelle uyum sağladığı gösterilir. Bir diğer deyişle doğrulayıcı faktör
analizi teyit edici faktör analizidir.
Doğrulayıcı faktör analizi, modelin tüm özelliklerinin önceden bilinmesini gerektiğinden
açımlayıcı faktör analizinden farklıdır, dolayısıyla faktör modelinin değerlendirilmesi için
güçlü bir ampirik temel gereklidir. Bu nedenle, çoğunlukla açımlayıcı faktör analizi
uygulaması yapı geçerliliği doğrulaması sürecinde önceki aşamalarda kullanılır; doğrulayıcı

faktör analizi ise daha önce kurulan deneysel ve teorik temeller üzerine uygulanır (Brown,
2006).
Brown’a (2006) göre doğrulayıcı faktör analizinin en yaygın kullanım alanlarından bazıları
şunlardır:
a) Testlerin Değerlendirilmesi: Doğrulayıcı faktör analizi, bir ölçme aracının gizil
yapısını incelemek için kullanılmaktadır. Ayrıca testin nasıl puanlanacağına da
yardımcı olmaktadır. Tek faktörlü yapınının yanı sıra çok faktörlü yani, iki ya da daha
fazla faktörlü yapılarda alt ölçeklerin nasıl puanlanması gerektiğini gösterir.
Psikometrik değerlendirmenin birçok alanında kullanılabilen doğrulayıcı faktör
analizi, ölçek geçerliliği hakkında da bilgi vermektedir.
b) Yapı Doğrulama: Doğrulayıcı faktör analizi sosyal bilimlerde yapı doğrulama için
vazgeçilmez bir tekniktir. Analiz, yapı geçerliliğini değerlendirmek için kullanılan
yöntemlerden biri olarak kabul edilen yakınsak (convergent) ve ıraksak (discriminant)
geçerlilik adına sağlam kanıtlar sağlayabilmektedir. Yakınsak geçerlilik maddelerin ait
oldukları faktörle ve faktöre ait diğer değişkenlerle yüksek korelasyona sahip
olduğunu, ıraksak geçerlilik ise maddelerin ait oldukları faktör haricindeki faktörlerle
düşük korelasyona sahip olduğunu öngörmektedir (Yaşlıoğlu, 2017). Yapı
doğrulamada doğrulayıcı faktör analizinin temel rolü, ölçme hatalarının geçerlilik
sonuçlarında hesaba katılmasıdır. Bu yönüyle doğrulayıcı faktör analizi geleneksel
yöntemlerden daha güçlü bir kanıt sağlar.
c) Yöntem Etkileri: Çoğu zaman, gözlenen ölçümlerin bazı kovaryansları gizil
değişkenlerden farklı sebeplerle ortaya çıkmaktadır. Ölçme yaklaşımları ile
göstergeler arasında ilave bazı değişkenler görüldüğü zaman yöntem etkisinden
bahsedilebilir. Yöntem etkisi genellikle olumlu ve olumsuz olarak ifade edilen
cümlelerin kombinasyonlarını içeren araçlarda görülmektedir. Açımlayıcı faktör

analizi yöntem etkilerini ortaya çıkarmada yetersiz kalırken doğrulayıcı faktör analizi,
yöntem etkilerini ölçme modeline ait hata teorisinin bir parçası olarak ele alır.
d) Ölçme Değişmezliği Değerlendirmesi: Ölçme değişmezliğini araştırmak test
geliştirmenin ve uygulamanın önemli bir parçasıdır, ölçme özelliklerinin
değişmezliğinin cinsiyet, ırk vs. gibi etkenler için tespit edilmesi gereklidir.
Değişmezliğin tespit edilememesi durumumda o testin yanlılığından şüphelenilir. Bu
tip sorunlar çoklu grup doğrulayıcı faktör analizinde ele alınabilir. Bu analizde çeşitli
alt gruplarda ölçme modeli aynı anda kestirilebilmektedir.
2.4 Ölçme Değişmezliği
Ölçme değişmezliği testinin önemi 50 yıldan uzun bir süre önce alanyazına girmiştir ancak,
değişmezlik testi için kullanılan istatistiksel teknikler daha çok son yıllarda ulaşılabilir hale
geldiğinden, araştırmacıların ölçme değişmezliğini test etmesi günümüzde daha beklenir hale
gelmiştir (Putnick and Bornstein, 2016). Faktör yapılarının eşitliği hakkında yazan ilk
araştırmacı Jöreskog (1971) olmuştur. Ölçme değişmezliği kavramı ise, Byrne, Shavelson ve
Muthe´n (1989) tarafından tanıtılmış ve daha sonra test edilmiştir.
Ölçme değişmezliği, gözlenen değişkenlerle gizil değişkenlere yani yapılara ulaşmaya çalışan
ölçeklerin sahip olması gereken psikometrik özelliklerden biridir. Aynı yapı, ülkeler, kültürel
birimler, zaman hususları veya ülkeler içindeki bölgeler gibi farklı gruplar arasında aynı
şekilde ölçüldüğünde, ölçümün gruplar için değişmez olduğu sonucuna varılır (Horn and
McArdle, 1992; Meredith, 1993; Vandenberg and Lance, 2000). Ölçme değişmezliği
sağlandığında gizil değişken üzerinde yapılan gruplar arası karşılaştırmaların geçerliliği
sağlanabilir; aynı zamanda gelecekte yapılacak olan çalışmalarla gizil değişken puanlarının
oluşumu, belirleyicileri ve sonuçları da kıyaslanarak değerlendirilebilir (Schoot, Lugtig and
Hox, 2012).

Horn ve McArdle ‘a göre (1992) yaş, cinsiyet veya kültür gibi değişkenlerin yer aldığı her
çalışmada gerekli çıkarım ve yorumların yapılabilmesi için ölçme değişmezliği gereklidir.
Ölçme değişmezliğinin temel sorusu, olguların farklı koşullar altında gözlemlenmeleri
sonucunda ölçülen niteliğin aynı ölçme sonuçlarını verip veremediğidir. Eğer değişmezliğin
varlığına dair bir kanıt elde edilemediyse bireyler ve gruplar arasındaki farklılıklara dair
bilimsel çıkarımlar yapabilmek mümkün olmamaktadır.
Ölçme değişmezliği çoklu grup doğrulayıcı faktör analizi ile dört adet hiyerarşik modelin test
edilmesi ile ortaya konmaktadır. Bu modeller sırasıyla “yapısal değişmezlik (configural
invariance)”, “zayıf faktöriyel değişmezlik (metric invariance= weak factorial invariance)”,
“güçlü faktöriyel değişmezlik (strong factorial invariance= scalar invariance)” ve “katı
faktöriyel değişmezlik (strict factorial invariance)” olarak adlandırılmaktadır. Aşamalılık
içeren bu dört modelin test edilmesi gereklidir (Meredith, 1993). Zayıf teknikten güçlü
tekniğe doğru gerçekleştirilen değişmezlik testleri çoklu grup doğrulayıcı faktör analizleri ve
yapısal eşitlik modellemeleri kullanılarak gösterilir (Horn ve McArdle, 1992).
2.4.1 Yapısal Değişmezlik (Configural Invariance)
Ölçme değişmezliğindeki en temel seviyedir. Yapısal değişmezlik test edilirken faktör
yükleri, faktör varyansları ve hata varyansları serbest bırakılır. Bu aşamada test edilen hipotez
ölçme aracının faktör yapısının gruplar arasında değişmez olduğudur. Grupların aynı faktör
yapısına sahip olup olmadıkları incelenir. Eğer yapısal değişmezlik kanıtı elde edilemezse, bu
durum gruplarda farklı yapıların ölçüldüğü anlamına geldiğinden (Wu, Li ve Zumbo, 2007),
sonraki aşamalardaki hipotezlerin test edilmesinin anlamı olmayacaktır.

2.4.2 Zayıf Faktöriyel Değişmezlik (Weak Factorial Invariance)
Aşamalılık gereği yapısal değişmezliğin doğrulanması durumunda zayıf faktöriyel
değişmezliğin testine geçilebilmektedir. İlk kez parametre sınırlamasına geçilen bu modelde
sadece faktör yükleri serbesttir. Bu aşamada test edilen hipotez, gizil değişkene ait ölçme
aracını oluşturan maddelere ait faktör yüklerinin gruplar arasında değişmez olduğudur. Zayıf
faktöriyel değişmezliğin sağlanması durumunda tahmini faktör varyanslarının ve
kovaryanslarının grupsal karşılaştırmaları savunulabilir. Benzer bir ifadeyle bir madde zayıf
faktöriyel değişmezlik şartını sağlarsa madde üzerindeki fark puanları ülkeler arasında
anlamlı bir şekilde karşılaştırılabilir ve bu farklılıklar benzer yapıdaki ülkeler arası
farklılıkların da göstergesidir (Steenkamp ve Baumgartner, 1998).
Zayıf faktöriyel değişmezliğin desteklenmemesi, ortak grupların bir veya daha fazlasının veya
maddelerin en azından bir alt kümesinin, gruplar arasında farklı anlamlara sahip olduğu
anlamına gelmektedir (Gregorich, 2006).
2.4.3 Güçlü Faktöriyel Değişmezlik (Strong Factorial Invariance)
Ölçek değişmezliği olarak da adlandırılan güçlü faktöriyel değişmezlik modelinde, bir ölçme
aracına ait maddelerin faktör puanlarının sıfır olması durumunda elde edilen regresyon
sabitinin gruplar arasında değişmez olduğu hipotezi test edilir. Bu aşama örtük ortalamaların
karşılaştırılabilmesi için önemlidir. Güçlü faktöriyel değişmezliğin sağlanması gözlenen
puanların gizil puanlarla ilişkili olduğu anlamına gelir; yani, gizil yapıda aynı puana sahip
olan bireyler hangi gruptan olursa olsun, gözlenen değişkende aynı puanı elde ederler
(Milfont and Fischer, 2010).
Güçlü faktöriyel değişmezlik zayıf faktöriyel değişmezlik modelini tanımlayanların üzerinde
bir dizi kısıtlama içerir (Widaman and Reise, 1997). Yalnızca faktör yüklerinin eşitliğinin test

edildiği zayıf faktöriyel değişmezlik modeline kıyasla bu modelde regresyon sabitinin de
gruplar arası eşitliği gerekmektedir. Zayıf faktöriyel değişmezlik modeli, güçlü faktöriyel
değişmezlik modeli için bir ön koşuldur (Tucker, Özer, Lyubomirsk ve Boehm, 2006). Güçlü
faktöriyel değişmezliğin sağlanmaması durumunda, örtük ortalamaların karşılaştırması
belirsizdir (Cheung and Rensvold, 2002). Buradan hareketle yapılan grup karşılaştırmalarının
da gerçekliğinden söz edilemez.
2.4.4 Katı Faktöriyel Değişmezlik (Strict Factorial Invariance)
Bu aşamada test edilen hipotez, hata varyanslarının gruplar arasında değişmez olduğudur.
Katı faktöriyel değişmezlik modelinde, faktör yükleri ve regresyon sabitinin yanı sıra hata
varyanslarının da eşitliği gerekmektedir. Ortalama ve varyans kestirimlerinin gruplar arası
karşılaştırmaları için, katı faktöriyel değişmezlik kanıtı elde edilmelidir (Gregorich, 2006).
Katı faktöriyel değişmezlik kanıtının elde edilmesi madde varyanslarının sabit olduğu
anlamına gelir. Madde varyansları gözlenen değişkenler arasındaki korelasyonları
etkilediğinden bu korelasyonları karşılaştırılabilmesi için katı faktöriyel değişmezlik
sağlanmalıdır (Tucker, Özer, Lyubomirsk ve Boehm, 2006). Ölçme değişmezliğine ilişkin
aşamalı süreçte son aşamada yer alan bu model, en çok sınırlandırılmış modeldir.
2.5 İlgili Araştırmalar
Bu bölümde kronolojik sıralama ile daha önceden yapılmış ölçme değişmezliği çalışmalarına
yer verilmiştir.
Uzun ve Öğretmen (2010), TIMSS 1999 verileri üzerinde yürüttükleri çalışmalarında,
öğrencilerin fen bilimleri başarısını belirleyen değişkenleri belirlemiş ve bu değişkenlerin
cinsiyet bazında değişmezliğini incelemişlerdir. Öz yeterlik, önem, tutum ve sınıf içi öğrenci
etkinlikleri için aşamalı şekilde ölçme değişmezliği testleri yapılmış ve elde edilen uyum

indeksleri sonucunda modelde yer alan değişkenlerin yalnızca metrik değişmezlik modeline
kadar uyum gösterdikleri görülmüştür. Cinsiyet bazında oluşturulan grupların ise katı
değişmezlik koşullarını sağlayamadıkları belirlenmiştir.
Güzeller (2011), PISA 2009 uygulamasında yer alan öğrenci anketinin sekiz tanesi OECD
üyesi olmak üzere toplam on ülke arasındaki ölçme değişmezliğini incelemiştir. Ankette yer
alan bilgisayar tutum boyutunu ele alan araştırmacı, kültürler arası değişmezliği incelemek
üzere tüm öğrencilerin verilerini analizde kullanmıştır. Elde ettiği sonuçlar ölçme
değişmezliğinin sağlandığını, bir başka deyişle bilgisayar tutumunun kültürler arasında
eşdeğer olduğunu, bu doğrultuda bilgisayar tutumuna dair puanların söz konusu ülkeler için
sıralanabileceğini göstermiştir.
Hansson ve Gustafsson (2013), TIMSS 2003 verilerini kullanarak sosyoekonomik durum
değişkeninin İsveçli ve İsveçli olmayan öğrencilerin oluşturduğu alt gruplarda ölçme
değişmezliğini araştırmışlardır. Okunan kitap sayısı, anne babanın eğitim seviyesi ve okuldan
beklenti içerikli ölçek maddelerinden seçilen 4 adet madde gözlenen değişken olarak, standart
matematik başarı puanı ise sonuç değişkeni olarak belirlendikten sonra yapılan ölçme
değişmezliği analizleri sonucunda, gruplar arası metrik değişmezliğin sağlandığı görülmüştür.
Bu bulgu, sosyoekonomik durum değişkeninin tüm gruplarda aynı anlama geldiği şeklinde
yorumlanabilir.
Segeritz ve Pant (2013), PISA 2013 Almanya verileri ile yürüttükleri çalışmada ülkede
ağırlıklı bulunan göçmen gruplarının (Türk ve eski SSCB kökenli) öğrenci öğrenme
yaklaşımları aracı üzerinden ölçme değişmezliğini araştırmışlardır. OECD öncülüğünde bir
grup tarafından oluşturup geliştirilen bir araç olan öğrenci öğrenme yaklaşımları aracı 9 ölçek
ve 45 maddeden oluşmaktadır. Aracın faktör yapısı incelenerek uygun olmayan maddeler
elendikten sonra yapısal değişmezlik ve metrik değişmezliğin sağlandığı görülmüş, ancak

güçlü faktöriyel değişmezlik şartlarının sağlanamadığı görülmüştür. Ayrıca tüm ölçekler için
metrik değişmezliğin sağlandığını ve bu nedenle birimlerin gruplar arasında karşılaştırılabilir
olduğunu belirtmişlerdir. Araştırmadaki en ilgi çekici sonuç ise göçmen öğrencilerin
akademik başarı açısından yerli öğrencilerin gerisinde olmalarına rağmen, soruları
yanıtlamada daha olumlu bir eğilim göstermeleri olmuştur.
Uyar ve Doğan (2014), araştırmalarında PISA 2009 Türkiye örnekleminde öğrenci anketinde
yer alan öğrenme stratejilerine ilişkin bir modeli cinsiyet, okul türü ve istatistiksel 12 bölge
gruplarına göre incelemiş ve ölçme değişmezliğinin sağlanıp sağlanamadığını belirlemeye
çalışmışlardır. Yaptıkları analizler sonucunda modelin cinsiyet ve okul türleri gruplarında
ölçme değişmezliğinin sağlanamadığını, istatistiksel bölge gruplarında ise tüm değişmezlik
koşullarını yerine getirerek değişmezliğin sağlandığını belirlemişlerdir.
Asil ve Brown (2015), PISA 2009 okuma becerileri testinin dil, kültür ve ekonomik gelişim
düzeylerinde ölçme değişmezliğini test etmişlerdir. Araştırmaya, örneklem büyüklükleri göz
önünde bulundurulduğundan 55 ülke dahil edilmiştir. Avustralya’nın referans olarak seçildiği
çalışmada İngilizce konuşulan yalnızca üç ülkenin Avustralya ile güçlü faktöriyel
değişmezliği olduğu sonucuna ulaşılmıştır. Ayrıca elde edilen verilerden hareketle, eğitimde
sosyo-ekonomik kaynakların ölçme değişmezliğinde önemli bir rol oynadığı ancak dil
faktörünün ve dil eğitimi uygulamalarının etkilerinin daha az olduğu görülmüştür.
Başusta ve Gelbal (2015), PISA 2009 öğrenci anketinde yer alan fen bilgisi ve teknolojileri ile
ilgili maddelere ait faktörleri belirleyerek, bu faktörlerin cinsiyet grupları arasında ölçme
değişmezliğine sahip olup olmadığını inceledikleri çalışmalarında, Türkiye örneklemini ele
almışlardır. Anket verilerinin analizi için yapısal eşitlik modellemesi kullanılmış ve ölçme
modeli aşama aşama test edilmiştir. Analiz sonuçlarından elde edilen uyum indeksleri
karşılaştırılmış ve ölçme değişmezliğinin cinsiyet değişkeni bakımından sağlandığı sonucuna
ulaşılmıştır. Buradan hareketle ölçme modelinin kız ve erkek öğrenci grupları için aynı biçimde ölçme yaptığı söylenebilir.
Kıbrıslıoğlu (2015), PISA 2012 uygulamasında matematik öğrenme alt boyutu anketleri ile
oluşturulan matematik öğrenme modelinin ülke ve cinsiyet grupları arasında ölçme
değişmezliğinin sağlanıp sağlanmadığını belirlemeye çalıştığı araştırmasında Türkiye,
Endonezya ve Çin-Şangay örneklemlerini ele almıştır. Açımlayıcı faktör analizi ile
oluşturduğu matematik öğrenme algısı modelini doğruladıktan sonra, ölçme değişmezliği
analizlerinde çoklu grup doğrulayıcı faktör analizini kullanarak modeli incelemiştir. Elde
edilen araştırma sonuçlarına göre model ülkeler arasında ölçme değişmezliğinin tüm
koşullarını sağlayamamış olup, cinsiyet grupları arasında ise model ölçme değişmezliğini her
aşamada sağlamıştır. Buradan hareketle modele ait ortalama, varyans ve kovaryansların
yalnızca cinsiyet grupları arasında karşılaştırılabilir olduğu sonucuna ulaşmışlardır.
Ayvallı (2016), PISA 2012 uygulamasındaki matematik okuryazarlığı testinin Türkiye’deki
cinsiyet ve bölge grupları arasında ve OECD ülkeleri arasında ölçme değişmezliğinin sağlanıp
sağlanmadığını çoklu grup doğrulayıcı faktör analizi aracılığıyla test etmiştir. Tüm gruplarda
ayrı ayrı doğrulayıcı faktör analizi sağlaması yapıldıktan sonra kovaryans matris eşitliği de
sağlanmış, ardından ölçme değişmezliği testlerine geçilmiştir. Yapılan analizler sonucunda
Türkiye’deki cinsiyet ve bölge grupları arasında ölçme değişmezliğinin sağlandığı, OECD
üyesi ülkeler arasında ise ölçme değişmezliğinin sağlanamadığı görülmüştür.
Karakoç Alatlı (2016), araştırmasında PISA 2012 matematik ve fen okuryazarlık testleri ile
okuma becerileri testlerinden elde edilen puanların uygulamaya katılan Avustralya, ŞangayÇin, Türkiye ve Fransa grupları arasında ölçme değişmezliğinin sağlanıp sağlanamadığını belirlemeyi amaçlamıştır. Dil değişkenine göre incelenen çalışmada Çoklu Grup Doğrulayıcı
Faktör Analizi, Genelleştirilmiş Aşamalı Doğrusal Modelleme, Simulteneous Item Bias Test
ve Madde Tepki Kuramı’na dayalı Olabilirlik Oran gibi farklı teknikler kullanılmıştır.
Araştırma sonuçlarına göre, PISA 2012 matematik ve fen okuryazarlığı testleri ile okuma
becerileri testlerinin belirlenen ülke örneklemleri arasında dil değişkenine göre ölçme
değişmezliğinin sağlanamadığını belirlemiştir. Ayrıca, temel model olan yapısal
değişmezliğinin sağlandığı ancak metrik değişmezlik modelinin sağlanamadığı ortaya
koyulmuştur.

Kıbrıslıoğlu Uysal ve Akın Arıkan (2018), PISA 2006 ve PISA 2015 uygulamalarında ortak
biçimde uygulanmış olan fen öz yeterlilik ölçeğinin Türkiye örnekleminde yıllara ve cinsiyet
gruplarına göre ölçme değişmezliğini sağlayıp sağlamadığını araştırmışlardır. Yıllara ve
cinsiyete bağlı ölçme değişmezliğinin varlığına karar verme aşamasında çoklu-grup
doğrulayıcı faktör analizi kullanılmış ve uyum indeksleri karşılaştırılarak değişmezlik
aşamaları incelenmiştir. Elde edilen bulgulara göre, fen öz yeterlilik ölçeğinin 2006 ve 2015
yıllarında cinsiyet grupları arasında ölçme değişmezliğini her aşamada doğruladığı
belirlenmiştir. Her iki cinsiyet grubunun yıllar arası karşılaştırmasında da toplam grubun
yıllar arası karşılaştırmasında da yapısal değişmezlik ve zayıf faktöriyel değişmezlik kanıtlarıelde edilmiştir.

Şekercioğlu ve Koğar (2018), PISA 2015 uygulamasında matematik ve fen okuryazarlığı ile
okuduğunu anlama becerisi testlerinin yaygın kullanılan yedi adet test dili açısından ölçme
değişmezliğini inceleme ve araştırmaya dahil edilen bilişsel test maddelerine ilişkin değişen
madde fonksiyonlarını incelemeyi amaçlamışlardır. Toplam verinin %59.14’ünü temsil eden
İngilizce, İspanyolca, Arapça, Portekizce, Çince, Almanca ve Fransızca dillerinin ele alındığı
araştırmada, yapılan analizler sonucunda bilişsel testlerin üçü için de en iyi çalışan modelin
güçlü faktöriyel değişmezlik olduğu belirlenmiş ve ölçme değişmezliğinin sağlanamadığı
bulgusu elde edilmiştir.

You may also like...

Bir yanıt yazın