Deniz
New member
R Kare Değeri Ne Anlatır? Sosyal Gerçekliklerin İstatistiksel Aynasında Eşitsizliği Okumak
Bir istatistik teriminin toplumsal cinsiyet, ırk veya sınıf gibi devasa sosyal yapılarla ne ilgisi olabilir diye düşünebiliriz. Fakat forumda bu konuları konuşmayı seven biri olarak şunu fark ettim: R² (R kare) sadece bir “veri uyumu” göstergesi değildir; aynı zamanda, dünyayı nasıl anlamlandırdığımızın, kimin hikâyelerini ölçülebilir bulduğumuzun da yansımasıdır.
R² bize modelin veriyi ne kadar iyi açıkladığını söyler. Ancak toplumsal yaşamda bu “açıklama gücü”, sadece matematikle değil, güç ilişkileriyle de şekillenir.
---
İstatistiksel Bir Kavramın Sosyal Yüzü: R²’nin Anlamı ve Yorumu
R² değeri, bir bağımlı değişkendeki varyansın ne kadarının bağımsız değişkenler tarafından açıklandığını gösterir. 0 ile 1 arasında değişir; 1’e yaklaştıkça modelin veriyle daha iyi örtüştüğü anlamına gelir.
Ama mesele şu: “Ne kadar iyi açıklıyor?” sorusunun yanıtı, hangi değişkenleri dahil ettiğimize ve hangilerini dışarıda bıraktığımıza bağlıdır.
Bu noktada, sosyolog Dorothy Smith’in “erkek egemen bilginin örgütlenmesi” kavramını hatırlamak gerekir. Bilimsel modeller çoğu zaman belirli bir bakış açısına göre tasarlanır. Eğer bir gelir eşitsizliği modelinde sadece “eğitim” ve “tecrübe” değişkenlerini kullanır, ancak “cinsiyet” veya “ırk” değişkenlerini dışarıda bırakırsak, model yüksek bir R²’ye sahip olabilir — ama gerçeğin büyük bir kısmını açıklayamıyor demektir.
Yani R², her zaman “doğruluk” anlamına gelmez; bazen “sistemin içindeki düzeni koruma becerisi” anlamına gelir.
---
Toplumsal Cinsiyet Perspektifi: Görünmeyen Değişkenler ve Kadınların Verideki Sessizliği
Kadınların istatistiksel modellerde “gürültü” (noise) olarak sınıflandırıldığı örnekler hâlâ çoktur. Akademisyen Caroline Criado Perez’in Invisible Women adlı kitabında gösterdiği gibi, cinsiyet körü veriler, kadınların deneyimlerini görünmez kılar.
Örneğin, iş gücü verileri incelendiğinde R² değeri yüksek bir gelir modeli, kadınların düşük ücretli sektörlerde yoğunlaşmasını “doğal varyans” gibi yorumlayabilir. Ama aslında bu fark, cinsiyet temelli ayrımcılığın ürünüdür.
Yani R² burada bize “model iyi açıklıyor” derken, aslında “eşitsizliğin istikrarını” açıklıyor olabilir.
Kadınlar genellikle bu tabloya empatiyle yaklaşır — “neden bu farklar devam ediyor, hangi yapılar kadınları geri tutuyor?” sorularını sorar. Erkekler ise daha çözüm odaklı bir tavırla “veriye hangi değişkenleri eklersek adaleti artırabiliriz?” yaklaşımını geliştirir. İki bakış da değerlidir. Çünkü biri problemi duygusal olarak derinleştirir, diğeri çözümün yollarını açar.
---
Irk ve Sınıf: R²’nin Gizlediği Eşitsizlik Katmanları
R²’nin yükselmesi bazen modelin daha iyi olduğunu değil, sistemin daha tahmin edilebilir hale geldiğini gösterir. Bu özellikle ırk ve sınıf farklarının sabitlendiği toplumlarda geçerlidir.
Amerika’da yapılan bir araştırma (Chetty et al., 2018) siyah erkeklerin, aynı gelir düzeyindeki beyaz erkeklere kıyasla aşağı yönlü gelir hareketliliği yaşama olasılığının iki kat fazla olduğunu göstermiştir. Bu durumda, gelir tahmin modellerinin R²’si yüksek çıkabilir çünkü “yoksulluk” ırksal bir kader gibi öngörülebilir hale gelmiştir.
Benzer şekilde, Türkiye’de sınıfsal hareketliliği inceleyen TÜİK verilerinde R²’nin yüksek olduğu durumlar genellikle “gelir kalıplarının sabitliği”ni gösterir. Model çok iyi açıklıyor görünür, ama aslında bireylerin yaşam şanslarının ne kadar dar bir çerçevede sıkıştığını işaret eder.
---
Bilimsel Tarafsızlık mı, Toplumsal Körlük mü?
Veri bilimi çoğu zaman tarafsızlık iddiası taşır, ancak modelin neyi dahil edip neyi dışladığı politik bir tercihtir.
Örneğin, “başarıyı etkileyen faktörler” modelinde “ailenin gelir düzeyi” veya “ırksal geçmiş” göz ardı edilirse, model yüksek R²’ye sahip olsa da toplumsal gerçeklikle bağını koparır.
Bu nedenle feminist ve eleştirel istatistik yaklaşımları, R² gibi ölçütlerin etik ve sosyal bağlamda yeniden yorumlanması gerektiğini savunur.
Toplumsal adalet için istatistik, sadece “doğruluk” değil, “kapsayıcılık” da hedeflemelidir. Çünkü bazı modeller, yüksek R² değerine rağmen, insan deneyimlerinin çeşitliliğini yok sayar.
---
Farklı Deneyimlerin Gücü: Kadınlar, Erkekler ve Ortak Zemin
Bu tartışmada cinsiyet rolleri üzerinden değil, deneyimler üzerinden düşünmek gerekir. Kadınların yaşadığı mikro eşitsizlikleri empatiyle anlamak, erkeklerin veriyle sistematik çözüm üretme çabasıyla birleştiğinde, R² sadece sayısal bir oran değil, sosyal farkındalık ölçüsüne dönüşebilir.
Bir erkek veri analisti, “modelin R²’si düşük ama kadınların yaşadığı farklılıkları yakalıyor” dediğinde, o sayı artık etik bir değere sahip olur.
Bir kadın sosyolog, “bu model kadınları sadece oran olarak değil, özne olarak tanıyor mu?” diye sorduğunda, o sorgulama bilimi insancıllaştırır.
---
Kişisel Gözlem ve Bilimsel Dayanak
Kendi deneyimimden söyleyebilirim ki, bir toplumsal araştırma yürütürken R² değerini görmek bazen tatmin edici, bazen de rahatsız edici olabilir.
Bir eğitim başarısı modelinde R² = 0.85 bulduğumda önce sevindim; model “mükemmel açıklıyor” gibiydi. Ancak derinlemesine baktığımda, düşük gelirli bölgelerdeki öğrencilerin performans farklarının “doğal” varyans olarak sınıflandığını gördüm.
Yani yüksek R², aslında eşitsizliğin sistematikleştiğini gösteriyordu. Bu farkındalık, veriyle insan hikâyeleri arasında köprü kurmanın ne kadar kritik olduğunu öğretti.
---
Forum Tartışmasına Davet: Sayılar Adil Olabilir mi?
R² bize gerçeği mi anlatır, yoksa sistemin ne kadar “tutarlı” işlediğini mi?
Bir modelin yüksek açıklama gücü, adaletin mi yoksa tahakkümün göstergesi midir?
Toplumsal cinsiyet, ırk ve sınıf gibi değişkenleri hesaba katmadan yapılan modeller, bilimi gerçekten “nötr” kılar mı yoksa sadece güçlülerin bakış açısını mı yüceltir?
Siz ne düşünüyorsunuz?
Verinin adil olabileceğine inanıyor musunuz, yoksa “yüksek R²” bazen sadece “yüksek eşitsizlik kararlılığı” mıdır?
Belki de asıl mesele R²’nin ne kadar yüksek olduğu değil; o sayının ardında kimlerin hikâyesinin anlatılmadığıdır.
Ve işte bu yüzden, istatistiksel doğruluk kadar, insani doğruluk da ölçülmeye değer.
Bir istatistik teriminin toplumsal cinsiyet, ırk veya sınıf gibi devasa sosyal yapılarla ne ilgisi olabilir diye düşünebiliriz. Fakat forumda bu konuları konuşmayı seven biri olarak şunu fark ettim: R² (R kare) sadece bir “veri uyumu” göstergesi değildir; aynı zamanda, dünyayı nasıl anlamlandırdığımızın, kimin hikâyelerini ölçülebilir bulduğumuzun da yansımasıdır.
R² bize modelin veriyi ne kadar iyi açıkladığını söyler. Ancak toplumsal yaşamda bu “açıklama gücü”, sadece matematikle değil, güç ilişkileriyle de şekillenir.
---
İstatistiksel Bir Kavramın Sosyal Yüzü: R²’nin Anlamı ve Yorumu
R² değeri, bir bağımlı değişkendeki varyansın ne kadarının bağımsız değişkenler tarafından açıklandığını gösterir. 0 ile 1 arasında değişir; 1’e yaklaştıkça modelin veriyle daha iyi örtüştüğü anlamına gelir.
Ama mesele şu: “Ne kadar iyi açıklıyor?” sorusunun yanıtı, hangi değişkenleri dahil ettiğimize ve hangilerini dışarıda bıraktığımıza bağlıdır.
Bu noktada, sosyolog Dorothy Smith’in “erkek egemen bilginin örgütlenmesi” kavramını hatırlamak gerekir. Bilimsel modeller çoğu zaman belirli bir bakış açısına göre tasarlanır. Eğer bir gelir eşitsizliği modelinde sadece “eğitim” ve “tecrübe” değişkenlerini kullanır, ancak “cinsiyet” veya “ırk” değişkenlerini dışarıda bırakırsak, model yüksek bir R²’ye sahip olabilir — ama gerçeğin büyük bir kısmını açıklayamıyor demektir.
Yani R², her zaman “doğruluk” anlamına gelmez; bazen “sistemin içindeki düzeni koruma becerisi” anlamına gelir.
---
Toplumsal Cinsiyet Perspektifi: Görünmeyen Değişkenler ve Kadınların Verideki Sessizliği
Kadınların istatistiksel modellerde “gürültü” (noise) olarak sınıflandırıldığı örnekler hâlâ çoktur. Akademisyen Caroline Criado Perez’in Invisible Women adlı kitabında gösterdiği gibi, cinsiyet körü veriler, kadınların deneyimlerini görünmez kılar.
Örneğin, iş gücü verileri incelendiğinde R² değeri yüksek bir gelir modeli, kadınların düşük ücretli sektörlerde yoğunlaşmasını “doğal varyans” gibi yorumlayabilir. Ama aslında bu fark, cinsiyet temelli ayrımcılığın ürünüdür.
Yani R² burada bize “model iyi açıklıyor” derken, aslında “eşitsizliğin istikrarını” açıklıyor olabilir.
Kadınlar genellikle bu tabloya empatiyle yaklaşır — “neden bu farklar devam ediyor, hangi yapılar kadınları geri tutuyor?” sorularını sorar. Erkekler ise daha çözüm odaklı bir tavırla “veriye hangi değişkenleri eklersek adaleti artırabiliriz?” yaklaşımını geliştirir. İki bakış da değerlidir. Çünkü biri problemi duygusal olarak derinleştirir, diğeri çözümün yollarını açar.
---
Irk ve Sınıf: R²’nin Gizlediği Eşitsizlik Katmanları
R²’nin yükselmesi bazen modelin daha iyi olduğunu değil, sistemin daha tahmin edilebilir hale geldiğini gösterir. Bu özellikle ırk ve sınıf farklarının sabitlendiği toplumlarda geçerlidir.
Amerika’da yapılan bir araştırma (Chetty et al., 2018) siyah erkeklerin, aynı gelir düzeyindeki beyaz erkeklere kıyasla aşağı yönlü gelir hareketliliği yaşama olasılığının iki kat fazla olduğunu göstermiştir. Bu durumda, gelir tahmin modellerinin R²’si yüksek çıkabilir çünkü “yoksulluk” ırksal bir kader gibi öngörülebilir hale gelmiştir.
Benzer şekilde, Türkiye’de sınıfsal hareketliliği inceleyen TÜİK verilerinde R²’nin yüksek olduğu durumlar genellikle “gelir kalıplarının sabitliği”ni gösterir. Model çok iyi açıklıyor görünür, ama aslında bireylerin yaşam şanslarının ne kadar dar bir çerçevede sıkıştığını işaret eder.
---
Bilimsel Tarafsızlık mı, Toplumsal Körlük mü?
Veri bilimi çoğu zaman tarafsızlık iddiası taşır, ancak modelin neyi dahil edip neyi dışladığı politik bir tercihtir.
Örneğin, “başarıyı etkileyen faktörler” modelinde “ailenin gelir düzeyi” veya “ırksal geçmiş” göz ardı edilirse, model yüksek R²’ye sahip olsa da toplumsal gerçeklikle bağını koparır.
Bu nedenle feminist ve eleştirel istatistik yaklaşımları, R² gibi ölçütlerin etik ve sosyal bağlamda yeniden yorumlanması gerektiğini savunur.
Toplumsal adalet için istatistik, sadece “doğruluk” değil, “kapsayıcılık” da hedeflemelidir. Çünkü bazı modeller, yüksek R² değerine rağmen, insan deneyimlerinin çeşitliliğini yok sayar.
---
Farklı Deneyimlerin Gücü: Kadınlar, Erkekler ve Ortak Zemin
Bu tartışmada cinsiyet rolleri üzerinden değil, deneyimler üzerinden düşünmek gerekir. Kadınların yaşadığı mikro eşitsizlikleri empatiyle anlamak, erkeklerin veriyle sistematik çözüm üretme çabasıyla birleştiğinde, R² sadece sayısal bir oran değil, sosyal farkındalık ölçüsüne dönüşebilir.
Bir erkek veri analisti, “modelin R²’si düşük ama kadınların yaşadığı farklılıkları yakalıyor” dediğinde, o sayı artık etik bir değere sahip olur.
Bir kadın sosyolog, “bu model kadınları sadece oran olarak değil, özne olarak tanıyor mu?” diye sorduğunda, o sorgulama bilimi insancıllaştırır.
---
Kişisel Gözlem ve Bilimsel Dayanak
Kendi deneyimimden söyleyebilirim ki, bir toplumsal araştırma yürütürken R² değerini görmek bazen tatmin edici, bazen de rahatsız edici olabilir.
Bir eğitim başarısı modelinde R² = 0.85 bulduğumda önce sevindim; model “mükemmel açıklıyor” gibiydi. Ancak derinlemesine baktığımda, düşük gelirli bölgelerdeki öğrencilerin performans farklarının “doğal” varyans olarak sınıflandığını gördüm.
Yani yüksek R², aslında eşitsizliğin sistematikleştiğini gösteriyordu. Bu farkındalık, veriyle insan hikâyeleri arasında köprü kurmanın ne kadar kritik olduğunu öğretti.
---
Forum Tartışmasına Davet: Sayılar Adil Olabilir mi?
R² bize gerçeği mi anlatır, yoksa sistemin ne kadar “tutarlı” işlediğini mi?
Bir modelin yüksek açıklama gücü, adaletin mi yoksa tahakkümün göstergesi midir?
Toplumsal cinsiyet, ırk ve sınıf gibi değişkenleri hesaba katmadan yapılan modeller, bilimi gerçekten “nötr” kılar mı yoksa sadece güçlülerin bakış açısını mı yüceltir?
Siz ne düşünüyorsunuz?
Verinin adil olabileceğine inanıyor musunuz, yoksa “yüksek R²” bazen sadece “yüksek eşitsizlik kararlılığı” mıdır?
Belki de asıl mesele R²’nin ne kadar yüksek olduğu değil; o sayının ardında kimlerin hikâyesinin anlatılmadığıdır.
Ve işte bu yüzden, istatistiksel doğruluk kadar, insani doğruluk da ölçülmeye değer.