Correlation Doesn't Imply Causation
Korelasyon Nedensellik Demek Değildir
Basit gibi geliyor değil mi? Ama inan bana, bugün hem iş dünyasında, hem medyada, hem de bilimde en çok yapılan hatalardan biri bu.
Peki Bu Neden Önemli?
Çünkü bu hatayı yaptığımızda, yanlış kararlar alıyoruz, yanlış stratejiler oluşturuyoruz ve bazen çok komik ama bazen de çok pahalı sonuçlara ulaşıyoruz!
Kavramı Anlamak
Öncelikle bu iki terimi netleştirelim:
Korelasyon (Correlation)
İki değişkenin birlikte değişme eğilimi.
- Pozitif korelasyon: Biri artarken diğeri de artar
- Negatif korelasyon: Biri artarken diğeri azalır
- İstatistiksel ilişki: Sayılarla ölçülebilir
Önemli: Veri bize "birlikte hareketi" gösterir, sebebi söylemez.
Nedensellik (Causation)
Biri diğerini gerçekten etkiliyorsa, orada neden-sonuç vardır.
- Doğrudan etki: A, B'ye neden olur
- Kanıtlanabilir: Deney ile test edilir
- Mekanizma: Nasıl etkilediği açıklanabilir
Önemli: Sebebi anlamak bizim işimizdir, veri otomatik söylemez.
Klasik Örnek: Dondurma ve Cinayet
Yaz Aylarındaki Garip İlişki
Gözlem:
- Yaz aylarında dondurma satışları artıyor
- Aynı dönemde cinayet oranları da artıyor
Yanlış Sonuç: "Dondurma insanları öldürmeye mi itiyor?" 😂
Gerçek Sebep: İkisinin de ortak bir nedeni var: SICAK HAVA!
Hava ısınınca insanlar dışarı çıkıyor, kalabalık artıyor, sosyal etkileşim artıyor, ve bazı olayların yaşanma olasılığı da artıyor.
Önemli Ders
Görünürde korelasyon var, ama nedensellik tamamen farklı yerde. İki değişken arasında üçüncü bir faktör (confounding variable) gerçek neden olabilir!
Eğlenceli Sahte Korelasyonlar
İnternette "spurious correlations" (sahte korelasyonlar) diye arattığınızda inanılmaz örnekler çıkıyor. İşte bazıları:
Nicolas Cage ve Havuz Kazaları
Amerika'da Nicolas Cage'in oynadığı film sayısı ile havuzda boğulma vakaları arasında %67 korelasyon bulunmuş!
Yanlış Yorum: "Cage film çektikçe insanlar havuza düşüyor! Demek ki tehlikeli aktör!"
Gerçek: Bu tesadüf. İkisinin de ortak noktası sadece zaman. Yıllar ilerledikçe her iki istatistik de aynı yönde hareket etmiş.
Ekşi Krema ve Motosiklet Kazaları
ABD'de yıllık kişi başı ekşi krema tüketimi arttıkça, çarpışma dışı motosiklet kazalarında hayatını kaybedenlerin sayısı da artmış.
Korelasyon katsayısı: 0.916 — neredeyse birebir!
Yanlış Yorum: "Ekşi krema yemek, insanı motosiklet kazasına sürüklüyor!"
Gerçek: Sadece bir spurious correlation. Her iki değişken de zamanla aynı yönde değişmiş ama aralarında gerçek bir neden-sonuç bağı yok.
Deniz Korsanları ve Küresel Isınma
Deniz korsanlarının sayısı azaldıkça küresel ısınma artmış. Bazı internet siteleri bile bunu ciddi ciddi yazmış!
Yanlış Yorum: "Korsanlar dünyayı soğutuyor!"
Gerçek: Korsanlar küresel serinletici değil. 😄 Bu tamamen tesadüfi bir korelasyon.
Daha Fazla Garip Örnek İçin
Tyler Vigen'in hazırladığı Spurious Correlations websitesini ziyaret edin. Gerçekten çok ilginç örnekler var!
https://www.tylervigen.com/spurious-correlationsİlk örneğe bir göz atın: Google'da "Nasıl Bebek Yapılır" diye arayanların sayısı en çok ne ile doğrusal ilişkilidir sizce? 😄
İş Dünyasında Bu Hata
Gerçek Dünyada Büyük Sonuçlar
Bu hata sadece eğlencelik değil, iş dünyasında büyük sonuçlar doğuruyor:
Senaryo 1: Reklam Bütçesi
Bir şirket reklam bütçesini artırıyor ve satışlar da artıyor. Hemen herkes "Reklam işe yaradı!" diyor.
Ama dikkat: Belki aynı dönemde rakip firma iflas etti. Ya da yeni ürün zaten talep patlaması yaratacaktı.
Senaryo 2: Web Trafiği
Bir e-ticaret sitesi "Sitemize gelen trafik arttı, gelirimiz de arttı" diyor.
Ama dikkat: O trafiğin yarısı botlardan geliyorsa? O zaman gelir artışı tamamen farklı bir nedenle olabilir.
Senaryo 3: Sosyal Medya
Şirket sosyal medyada aktif oldu, satışlar arttı. "Sosyal medya stratejisi başarılı!" denildi.
Ama dikkat: Belki o dönemde sezonluk talep artışı vardı veya rakipler stok sıkıntısı yaşıyordu.
Sonuç: Korelasyonu görüp, neden-sonucu yanlış kurarsan, şirket stratejisi boşa gider ve yanlış yatırımlar yapılır!
Bilimde Korelasyon Testi
Bilimsel Yöntem: Deneyler
Bilimde bu sorunu çözmek için kontrollü deneyler kullanılır.
İlaç Denemesi Örneği
- Bir gruba ilaç verilir (deney grubu)
- Diğer gruba plasebo verilir (kontrol grubu)
- Aradaki fark sadece ilaçtır
- Bu yöntem nedenselliği ölçer
Veri Biliminde: A/B Testleri
Aynı mantık veri biliminde de geçerlidir:
- Bir web sitesinde buton rengini değiştirirsiniz
- Bir gruba eski versiyonu gösterirsiniz
- Diğer gruba yeni versiyonu gösterirsiniz
- Eğer tıklanma farkı sadece renk değişiminden geliyorsa, o zaman neden-sonuç ilişkisi vardır
Ama dikkat: Sadece "rengi değiştirdim, satış arttı" diyorsanız, belki o gün maaş günüydü ve herkes alışverişteydi!
Korelasyon Yanılgısının Tarihi Örnekleri
1800'ler: Beyaz Eldiven Vakası
İngiltere'de doktorlar, beyaz eldiven takmanın hastalık yaydığını düşünüyordu. Çünkü eldiven takan doktorlar, ölüm oranı yüksek hastanelerdeydi.
Asıl neden: Eldiven değil, temizlik eksikliğiydi. Eldiven takan doktorlar daha ciddi vakalarda çalışıyordu.
2000'ler: İnternet ve Başarı
2000'lerin başında, internet kullanan öğrencilerin not ortalaması daha yüksek bulundu. Bazı okullar, internet erişimini doğrudan başarıyla ilişkilendirdi.
Asıl fark: Sosyoekonomik durumdu. İnterneti olan ailelerin çocukları zaten daha fazla fırsata sahipti. İnternet değil, fırsat eşitliği fark yaratıyordu.
Korelasyonun Yararlı Yanı
Korelasyon Tamamen İşe Yaramaz Değil!
Aksine, korelasyon mükemmel bir uyarı sistemidir.
- Korelasyon der ki: "Bak burada bir ilişki var"
- Ama "neden"i söylemez
- Biz veri bilimciler, işte o "neden"i bulmaya çalışırız
- Korelasyon sizi kapıya kadar getirir
- Ama anahtarı bulmak sizin işinizdir 🔑
Kullanım Alanları:
- Hipotez oluşturma
- Araştırma yönünü belirleme
- İlişki olabilecek değişkenleri tespit etme
- Daha detaylı analiz için başlangıç noktası
Sonuç: Bir Düşünme Biçimi
"Correlation doesn't imply causation" yalnızca bir istatistik kavramı değil, bir düşünme biçimidir.
Bir şeyi gördüğünde hemen "Bu yüzden bu olmuş!" deme. Bir adım geri at. Veriye tekrar bak. Belki sadece birlikte hareket ediyorlar, ama aslında alakaları yok.
Ve unutma: Her grafik bir hikaye anlatır. Ama o hikayenin doğru kahramanını bulmak bizim işimiz.
- Korelasyon görünce hemen sonuca atlama
- Üçüncü faktörleri düşün (confounding variables)
- Mümkünse kontrollü deneyler yap (A/B test)
- Tarihsel örneklerden ders al
- Sorgulamayı asla bırakma
Veriye güven, ama sorgulamayı da unutma. 😉
🎥 Video İçeriklerimiz için YouTube'dan Takip Edin!
Bu konuları video formatında da açıklıyoruz. Daha fazla veri bilimi ve programlama içeriği için Verinin Mutfağı kanalımızı takip etmeyi unutmayın!
📺 Verinin Mutfağı YouTube Kanalı