Varyans, bize verilerin ortalamadan ne kadar uzaklaşabileceği hakkında bilgi verir. Çoğunlukla popülasyon ortalaması ve varyansını bilmeyiz, öğrenmek için ise aşağıda görebileceğiniz t-dağılımı kullanılır. Bu dağılım, normal dağılım ki-kare dağılımının karekökü arasındaki bir orandan oluşan dağılımdır. Grafiği, yine çan eğrisine benzerdir. Detaylı okuma için ileri okumalarda güzel kaynaklar bulabilirsiniz. İstatistik hakkındaki bu teorik arka planı verdikten sonra, gerçek veriler üzerinden gidebiliriz.

Test Sayılarının Analizi

    27 Mart-17 Haziran arası test sayıları şu şekilde:  7533,7641,9982,11535,15422,12496,18757,16160,19664,20065,21400,20023,24900,28578,30864,33170,35720,34456,33070,34090,40427,40270,40520,35344,39703,39429,37535,40962,38351,38308, 30177,20143,29230,43498,42004,41431,36318,24001,35771,33283,30303,30395,  33687,35605,36187,32722,37351,33332,34821,38565,42236,35369,25141,25382,  20838,33633,37507,40178,24589,21492,19853,21043,33559,36155,39230,35600,31525,32325,52305,54234,57829,35846,35335,39361,37225,36521,49190,41013,45092,45176, 42032,46800,52901
    Test sayılarının ortalaması \(\overline{X}=32912\), standart sapması \(S=10534\) olarak hesaplanır.Bu yüksek standart sapma değeri, test sayısını önceden kestirmenin çok zor olduğunu, çünkü her gün test sayısının çok fazla miktarda artıp azaldığını gösteriyor.
Bu nedenle, test sayısının normal dağılıma sahip olup olmadığına bakalım. Bunun için QQPLOT denilen bir test uygulayacağız. MATLAB içerisinde hazır paket olarak gelen "qqplot(T)" komutu, bu testi hemen yapmamızı sağlıyor. Bu testi yapma amacımız, dağılımın normal olup olmadığını öğrenmek.