STATISTIKASTATISTIKASTATISTIKA
MULTIVARIATMULTIVARIATMULTIVARIAT
Irwan, S.Si., M.Si.
Adnan Sauddin, S.Pd., M.Si.
Alauddin University Press
9786023284566
ISBN 602-328-456-6
Irwan, S.Si., M.Si, lahir di Lisu, Kabupaten Barru pada Tahun 1978
bulan September tanggal 22. Menyelesaikan Pendidikan Magister
pada Jurusan Statistika Institut Teknologi Sepuluh November
Surabaya pada tahun 2006, Tahun 2003 menyelesaikan studi pada
Jurusan Pendidikan Matematika Universitas Negeri Makassar.
Selama mengikuti Pendidikan penulis terlibat pada beberapa
organisasi, asisten dosen, tim asisten di Laboratorium Komputer
Matematika.
Sejak tahun 2006, penulis mulai aktif mengajar di Jurusan
Matematika Fakultas Sains dan Teknologi Universitas Islam Negeri
Alauddin Makassar hingga sekarang. Mengikuti berbagai pelatihan
profesional dan juga sebagai trainer-Pelatihan Modul Dasar BTL,
LSE, ICT bagi guru SMT/MTS mitra DBE3 USAID Indonesia-2008-
2009, fasilitator pada workshop pembelajaran PAKEM dan
penggunaan alat peraga matematika bagi guru SD/MI se-
kabupaten Bulukumba. Jabatan Struktural, Ketua Jurusan
Matematika, Sekretaris LPM UIN Alauddin Makassar.
Adnan Sauddin, lahir Teomokole pada Tahun 1974 bulan Mei
tanggal 17. Suatu daerah kepulauan (Pulau Kabaena) di Kabupaten
Bombana. Anak ke-16 dari enam belas bersaudara. Menyelesaikan
Pendidikan Magister pada Jurusan Statistika Institut Teknologi
Sepuluh November Surabaya pada tahun 2007, Tahun 2000
menyelesaikan studi pada Jurusan Pendidikan Matematika Institut
Keguruan dan Ilmu Pendidikan (tahun 1998 berubah menjadi
UNM). Selama mengikuti Pendidikan penulis terlibat pada
beberapa organisasi .
Sejak tahun 2000, penulis mulai aktif mengajar di Lembaga
Pendidikan -STMIK Balikpapan- dan berkesempatan mengikuti
berbagai pelatihan profesional. Pada tahun 2013 penulis hijrah ke
Sulawesi Selatan dan terdaftar sebaik pengajar pada Jurusan
Matematika Fakultas Sains dan Teknologi Universitas Islam Negeri
Alauddin Makassar hingga sekarang.
Alauddin University Press
STATISTIKA MULTIVARIAT
Alauddin University Press
Irwan, S.Si., M.Si. & Adnan Sauddin, S.Pd., M.Si.

STATISTIKA
MULTIVARIAT



Irwan, S.Si., M.Si.
Adnan Sauddin, S.Pd., M.Si.













Alauddin University Press
2021

STATISTIKA MULTIVARIAT
©Penulis
Penulis:
Irwan, S.Si., M.Si.
Adnan Sauddin, S.Pd., M.Si.
Editor:
Khalilah Nurfadilah, S.Si., M.Si.
Penata Letak & Desain Sampul:
AU Press Team
Diterbitkan pertama kali dalam Bahasa Indonesia
oleh Penerbit Alauddin University
Press November 2021 viii + 157 hlm;
15.5 x 23 cm
ISBN 978-602-328-456-6
Hak cipta dilindungi oleh undang-
undang Perpustakaan Nasional;
Katalog Dalam Terbitan (KDT)

Alauddin University Press
Jl. H. M. Yasin Limpo
No. 36, Kab. Gowa,
Sulawesi Selatan

SAMBUTAN REKTOR
UIN ALAUDDIN MAKASSAR








Alhamdulillah wa Syukrulillah atas segala rahmat Allah SWT
beserta salawat dan salam kepada Rasulnya Muhammad SAW,
mengiringi aktivitas keseharian kita dalam menjalankan tugas dan
tanggungjawab akademik dan peran-peran kehidupan lainnya sehari-
hari.
Publikasi karya akademik adalah salah satu ruh perguruan tinggi,
karena perguruan tinggi adalah ruang produksi ide dan gagasan yang
harus selalu diupdate dan diupgrade. Buku adalah salah satu produk
akademik yang kelahirannya, mesti diapresiasi setinggi-tingginya.
Karena dibalik proses lahirnya, ada kerja keras yang menguras waktu,
tenaga dan pikiran. Kerja keras dan upaya sungguh-sungguh untuk
menghadirkan sebuah karya akademik, adalah bukti nyata dedikasi
serta khidmat seorang insan universitas bagi perkembangan ilmu
pengetahuan.
Sebagai kampus yang memiliki visi menjadi pusat pencerahan dan
transformasi ipteks berbasis peradaban Islam, kehadiran buku terbitan
Alauddin University Press ini, diharapkan menjadi sumbangan

iv Ir

berharga bagi desiminasi ilmu pengetahun di lingkungan kampus
peradaban, sekaligus semakin memperkaya bahan bacaan bagi
penguatan integrasi keilmuan.
Buku ini tentu jauh dari kesempurnaan, sehingga kritik dan
masukan dari para pembaca untuk para penulis akan sangat
dinantikan. Karena dengan itu, iklim akademik kampus akan dinamis
dengan tradisi diskursif yang hidup.
Akhirnya, sebagai Rektor, saya mengapresiasi setinggi-tingginya
atas penerbitan buku yang menjadi bagian dari Program Penerbitan
100 buku Referensi UIN Alauddin Makassar tahun 2021 ini. Semoga
membawa kemaslahatan bagi warga kampus dan masyarakat secara
umum.

Gowa, 17 Agustus 2021
Rektor



Prof. H. Hamdan Juhannis, M.A., Ph.D.

v Ir

PENGANTAR PENULIS





Alhamdulillah, segala puji hanya untuk, dari-Nya segala ilmu dan
pengetahuan bersumber, maka kepadanya patut kita bersyukur
terhadap nikmat besar yang telah diberikan kepada makhluk-Nya dari
jenis manusia berupa akal. Saya berlindung kepada Allah Subhanahu
Wata’ala dari kejelakan yang berasal dari diri kami, dan buruknya
amalan. Aku memohon perlindungan kepada Allah ‘Azza Wa Jalla, agar
terhindar dari mengerjakan amalan-amalan buruk. Dan aku memohon
kepada Allah Jalla Wa ‘ala untuk dikokoh dalam aqidah islam yang
lurus dan juga dikokoh dalam ilmu yang bermanfaat.
Buku disusun dimaksudkan untuk memudahkan mahasiswa dalam
referensi tambahan terkait analisis Multivariat. Pembahasan dalam
buku ini memadukan antara penurunan rumus-rumus statistika
multivariate secara matematika dan penggunaan contoh kasus serta
pemanfaatan aplikasi computer menggunakan R programming dalam
menyelesaikan setiap kasus yang disajikan.

Penulis


Adnan Sauddin

vii Ir


DAFTAR ISI





SAMBUTAN REKTOR UIN ALAUDDIN MAKASSAR ............................... III
PENGANTAR PENULIS .......................................................................... V
DAFTAR ISI .......................................................................................... VII
BAB I KONSEP DASAR ANALISIS MULTIVARIAT .................................... 1
1. Data Multivariat ........................................................................... 1
2. Rata-Rata dan Variansi variabel Acak Univariat ........................ 3
3. Kovarinsi dan Korelasi Variabel Acak Bivariate ......................... 4
4. Teknik Grafik ................................................................................ 8
BAB II GEOMETRI SAMPEL DAN SAMPEL ACAK ................................. 11
1. Geometri Sample ...................................................................... 11
2. Sampel Acak, Nilai Ekspektasi Rata-Rata Sampel dan Matriks
Kovarians. ................................................................................. 15
3. Rata-Rata Sampel, Kovariansi, dan Korelasi Dalam Operasi
Matriks....................................................................................... 20
4. Nilai Sampel dari Kombinasi Linear Variabel ......................... 24
Latihan Soal ...................................................................................... 27
BAB III DISTRIBUSI NORMAL MULTIVARIAT ....................................... 29
1. Fungsi Padat Normal Multivariat ............................................. 29
2. Properti Variabel Acak Multivariat Normal .............................. 35

viii Ir

3. Distribusi Sampel Multivariate Normal ................................... 39
4. Menilai Asumsi Normalitas Multivariat ................................... 44
5. Mendeteksi Data Pencilan dan Cleaning Data ....................... 52
6. Transformasi Normalitas .......................................................... 53
Latihan Soal ...................................................................................... 54
BAB IV INFERENSI VEKTOR RATA-RATA ............................................. 57
1. Uji µ Saat ΣDiketahui ........................................................... 57
2. Uji µ saat Σ tidak Diketahui .................................................. 60
3. Hotelling-
2
T dan Uji Likelihood Ratio ...................................... 67
4. Daerah Kepercayaan dan Perbandingan Simultan Komponen
Rata-Rata .................................................................................. 69
5. Inferensi Sample Besar Seputar Vektor Rata-Rata Populasi . 77
6. Inferensi Seputar Vektor Rata-Rata Untuk Data Missing ....... 78
Latihan Soal ...................................................................................... 82
BAB V MEMBANDINGKAN BEBERAPA RATA-RATA MULTIVARIAT ...... 84
1. Perbandingan Berpasangan dan Rancangan Pengukuran
Berulang .................................................................................... 84
2. Membandingkan Vektor Rata-Rata Dua Populasi .................. 98
3. Membandingkan Beberapa Rata-Rata Populasi Multivariat
(Manova-Satu Arah) ................................................................ 109
4. Interval Kepercayaan Simultan untuk Efek Perlakuan ........ 128
5. Uji Kesamaan Matriks Kovariansi ......................................... 131
6. Multivariat Analisis Variansi Dua-Arah .................................. 134
Latihan Soal .................................................................................... 147
DAFTAR PUSTAKA .............................................................................152
INDEKS .............................................................................................154
TENTANG PENULIS ...........................................................................154

1 Ir

BAB I
KONSEP DASAR ANALISIS MULTIVARIAT






1. Data Multivariat
Data multivariate merupakan data hasil pengamatan terhadap 1p≥
variabel sebanyak n kali. Nilai hasil pengamatan dari setiap variabel
disebut item atau unit eksperimen. Untuk menjelaskan struktur data
multivariat, digunakan symbol
ij
x yang menyatakan pengamatan ke-i
dari variabel ke j−, ditulis:
Nilai variabel ke- pada pengamatan ke-
ij
x j i=
Hasilnya, untuk n pengamatan dari p variabel dapat disusun dalam
bentuk:
11 12 1 1
21 21 2 2
1 1
1 1
Var 1 Var 2 Var Var
Item 1
Item 2
Item
Item n
j p
j p
i i ij ip
n n nj np
j p
x x x x
x x x x
i x x x x
x x x x
⋯ ⋯
⋯ ⋯
⋯ ⋯
⋮ ⋮ ⋮ ⋮ ⋮ ⋯ ⋮
⋯ ⋯
⋮ ⋮ ⋮ ⋮ ⋮ ⋯ ⋮
⋯ ⋯

2 Ir

Dimana susunan tersebut dapat disederhanakan dalam bentuk array,
yang disebut matriks X berukuran n p×, lihat persamaan (0.1).
11 12 1 1
21 22 2 2
1 2
1 2
j p
j p
i i ij ip
n n nj np
x x x x
x x x x
x x x x
x x x x
 
 
 
 
 
 
= 
 
 
 
 
 
 
X
⋯ ⋯
⋯ ⋯
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
⋯ ⋯
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
⋯ ⋯
(0.1)
Array X memuat semua data hasil pengamatan dari semua variabel.
Perhatikan matriks yang ditampilkan pada persamaan (0.1), bahwa:
 Jika kita pandang dari barisnya, maka
1 2
, , ,
i i i ip
x x x=x ⋯
 Jika kita pandang dari kolomnya, maka
1 2
, , ,
j j j nj
x x x=x ⋯
w Contoh 1.1.
Pemilihan empat buah nota dari suatu toko dilakukan dalam rangka
untuk meneliti penjualan barang tertentu dari toko tersebut. Setiap
nota yang disediakan, jumlah barang tertentu tersebut yang terjual dan
tujuan dari setiap penjualan. Misalkan variabel pertama adalah total
penjualan (dalam Rupiah) dan variabel kedua adalah jumlah barang
tertentu yang terjual. Total empat pengamatan dilakukan.
Datanya dapat disusun sebagai berikut:
Variabel 1 (jumlah penjualan-dalam rupiah) : 42 52 48 58
Variabel 2 (Jumlah buku terjual) : 4 5 5 3
Dengan menggunakan notasi yang telah diperkenalkan sebelumnya,
maka data tersebut susunannya dalam
11 21 11 11
11 11 11 11
42 52 48 58
4 4 4 3
x x x x
x x x x
= = = =
= = = =

Bentuk array X adalah

3 Ir

2. Rata-Rata dan Variansi variabel Acak Univariat
42 4
52 5
48 4
58 3
 
 
 
 
=
 
 
 
 
 
X

Untuk memudahkan pemahaman terhadap statistika multivariate,
berikut akan diberikan uraian yang berkaitan dengan matriks data X
dari sudut pandang statistika univariat.
Pandang elemen-elemen
11 21 1
, , ,
n
x x x⋯ dari matriks pengamatan X
pada persamaan (0.1), merupakan hasil pengamatan sebanyak n
kali dari variabel pertama. Dari data tersebut kita dapat menghitung
beberapa nilai statistik berikut:
Rata-Rata Sampel
Rumus umum untuk menghitung rata-rata setiap p variabel dengan n
pengamatan adalah jumlah seluruh pengamatan dibagi dengan
banyaknya pengamatan yang telah dilakukan, ditulis

1
1
; 1,2, ,
n
j ij
i
x x j p
n
=
= =∑ ⋯ (0.2)
Variansi Sampel
Variansi sampel yang terkait dengan n pengamatan untuk variabel
pertama adalah keadaan setiap data terhadap rata-rata dan dapat
dihitung dengan rumus sebagai berikut:
( )
2
2
1
1
1
1 1
n
i
s
in x x
=
= −∑
Dimana
1
x merupakan rata-rata sampel dari
1i
x . Dengan demikian,
secara umum variansi untuk p variabel dapat dihitung dengan rumus:
( )
2
2
1
1
; 1,2, ,
n
j
i
s j p
ij jn
x x
=
= = −∑ ⋯ (0.3)

4 Ir

Untuk diketahui,
Pertama, kebanyakan penulis mendefinisikan variansi dengan
pembagin 1n− .
Kedua, notasi
2
s merupakan symbol dari variansi sampel yang dikenal.
Untuk hal tersebut data multivariate yang disusun dalam bentuk
matriks, bahwa diagonalnya,
jj
s ,
( )
2
2
1
1
; 1,2, , p
n
j jj
i
s s j
ij jn x x=−
= = = −∑ ⋯ (0.4)
Kuadrat dari variansi kita peroleh standar deviasi, yaitu:
( )
2
1
1
; 1,2, ,
n
j jj
i
s s j p
ij jn
x x
=
= = = −∑ ⋯ (0.5)
3. Kovarinsi dan Korelasi Variabel Acak Bivariate
Kovariansi Sampel
Perhatikan n pasangan pengamatan dari variabel 1 dan 2 berikut

11 21 1
12 22 2
, , ,
n
n
x x x
x x x
     
     
     
          

1i
x dan
2i
x adalah pasangan pengamatan unit pengamatan ke-i
( )1, 2, ,i n= ⋯ dari pasangan variabel 1 dan variabel 2. Ukuran yang
berkaitan antara variabel 2 dan variabel 1 secara linear menghasilkan
kovariansi sampel
( ) ( )
12 1 1 2 2
1
1
n
i i
i
s x x x x
n
=
= − −∑
Bentuk umum dari kovariansi sampel adalah
( ) ( )
1
1
n
ij ij i ij j
i
s x x x x
n
=
= − −∑ (0.6)

5 Ir

Beberapa kondisi dari nilai-nilai variabel untuk kovariansi sampel,
1. Jika nilai pengamatan dari suatu variabel merupakan nilai yang
besar dan berkaitan dengan variabel lain dengan nilai yang besar
pula, maka nilai kovariansi antara kedua variabel tersebut positif.
Demikian halnya jika kedua variabel yang saling berkaitan memiliki
nilai yang kecil secara bersama-sama, maka
12
s hasilnya adalah
positif atau nilai kovariansinya adalah positif.
2. Jika nilai dari salah satu variabel yang saling berkaitan memiliki
nilai-nilai pengamatan yang besar dan variabel yang lainnya
memiliki nilai pengamatan yang kecil, maka nilia dari
12
s hasilnya
adalah negatif atau nilai kovariansinya adalah negatif.
3. Jika tidak ada kaitannya antara nilai bagi kedua variabel,
12
s,
diperkirakan nilainya akan nol atau nilai korelasinya diperkirakan
bernilai nol.
Korelasi Sampel
Ukuran yang menjelaskan keterkaitan secara linear antara dua
variabel tidak bergantung pada unit pengukuran. Rumusnya dituliskan
sebagai berikut:
( ) ( )
( ) ( )
1
2 2
1 1
n
ij i ij j
ij i
ij
n n
ii jj
i i
x x x x
s
r
s s
ij i ij j
x x x x
=
= =
− −
= =∑
− −∑ ∑
(0.7)
Statistik deskriptif yang telah dijelaskan pada bagian di atas, jika
kesemuanya dihitung dari pengamatan yang dilakukan sebanyak
n
kali pada variabel yang berjumlah p dapat disusun dalam bentuk
array.
Perhatikan matrik pengamatan pada persamaan (0.1) dapat disusun
ulang dalam bentuk vektor dari variabel p sebagai berikut

6 Ir

11 12 1 1 1 1
21 22 2 2 2 2
1 2
1 2
atau
j p
j pi i ij ip j j
n n nj np p p
x x x x
x x x x
x x x x
x x x x
      ′ ′
     
      ′ ′
     
     
     
= =     
′ ′
     
     
     
     
′ ′     
     
x y
x y
X
x y
x y
⋯ ⋯
⋯ ⋯
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
⋯ ⋯
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
⋯ ⋯
(0.8)
Sehingga nilai statistik deskriptifnya dapat dituliskan sebagai berikut
1. Rata-rata sampel

1
2
j
p
 ′
 
 ′
 
 
 
= 

 
 
 
 
′ 
 
x
x
x
x
x


(0.9)
2. Variansi – Kovariansi sampel

11 12 1
21 22 2
1 2
p
p
n
p p pp
s s s
s s s
s s s
 
 
 
 
=
 
 
 
 
 
S


⋮ ⋮ ⋱ ⋮

(0.10)
3. Korelasi Sampel

12 1
21 2
1 2
1
1
1
p
p
p p
r r
r r
r r
 
 
 
 
=
 
 
 
 
 
R


⋮ ⋮ ⋱ ⋮

(0.11)
Untuk korelasi sampel, r , memenuhi keadaan berikut:
1. Nilai r berkisar antara 1 dan -1

7 Ir

2. r merupakan ukuran yang menyatakan kekuatan asosiasi linear,
maka;
a) Jika 0r= , hal ini menyatakan tidak ada hubungan antara
setiap komponen
b) Jika 1r< , hubungan negative
c) Jika 1r> , hubungan positif
3.
ij
r tidak mengalami perubahan jika pengukuran dari variabel ke-i
diubah ke
ij ij
y ax b= + , dan nilai dari variabel ke-j diubah ke
ij ij
y cx d= + , dimana tanda dari a, c bertanda sama.
w Contoh 1.2
Perhatikan data yang diberikan pada contoh 1.1, setiap invoice
menghasilkan empat pasangan, total penjualan (dalam rupiah), dan
jumlah buku terjual. Tentukan array dari , ,x s R.
w Solusi 1.2.
Karena ada empat invoice, maka terdapat empat pengamatan
(pengukuran) pada setiap variabel. Dengan demikian
Rata-rata sampelnya adalah

( )
( )
4
1 1
1
4
2 2
1
1
2
1 1
42 52 48 58 50
4 4
1 1
4 5 4 3 4
4 4
50
4
i
i
i
i
x x
x x
x
x
=
=
= = + + + =
= = + + + =
   
   
= =
   
      


x

Variansi dan kovariansi sampelnya adalah ( )
( ) ( )
( )( )
4
2
11
1
2 2
2 2
1
1 14
1
34
4
42 50 52 50
48 50 58 50
i
s
i x x
=
=
 
  + +
 
= = 
 
+ 
 
−∑
− −
− −

8 Ir


( )
( ) ( ) ( ) ( )
2 2 2 2
2 2
22
4
2
1
4
1
1
0.5
4 4 5 4 4 4 3 4
4
i
i
s x x
+ + +
=
= −
 
= = − − − −
 


( )( )
( )( ) ( )( )
( )( ) ( )( )
4
12
1
1
1 1 2 24
42 50 4 4 52 50 5 41
1.5
48 50 4 4 58 50 3 44
i
s
i i x x x x
=
=
 − − + − − +
 
= = −
 
− − + − −
  
− −∑

12 21
S S=

dan

34 1.5
1.5 0.5
 −
 
=
 

  
s

Korelasi sampelnya adalah

12
12
11 22
1.5
34 0.5
s
r
s s

= =

12 21
r r=

atau

1 0.36
0.36 1
  −
 
=
 

  
R

a
4. Teknik Grafik
Memetakan data hasil pengamatan pada koordinat kartesis 2-D
diistilahkan dengan kata “Plot”. Plot dari suatu pengamatan
merupakan hal yang penting sebagai analisis permulaan yang
sebaiknya dilakukan untuk melihat pola penyebaran dari sekumpulan
data hasil pengamatan pada sejumlah variabel, namun metode
tersebut banyak dilupakan. Meskipun tidak mungkin u ntuk

9 Ir

menggambarkan keseluruhan dari semua pengukuran yang dilakukan
terhadap variabel, plot untuk individual variabel dan variabel
berpasangan masih sangat berguna dan dapat memberikan banyak
informasi.
Untuk melihat pola asosiasi dari sekumpulan data dari hasil
pengukuran merupakan cara yang sangat bagus. Perhatikan pasangan
hasil pengukuran dari dua variabel berikut:
Variabel
1
x 3 4 2 6 8 2 5
Variabel
2
x 5 5.5 4 7 10 5 7.5
Data tersebut dapat diplot dalam dua dimensi (setiap sumbu mewakili
variabel). Plot yang dihasilkan dalam dua dimensi dikenal dengan
diagram pencar atau scatter plot.

Gambar 1. Scatter plot variable
1
x dan
2
x
8765432
10
9
8
7
6
5
4
x1
x2
Scatterplot of x2 vs x1

11 Ir
BAB II
GEOMETRI SAMPEL DAN SAMPEL ACAK






1. Geometri Sample
Suatu pengamatan multivariate adalah kumpulan hasil pengamatan
pada p variabel yang berbeda yang diambil pada item yang sama.
Sebagaimana yang ditampilkan pada bab 1, jika n pengamatan telah
dilakukan, maka seluruh data yang diperoleh dapat disusun dalam
bentuk matriks berukuran n p× sebagai berikut:

( )
11 12 1
21 22 2
1 2
p
p
n p
n n np
x x x
x x x
x x x
×
 
 
 
 
=
 
 
 
 
 
X


⋮ ⋮ ⋱ ⋮

(0.12)
Setiap baris dari matriks X menggambarkan pengamatan multivariate
(multi variabel). Karena keseluruhan pengukuran kebanyakannya
merupakan realitas dari sesuatu, maka hasil pengamatan tersebut
dinyatakan sebagai data sampel berukuran n dari suatu “populasi”
p− variasi (p variabel).
Terdapat dua cara memandang susunan data matriks X, Pertama;
dengan memandang baris-baris dari matriks X yang merupakan
representasi dari n titik dalam ruang dimensi-p, dituliskan sebagai
berikut

12 Ir

( )
( )
( )
11 12 1 1
21 22 2 1
1 2
Pengamatan 1
Pengamatan
p
p
n p
n n np n
x x x ke
x x x
x x x ke n
×
    ′← −
   
    ′
   
= =
   
   
   
′← −   
   
x
x
X
x


⋮ ⋮ ⋱ ⋮ ⋮

(0.13)
Vektor baris
i
′xmerepresentasikan pengamatan ke-i, yang memuat
koordinat dari titik pengamatan, memuat titik-titik koordinat.
w Contoh 3.1 (Menghitung Rata-rata Vektor)
Menghitung vektor rata-rata x dari matriks data
4 1
1 3
3 5
 
 
 
= −
 
 
 
 
X
Plot data 3n= dalam ruang dimensi-p=2, dan tempatkan x pada
diagram tersebut.
Titik pertama,
1
,x mempunyai koordinat
1
4,1 ′=
 
x , dengan cara yang
sama untuk kedua titik-titik yang lain, yaitu
2
1.3 ′= −
 
x dan
3
3, 5 ′=
 
x
. Hasilnya
4 1 3
2
3
1 3 5 3
3
 − +
   
   
= =   
+ +    
 
 
x
a

13 Ir

Gambar 2. Plot data matriks X untuk 3n= pada 2p=
Kedua, dengan memandang data sebagai vektor-p dalam ruang
dimensi-n, yaitu dengan mengambil elemen-elemen kolom dari
matriks data menjadi vektor koordinat. Misalkan

( )
11 21 1
21 22 2
1 2
1 2 p
p
p
n p
n n np
x x x
x x x
x x x
×
 
 
 
   = =
   
 
 
 
 
X y y y



⋮ ⋮ ⋱ ⋮

(0.14)
Koordinat dari titik pertama
1 11 21 1
, ,
n
x x x ′=
 
y ⋯ merupakan n
pengukuran pada variabel pertama. Secara umum titik ke-i,
1 2
[x , , , ]
i i i ni
x x′=y ⋯ ditentuk dengan n-pasangan dari semua
pengukuran pada variabel ke-i. Secara geometri, menggambarkan
1 2
, , ,
p
y y y⋯ sebagai vektor lebih sesuai dari pada titik, seperti diagram
pencar dalam dimensi-p
w Contoh 3.2 (Menampilkan data sebagai vektor p dalam
dimensi n )
Plot data berikut sebagai vektor 2p= dalam ruang 3n= :
Perhatikan matriks X berikut

14 Ir
4 1
1 3
3 5
 
 
 
= −
 
 
 
 
X
Dari data tersebut,
1
4, 1, 3 ′= −
 
y dan
2
1, 3, 5 ′=
 
y , gambar vektor dari
keduanya ditampilkan dalam gambar berikut

Gambar 3. Plot data matriks X untuk 3n= pada 2p=
Hal yang tidak begitu menguntungkan dalam menampilkan matriks
data secara geometri adalah keterbatasan dimensi yang dapat
ditampilkan, yaitu terbatas pada tiga dimensi. Sementara itu, pada
kenyataannya hampir semua pengamatan dari kejadian real selalu
mengikutkan lebih dari 3 variabel atau 3n>.
Selanjutnya, bahwa memungkinkan bagi kita untuk memberikan
interpretasi secara geometri dari proses mendapatkan rata-rata
sampel. Hal tersebut dapat dilakukan dengan:
 Definisikan terlebih dahulu vektor 1,1, ,1
n
 ′=
 
1 ⋯ berukuran 1n×.
Dimana Vektor 1 tersebut membentuk sudut yang sama terhadap
setiap dari n sumbu koordinat,
 Perkalikan vektor 1 tersebut dengan 1 /n, yaitu ( )1 /n1.
 Karena vektor 1 membentuk sudut yang sama terhadap setiap
dari n sumbu koordinat, sehingga vektor ( )1 /n1 mempunyai
panjang sama dengan 1 dalam arah sudut yang sama.

15 Ir
Perhatikan vektor
1 2
[x , , , ]
i i i ni
x x′=y ⋯ , proyeksi
i
′y pada vektor unit
( )1 /n1 adalah
1 21 1
i i ni
i i
x x x
x
nn n
  + + +
′  = =   
y 1 1 1

(0.15)
Merupakan rata-rata sampel
1 2
1
1
i i ni
i
x x x
x n n
 + + +
′= =   
y 1


Berkaitan dengan perkalian vektor 1 diperlukan untuk memberikan
proyeksi dari
i
ypada garis ditentukan oleh vektor 1.
2. Sampel Acak, Nilai Ekspektasi Rata-Rata Sampel dan Matriks
Kovarians.
Dalam rangka mempelajari variabilitas statistik seperti x dan
n
S
dengan tujuan membuat inferensi, kita perlu memuat asumsi seputar
variabel teramati yang nilainya disusun dalam bentuk matriks .X
Sebelum data dikumpulkan tak satupun nilai yang kita ketahui tentang
suatu keadaan. Andaikan kita merencanakan akan melakukan
pengamatan terhadap p variabel sebanyak n pengamatan, sebelumn
melakukan pengamatan atau pengukuran, tak satupun nilai statistic
ataupun parameter yang kita ketahui, secara umum dalam masalah
tersebut kita harus melakukan prediksi secara tepat. Akibatnya, data
yang kita kumpulkan harus benar-benar diperoleh secara adil,
biasanya kita kenal dengan dikumpulkan dengan cara acak atau
random-yaitu-sehingga setiap variabel yang kita ukur atau diamati kita
sebut dengan Variabel Acak.
Setiap kumpulan pengamatan atau pengukuran
j
X pada p variabel
merupakan vektor acak, yaitu elemen ke-,i j dalam matriks data
merupakan variabel acak
ij
X, dituliskan sampel acak sebagai berikut

16 Ir

( )
11 21 1 1
21 22 2 2
1 2
p
p
n p
n n np n
x x x
x x x
x x x
×
    ′
   
    ′
   
= =
   
   
   

   
   
x
x
X
x


⋮ ⋮ ⋱ ⋮ ⋮

(0.16)
Jika vektor baris
1 2
, ,
n
′ ′ ′x x x⋯ pada persamaan (0.16) mengambarkan
pengamatan independen dari distribusi gabungan umum dengan
fungsi padat ()( )
1 2
, , ,
p
f f x x x=x ⋯ , maka
1 2
, , ,
n
x x x⋯ disebut sampel
acak dari ()fx. Secara matematika,
1 2
, , ,
n
x x x⋯ merupakan sampel
acak jika fungsi padat gabungannya diberikan oleh hasil kali
()()()
1 2 n
f f fx x x ⋯ , dimana ()( )
1 2
, , ,
i i i ip
f f x x x=x ⋯ merupakan
fungsi padat untuk vektor baris ke-j.
Ada dua hal penting yang berkaitan dengan definisi variabel acak
1. Pengukuran p variabel dalam satu percobaan, seperti
1 2
, , ,
i i i ip
x x x ′=
 
x ⋯ biasanya akan saling berkorelasi. Dalam
keadaan yang berbeda, pengukuran dari beberapa percobaan
yang berbeda, akan independen
2. Sifat independen dari pengukuran dari pengukuran ke
pengukuran mungkin tidak terpenuhi ketika variabel sama
sepanjang waktu.
Teorema 3.1.
Misalkan
1 2
, , ,
n
x x x⋯ merupakan sampel acak dari suatu distribusi
gabungan yang mempunyai vektor rata-rata µ dan matriks kovariansi
Σ. Maka x merupakan estimator tak bias dari µ, dan matriks
kovariansinya adalah
1
n
Σ
Yaitu,
1. ()E =X µ (0.17)

17 Ir
2. ( )
1
cov
n
=ΣX (0.18)
Untuk matriks kovariansi
n
S
( )
( )1 1
n
n
E
n n

= −S Σ = Σ Σ
selanjutnya
3.
1
n
n
E
n
 

 =   −
S Σ (0.19)
Sehingga ( )1
n
n n
 

  
S merupakan estimator tak bias dari Σ, dengan
( ) ( )
1
.
n
bias E
n
 

= − = −   
S Σ Σ
Bukti. Theorem 3.1
1. Ekspektasi parameter rata-rata.
Perhatikan bahwa,
 jika kita pandang matriks X pada persamaan (0.12) sebagai
kumpulan variabel dengan n pengamatan (pandang dari
barisnya), maka
1 2 n
n
+ + +
=
X X X
X


 jika kita pandang matriks X pada persamaan (0.12) sebagai
kumpulan pengamatan dari p variabel (pandang dari kolom ),
maka
1 2 p
p
+ + +
=
X X X
X


Dimana kedua hal tersebut tidak akan memberikan hasil yang
berbeda dari nilai rata-ratanya, yaitu jumlah total pengamatan dari
p variabel yang diamati sebanyak n pengamatan pada setiap
varibelnya adalah n x p.
Dengan demikian bentuk berikut berlaku

18 Ir

( )
( ) ( ) ( )
1 2
1 2
1 2
1 1 1
1 1 1
1 1 1
n n
n
E E
n n n
E E E
n n n
E E E
n n n
 

= + + +    
     
    
= + + +               
= + + +
X x x x
x x x
x x x




1 2
1 1 1
n
n n n
= + + +
=
⋯µ µ µ
µ

2. Estimasi parameter kovariansi,

( ) ( ) ( ) ( )
( ) ( )
1 1
2
1 1
1 1
1
n n
i j
i j
n n
i j
i j
n n
n
= =
= =
′  
  ′   − − = − −           

= − −
∑ ∑
∑∑X X x x
x x
µ µ µ µ
µ µ

Sehingga

( ) ( ) ( ) ( ) ( )
2
1 1
1
cov
n n
i j
E E
n
= =
 
′ ′ = − − = − −    
∑∑X X X X Xµ µ µ µ

Untuk i j≠, setiap elemen dalam ( )( )E

− −X Xµ µ adalah sama
dengan nol karena elemen-elemen tersebut merupakan kovariansi
antara komponen
i
X dan komponen
j
X, dimana kedua adalah
independen.
Oleh karena itu,
( ) ( ) ( )
2
1 1
1
cov
n n
i j
E
n
= =
 
 ′= − −    
∑∑X X X µ µ

19 Ir
Akibatnya ( )( )
i i
E

= − −X XΣ µ µ merupakan matriks kovariansi
populasi umum untuk setiap
i
X, diperoleh
( ) ( )( )
( )
( )
2
1
2
2
1
cov
1
1 1
n
i i
i
E
n
n
n
n
n
=
  ′= − −   
= + +
 

= =   
∑X X X
Σ + Σ Σ
Σ Σ

µ µ

3. Ekspektasi dari
n
S,
Untuk memperoleh nilai estimasi dari
n
S, Pertama perhatikan
bahwa ( )( )
ij i ji j
x x x x− − merupakan elemen ke-(),i j dari
( )( )
i j

− −X x X x ,

( ) ( ) ( )
1 1
1 1 1 1
1
1
1
2
n n
i i i i i i
i i
n n n n
i i i i
i i i i
n
i i
i
n
i i
i
n
i i
i
n n n
n n
n
= =
= = = =
=
=
=

′ ′ ′ ′− − = − − +
′ ′ ′ ′= − − +
′ ′ ′ ′= − − +
′ ′ ′= − +
′ ′= −
∑ ∑
∑ ∑ ∑ ∑



X X X X X X X X XX XX
X X X X XX XX
X X XX XX XX
X X XX XX
X X XX

Dari hasil tersebut, nilai ekspektasinya adalah

( ) ( )
1 1
n n
i i i i
i i
E n E nE
= =
 

 ′ ′ ′ ′− = −    
∑ ∑X X XX X X XX

20 Ir
Untuk sembarang vektor acak V dengan ()E =
v
V µ dan
()cov =
v
V Σ, demikian halnya ()E ′ ′= +
v v v
VV Σ µ µ, akibatnya
( )
i i
E ′ ′=X X Σ +µµ

dan
( )
1
E
n
′ ′=XX Σ +µµ
Dengan
( )
( )
1
n
i i
i
E nE
=
′ ′−∑ X X XX , diperoleh
( ) ( )
( )
1
1
1
n
i i
i
E nE n n
n
n
=
 
′ ′ ′ ′− =     
= −
∑X X XX Σ + Σ +
Σ
µµ − µµ

Dan selanjutnya, karena ( )
1
1
n
n i i
i
n n
=
 

 ′ ′= −    
∑S X X XX , maka

( )
( )
( )
( )
( )
1
1
1
1
1
1
1
n
n i i
i
n
i i
i
n
E E n n
E n
n
n
n
n
E
n
=
=
  
 
  ′ ′= −        
 

 ′ ′= −     
= −

=

∑S X X XX
X X XX
S
Σ
Σ

w
3. Rata-Rata Sampel, Kovariansi, dan Korelasi Dalam Operasi Matriks
Pada bagian sebelumnya kita telah dijelaskan bagaim ana
menampilkan data matriks X dengan menggunakan grafik dan telah
kita menghitung statistic deskriptif dari x dan S. Sebagai tambaha,
dan hal ini lebih memudahkan dalam proses komputasi, yaitu kita

21 Ir
dapat menghitung berbagai nilai statistic, x dan S secara langsung
padaX demgan menggunakan operasi matriks.
Perhatikan data matriks yang dijelaskan pada bab 1, dari data tersebut
kita punya
1 2
.1 .1 .1 1
i i ni
i i
x x x
x
n n
+ + +
′= = y 1

, dengan demikian

1
1 11 12 1
2
2 21 22 2
1 2
1
11
1
n
n
p p n pn
p
nx x x x
x x x x
n
n
x x x x
n
 ′
 
      
      
′      
      
= = =      
      
      
      ′      
 
 
y 1
y 1
x
y 1


⋮ ⋮ ⋮ ⋱ ⋮ ⋮



atau

1
n
′=x X 1
(0.20)
Yaitu, x dihitung dari transpose data matriks dengan mengalikannya
dengan vektor 1 dan mengalikan haislnya dengan 1n.
Selanjutnya kita buat matriks rata-rata berukuran n p× dengan
mentranspos persamaan (0.20) dan mengalikannya dengan vektor 1
dari sisi sebelah kiri; yaitu

1
1
1
1
n
n
n
′=
′ 
′ ′=    
′=
x X 1
x 1 X 1
11 X

22 Ir

1 2
1 2
1 2
1
p
p
p
x x x
x x x
x x x
 
 
 
 
′=
 
 
 
 
 
x


⋮ ⋮ ⋱ ⋮

(0.21)
Lalu perkurangan persamaan (0.21) dari matriks data X menghasilkan
matriks simpangan (residual) berukuran n p×

11 1 12 2 1
21 1 22 2 2
1 1 2 2
1
p p
p p
n n np p
x x x x x x
x x x x x x
n
x x x x x x
 − − −
 
 
− − −
 
′− =
 
 
 
− − − 
 
X 11 X
w


⋮ ⋮ ⋱ ⋮

(0.22)
Sekarang, matriks
( )1n−S merupakan jumlah kuadrat dari hasil kali
transpose dari persamaan (0.22) dengan matriks dirinya sendiri, yaitu

( )
11 1 12 2 1
21 1 22 2 2
1 1 2 2
11 1 12 2 1
21 1 22 2 2
1 1 2 2
1
1 1
p p
p p
n n np p
p p
p p
n n np p
x x x x x x
x x x x x x
n
x x x x x x
x x x x x x
x x x x x x
x x x x x x
n n
 − − −
 
 
− − −
 
− =
 
 
 
− − − 
 
 − − −
 
 
− − −
 
×
 
 
 
− − − 
 
′  
  ′ ′= −  −      
S
X 11 X X 11 X
w


⋮ ⋮ ⋱ ⋮

w


⋮ ⋮ ⋱ ⋮

( )
2
2
1 1 1
1 1 1
11
1 1
1
n n n
n n n
n n



  
 
′ ′ ′ ′ ′ ′ ′= − − −    
 
′ ′ ′ ′ ′= − − −    
 
′ ′= −     −
X X X 11 X X 1 1X X 1 111 X
X I 11 11 11 X
S X I 11 X

Setelah menghitung
S, dari hasil tersebut kita dapat menghitung
secara langsung dari matriks korelasi sampel. R.

23 Ir
Definisikan matriks standar deviasi sampel
1
2D, lalu hitung inversnya,
()
1 1
2 2
1−

=D D . Misalkan
( )
1
2
11
22
0 0
0 0
0 0
p p
pp
s
s
s
×
 
 
 
 
= 
 
 
 
  
D


⋮ ⋮ ⋱ ⋮

(0.23)
Kemudian
( )
1
2
11
22
1
0 0
s
1
0 0
s
1
0 0
s
p p
pp

×
 
 
 
 
 
 
 
=
 
 
 
 
 
 
 
 
D


⋮ ⋮ ⋱ ⋮


karena

11 12 1
21 22 2
1 2
p
p
p p pp
s s s
s s s
s s s
 
 
 
 
=
 
 
 
 
 
S


⋮ ⋮ ⋱ ⋮


Dan
111 12
11 11 11 22
11 12 1
221 22
21 22 2
22 11 22 22 22
1 2
1 2
11 22
p
pp
p
p
p
pp
p p pp
p p pp
pp pp pp pp
ss s
s s s s s s
r r r
r r r
s s s s s s
r r r
s s s
s s s s
σσ σ
σ σ
 
 
 
 
  
  
  
  = =
  
  
  
   
 
 
 
 
R


⋯ ⋯
⋮ ⋮ ⋱ ⋮
⋮ ⋮ ⋱ ⋮



Kita punya

24 Ir

1 1
2 2
− −
=R D SD (0.24)
Kalikan kedua ruas dari persamaan (0.24) dengan
1
2D, dan perhatikan
bahwa
1 1 1 1
2 2 2 2
− −= =D D D D I , sehingga
Dari persamaan (0.24), diperoleh

1 1
2 2=S D RD (0.25)
4. Nilai Sampel dari Kombinasi Linear Variabel
Kombinasi linear telah diperkenal pada bab 2. Dalam produser
multivariabel, bentuk kombinasi linear umum kita tuliskan

1 1 2 2
p p
c c c′= + + +c X x x x ⋯
Yang nilai pengamatannya pada percobaan kei adalah
1 1 2 2
, 1, 2, ,
i i i p ip
c x c x c c i n′= + + =c x ⋯ ⋯ (0.26)
Dari n pengamatan pada persamaan (0.26) kita dapat menghitung
Rata-rata sample
( )
1 2
1
n
n
′ ′= + +c x c x x x
w

(0.27)
Karena
( ) ( )( ) ( )( )
2 2
i i i i

′ ′ ′ ′− = − = − −c x c x c x x c x x x x c
w
, maka
kita dapat menghitung variansi sample

( )( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
2 2 2
1 2 2
1 1
1 1
var Sampel
1
1
1
n n
n n
n
n
n
′ ′ ′ ′ ′ ′− + − + + −
=

′ ′
′ ′− − + + − −
=

 ′ ′
′− − + + − − 
  
=

c x c x c x c x c x c x
c x x x x c c x x x x c
c x x x x x x x x c




Atau

25 Ir
a. Variansi sampel
′c Sc (0.28)
Selanjutnya, perhatikan kombinasi linear kedua

1 1 2 2
p p
b b b′= + +b X x x x ⋯
Yang nilai pengamatannya pada percobaan ke-j adalah
1 1 2 2i i i p ip
b x b x b x′= + + +b x ⋯ (0.29)
Dengan mengikuti persamaan (0.27) dan (0.28) bahwa rata-rata
sampel dan variansi sampel dari hasil pengamatan adalah

Rata-Rata Sampel dari
Variansi Sampel dari
′ ′=
′ ′=
b X b x
b X b Sb

Dari data hasil pengamatan tersebut juga dapat dihitung kovariansi,
yaitu
d a n ′ ′ ′ =b X c X b S c (0.30)
Teorema 3.2.
Kombinasi linear

1 1 2 2
1 1 2 2
p p
p p
b b b
c c c
′= + + +
′= + + +
b X x x x
c X x x x



Mempunyai rata-rata sampel. variansi sampel, dan kovariansi sampel
yang berkaitan dengan x dan S secara berturut sebagai berikut
dan
′ ′=
′ ′=
′ ′=
′ ′=
′ ′ ′ =
b X b x
c X c x
b X b Sb
c X c Sc
b X c X b Sc
w
(0.31)
Contoh 3.2 (Rata-Rata dan Kovariansi untuk Kombinasi Linear)
Perhatikan dua kombinasi linear dan nilai yang diturunkan untuk
jumlah pengamatan 3n=,

26 Ir

11 12 13
21 22 23
31 32 33
1 2 5
4 1 6
4 0 4
x x x
x x x
x x x
   
   
   
= =
   
   
   
   
X
Perhatikan dua kombinasi linear

1
2 1 2 3
3
2 2 1 2 2
X
X X X X
X
 
 
  ′= − = + −
    
 
 
 
b X
Dan
1
2 1 2 3
3
1 1 3 1 1 3
X
X X X X
X
 
 
  ′= − = − +
    
 
 
 
c X
Rata-rata, variansi dan kovariansi dapat dihitung secara langsung.
Pengamatan pada kedua kombinasi linear tersebut diperoleh dengan
menggantikan
1
X,
2
X, dan
3
X dengan nilai-nilai pengamatannya.
Sebagai contoh, pengamatan 3n= pada ′b X adalah

()()()
( ) ( ) ( )
()()()
1 11 12 13
2 11 12 13
3 11 12 13
2 2 2 1 2 2 1 5 1
2 2 2 4 2 1 1 6 4
2 2 2 4 2 0 1 4 4
x x x
x x x
x x x
′= + − = + − =
′= + − = + − =
′= + − = + − =
b x
b x
b x

Rata-rata sample, variansi secara dari kombinasi linear tersebut
secara berturut-turut adalah

( )
( ) ( ) ( )
2 2 2
1 4 4
3
3
1 3 4 3 4 3
3
3 1
+ +
′= =
− + − + −
′= =

b x
b xb
w

Dengan cara yang sama,
3n= pengamatan pada ′c X adalah

27 Ir
()()()
( ) ( ) ( )
()()()
1 11 12 13
2 11 12 13
3 11 12 13
3 1 1 1 2 3 5 14
3 1 4 1 1 3 6 21
3 1 4 1 0 3 4 16
x x x
x x x
x x x= − + = − + =
′= − + = − + =
′= − + = − + =
cx
c x
c x

Dan
( )
( ) ( ) ( )
2 2 2
14 21 16
17
3
14 17 21 17 16 17
13
3 1
+ +
′= =
− + − + −
′= =

b x
b xb
w

Dan kovariansi sampel adalah
( )( )( )( )( )( )1 3 14 7 4 3 21 17 4 3 16 17 9
3 1 2
− − + − − + − −
= =


a
Kombinasi linear dapat dituliskan dalam bentuk umum, yaitu
1
11 1 12 2 1 11 12 1 1
21 1 22 2 2 21 22 2 2
1 2 1 2
p p p
p p p
q x q p qp p q q qp p
a x a x a x a a a
a x a x a x a a a
a a x a x a a a
     
     
     
     
= =
     
     
     
     
    
x
x
AX
x
⋯ ⋯
⋯ ⋯
⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮
⋯ ⋯
(0.32)
Teorem 3.3.
q kombinasi linear AX dalam persamaan (0.32) mempunyai vektor
rata-rata Ax dan matriks kovarinsi sampel, ′A S A.
Latihan Soal
1. Diberikan matriks

9 1
5 3
1 2
 
 
 
=
 
 
 
 
X

28 Ir
Gambar diagram pencar dalam dimensi-2. Tempat rata-rata
sampel pada diagram pencar
Gambarkan data dalam dimensi-3, dan plot vektor deviasi

1 1
x−y 1 dan
2 2
x−y 1

29 Ir
BAB III
DISTRIBUSI NORMAL MULTIVARIAT




1. Fungsi Padat Normal Multivariat
Kebanyakan uji univarit dan interval kepercayaan didasarkan pada
distribusi normal univariat. Dengan cara yang sama, mayoritas
prosedur multivariate mempunyai distribusi normal multivariate. Untuk
memudahkan pemahaman konsep-konsep fungsi padat peluang
multivariate, pembahasan dilakukan dari pendekatan univariat.
Padat Normal Univariat
Fungsi padat normal multivariate merupakan bentuk umum dari padat
normal univariat untuk dimensi 2 .p≥ perhatikan fungsi padat
peluang normal untuk univariat berikut:

( )
2
1
2
2
1
;
2
i
x
f x e x
µ
σ
πσ
 −
−      
= −∞ < < ∞ (0.33)
Jika x mempunyai fungsi sebagaimana yang ditampilkan pada
persamaan (0.33), maka hal tersebut dikatakan bahwa x berdistribusi
normal dan dinyatakan dengan (), .Nµ σ Jika fungsi ini dibuat
grafiknya, maka akan membentuk grafik seperti lonceng (Lihat Gambar
1) yang memperlihatkan luasan area dibawah kurva dalam standar
deviasi 3± dari rata-rata. Luasan area tersebut merepresentasikan
peluang untuk variabel acak X normal, yaitu:

30 Ir
( )
f x
x

[cGfHVJq‘VzcafEJ‘FE3EcmfH‘Jq3FLzcbfFJzEO’FcafHqJEzq3VcrfqJLFz’Ec fH’J’VFF‘zEc1fH‘J’LFzEc.fH’J’VFF‘zEc f‘’JL‘EVc
( )
( )
0.68
2 2 0.95
P X
P X
µ σ µ σ
µ σ µ σ
− ≤ ≤ + =
− ≤ ≤ + =

X yang
µ ,σ adalah
(),X N µ σ∼
()10,4X N∼ 10µ= dan
2σ=
Padat Normal

( )( )( )
2
1
2
x
x x
µ
µ σ µ
σ
−−
= − −
 

  
(0.34)
x terhadap µ

bentuk yang
1p× untuk

( ) ( )
1−′
− −x x

µ µ (0.35)
µ berukuran 1p×
,X ∑
.X

31 Ir
1 1
, X , ,
p
X X =
 
X ⋯ maka fungsi pada persamaan (0.33) dapat
dituliskan kembali dengan menggunakan vektor rata-rata dan matriks
variansi-kovariansi, sebagai berikut:
( )
()
( ) ( )
1
1
2
21
2
1
2
p
f e
π


− − −
=
x x
x
Σ
Σ
µ µ
(0.36)
Dimana
, 1, 2,
i
x i p−∞ < < ∞ = ⋯ dan dinyatakan sebagai fungsi
pada peluang berdimensi p ditulis
( )
p
NX∼ µ,Σ
w Contoh 4.1
Misalkan kita akan menghitung fungsi padat normal dengan 2p=
dengan parameternya ()
1 1
,E Xµ= ()
2 2
,E Xµ= ()
11 1
Var ,Xσ=
()
22 2
Var ,Xσ= dan
( )
12
12 1 2
11 22
Kov ,X X
σ
ρ
σ σ= =


w Solusi 4.1
Berdasarkan teorema…, dari soal kita peroleh matriks kovariansi
11 12
21 22
σ σ
σ σ
 
 
 
  
Σ =
dengan
22 121
2
12 11
11 22 12
1 σ σ
σ σσ σ σ

 −
 
=
 
−−   
Σ
Sebagaimana telah dijelaskan sebelumnya, koefisien korelasi
12
ρ
dapat dihitung dengan

32 Ir
12 12 11 22
σ ρ σ σ=
Diperoleh ( )
2 2
11 22 12 11 22 12
1σ σ σ σ σ ρ− = − dan jarak kuadrat menjadi
( ) ( )
1−′
− −x xΣµ µ
( )
1 1 2 2
2
11 22 12
1
,
1
x xµ µ
σ σ ρ
 = − −
 

22 12 11 22 1 1
2 212 11 22 11
x
x
σ ρ σ σ µ
µρ σ σ σ
   − −
   
   
−−     

( ) ( ) ( )( )
( )
2 2
22 1 1 11 2 2 12 11 22 1 2
2
11 22 12
2
1
x x x x
σ µ σ µ ρ σ σ µ µ
σ σ ρ
− + − − − −
=



( )
2 2
1 2 2 1 2 2
12
2
12 11 22 11 22
1
2
1
x x x x
µ µ µ µ
ρ
ρ σ σ σ σ
 
     
− − − −     
    = + −            −      
  
(0.37)
a
Dari persamaan (0.36) untuk pada dari variabel normal dimensi-p,
harus jelas bahwa jalur dari nilai x menghasilkan konstan yang tinggi
untuk pada bentuk ellips. Padat normal multivariate merupakan
konstan pada permukaan dimana kuadrat dari jarak
( ) ( )
1−′
− −x xΣµ µ adalah konstan.
Jalur-Jalur tersebut disebut bentuk (Kontur-Contour):
( ) ( )
1 2
c
−′
− − =x xΣ
µ µ (0.38)

33 Ir
Teorema 4.1.
Jika Σ merupakan matriks definit positif, sedemikian hingga
1−
Σ,
maka
λ=e eΣ akibatnya
1 1
λ

 

=  
e eΣ
Sehingga ()λ, e merupakan pasangan nilai eigen dan vektor eigen
untuk Σ yang berkaitan dengan pasangan
1
λ
 

 
, euntuk
1−
Σ.
1−
Σjuga
merupakan matriks definit positif.
w Bukti.
Untuk matriks definit positif, Σ , dan 0≠e suatu vektor eigen, kita
punya
() () 0λ λ λ′ ′ ′ ′= = = = >e e e e e e e eΣ Σ
Dan juga
() ()
1 1
λ
− −
= =e e eΣ Σ Σ
Atau

1
λ

=e eΣ
Untuk model terakhir dengan 0λ> , hasilnya

11
λ

=e eΣ
Selanjutnya,
1
,
λ
 

 
e merupakan pasangan nilai eigen dan vektor eigen
untuk matriks
1−
Σ. Demikian halnya dengan vektor x berukuran 1p×

1
1 1
p
i i
i i
λ

=
  
  ′ ′ ′ =        
∑x x x e e xΣ

34 Ir
Oleh karena setiap model
()
2
1
i i
λ


x e
non-negatif. Jika 0=x , maka
keadaan dari 0
i
′=x e untuk setiap i . Sehingga, jika 0,≠x maka
( )
2
1
1
0
p
i
i i
λ
=
′>∑ x e
Sehingga
1−
Σ juga definit positif.

w Contoh 4.4 (Bentuk dari padat normal bivariate)
Kita akan menggambarkan sumbu bentuk padat peluang konstan
untuk distribusi normal bivariate dimana
11 22
σ σ=.
Dari persamaan (0.38), sumbu-sumbu tersebut diberikan oleh nilai
eigen dan vektor eigen dari Σ.
Persamaan karakteristik 0− =IΣλ menjadi

( )
( )( )
211 12 2
11 12
12 11
11 12 11 12
0
σ λ σ
σ λ σ
σ σ λ
λ σ σ λ σ σ−
= = − −

= − − − −

Akibatnya, nilai eigen adalah
1 11 12
λ σ σ= + dan
2 11 12
λ σ σ= + . Vektor
eigen
1
x ditentukan dari
( )
11 12 1 1
11 12
12 11 2 2
x x
x x
σ σ
σ σ
σ σ
     
     
= +
     
          

atau
( )
( )
11 1 12 2 11 12 1
12 1 11 2 11 12 2
x x x
x x x
σ σ σ σ
σ σ σ σ
+ = +
+ = +

Persamaan terakhir menghasilkan
1 2
x x=, dan setelah dinormalkan
pasangan nilai eigen dan vektor eigen pertama adalah

35 Ir
1 11 12
λ σ σ= + ;
1
2
1 1
2
 
 
= 
 
 
x
Dengan cara yang sama
2 11 12
λ σ σ= − ;
1
2
2 1
2
 
 
= 
− 
 
x
Ketika kovariansi
12
σ
positif,
1 11 12
λ σ σ= +
merupakan nilai eigen
terbesar, dan vektor eigen yang bersesuaian, menyimpan sejauh 45
o
melalui
1 2
,µ µ ′=
 
µ .
Sumbu ellip dari padat konstan untuk distribusi normal bivariate
dengan
11 22
σ σ= ditentukan oleh
1
2
11 22 1
2
cσ σ
 
 
± +  
 
 
dan
1
2
11 22 1
2
cσ σ

 
 
± −  
 
 

a
Kita tunjukkan bahwa persamaan (0.38), ()
2 2
p
c
χ α= merupakan
persentil ke-( )100α dari distribusi chi-kuadrat dengan derajat bebas p
menghasilkan kontur yang memuat ( )1 100%α− ,
( ) ( ) ()
1 2
p
χ α
−′
− − ≤x x
Σµ µ (0.39)
Mempunyai peluang
1α−
2. Properti Variabel Acak Multivariat Normal
Berikut dijelaskan beberapa aturan dari vektor acak x berukuran 1p×
dari distribusi normal multivariate (),
p
N Σµ :
Sifat linear dari kombinasi linear variabel dalam x

36 Ir
Teorema 4. 2.
Jika X berdistribusi ( ),
p
N Σµ, maka sembarang kombinasi linear dari
variabel
1 1 2 2
p p
a x a x a x′= + + +a X ⋯ berdistribusi ( ).
p
N′ ′a a aΣµ,
Teorema 4.3.
Jika
1 1 2 2
p p
a x a x a x′= + + +a X ⋯ berdistribusi ( )
p
N′ ′a a aΣµ, untuk
setiap a, maka X berdistribusi ( )
p
N Σµ,.
w Contoh 4.2. (Distribusi dari kombinasi linear komponen vektor
acak normal).
Perhatikan kombinasi linear ′a X dari vektor acak multivariate normal
ditentukan dengan memilih 1, 0, 0, , 0 ′=
 
a ⋯. Karena itu
1
2
1
1 0 0
p
X
X
X
X
 
 
 
  ′= =
    
 
 
 
 
a X ⋯
⋮ Dan
1
2 1
1 0 0
p
µ
µ
µ
 
 
 
  ′ =
    
 
 
 
 
a ⋯

µ = µ
Sehingga
11 12 1
21 22 2
11
1 1
1
0
1 0 0
0
p
p
p p pp
σ σ σ
σ σ σ
σ
σ σ σ
   
   
   
    ′= =
      
   
   
   
   
a aΣ



⋮ ⋮ ⋱ ⋮ ⋮

Teorema 4.3
Jika ( ),
p
NX Σ∼ µ, q kombinasi linear
( )( )
11 1 1
21 1 2
1
1 1
p p
p p
q p p
q qp p
a X a X
a X a X
a X a X
× ×
 + +
 
 
+ +
 
=
 
 
 
+ + 
 
A X





37 Ir
Berdistribusi normal ( )
q
NA AΣΑµ,
Variabel terstandarkan (Standarized Variabel)
Distribusi Chi-Square
Distribusi chi-square menentukan variabilitas dari variansi sampel,
2
11
,s s= untuk sampel dari suatu populasi normal univariat. Hal
tersebut memainkan peran penting dalam kasus multivariate.
w Contoh 4.3 (Distribusi dua kombinasi linear dari komponen
vektor acak normal)
Untuk ( )
3
NX Σ∼ µ,, tentukan distribusi dari
1
1 2
2
2 3
3
1 1 0
0 1 1
X
X X
X
X X
X
 
    − −
    
= =
    
− −
        
 
 
AX
Dengan teorem 4.3, distribusi dari AX adalah normal multivariate
dengan rata-rata
1
1 2
2
2 3
3
1 1 0
0 1 1
µ
µ µ
µ
µ µ
µ
 
    − −
    
=
    
− −
       
 
 
Aµ =
Dan matriks kovariansi

11 12 13
21 22 23
31 32 33
1 0
1 1 0
1 1
0 1 1
0 1
σ σ σ
σ σ σ
σ σ σ
   
    −
    ′ −
    

      
−   
   
AΣΑ =
11 12 12 22 13 23
12 13 22 23 23 33
1 0
1 1
0 1
σ σ σ σ σ σ
σ σ σ σ σ σ
 
  − − −
  
= −
  
− − −
    
− 
 

38 Ir
11 12 22 12 23 22 13
12 23 22 13 22 23 33
2
2 2
σ σ σ σ σ σ σ
σ σ σ σ σ σ σ
 − + + − −
 
=
 
+ − − − +
  

a
Teorema 4.3
Misalkan ( )
p
NX Σ∼ µ, dengan 0>Σ Maka
a. ( ) ( )
1−′
− −x x
Σ
µ µ berdistribusi
2
p
χ , dimana
2
p
χ merupakan
distribusi chi-square dengan derajat bebas p
b. Distribusi ( )
p
NX Σ∼ µ, menyatakan peluang 1α− pada daerah
padat ellips
( ) ( ) ( )
{ }
1 2
:
p
χ α
−′
− − ≤x x x Σµ µ
dimana ()
2
p
χ α
merupakan persentil ke-100α dari distribusi
2
p
χ.
Sifat Normal Distribusi Marginal
Sifat Independen
Teorem 4. 3.
Jika
1
X dan
2
X independen, maka ( )
1 2
kov , 0=X X ,
Jika
1
........
2
 
 
 
 
 
X
X
adalah
1 2
1 11 12
....... ....... .......
2 21 22
, ,
q q
N
µ
µ
+
   
  Σ Σ          
  Σ Σ  
     
 



maka
1
X dan
2
X adalah
independen jika dan hanya jika
12
0=Σ

39 Ir
Distribusi Bersyarat
Teorema 4.5
Misalkan
1
.......
2
 
 
= 
 
 
X
X
X
berdistribusi ( )
p
N Σµ, dengan
1
.......
2
 
 
 
 
 
µ
µ
,
11 12
....... .......
21 22
 
 Σ Σ
 
 
Σ Σ 
 
 
Σ =


⋮ , dan
0>Σ . Maka distribusi bersyarat dari
1
X ,
diberikan
2 2
=X x adalah normal dan mempunyai
( )
1
1 12 22 2 2
Rata-Rataµ µ

= + Σ Σ − x Dan
1
11 12 22 21
Kovariansi

= Σ − Σ Σ Σ
Perhatikan bahwa, kovariansi tidak bergantung pada nilai
2
x dari
variabel pensyarat
Distribusi Jumlah dua Vektor
3. Distribusi Sampel Multivariate Normal
Pada bagian ini kita akan membahas tentang statistik X dan S
Estimasi Normal Multivariate
Ketika kita akan melakukan inferensi multivariat normal terhadap
poulasi berdasarkand data sampel, salah satu metode yang sering
digunakan untuk mendapatkan nilai estimasi dari parameter adalah
maksimum likelihood. Teknik ini cukup sederhana secara konsep,
vektor pengamatan
1 2
, , ,
n
x x x⋯ yang telah dikumpulkan, dan nilai µ
dan Σ yang memaksimumkan pada gabungan dari X , disebut fungsi
likelihood.
Teorema 4.6
Misalkan
1 2
, , ,
n
x x x⋯ merupakan sampel acak dari populasi normal
dengan rata-rata µ dan kovariansi Σ. Maka
ˆµ=x (0.40)

40 Ir
( ) ( )
1
1
ˆ
n
j j
j
n
=

Σ = − −∑x x x x =
( )1n
n

S (0.41)
Merupakan estimator maksimum likelihood dari µ dan Σ. Nilai
pengamatan, x dan ( ) ( )
1
1
n
j j
j
n
=

− −∑x x x x disebut pengestimasi dari
µ dan Σ.
Dimana S adalah matriks kovariansi sampel.
Selanjutnya fungsi likelihood adalah

( ) ( )
()
( ) ( )
1
1 2
1
1
2
1 2
1
, , , , , ,
1
2
i i
n
n i
i
n
p
i
L f
e
µ µ
π

=

− − Σ −
=
=
=
Σ∏

x x
x x x xΣ; Σ⋯µ µ

( )
()
( ) ( )
11
2
1 2
2
1
, , , ,
2 i i
n
np n
L e
µ µ
π
−′
− Σ − Σ −
=
Σ
x x
x x xΣ; ⋯µ (0.42)
Sebelum membahas lebih lanjut estimasi parameter dengan metode
likelihood, berikut diberikan teori yang berkaitan dengan trace dari
suatu matriks. Teorema 4.7
Misalkan A merupakan matriks simetri berukuran k k× dan x
merupakan vektor berukuran 1.k× Maka
1. ( ) ( )tr tr′ ′ ′= =x Ax x Ax Axx
2.
( )
1
k
i
i
tr λ
=
=∑A , dimana
i
λ merupakan nilai eigen dari A

41 Ir
Perhatikan eksponen dari persamaan (0.42), yaitu
( ) ( )
1
i i
µ µ
−′
− Σ −x x
, dapat disederhakan menjadi
( ) ( ) ( ) ( )
( ) ( )
1 1
1
i i i i
i i
tr
tr
− −

 ′ ′
− − = − −  
  
  ′
= − − 
  
x x x x
x x Σ Σ
Σ
µ µ µ µ
µ µ
(0.43)
Selanjutnya

( ) ( ) ( ) ( )
( ) ( )
1 1
1 1
1
1
n n
i i i i
i i
n
i i
i
tr
tr
− −
= =

=
 ′ ′
− − = − −  
  
  ′
= − − 
  
∑ ∑
∑x x x x
x x
Σ Σ
Σ
µ µ µ µ
µ µ

( ) ( ) ( ) ( )
1 1
1 1
n n
i i i i
i i
tr
− −
= =
 ′ ′
− − = − −  
  
∑ ∑x x x xΣ Σµ µ µ µ (0.44)
Karena trace dari suatu jumlahan matriks adalah sama dengan jumlah
trace dari setiap matriks. Kita dapat menambahkan d an
mengurangkan
1
1
n
j
i
n
=
=∑x x dalam setiap model ( )
i
−xµ dalam
( )( )
1
n
i i
i
µ µ
=

− −∑x x yang menghasilkan
( ) ( )
1
1 1
2 2
1
2
n
i i
i
C D
C nD
=

− − + − − + − =− +
=− +
∑x x x x x xµ µ
(0.45)
Dimana
( ) ( )
1
n
i i
i
C
=

= − −∑x x x x dan ( )( )
1
n
i i
i
D
=

= − −∑x xµ µ

42 Ir
Karena model hasil kali ( )( )
1
n
i i
i=

− −∑x x x µ dan
( )( )
1
;
n
i
i=

− −∑x xµ µ keduanya adalah nol Persamaan (0.45) menjadi
( )
()
1
2
1 2
2
1
, , ,
2
B
n
np n
L e
π

=x x xΣ;
Σ ⋯µ, (0.46)
Dimana
( ) ( ) ( ) ( )
1
n
i i
i
B n
′ ′
=
= − − + − −∑x x x x x x µ µ
Karena
1−
Σ adalah definit positif, model ( ) ( )
1
0
2
n
−′
− − − ≤x xΣµ µ
dan
( ) ( )
1
20 1,
n
e
−′
− − −
< ≤
x xΣµ µ
maksimum ketika pangkatnya sama
dengan 0. Oleh karena itu L maksimum ketiak ˆµ=x
Distribusi X dan S
Untuk distribusi dari
1
1
n
j
i
n
=
=∑x x , dapat dibagi dalam dua kasus,
1. Ketika x didasarkan pada sampel acak
1 2
, , ,
n
x x x⋯ dari distribusi
normal multivariate ( )
p
N Σµ, maka ( )p
N
n
x
Σ
∼ µ,
2. Ketika x didasarkan pada sampel acak
1 2
, , ,
n
x x x⋯ dari suatu
distribusi nonnormal populasi multivariate dengan vektor rata-rata
µ dan matriks kovarinsi Σ , maka untuk n cukup besar, x
mendekati distribusi ( )p
N
n
x
Σ
∼ µ, . Formalnya dikenal dengan
teorema limit central multivariate: Jika x merupakan vektor rata-
rata dari sampel acak
1 2
, , ,
n
x x x⋯ dari suatu populasi dengan

43 Ir
vektor rata-rata µ dan mariks kovariansi Σ, maka saat n→ ∞ ,
distribusi dari ( )n−xµ mendekati ()0,
p
N Σ
Terdapat p variansi dalam S dan
2
p 

 
kovariansi, untuk total
( ) ( )1 1
2 2 2
p p p pp
p p
  − +

+ = + =   

Entri berbeda. Distribusi gabungan dari
( )1
2
p p−
variabel berbeda
dalam
( )
( ) ( )1
i i
i
n

= − = − −∑W S x x x x merupakan distribusi
Wishart, dinyatakan dengan
( )1,
p
W n−Σ
Dimana ( )1n− adalah derajat bebas.
Distribusi Wishart analog dengan distribusi chi-square multivariate,
dan penggunaannya sama. Suatu variabel acak
2
χ didefinisikan
secara formal sebagai jumlah kuadrat dari standar normal independen
(univariat) variabel random:
( )
( )
2
2 2
2
1 1
n n
i
i
i i
x
z n
µ
χ
σ= =

=
∑ ∑ ∼
Jika
µdigantikan dengan x, maka
( )( )
( )
2
2
2
2 2
1
1
1
n
i
i
x x n s
n
χσ σ=
− −
= −
∑ ∼
Dengan cara yang sama, definisi formal dari variabel acak wishart
adalah

44 Ir
( )( ) ( )
1
,
n
i i p
i
W n
=

− −
∑x x
Σ∼µ µ (0.47)
Dimana
1 2
, , ,
n
x x x⋯ secara independen berdistribusi ( )
p
N Σµ, . Ketika
µ digantikan dengan x , hasilnya adalah

( )
( ) ( ) ( )
1
1 1,
n
i i p
i
n W n
=

− = − − −
∑S x x x x
Σ∼ (0.48)
Berikut ringkasan distribusi sampel:
Misalkan
1 2
, , ,
n
x x x⋯ sampel acak berukuran n dari suatu distribusi
normal p variabel dengan rata-rata µ dan matriks kovariansi Σ .
Maka
1.
1
p
N
n
   
  
        
X Σ∼ µ,
2. ( )1n−S berdistribusi wishart dengan derajat bebas 1n−
3. X dan S independen
4. Menilai Asumsi Normalitas Multivariat
Ketika kita bekerja dengan beberapa variabel, memeriksa kenormalan
setiap variabel seharusnya bukan pendekatan yang bagus, karena
1. Variabel saling berkorelasi
2. Normalitas dari setiap variabel tidak menjamin gabungannya
normal
Mengevaluasi Normalitas Univariat
Pendekatan secara grafik untuk memerikan normalitas adalah plot
Q Q− yang membandingkan kuantil dari sampel dengan kuantil
populasi dari normal univariat. Jika titik-titik dekat-dekat dengan garis
lurus, tidak ada yang mengindikasikan adanya normalitas.

45 Ir
Misalkan diberikan data hasil pengamatan,
1 2
, , ,
n
x x x⋯ untuk satu
karakteristik saja, .
i
X Misalkan
( ) ( ) ( )1 2 n
x x x≤ ≤ ≤⋯ data hasil
pengamatan yang telah susun secara terurut dari yang terkecil.
( )
i
x
merupakan quantil data. Ketika nilai
( )
i
x berbeda, secara tepat
pengamatan i kurang dari atau sama dengan
( )i
x. Proporsi i n dari
sampel pada
( )
i
x sering diperkirakan dengan ( )
1
2
i n− .
Untuk distribusi normal standar, quantil
( )
i
q didefinisikan dengan relasi
( )
( )
( )
21
2
1
21
2
i
q
z
i i
i
P Z q e dz p


−∞

 
≤ = = =
 
 

(0.49)
( )
i
p adalah peluang yang diperoleh dari nilai yang kurang dari atau
sama dengan
( )
i
q dalam satu pengambilan dari populasi berdistribusi
normal.
Idenya adalah untuk melihat pasangan quantil
( ) ( )
( ),
i i
q x dengan
asosiasi yang sama peluang kumulatif ( )
1
2
i n− . Jika data berasa dari
populasi yang berdistribusi normal, pasangan
( ) ( )
( ),
i i
q x diperkirakan
akan berkaitan secara linear, karena
( )i
q
σ µ+ dekat dengan nilai
ekspektasi kuantil.
w Contoh 4.4 (Mengkonstruksi QQ-Plot)
Sampel sebanyak 10n= pengamatan, nilainya sebagaimana dalam table
berikut:
Pengamatan
(terurut)
( )i
x
Level Peluang
( )
1
2
j
n


Quantil
Standar Normal
( )i
q

46 Ir
-1.00 0.05 -1.645
-0.10 0.15 -1.036
0.16 0.25 -0.674
0.41 0.35 -0.385
0.62 0.45 -0.125
0.80 0.55 0.125
1.26 0.65 0.385
1.54 0.75 0.674
1.71 0.85 -1.036
2.30 0.95 -1.645
Sebagai contoh, ( )
21
2
0.385
10.385 0.65
2
z
P Z e dz
π

−∞
≤ = = ∫

Misalkan kita ingin mengkonstruksi Plot Q-Q dan memberikan
interpretasi terhadap apa yang nampak pada grafik tersebut. Plot Q-Q
untuk data diatas, dimana plot dari data yang telah diurutkan
( )
i
x
dengan quantile normal
( )
i
q, sebagaimana ditunjukkan pada grafik
berikut. Pasangan titik-titik
( ) ( )
( ),
i i
q x berada sangat dengan sepanjang
garis lurus, dan kita tidak ingin menolak hal yang menyatakan bahwa
data tersebut mempunyai distribusi normal-secara khusus dengan
ukuran sampel yang kecil n =10.

47 Ir

Gambar 4. Normal Q-Q Plot nilvai Ekspektasi v.s Nilai Pengamatan
Terstandar
Berikut langkah-langkah membuat plot Q Q−
1. Urutkan pengamatan asal,
( ) ( ) ( )1 2
, , ,
n
x x x⋯ dan peluang
yang bersesuaian
( )( )( )
1 1 1
2 2 2
1 2
, , , ;
n
n n n
− − −


2. Hitung quantil standar normal
( ) ( ) ( )1 2
, , ,
n
q q q⋯ ; dan
3. Plot pasangan pengamatan
( ) ( )( )( ) ( )( ) ( ) ( )( )1 1 2 2
, , , , , , ,
n n
q x q x q x ⋯
w Contoh 4.3 (Plot Q-Q untuk Data Radiasi)
Departemen pengontrolan kualitas dari suatu pabrik pembuat
microwave oven yang dibutuhkan oleh pemerintah untuk memonitor
jumlah radiasi yang dipancarkan ketika pintu oven tertutup.
Pengamatan pancaran radiasi melalui pintu tertutup dari 42n= telah
diambil secara acak. Datanya sebagaimana ditampilkan pada table 4.2
b berikut

48 Ir
Plot Q-Q dari data radiasi dibuat dengan menggunakan software SPSS
V16. Perhatikan hasil plot tersebut, terdapat dua titik yang terletak
menyimpang sangat jauh dari titik yang lain dan dari garis luruh, yang
demikian disebut sebagai outlier. Maka dari hasil tersebut dapat kita
simpulkan data radiasi oven tidak normal.


Garis lurus dari plot Q-Q dapat diukur dengan menghitung koefisien
korelasi dari titik-titik dalam plot. Koefisien korelasi untuk plot Q-Q
didefinsikan dengan
( )
( ) ( )( )
( )( ) ( )( )
1
2 2
1 1
n
j i
i
Q
n n
j i
i i
x x q q
r
x x q q
=
= =
− −
=
− −∑
∑ ∑
(0.50)

Secara formal penolakan hipotesis dari normal pada level signifikansi
α jika
Q
r berada dibawah nilai perkiraan, sebagaimana dalam table
berikut
w Contoh 4.4 (uji koefisien korelasi untuk Normalitas)
Misalkan kita akan menghitung koefisien korelasi
Q
r dari contoh 4.3
dan uji untuk normalitas.
Dari contoh 4.3, diketahui
0.770x=
dan

49 Ir
( )( ) ( )
10
1
8.584
i i
i
x x q
=
− =∑ ,
( )( )
10
1
8.472
i
i
x x
=
− =∑ , dan
( )
10
2
1
8.795
i
i
q
=
=∑ .
Karena 0q= (selalu),

8.584
0.994
8.472 8.795
Q
r= =
Uji normalitas pada taraf signifikasni 10% memberikan patokan
0.994
Q
r= untuk dibandingkan dengan table …untuk 10n= dan
0.10α= , nilai kritisnya adalah 0.9351. Oleh karena 0.994
Q
r= >
0.9351, hipotesis yang menyatakan distribusinya tidak ditolak.
a
a. Mengevaluasi Normalitas Bivariate
Perhatikan himpunan kejadian bivariate x sehingga
( ) ( ) ()
1 2
2
0.05χ
−′
− − ≤x x
Σµ µ
Mempunyai peluang 0.05. kita coba mengharapkan secara apa adanya
persentase yang sama, 50% dari sampel pengamatan un tuk
menyimpang dari ellips diberikan oleh
( ) ( ) ( ){ }
1 2
2
semua sehingga 0.05 χ
−′
− − ≤x x x S x x

Dimana
µ kita estimasi denga x dan
1−
Σ kita estimasi dengan
1−
S.
Jika bukan, asumsi normalitas dicurigai
Contoh 4.3 (Pemeriksaan Normalitas Bivariat)
Meskipun bukan berasal dari sample acak, data yang memuat
pasangan hasil pengamatan (
1
x = salse dan
2
x = profit) untuk 10
perusahaan terbesar didunia sebagaimana ditunjukkan pada contoh
4.1. Dari data tersebut, diberikan

50 Ir
155.60
14.70
 
 
=
 
  
x ,
7476.45 303.63
303.62 26.19
 
 
=
 
  
S
Sehingga
1
26.19 303.631
303.63 7476.45103, 623.12
0.000253 0.002930
0.002930 0.072148

  −
 
=
 

  
  −
 
=
 

  
S

Dari table, diperoleh ()
2
2
0.5χ =1.39. Lalu, sembarang pengamatan
1 2
,x x ′=
 
x memenuhi
1 1
2 2
155.60 0.000253 0.002930 155.60
1.39
14.70 0.002930 0.072148 14.70
x x
x x
′     − − −
     

     
− − −
          

Jatuh didalam kontur pengamatan 50%. Pengamatan lain jatuh diluar
kontur. Pengamatan yang lain selain dari yang disebut diatas jatuh
diluar kontru. Pasangan pengamatan pertama,
1 2
108.28 17.05x x
′   
=
      
. Dalam kasus ini,
108.28 155.60 0.000253 0.002930 108.28 155.60
17.05 14.70 0.002930 0.072148 17.05 14.70
1.61 1.39
′     − − −
     
     
− − − −
          
= >

Dan titik ini jatuh diluar kontur 50%.
a
Metode formal lain yang dapat digunakan untuk menilai gabungan sifat
normal dari sekumpulan data adalah dengan memperhatikan jarak
kuadrat umum
( )( )
2 1
j j j
d
−′
= − −
x x S x x , 1,2, ,j n= ⋯ (0.51)

51 Ir
Dimana
1 2
, , ,
n
x x x⋯ adalah sampel pengamatan.
Ketika populasi primernya merupakan multivariate normal dimana n
dan n p− lebih besar dari 25 atau 30, setiap dari kuadrat jarak akan
cenderung mengikuti variabel random chi-kuadrat. Walaupun jarak-
jarak tersebut tidak independent atau secara tepat berdistribusi chi-
kuadrat, namun cukup membantu untuk digambarkan plotnya. Plot
yang dihasilkan disebut plot chi-kuadrat atau Gamma Plot, karena
distribusi chi-kuadrat merupakan kasus khusus dari distribusi gamma.
Untuk mengkonstruksi plot chi-kuadrat
Langkah-Langkah Mengkonstruki Plot Chi-Kuarat
1. Urutkan data jarak dalam persamaan (0.51) dimulai dari
yang paling kecil hingga yang paling besar.
2 2 2
1 2 n
d d d≤ ≤ ≤⋯
2. Gambarkan pasangan
2
.
1
,
2
c p j
q j n d
    
   
−              
dimana
.
1
2
c p
q j n
  
 
−       
merupakan kuantil ke-
1
100
2
j n
 

−   

dari distribusi chi-kuadrat dengan derajat bebas p.
w Contoh 4.4 (Mengkonstruksi Plot Chi-Kuadrat)
Misalkan kita akan membuat plot chi-kuadrat dari jarak dalam contoh
4.3. Jarak diurutkan dan hubungkan dengan persentil chi-kuadrat
untuk 2p= dan 10n= sebagaimana ditampilkan pada table 4.4
berikut
j

2
j
d
.2
1
10
2
c
q j
  
 
−       

1 0.30 0.10
2 0.62 0.33
3 1.16 0.58
4 1.30 0.86
5 1.61 1.20
6 1.64 1.60

52 Ir
7 1.71 2.10
8 1.79 2.77
9 3.53 3.79
10 4.38 5.99
Hasil plotnya
6543210
4
3
2
1
0
q
d
S c a t t e r p l o t o f d v s q

Gambar 5. Scatte plot data d v.s q
5. Mendeteksi Data Pencilan dan Cleaning Data
Kebanyakannya kumpulan data memuat satu atau lebih hasil
pengamatan yang berbeda keadaannya dari pengamatan yang lainnya
atau diistilah dengan unusual observartion atau dikenal dengan Data
pencilan (outlier). Data yang demikian biasanya berada pada posisi
sangat kecil atau sangat dari kumpulan pengamatan. Keadaan data
yang demikian sangat berpengaruh dalam analisis statistic.
Langkah-langkah mendeteksi outlier:
Buat dot plot untuk setiap data variabel
1. Buat scatter plot atau diagram pencar untuk setiap
pasangan variabel
2. Hitung nilai terstandar (standardized value)
( )
jk jk k kk
z x x s= − untuk 1,2, ,j n= ⋯ dan setiap
kolom 1,2, ,k p= ⋯ . Uji nilai terstandar tersebut untuk
nilai terkecil atau terbesar
3. Hitung jarak kuadrat umum ( )( )
2 1
j j j
d
−′
= − −
x x S x x .
Uji jara-jarak tersebut untuk unusual nilai besar. Dalam

53 Ir
plot chi-kuadrat, titik-titik tersebut akan berada jauh dari
titik asal.

Dalam langkah ketiga, harus diinterpretasi relative terhadap ukuran
sampel dan jumlah variabel. Terdapat nilai terstandarkan sebanyak
n p×. Andaikan terdapat 100n= dan 5p=, maka ada 500 nilai.
Diharapkan 1 atau 2 dari data-data tersebut melebihi 3 atau kurang
dari -3, jika data berasal dari distribusi multivariate hal tersebut berarti
normal, dan 3.5 dicurigai sebagai data yang besar. Nilai terstandarkan
dihitung berdasarkan rata-rata dan variansi sampel.
6. Transformasi Normalitas
Asumsi dasar setiap teknik statistic adalah sifat normalitas, ika
sekumpulan data tidak mengikuti distribusi normal, apa yang harus
dilakukan atau langkah apa yang selanjutnya diambil? Alternative
pertama adalah menghilangkan data yang menyebabkan tidak normal,
namun cara ini tidak dianjurkan karena yang merusak kesimpulan atau
melahirkan kesimpulan yang tidak tepat. Alternative kedua adalah
membuat data “tidak normal” menjadi nampak “normal” atau hampir
normal dengan transformasi data.
Transformasi data adalah menampilkan data dalam bentuk yang
berbeda. Transformasi yang tepat yang dianjurkan adalah (1)
berdasarkan teori atau (2) berdasarkan data itu sendiri atau (3)
keduanya. Secara teoritis bahwa data yang dihitung lebih sering
cenderung normal dengan mengambil akar kuadrat. Dengan cara yang
sama transformasi logit untuk proporsi dan tranformasi z untuk
koefisien korelasi menghasilkan kuantitas yang mendekati distribusi
normal.
Berikut beberapa bentuk tranformasi
Skala Asal Skala Transformasi
1 Count, y
y
2 Proporsi, ˆp
( )
ˆ1
ˆlogit log
ˆ2 1
p
p
p
 

=    − 

54 Ir
3 Korelasi, r
( )
1 1
log
2 1
r
Fisher z r
r
 +

=    − 

Dalam kebanyakan kasus, pilihan transformasi untuk meningkatkan
pendekatan kenormalan data ternyata tidak mudah. Namun, adalah
satu satu teknik transformasi yang disebut dengan p ower
transformation yang dianjurkan untuk mengatasi kesulitan tersebut.
Power transformation terdefinisikan hanya pada variabel positif. Akan
tetapi, hal ini bukan merupakan pembatasan, karena satu konstanta
dapat ditambahkan ke setiap pengamatan dalam himpunan data jika
beberapa nilai adalah negative.
Misalkan x merepresentasikan pengamatan, maka power
transformasi merupakan pengurutan oleh parameter λ . suatu nilai
diberikan untuk λ yang menyebabkan transformasi tertentuk lebih
dekat.
Sebuah metode analisis diberikan untuk memilih power transformasi.
Box dan Cox melakukan perubahan pada power transformasi

( )
1
; 0
ln ; 0
x
x
x
λ
λ
λ
λ
λ
−

≠ 
=

 =

(0.52)
Dimana 0λ> .
Diberikan pengamatan
1 2
, ,
n
x x x…, solute Box-Cox untuk memmilih
pendekatan power λ adalah solusi yang meminimumkan rumus
( )
( ) ( )
( )( )
2
1 1
1
ln 1 ln
2
n n
j j
j j
n
x x x
n
λ λ
λ λ
= =
 
 
= − − + −
 
 
 
∑ ∑ℓ (0.53)
Latihan Soal
4. 1. Perhatikan suatu distribusi normal bivariate dengan
1
µ =1,
2
µ = 3,
11
σ = 3,
22
σ = 1 dan
12
ρ =-0.8.
a. Tuliskan fungsi dari padat normal bivariate

55 Ir
b. Nyatakan jarak statistic kuadrat ( )( )

− −
x xΣ
µ µ sebagai
suatu fungsi kuadrati dari
1
x dan
2
x
4. 2. Misalkan ( )
3
NX Σ∼ µ, dengan 3,1, 4 ′= −
 
µ dan

1 2 0
2 5 0
0 0 2
 

 
 

 
 
 
 
Σ =
Mana dari variabel acak berikut yang independent?
a.
1
X dan
2
X
b.
2
X dan
3
X
c. ( )
1 2
,X X dan
3
X
d.
1 2
2
X X+
dan
3
X
e.
2
X dan
5
2 1 3
2
X X X− −

57 Ir
BAB IV
INFERENSI VEKTOR RATA-RATA







1. Uji µ Saat ΣDiketahui
Pengujian vektor rata-rata dengan asumsi Σ diketahui merupakan
pendahuluan untuk mengilustrasikan pengujian multivariate dan untuk
memberikan pengantar pemahaman kepada keadaan dimana Σ tidak
diketahui. Untuk memudahkan pemahaman, pertama akan
diperkenalkan kasus pada univariate, variabel x yang berdistribusi
(),Nµ σ .
Hipotesis yang akan diuji adalah rata-rata dari x adalah sama dengan
suatu nilai rata-rata yang ditentukan atau diberikan, yaitu
0
µ lawan
hipotesis alternative yang tidak sama dengan
0
µ, secara statistic dapat
dirumuskan sebagai berikut:
0 0 0 0
: Lawan :H Hµ µ µ µ= ≠

58 Ir
Dimana
0
H merupakan hipotesis nol dan
1
H merupakan hipotesis
alternative, dua sisi. Jika diberikan data,
1 2
, , ,
n
X X X⋯ , yang
menyatakan data variabel acak yang berasal dari populasi yang
berdistribusi normal, pendekatan uji statistic yang dapat digunakan
adalah
0 0
x
x x
z
n
µ µ
σ σ
− −
= =
yang berdistribusi ()0,1N Jika
0
H benar.
Uji Multivariate untuk
0 0
:Hµ µ=; σ Diketahui
Dalam kasus multivariate dimana mempunyai banyak variabel yang
diukur pada setiap unit sample, dan kita ingin menguji hipotesis suatu
nilai,
0
µ dari setiap variabel,
0 0 0 0
: Lawan :H Hµ µ µ µ= ≠ , kita
punya
1 01 1 01
2 02 2 02
0 1
0 0
: , : ,
p p p p
H H
µ µ µ µ
µ µ µ µ
µ µ µ µ
       
      
                     
      = ≠      
      
      
      
                         
⋮ ⋮ ⋮ ⋮

Dimana, setiap
0j
µ merupakan nilai yang ditentukan sebagai nilai target
oleh peneliti.
 Kesamaan vektor dalam
0
H mengakibatkan
0j j
µ µ= untuk setiap
1,2, ,j p= ⋯
 Sedangkan ketaksamaan vektor dalam
1
H mengakibatkan paling sedikit
satu dari
0j j
µ µ≠, untuk kemudian kita menolak
0
H .
Untuk menguji
0
H, andaikan sampel acak dari n vektor pengamatan,
1 2
, , ,
n
x x x⋯ dari populasi yang berdistribusi normal, (),
p
N Σµ ,

59 Ir
dengan Σ diketahui, dan menghitung
1
1
n
i
i
n
=
=∑x X dari data yang telah
dikumpulkan sebelumnya. Uji statistic yang bersesuaian adalah
( )( )
2
0 0
Z n

= − −x x Σµ µ (0.54)
Jika
0
H benar,
2
Z berdistribusi
2
p
χ , oleh karena itu kita tolak
0
H jika
2 2
,p
Z
α
χ> .
w Contoh 3.1
Dalam Table 3.1, tinggi dan berat dari 20 orang mahasiswa laki-laki.
Misalkan diasumsikan bahwa sampel ini berasal dari bivariate normal
( )
2
N Σµ, , dimana
20 100
100 1000
 
 
 
 

Andaikan kita ingin menguji
0
: (70,170)H

 . Dari contoh 3.21
1
71.45x dan
2
164.7.x Selanjutnya kita punya
( ) ( )
( )
( )
( )
2 1
1
71.45 70 20 100 71.45 70
20
164.7 170 100 1000 164.7 170
0.1 0.01 1.45
20 1.45 5.3
0.01 0.002 5.3
8.4026
Z n

−′
= − −

     − −
    
    =        − −         
  −
  
  = −     − −      
=
y yΣµ µ

Gunakan α =0.05,
2
0.05,2
5.99χ = dan oleh karena itu tolak
( )
0
: 70,170H

µ = karena
2
8.4026 5.99Z= >
Perhatikan bahwa uji statistic sensitive terhapad struktur kovariansi.
Jika ( )
1 2
Kov ,x x negative,
2
y akan cenderung naik ketika
1
y naik, dan
gambar ellips akan arahnya akan berubah.

60 Ir
a
2. Uji µ saat Σ tidak Diketahui
Pada bagian ini akan dibagi pembahasan menjadi dua bagian, yaitu
pengujian untuk satu sampel lalu pengujian untuk dua sampel. Ada
dua alasan:
1. Prinsip-prinsip umum kebanyakannya lebih mudah
mengilustrasikan dalam satu sampel dibanding dua sampel
2. Beberapa test yang banyak digunakan adalah untuk kasus satu
sampel.
Sebelum membahas lebih lanjut tentang bagaimana menguji hipotesis
berkaitan dengan masalah ini, terlebih dahulu kita tinjau kembali
masalah univiariat yang berkenaan dengan kasus ini.
Andaikan kita telah mengumpulan data sampel acak, yaitu
1 2
, , ,
n
x x x⋯
yang diperoleh dari populasi yang berdistribusi normal, ( )
2
,Nµ σ.
Estimator dari µ adalah x dan estimator dari
2
σ adalah
2
s, yaitu
1
1
n
i
i
x x
n
=
=∑ dan ( )
2
2
1
1
1
n
i
i
s x x
n
=
= −
− ∑
Untuk menguji hipotesis
0 0 1 0
: lawan :H Hµ µ µ µ= ≠
Kita gunakan uji t-student dengan rumus

( )
00
n xx
t
ss n
µµ −−
= =
(0.55)
Jika
0
H benar, t berdistribusi
1n
t

, dimana 1n− merupakan derajat
bebas.
Keputusan statistika yang dapat kita ambil adalah, tolak
0
H jika

61 Ir
( )
/2, 1n
n x
t
s
α
µ




atau
Tidak tolak
0
H jika
( )
/2, 1n
n x
t
s
α
µ




Kedua bentuk diatas ekuivalen dengan interval kepercayaan
0 /2; 1
berada dalam 100(1 )% CI
n
s
x t
n
α
µ α

  
 
− ± 
 
  

atau

/2; 1 0 /2; 1 0
2 2
n n
x t x t
n n
α α
µ µ
− −
− ≤ ≤ + ≤ (0.56)
Dimana
/ 2, 1n
t
α −
merupakan nilai kritis dari table t.
Bentuk
0
x
t
s n
µ−
= pada persamaan (0.55) merupakan bentuk
karakteristik dari statistic-t, yang merepresentasikan jarak sampel
terstandarkan antara x dan
0
µ.
Uji Hotelling-
2
T untuk
0 0
:H ; Σ tidak diketahui
Diberikan hasil pengamatan suatu sampel acak
1 2
, , ,
n
x x x⋯ berasal
dari populasi yang berdistribusi ( ),
p
N Σµ, dimana
i
x memuat p
pengukuran pada unit sampel ke-i.
Dalam rangka pengujian hipotesis
0 0
:H =µ µ lawan
1 0
:H ≠µ µ

62 Ir
Digunakan rumus yang merupakan perluasan dari statistic-t kasus
univariat. Dalam bentuk kuadrat, bentuk univariat statistic-t dapat
dituliskan

( )
( ) ( )( )
2
02 2
0 0
2
.
n x
t n x s x
s
µ
µ µ

= = − −
(0.57)
Pada persamaan (0.57), gantikan
( )
0
xµ− dan
2
s dengan ( )−xµ
dan S , diperoleh uji statistika
( )( )
2 1
.T n
−′
= − −
x S x
µ µ (0.58)
dimana

( )
11
1
n
i
ip
n

= ∑X
x
,
( )
( ) ( )
1
1
1
n
i i
ip p
n


= − −
− ∑
X X X X
S
dan
10
20
0
0p
µ
µ
µ
 
 
 
 
=
 
 
 
 
 

µ
Statistik
2
T disebut Hotelling’s
2
T .
Bentuk karakteristik dari statistic
2
T adalah
( ) ( )
1
2
.T
n

 
′
= −  − 
S
x xµ µ (0.59)
Bentuk karateristik mempunyai dua fitur:
1. nS merupakan matriks kovariansi sampel X dan matriks
terstandarkan dalam fungsi jarak
2. Karena
1 2
, , ,
n
x x x⋯ berdistribusi ( )
p
N Σµ, , demikian halnya
dengan
1
p
N
n
 

   
X Σ∼ µ, , ( ) ( )1 1,n W n− −S Σ∼ dan X dan S
independen.
Perhatikan persamaan (0.57), statistic-t merepresentasikan jumlah
standar deviasi x dari
0
µ . Hal yang sama nampak pada statistic
2
T,

63 Ir
akan tetapi dalam interpretasinya tidak mudah. Jika kita tambahkan
variabel, jaraka dalam persamaan (0.59) akan meningkat.
Untuk melakukan pengujian hipotesis, kita harus membandingkan nilai
hasil perhitungan dari
2
T dengan nilai table. Jika suatu pengujian
untuk menolak
0 0
: ,Hµ = µ pertanyaan yang harus diajukan adalah,
variabel apa atau variabel mana yang memberikan kontribusi lebih
untuk suatu penolakan.
Berikut beberapa hal yang berkaitan dengan uji-
2
T :
1. Jumlah pengamatan terhadap jumlah variabel seharusnya, n p>
. Untuk kondisi yang lain, akan menghasilkan S yang singular dan
akibatnya
2
T tidak dapat dihitung
2. Kasus satu sampel maupun dua sampel, derajat bebas untuk
statistic
2
T akan sama, yaitu; 1v n= − untuk satu sampel, dan
1 2
1v n n= + − untuk dua sampel.
3. Hipotesis alternative adalah uji dua-sisi. Karena ruang adalah
multidimensi. Pengujian satu sisi tidak pertimbangkan, semisal
0
>µ µ. Namun demikian, daerah kritisnya tetap satu-sisi
(Penolakan untuk nilai
2
T yang besar). Hal ini merupakan
karakteristik dari kebanyakan uji multivariate.
4. Dalam kasus univariat,
1
2
1, 1n n
t F
− −
= . Statistik
2
Tjuga dapat
dikonversi ke statistic-F sebagai berikut:

2
, , 1
1
p v p v p
v p
T F
vp
− +
− +
= (0.60)

Berikut cara membaca table
2
T
1. Kolom pertama dari table memuat nilai kuadrat dari table t; yaitu
2 2
,1, / 2,v v
T t
α α
= . Untuk 1p=
2
T menjadi
2
t.
2. Baris terakhir memuat nilai kritis
2
χ, yaitu
2 2
,p p
T χ

=

64 Ir
w Contoh 2.
Misalkan matriks data untuk suatu sampel acak berukuran 3n= dari
populasi normal bivariate adalah
6 9
10 6
8 3
 
 
 
=
 
 
 
 
X

Uji
2
T untuk
0
9, 5 ′=
 
µ . Apa distribusi sampel dari
2
T dalam contoh
ini?
Dari soal, kita dapat menghitung
1
2
6 10 8
8
3
9 6 3 6
3
x
x
 + +
    
    
= = =    
+ +       
 
 
x
dan

( ) ( ) ( )
( )( ) ( )( ) ( )( )
( ) ( ) ( )
2 2 2
11
12
2 2 2
22
6 8 10 8 8 8
4
3
6 8 9 6 10 8 6 6 8 8 3 6
3
3
9 6 6 6 3 6
9
3
s
s
s
− + − + −
= =
− − + − − + − −
= = −
− + − + −
= =

Dengan demikian
4 3
3 9
 −
 
=
 

  
S
Selanjutnya
()()()()
1 1
1 3 9
1 4
9 27
4 31
3 94 9 3 3

  −
  
= =
  
−− − −       
S
Dan, dari persamaan (0.58), ( )( )
2 1
.T n
−′
= − −x S xµ µ diperoleh
Solusi :

65 Ir

1 1 2
2 3 9 9
1 4 1
9 27 27
8 9 7
3 8 9 6 5 3 1 1
6 5 9
T
    − −
        
= − − = − =
            −
        

Sebelumnya, sampel terpilih,
2
T berdistribusi
( )
( )
2,3 2 2,1
3 1 2
4
3 2
F F


=

a
w Contoh 3. (Pengujian Vektor Rata-rata dengan
2
T )
Keringat dari 20 wanita sehat telah dianalisis. Tiga komponen,
1
X =
rata keringat,
2
X= mengandung sodium, dan
3
X = mengandung
potassium, telah diukur, dan hasil. Datanya sebagaimana ditampilkan
dalam table 5.1
Individual
1
X
2
X
3
X
1 3.7 48.5 9.3
2 5.7 65.1 8.0
3 3.8 47.2 10.9
4 3.2 53.2 12.0
5 3.1 55.5 9.7
6 4.6 36.1 7.9
7 2.4 24.8 14.0
8 7.2 33.1 7.6
9 6.7 47.4 8.5
10 5.4 54.1 11.3
11 3.9 36.9 12.7
12 4.5 58.8 12.3
13 3.5 27.8 9.8
14 4.5 40.2 8.4
15 1.5 13.5 10.1
16 8.5 56.4 7.1
17 4.5 71.6 8.2
18 6.5 52.8 10.9
19 4.1 44.1 11.2
20 5.5 40.9 9.4

66 Ir
Uji hipotesis
0
: = 4, 50,10H  ′
 
µ
lawan
1
: 4, 50,10H  ′≠
 
µ

Pada level signifikansi 0.01α= .
Hitung statistik berikut
4.640
45.400
9.965
 
 
 
=
 
 
 
 
x ,
2.879 10.010 1.810
10.010 199.788 5.640
1.810 5.640 3.628
 

 
 
= −
 
 
− − 
 
S
dan

1
0.586 0.022 0.258
0.022 0.006 0.002
0.258 0.002 0.402

 

 
 
= − −
 
 
− 
 
S
Hitung

2
20 4.640 4 45.400 50 9.965 10
0.586 0.022 0.258 4.640 4
0.022 0.006 0.002 45.400 50
0.258 0.002 0.402 9.965 10
0.467
20 0.640 4.600 0.035 0.042
0.160
9.74
T
 
= − − −
  
   
− −
   
   
− − −
   
   
− −   
   
 
 
  
= − − −
    
 
 
 
=

Bandingkan hasil perhitung
2
9.74T=
dengan nilai kritis

( )
( )
()
( )
, ,0.01 3,17,0.10
1 19 3
3.353 2.44 8.18
17
p n p
n p
F F
n p


= = =

Dari hasil tersebut nampak bahwa,
2
9.74 8.18,T= > Akibatnya kita
tolak
0
H pada leve signifikansi 10%.
a
Solusi.

67 Ir
3. Hotelling-
2
T dan Uji Likelihood Ratio
Pada bagian sebelumnya telah dijelaskan statistic
2
T dengan analogi
univariat jarak kuadrat
2
t. Terdapat prinsip umum untuk
mengkonstruksi prosedur uji yang disebut uji likelihood ratio, dan
statistic
2
T dapat diturunkan dari uji likelihood ratio dari
0 0
: .H =µ µ
Lihat Persamaan (0.61) bahwa maksimum dari likelihood normal
multivariate seperti µ dan Σ diberikan oleh

( )
( )
S
/2
/2
/2
,
1
,
2
max
np
n
np
L e
π

=
Σ
Σ
Σ
µ
µ (0.61)
dimana
S
( ) ( )
1
1
n
i i
i
n
=

= − −∑x x x xΣ dan
1
1
ˆ
n
i
i
n
=
= =∑x xµ
Merupakan estimasi maksimum likelihood.
Dibawah hipotesis
0 0
:H =µ µ, fungsi likelihood normal
( )
()
( ) ( )
1
0 0
1
1
2
0
/2 /2
1
,
2
n
i i
i
np n
L e
π

=′
− − −

=x x Σ
Σ
Σ
µ µ
µ
Nilai
0
µ merupakan nilai konstans, tapi Σdapat bervariasi untuk
mendapatkan nilai yang “lebih mirip”, nilainya dapat diperoleh dengan
memaksimumkan fungsi likelihood, ( )
0
,L Σµ terhadap Σ.
Langkah berikut, sebagaimana langkah pada persamaan (0.61)
eksponen dalam ( )
0
,L Σµ dapat dituliskan sebagai

68 Ir

( ) ( ) ( ) ( )
( ) ( )
1 1
0 0 0 0
1 1
1
0 0
11 1
2 2
1
2
n n
i i i i
i i
n
i i
i
tr
tr
− −
= =

=
 ′ ′
− − − = − − −  
  
  
 ′  = − − −      
 
∑ ∑
∑x x x x
x x
Σ Σ
Σ
µ µ µ µ
µ µ

Dengan menerapkan Teorema 4.7, kita punya

( )
( )
S
/2
0
/2
/2
0
1
max ,
2
np
n
np
L e
π

=
Σ
Σ
Σ
µ (0.62)
Dengan
S
( ) ( )0
1
1
n
i
n
=

= − −∑x xΣ µ µ
Dengan menggunakan (0.61) dan (0.62) , kita peroleh bentuk
likelihood ratio

( )
( )
S
S
/2
0
0
max
max
n
L
LR
L
 

 = Λ = =  
 
  
Σ
Σ
Σ Σ
Σ
Σ
µ,
µ ,
µ,
(0.63)
Statistic yang ekuivalen dengan persamaan (0.63),
S
S
2/
0
n
 

Λ = 

 
Σ
Σ

disebut Wilks’ Lambda. Jika nilai teramati dari likelihood ratio terlalu
kecil, akibatnya hipotesis
0 0
:H =µ µ tidak mungkin sesuai, oleh
karena itu hipotesis ditolak. Kasus khusus, Uji likelihood ratio dari
0 0
:H =µ µ lawan
1 0
:H ≠µ µ tolak
0
H jika
S
S
( ) ( )
( )( )
/2
/2
1
0
0 0
1
n
n
n
i i
i
n
i i
i
c
α
=
=
 
 ′ − −         Λ = = <        ′  − −     

∑x x x x
x x
Σ
Σ
µ µ
(0.64)
Dimana
c
α
merupakan persentil 100α bawah distribusi .Λ

69 Ir
Teorema 1.
Misalkan
1 2
, , ,
n
X X X⋯ sampel acak dari suatu populasi berdistibusi
normal, (),
p
N Σµ . Maka uji pada persamaan (0.58) didasarkan pada
2
T ekuivalen terhadap uji likelihood ratio dari
0 0
:H =µ µ lawan
1 0
:H ≠µ µ
Karena
( )
1
2
2/
1
1
n T
n

 

Λ = +   − 

w
4. Daerah Kepercayaan dan Perbandingan Simultan Komponen Rata-
Rata
Untuk melakukan inferensi dari suatu sampel, kita perlu memperluas
konsep interval kepercayaan dari masalah univariat ke masalah
daerah kepercayaan multivariate. Misalkan θ merupakan vektor
parameter populasi yang tidak diketahui dan Θ merupakan himpunan
semua nilai yang mungkin dari .θ Daerah kepercayaan merupakan
suatu nilai θ yang mungkin. Daerah ini ditentukan dengan data, dan
kita nyatakan (),DX dimana
1 2
, , ,
n
′ =
 
X x x x⋯ merupakan data yang
disusun secara matriks.
Daerah (),DXdikatakan mempunyai daerah kepercayaan
( )100 1 %,α−
( ) benar untuk 1P D θ α  = −
 
X (0.65)
Merupakan peluang untuk keadaan θ benar dimana nilainya tidak
diketahui.
Daerah kepercayaan untuk µ dari populasi berdistribusi dengan
jumlah variabel p

70 Ir
( ) ( )
( )
( )
( )
1
,
1
1
p n p
n p
P n F
n
α α


 −
′ − − ≤ = −
 
− −  
X S Xµ µ
Apapun nilai dari µ dan Σ. Dengan kata lain, X akan berada didalam
( )
( )
( )
1/2
,
1
p n p
n p
F
n p
α

 −
 
 
−  

Dari µ, dengan peluang dengan syarat bahwa jarak sebagaimana
digambarkan dalam model
1
n

S. Untuk sampel tertentu, x dan S
dapat dihitung, dan ketaksamaan
( ) ( )
( )
( )
( )
1
,
1
p n p
n p
n F
n p
α




− − ≤

X S Xµ µ akan mendefinisikan
daerah
()DX dalam ruang semua nilai parameter yang mungkin.
Dalam kasus ini, daerah akan berupa ellipsoid pada titik tengah x .
Suatu daerah kepercayaan ( )100 1 %α− untuk rata-rata dari distribusi
normal berdimensi-p merupakan ellips yang ditentukan oleh semua
nilai µ sehingga
( ) ( )
( )
1
, ,
1
p n p
p n
n F
n p
α




− − ≤−
x S xµ µ (0.66)
Dimana
1
1
,
n
i
i
n
=
=∑x x
( )
( ) ( )
1
1
1
n
i i
i
n
=

= − −
− ∑
S x x x x dan
1 2
, , ,
n
x x x⋯ adalah sampel teramati.
Untuk menentukan apakah sembarang
0
µmenyimpang dari daerah
kepercayaan atau tidak, perlu dilakukan jarak kuadrat umum
( ) ( )
1
0 0
n
−′
− −
x S x
µ µ dan bandingkan dengan
( )
, ,
1
p n p
p n
F
n p
α−


. Jika

71 Ir
jarak kuadrat lebih besar dari
( )
, ,
1
p n p
p n
F
n p
α−


,
0
µ tidak berada dalam
daerah kepercayaan.
Untuk 4p≥ , kita tidak dapat menggambarkan grafik dari daerah
kepercayaan untuk µ. Namun demikian, kita dapat menghitung sumbu
dari ellips kepercayaan dan yang berkaitan dengan panjangnya.
Dengan menentukan nilai eigen dan vektor eigen dari .S
Panjang dan arah sumbu dari
( ) ( )
( )
1
, ,
1
p n p
p n
n F
n p
α




− − ≤−
x S xµ µ
Ditentukan dengan
( )
( )
, ,
1
i i p n p
p nc
F
n n pn
α
λ λ


=


Unit sepanjang vektor eigen
i
e ,
( )
, ,
(n 1)
i p n p i
p
F
n n p
α
λ


±

e, dimana , 1,2, ,
i i i
i p= =Se e ⋯λ (0.67)
w Contoh 4.3 (mengkonstruksi elips kepercayaan untuk µ)
Data radiasi dari oven microware pada contoh 4.10 dan 4.17. Misalkan

4
1
Pengukuran radiasi dengan pintu tertutupx=

Dan

4
2
Pengukuran radiasi dengan pintu tertutupx=

Untuk 42n= pasangan dari pengamatan yang telah
ditransformasikan, diperoleh
0.564
0.603
 
 
=
 
  
x
,
0.0144 0.0117
0.0117 0.0146
 
 
=
 
  
S
,
1
203.018 163.391
169.391 200.228

  −
 
=
 

  
S

72 Ir
Dengan nilai eigen dan vektor eigen dari S adalah
1 1
2 1
0.026, 0.704 0.710
0.002, 0.710 0.704
λ
λ
 ′= =
  
 ′= =
  
e
e

Elips kepercayaan 95% untuk
µmemuat semua nilai ( )
1 2
,µ µ yang
memenuhi

1 2
1
2
42 0.564 0.603
203.018 163.391 0.564
163.391 200.228 0.603µ µ
µ
µ
 
− −
   
   − −
   
   
− −
      


()
( )2,40, 0.05
2 41
40
F≤

Atau, karena
( )2,40, 0.05
3.23,F =

( )( )
( )( )
( )( )( )
2
1
2
2
1 2
42 203.018 0.564
42 200.228 0.603
84 163.391 0.564 0.603 6.62
µ
µ
µ µ
− +

− − − ≤

Untuk melihat apakah
0.562 0.589
 ′
  
µ =
di dalam daerah
kepercayaan atau tidak, kita hitung
( )( )
( )( )
( )( ) ( )
2
2
42 203.018 0.564 0.562
42 200.228 0.603 0.589
84 163.391 0.564 0.562
0.603 0.589 1.30 6.62

+ −
− −
− = ≤

kita simpulkan bahwa
0.562 0.589
 ′
  
µ = berada dalam daerah
kepercayaan. Secara ekuivalen, suatu pengujian dari
0
0.562
:
0.589
H
 
 
 
  
µ =

73 Ir
tidak seharusnya ditolak, dengan
1
0.562
:
0.589
H
 
 

 
  
µ pada level
signifikansi 0.05α= .
Ellipsoid kepecayaan gabungan sebagaimana gambar 5.1. Titik pusat
pada 0.564 0.603 ,
 ′=
  
x dan panjang setengahnya dari sumbu mayor
dan minor diberikan oleh
( )
( )
()
()
( )
1 , ,
1 2 41
0.026 3.23 0.064
42 40
p n p
p n
F
n n p
α
λ


= =


Dan
( )
( )
()
()
( )
2 , ,
1 2 41
0.002 3.23 0.018
42 40
p n p
p n
F
n n p
α
λ


= =


Secara berurutan. Sumbu-sumbu yang menyimpang sepan jang
1
0.704 0.710
 ′=
  
e dan
2
0.710 0.704
 ′= −
  
e ketika vektor-vektor
tersebut ditempatkan pada grafik dengan x sebagai titik asal. Suatu
indikasi penyimpangan elip kepercayaan diberikan oleh rasio panjang
sumbu mayor dan minor.
Rasio tersebut adalah
( )
( )
( )
( )
1 , ,
1
2
2 , ,
1
2
0.161
3.6
0.0451
2
p n p
p n p
p n
F
n n p
p n
F
n n p
α
α
λ
λ
λ
λ




= = =



74 Ir

a
Prosedur Uji Hipotesis menggunakan Uji Hotelling
1. Kumpulkan Data sampel
2. Hitung nilai statistic uji Hotelling dengan rumus:
( ) ( )
2 1
.T n
−′
= − −
x S xµ µ
3. Pilih level uji, α
4. Tentukan nilai Hotelling berdasarkan nilai level uji
( )
( )
( )
,
1
p n p
n p
F
n p
α




5. Bandingkan Nilai statistic uji hoteling berdasarkan hasil
perhitungan dengan nilai hoteling table berdasarkan level
uji yang dipilih
6. Keputusan Statistik, Tolak H0, jika statistic likelihood
ratio, Λ,
S
S
( ) ( )
( )( )
/2
/2
1
0
0 0
1
n
n
n
i i
i
n
i i
i
c
α
=
=
 
 ′ − −         Λ = = <        ′  − −     

∑x x x x
x x
Σ
Σ
µ µ

75 Ir
yang berdistribusi
( ) ( )
( )
( )
( )
1
,
1
p n p
n p
n F
n p
α




− − ≤

X S Xµ µ
7. Buat Kesimpulan Berdasarkan langkah (5)
a. Perbandingan berganda metode Banferroni
Andaikan bahwa, sebelum mengumpulkan data, pernyata an
kepercayaan seputar m kombinasi linear
1 2
, ,
m
′ ′ ′a a a⋯µ, µ µ perlua
ditetapkan. Misalkan
i
C menyatakan pernyataan kepercayaan sekitar
nilai dari
i
µ′a dengan benar 1 , 1, 2, ,
i i
P C i m α  = − =
 
⋯. Perhatikan,
( )
( )( )
11
semua benar 1 Paling sedikit satu Salah
1 salah
1 1 benar
i i
m
i
i
m
i
i
P C P C
P C
P C
=
=
    = −
   
≥ −
= − −∑

( )
1 2
semua benar 1
i m
P Cα α α  = − + + +
 
⋯ (0.68)
Misalkan kita akan mengembangkan estimasi interval bersama-sama
untuk membatasi himpunan yang memuat komponen
i
µ dari µ.
Informasi yang kurang pada komponen-komponen yang relative
penting, pertimbangkan individual interval-t .

()
2
1;
; 1,2, ,
i
i
i n
sx t i m
n
α

± = ⋯
Dimana .
i
mα α= Karena
( )1; 2
Memuat 1 ,
i ii in m
P X t s n m
α
µ α

 
± = − 
 

1,2,...,i m= , kita punya, Dari persamaan (0.68)
1
1;
model
memuat , semua 1
1
m
i n ii i
m
P X t s n i
m m m
α
α α α
µ
α

 

   ± ≥ − + + +        
  
= −

.iiiiiiiiMiiiiiiiiA

76 Ir
Oleh karena itu, dengan satu level kepercayaan keseluruhan lebih
besar daripada atau sama dengan 1α−, kita dapat membuat m p=
pernyataan:

2 2
2 2
11 11
1 1 11; 1;
1; 1;
p p
p p
n n
pp pp
p p pn n
s s
x t x t
n n
s s
x t x t
n n
α α
α α µ
µ
− −
− −
− ≤ ≤ +
− ≤ ≤ +
⋮ ⋮ ⋮ (0.69)
w Contoh (Mengkonstruksi Interval Kepercayaan simultan
Banferroni dan membandingkannya dengan Interval-
2
T)
Perhatikan kembali contoh data radiasi oven. Kita membuat interval
kepercayaan banferoni simultan 95% untuk rata-rata
1
µ dan
2
µ, dari
keempat kaki dari pintu-tertutup dan pintu-terbuka ukuran dengan
0.05 2
i
α= , 1,2.i=
Gunakan hasil pada contoh…perhatikan bahwa 42n= dan
()( ) ( )
41 41
0.05 2 2 0.0125 2.327t t = = untuk mendapatkan
( )
11
1 41
0.0144
0.0125 0.564 2.327
42
s
x t
n
± = ±
atau
1
0.521 0.607µ≤ ≤
( )
22
2 41
0.0146
0.0125 0.603 2.327
42
s
x t
n
± = ± atau
2
0.560 0.646µ≤ ≤

Inteval Banferoni untuk kombinasi linear ′aµ dan analog dengan
interval -
2
T, mempunyai bentuk yang sama:
( )nilai kritis
n

′±
a Sa
a X
Akibatnyanya, dalam setiap interval dimana
i
m
α
α= ,

77 Ir
( )
( )
( )
1
2
,
/ 2panjang interval Banferroni
Panjang interval 1
n
p n p
t m
T p n
F
n p
α
α


=


(0.70)
Tidak bergantung pada besar acak X dan S
5. Inferensi Sample Besar Seputar Vektor Rata-Rata Populasi
Ketika sampel diambil mempunyai ukuran yang besar, uji hipotesis dan
daerah kepercayaan untuk µ dapat dikonstruksi tanpa asumsi
populasi berdistribusi normal.
Hal yang dianjutkan berkaitan dengan sampel yang berukuran besar
mungkin secara partial kehilangan informasi oleh hanya pada
penggunaan nilai-nilai statistic seperti X dan S.
Semua inferensi seputar µ yang berasal dari sampel yang berukuran
besar didasarkan pada distribusi chi-kuadrat,
2
χ, dari persamaan 4-
28 diketahui bahwa
( ) ( )( ) ( ) ( ) ( )
1 1
1
n n
− −

′ ′
− − = − −
X S X X S X
µ µ µ µ
Didekati dengan
2
χ dengan fungsi padat peluang
( ) ( ) ( ) ( )
1
2
1
p
P n χ α α
−  ′
− − ≤ = − 
  
X S Xµ µ (0.71)
Dimana ()
2
p
χ α persentil ke ( )100α dari distribusi
2
p
χ.
Teorema 5.11
Misalkan
1 2
, , ,
n
X X X⋯ sampel acak dari populasi dengan rata-rata µ
dan matriks kovariansi Σ definit positif. Ketika n p− besar, hipotesis
0 0
:H =µ µ ditolak pada taraf signifikansi α yang dipilih. Jika
pengamatan
( )( )()
1 2
0 0
p
n
χ α
−′
− −
x S xµ µ

78 Ir
Dimana Dimana ()
2
p
χ α persentil ke ( )100α dari distribusi
2
p
χ dengan
fpp
6. Inferensi Seputar Vektor Rata-Rata Untuk Data Missing
Dalam hal pengamatan yang dilakukan dalam suatu survey atau
pengukuran, terkadang diketemukan fakta terjadi data yang tidak
terekam atau tersimpan, yang demikian dikenal dengan Data Missing
atau Pengamatan Missing.
Pendekatan umum untuk menghitung estimasi dengan maksimum
likelihood dari data yang tidak lengkap diperkenalkan oleh Dempster,
Laird, dan Robin. Teknik yang mereka perkenalkan disebut Algoritma-
EM yang memuat perhitung secara iterative dalam dua langkah yang
disebut dengan prediksi dan estimasi.
1. Langkah prediski; Diberikan beberapa estimasi
ɶ
θ dari parameter
yang tidak diketahui, prediksi dari pengamatan yang pada statistic
sufficient
2. Langkah Estimasi; Gunakan prediksi statistic sufficient untuk
menghitung estimasi revisi dari parameter.
Ulangi perhitungan dari satu langkah ke langkah selanjut hingga
mendapatkan estimasi revisi yang tidak terlalu berbeda dari estimasi
yang diperoleh dari iterasi sebelumnya.
Diberikan pengamatan
1 2,
, ,
n
X X X⋯ merupakan sampel acak dari
populasi yang berdistribusi normal sebanyak p variabel. Algoritma –
EM didasarkan pada statistic data lengkap

1
1
n
j
j
T n
=
= =∑x x dan ( )
2
1
1
n
j j
j
n n
=
′ ′= = − +∑T x x S xx
Diasumsikan bawah parameter populasi µ dan Σ tidak diketahui dan
harus diestimasi

79 Ir
Langkah Prediksi. Untuk setiap vektor
j
x dengan nilai missing,
misalkan
()1
j
x menyatakan komponen missing dan
()2
j
x komponen yang
ada. Selanjutny,
()()1 2
,
j j j
 
′= 
 
x x x
Diberikan estimasi ɶµ dan
u
Σ dari langkah estimasi, gunakan rata-rata
dari syarat distribusi normal dari
()1
x, diberikan
()2
x untuk
mengestimasi nilai missing.

() ()()u
( )
()uu () ()
( )
1 1 2 2 21
12 22
| ;
j j j j j
E= = + −x X x x x Σ Σ Σɶ ɶɶ ɶµ, µ (0.72)
Estimasi kontribusi dari
()1
j
x pada
1
T
Selanjutnya, kontribusi estimasi dari
()1
j
x pada
2
T
( ) ( )P
( ) ( ) ( ) u
( )
u u u u ( ) ( )1 1 1 1 2 1 1
11 12 22 21| ;
j j j j j j j
E ′ ′= = + +x x X X x x x Σ Σ Σ Σ Σɶ ɶ ɶµ, (0.73)
Dan
( ) ( )
P
( ) ( ) ( ) u
( )
( ) ( )1 2 1 2 2 1 2
| ;
j j j j j j j
E ′ ′= =x x X X x x x Σɶ ɶµ,
Langkah estimasi; Hitung estimasi maksimum likelihood revisi

u
1
n
T
ɶµ =,
u u
2
1
n
′= −TΣ ɶ ɶµµ (0.74)
Untuk memudahkan pemahaman tentang algoritma-EM, perhatikan
contoh berikut
w Contoh (Ilustrasi Algoritma-EM)
Estimasi rata-rata populasi normal µ dan matriks kovariansi Σ
menggunakan data yang tidak lengkap.

80 Ir

0 3
7 2 6
5 1 2
5
 −
 
 
 
=
 
 
 
− − 
 
X

Dari matriks data tersebut, diketahui 4n= dan 3p= dan bagian dari
vektor pengamatan
1
x dan
4
x missing.
Dari sampel awal, dapat dihitung nilai statistik
1
7 5
6,
2
µ
+
= =ɶ

2
0 2 1
1,
3
µ
+ +
= =ɶ
3
3 6 2 5
4,
4
µ
+ + +
= =ɶ

Selanjutnya hitung estimasi matriks kovariansi. Konstruksi estimasi
tersebut menggunakan pembagi n karena algoritma merupakan hasil
dari maksimum likelihood,

( ) ( ) ( ) ( )
2 2 2 2
11
6 6 7 6 5 6 6 6
1
4 2
σ
− + − + − + −
= =ɶ

( ) ( ) ( ) ( )
2 2 2 2
22
0 1 2 1 1 1 1 1
1
4 2
σ
− + − + − + −
= =ɶ
( )( )( )( )
( )( ) ( )( )
12
6 6 0 1 7 6 2 1
5 6 1 1 6 6 1 1
1
4 4
σ
− − + − − +
− − + − −
= =ɶ

23
3
4
σ=ɶ

13
1σ=ɶ
Komponen pertama dari vektor
1
x adalah missing, sehingga kita partisi
ɶµ dan
u
Σsebagai

81 Ir

( )
( )
11
2 2
3
µ
µ
µ
µ
µ
 
  
  
= =   
  
 
 
 
ɶ
ɶ
ɶ ɶ
ɶ
ɶ
µ
,

u
u u
u u11 12 13
11 12
12 22 23
21 22
13 23 33
σ σ σ
σ σ σ
σ σ σ
 
  
  
= =
  
  
 
 
 
Σ Σ
Σ
Σ Σ
ɶ ɶ ɶ
ɶ ɶ ɶ
ɶ ɶ ɶ

dan prediksi

u u
12
1
12 2
12
11 1
13 3
1
1 3
2 4
3 5
4 2
0 11
6 ,1
3 44
5.73
x
x
x
µ
µ
µ


 −
 
= +
 

  
   − 
    = +
     −
      
=
Σ Σ
ɶ
ɶɶ
ɶ

l u u u
( )
12
1
2 2
12 21
11 11 11
1
1 3 1
2
2 4 4
3 5
4 2
1 1
,1 5.73
12 4
32.99
x xσ


= − +
    
    = − +
    
       
=
Σ Σ Σɶ ɶ

P
11 12 13 11 12, 13
, 5.73 0, 3 0,17.18x x x x x x       = = =
      
ɶ

Untuk dua komponen missing yang lainnya,
4
x partisi ɶµ dan
u
Σ
sebagai
( )
( )
11
2 2
3
µ
µ
µ
µ
µ
 
  
  
= =   
  
 
  
ɶ
ɶ
ɶ ɶ
ɶ
ɶ
µ
,
u
u u
u u11 12 13
11 12
12 22 23
21 22
13 23 33
σ σ σ
σ σ σ
σ σ σ
 
  
  
= =   
  
 
  
Σ Σ
Σ
Σ Σ
ɶ ɶ ɶ
ɶ ɶ ɶ
ɶ ɶ ɶ

dan prediksi

82 Ir

P
u
u u
( ) ( )
41 41
43
42 42
1
1
12 22
43 3
2
1
3
4
5;
16 5
5 4
1 2
6.4
1.3
x X
E x
x X
x
µ
µ
µ


     
    = =             
 
 
= + −
 
   
    
   
= + −     
    
 
 
=
 
  
Σ
Σ Σ
ɶ
ɶ
ɶ
ɶ
µ,

Untuk kontribusi pada
1
T.
Latihan Soal
5. 1. (a) Evaluasi
2
T untuk menguji
0
: 7 11H
 ′
  
µ = dengan
menggunakan data
2 12
8 9
6 9
8 10
 
 
 
 
=
 
 
 
 
 
X
(b) tentukan distribusi dari
2
T untuk keadaan (a)
( c) Gunakan (a) dan (b), untuk menguji
0
H pada taraf signifikansi
0.05α= , Kesimpulan apa yang anda dapat ambil?
5. 2. Gunakan data dalam 5.1. Periksa bahwa
2
Ttidak mengalami perubahan
jika pengamatan
j
x, 1,2, 3j= diganti dengan
j
Cx , dimana
1 1
1 1
 −
 
=
 
  
C
Perhatikan bahwa pengamatan
1 2
1 2
j j
j
j j
x x
x x
 −
 
=
 
+
  
Cx

83 Ir
Menghasilkan matriks pengamatan
( ) ( ) ( )
( ) ( ) ( )
6 9 10 6 8 3
6 9 10 6 8 3
′ − − −
 
 
+ + +
  

5. 3. (a) gunakan rumus pada persamaan (5-15) untuk mengevaluasi data
dalam latihan 5.1
(b) Gunakan data dalam latihan 5.1 untuk mengevaluasi Γ, juga evaluasi
lambda wilk

84 Ir
BAB V
MEMBANDINGKAN BEBERAPA
RATA-RATA MULTIVARIAT






1. Perbandingan Berpasangan dan Rancangan Pengukuran Berulang
Perbandingan Berpasangan
Pengukuran dari eksperimen yang berbeda biasanya disimpan dalam
himpunan yang berbeda dimaksudkan untuk melihat apakah respon
pada setiap himpunan data dari eksperimen-eksperimen tersebut
berbeda secara signifikans. Sebagai contoh, Kemanjuran suatu obat
herbal baru atau titik jenuh kampanye melalui iklan mungkin saja
ditentukan melalui perbandingan pengukuran sebelum “perlakuan”
(obat herbal atau iklan) dengan setelah “perlakuan”. Dalam situasi
yang lain, dua atau lebih perlakuan dapat dilakukan pada unit
eksperimen yang sama, dan respon dapat dibandingkan untuk menilai
efek dari perlakuan.
Satu pendekatan yang rasional untuk membandingkan dua perlakuan,
atau ada tidaknya efek dari suatu perlakuan, adalah dengan cara
melakukan kedua perlakuan pada unit yang identic. Pasangan respon
selanjutnya dimungkinkan untuk dianalisis dengan menghitung
perbedaan antara keduanya, cara yang demikian dimaksudkan untuk
mengeliminasi pengaruh variasi dari unit-ke-unit.
Sebelum kita membahas lebih lanjut terkait dengan perbandingan
berpasangan multivariate, kita ingatkan kembali perbandingan

85 Ir
berpasangan pada kasus univariate untuk memudahkan dalam
memahami masalah yang akan didiskusikan.
Misalkan
1i
X menyatakan respon pada perlakuan 1 (atau respon
sebelum perlakuan), dan misalkan
2i
X menyatakan respon pada
perlakuan 2 (atau respon setelah perlakuan) untuk perlakuan ke-i.
Pasangan ( )
1 2
,
i i
X X merupakan hasil pengukuran pada unit ke-i
.Perbedaan antara keduanya adalah

1 2
, 1,2, ,
i i i
D X X i n= − = ⋯ (0.75)
Distribusi dari data perbedaan antara kedua pengamatan diketahui
berdistribusi normal, ( )
2
,
d
Nδ σ dengan statistik
d
D
t
S n
δ−
= (0.76)
Dimana
1
1
n
i
i
D D
n
=
=∑ dan ( )
2
2
1
1
1
n
d i
i
s D D
n
=
= −
− ∑ (0.77)
Berdistribusi
t dengan derajat bebas 1n− . Dengan suatu
konsukuensi, pada uji hipotesis pada level -α dari

0
: 0Hδ= lawan
1
: 0Hδ≠
Diuji dengan membandingkan t dengan
()1; 2n
t
α−
persentil ke-
()100 2α dari distribusi-t dengan derajat bebas 1n−. Interval
kepercayaan ( )100 1 %α− untuk perbedaan rata-rata
( )
1 2i i
E X Xδ= − diberikan oleh persamaan berikut

( ) ( )1; 2 1; 2
d d
n n
s s
d t d t
n n
α α
δ
− −
− ≤ ≤ + (0.78)
a

86 Ir
Rangkuman Prosedur Pengujian Perbandingan rata-rata berpasangan
Univariat
Tujuan: Membandingkan dua rata-rata dari satu atau dua populasi
Asumsi
Langkah-Langkah Pengujian:
1. Hitung Selisih dari pengamatan satu dengan pengamatan kedua,
gunakan rumus pada persamaan 0.75
2. Hit ung statistic dari data selisih antara kedua data, dengan rumus 0.77
3. Rumuskan Hipotesis yang akan diuji;
0
: 0Hδ=

4. Hitung Nilai Statistik Uji, gunakan persamaan 0.76
5. Tentukan Nilai kritis,
()1,
2
n
t
α−
pada taraf signifikansi yang dipilih,
α.
6. Keputusan; Tolak
0
: 0Hδ= jika
()1;
2
n
t t
α−
>

c. Perbandingan Berpasangan Multivariat
Dari kasus univariat untuk perbandingan berpasangan, kasus tersebut
dalam diperluas penggunaan ke masalah multivariate. Perbedaannya
terletak pada, p respon, dua perlakuan, dan n unit eksperimen. Kita
indentifikasi p respon dalam unit ke-i sebagai

1 1
1 2
1
2 1
2 2
2
Variabel 1 dibawah perlakuan 1
Variabel 2 dibawah perlakuan 1
Variabel p dibawah perlakuan 1
Variabel 1 dibawah perlakuan 2
Variabel 2 dibawah perlakuan 2
Variabel p
j
j
jp
j
j
jp
X
X
X
X
X
X
=
=
=
=
=
=
⋮ ⋮
⋮ ⋮
dibawah perlakuan p

dan p pasangan variabel acak berbeda menjadi

87 Ir

1 1 1 2 1
2 1 2 2 2
1 2
i j j
i j j
ip jp jp
D X X
D X X
D X X
= −
= −
= −

(0.79)
Misalkan
1 2
, ,
i i i ip
D D D ′=
 
D ⋯ , dan asumsikan, untuk 1,2, ,i n= ⋯, jika

( )
1
2
i
p
E
δ
δ
δ
 
 
 
 
=
 
 
 
 
 
D

δ = dan ()cov
i d
=D Σ (0.80)
Jika
1 2
, ,
n
D D D⋯ merupakan vektor acak yang independen dan
berdistribusi normal, ( )
p d
N Σδ,, maka inferensi sekitar vektor
perbedaan rata-rata δ dapat didasarkan pada statistic
2
T, yaitu

( )( )
2 1
d
T n
−′
= − −D S Dδ δ (0.81)
dimana

1
1
n
j
i
n
=
=∑D D dan ( ) ( )
1
1
1
n
d i i
i
n
=

= − −
− ∑
S D D D D (0.82)
Teorema 6.1.
Misalkan selisih
1 2
, ,
n
D D D⋯ merupakan sampel acak dari populasi
yang berdistribusi normal,
( )
p d
N Σδ,
.
Maka
( )( )
2 1
d
T n
−′
= − −D S Dδ δ

88 Ir
berdistribusi
( )
( )
,
1
p n p
n p
F
n p

 −
 
 
−  

Untuk sembarang nilai δdan Σ benar.
w
Suatu daerah kepercayaan ( )100 1α− untuk δ sedemikian hingga

( ) ( )
( )
( )
( )
1
,
1
d p n p
n p
F
n n p
α




− − ≤

d S dδ δ (0.83)
Demikian halnya dengan interval kepercayaan simultan
( )100 1α−
untuk perbedaan rata-rata individual
i
δ diberikan oleh

( )
( )
( )
2
,
1
:
i
d
i i n n p
n p
d F
n p n
δ α


±

s
(0.84)
Dimana
i
d merupakan elemen ke i− dari d dan
2
i
d
smerupakan elemen
diagonal ke-i dari
d
S.
Untuk n p− cukup besar, ( )( ) () ()
2
,
1
p n p p
n p n p F
α χ α

 
− − =
  
dan
asumsi normal tidak dibutuhkan.
Interval kepercayaan simultan ( )100 1α− metode banferroni untuk
selisih individual rata-rata adalah
2
1
:
2
di
i i n
s
d t
p n
α
δ

 

± 
 
(0.85)
Dimana ( )
1
2
n
t pα

merupakan persentil ke ( )100 2pα dari distribusi
t dengan derajat bebas 1n−.

89 Ir
w Contoh 6.1. (Memeriksa perbedaan rata-rata dengan
pengamatan berpasangan)
Suatu perusahaan merencanakan perlakuan air buangan yang
diperlukan untuk memonitor buangannya ke sungai dan anak sungai
yang sesuai dengan peraturan. Perhatian tentang reliabilitas data dari
satu program monitoring diambil untuk diteliti pada dua laboratorium
untuk keperluang pengujian. Setengah dari sampel dikirim ke lab 1,
dan setengah yang lainnya dikirim ke lab 2. Pengukuran bio-chemical
oxygen deman (BOD) dan suspend solid (SS) telah dilakukan, untuk
sampel 11n= terpisah, dari kedua lab tersebut. Berikut datanya
Sampel i Lab 1 Lab 2

1 1j
x
1 1j
x
1 1j
x
1 1j
x
1 6 27 25 15
2 6 23 28 13
3 18 64 36 22
4 8 44 35 29
5 11 30 15 31
6 34 75 44 64
7 28 26 42 30
8 71 124 54 64
9 43 54 34 56
10 33 30 29 20
11 20 14 39 21
Apakah hasil analisis kedua lab sama? Jika berbeda, apa
penyebabnya?
Statistik
2
T untuk menguji hipotesis
0 1 2
: , 0, 0H δ δ   ′ =
   
δ =
dikonstruksi dari perbedaan pasangan pengamatan:
1i
d
-19 -22 -18 -27 -4 -10 -14 17 9 4 -19
2i
d
12 10 42 15 -1 11 -4 60 -2 10 -7
Dari selisih tersebut

90 Ir
1
2
9.36
13.27
d
d
   −
   
= =
   
      
d ,
199.26 88.38
88.38 418.61
d
 
 
=
 
  
S
dan

2
0.0055 0.0012 9.36
11 9.36 13.27 16.6
0.0012 0.0026 13.27
T
   − −
     
= − =
       −
      

Ambil α = 0.05, diperoleh

( )
( )
( )
()
( )
, ; 0,05 2,9
1 2 10
0.05 9.47
9
p n p
p n
F F
n p

   −
   
= =
   
−      

Karena
2
1 3.6 9 .47T= > , karena itu tolak
0
H dan disimpulkan bahwa
terdapat selisih yang tidak nol antara pengukuran dari kedua lab
tersebut. Hal tersebut menunjukkan, dari inspeksi dari data, bahwa lab
1 cenderung menghasilkan pengukuran BOD yang rendah dan
pengukuran SS yang tinggi dibanding dengan lab 2. Interval
kepercayaan simultan 95% untuk selisih rata-rata
1
δ dan
2
δ dapat
dihitung dengan persamaan 0.83. Interval-interval tersebut adalah
( )
( )
( )
2
1 1 ,
1
199.26
: 9.36 9.47
11
i
d
p n p
sn p
d F
n p n
δ α


± = − ±

( )
( )
( )
2
1 1 ,
1
418.61
: 13.27 9.47
11
i
d
p n p
sn p
d F
n p n
δ α


± = ±


Interval kepercayaan simultan 95% termasuk nol, Tolak
0
H pada level
signifikansi 0.05α= . Kesimpulan apa yang dapat kita ambil?
w
Dalam contoh 6.1, peneliti secara actual membagi sampel ke dalam
dua bagian secara langsung untuk keperluan analisis kimia.
Kemudian, kedua laboratorium dimana sampel tersebut akan diteliti
kemungkinan bekerja pada kondisi yang tidak sama dapat terjadi,

91 Ir
kompetensi dari laboratorium, teknik pengukuran dan seterusnya akan
memberikan pengaruh terhadap hasil analisis.
Rangkuman Prosedur Pengujian Perbandingan rata-rata berpasangan
Multivariate
Tujuan: Membandingkan dua rata-rata dari satu atau dua populasi
Asumsi
Langkah-Langkah Pengujian:
1. Hitung Selisih dari pengamatan satu dengan pengamatan kedua,
gunakan rumus pada persamaan 0.79
2. Hitung statistic dari data selisih antara kedua data, dengan rumus 0.82
3. Rumuskan Hipotesis yang akan diuji;
0
: 0Hδ=
4. Hitung Nilai Statistik Uji, gunakan persamaan 0.81
5. Tentukan Nilai kritis,
()1; 2n
t
α−
pada taraf signifikansi yang dipilih, α.
6. Keputusan; Tolak
0
: 0Hδ= jika
( )1; /2n
t t
α−
>
Akan tetapi, ketika peneliti dapat mengontrol penetapan perlakuan
pada unit eksperimen, pasangan unit eksperimen yang tepat dan
penetapan pengacakan perlakuan dapat mempertinggi hasil analisis
statistic. Artinya, penetapan kelompok unit eksperimen yang identic
secara acak dari perlakuan 1 pada suatu unit dan perlakuan 2 pada
unit yang lain akan sangat membantu dalam mengeliminasi sumber
variasi yang tak terkontrol. Pengacakan yang saling independen harus
diterapkan pada setiap pasangan, berikut proses:
Rancangan eksperimen untuk Perbandingan Berpasangan

92 Ir
Untuk perbandingan berpasangan, d sebagai rata-rata selisih dan
d
S
sebagai variansi selisih, dan karena itu
2
T dapat dihitung dari sampel
penuh statistik x merupakan vektor berukuran 2 1p× dari rata-rata
sampel untuk p variabel pada kedua perlakuan, yaitu

11 12 1 21 22 2
, , , , , , ,
p p
x x x x x x ′=
 
x ⋯ ⋯ (0.86)
Dan S merupakan matriks berukuran 2 2p p× dari variansi –kovariansi
sampel, susunannya

( ) ( )
( ) ( )
11 12
21 22
p p p p
p p p p
× ×
× ×
 
 
 
=
 
 
 
 
S S
S
S S
(0.87)
Dari persamaan 0.87, matriks
11
S memuat variansi-kovariansi sampel
untuk p variabel pada perlakuan pertama. Cara yang sama untuk
22
S
demikian halnya dengan
12
S dan
21
S.
Rancangan matriks

( )
( )1
2
1 0 0 1 0 0
0 1 0 0 1 0
0 0 1 0 0 1
kolom p
p p
+
×

  −
 
 

 
=
 
 
 
− 
 
C
⋯ ⋯
⋯ ⋯
⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
⋯ ⋯
(0.88)
Membandingkan Percobaan untuk Rancangan Pengukuran Berulang
Situasi dimana m perlakuan dibandingkan dengan satu variabel
respon. Setiap subjek atau unit eksperimen menerima setiap
perlakuan sekali sepanjang satu periode waktu.
Pengamatan ke-i adalah

93 Ir

1
2
i
i
i
im
X
X
X
 
 
 
 
=
 
 
 
 
 
X

, 1,2, ,i m= ⋯
Dimana
1i
X merupakan respon pada perlakuan ke-i pada unit ke j.
Pengukuran berulang merupakan fakta bahwa semua perlakuan
dilakukan pada setiap unit.
Untuk tujuan perbandingan, perhatikan kontras komponen dari
()
i
Xµ = Ε
1 2 1
1 3 2
1
1
1 1 0 0
1 0 1 0
0
1 0 0 1
m m
µ µ µ
µ µ µ
µ µ µ
     − −
     
     
− −
     
= =
     
     
     
− −     
     
C


⋮ ⋮ ⋮ ⋮ ⋱ ⋮

µ
Atau
2 1 1
3 2 2
2
1
1 1 0 0 0
0 1 1 0 0
0 0
0 0 0 11
m m m
µ µ µ
µ µ µ
µ µ µ

     − −
     
     
− −
     
= =
     
     
     
− −     
     
C


⋮ ⋮ ⋮ ⋮ ⋱ ⋮

µ
1
C dan
2
C disebut matriks kontras, karena baris 1m− independen
secara linear dan masing-masing adalah vektor kontras
Ketika rata-rata perlakuan adalah sama. Secara umum hipotesis
bahwa tidak ada perbedaan dalam perlakuan menjadi =Cµ 0 untuk
sembarang kontras.

94 Ir
Pengujian Kesamaan Perlakuan dalam Rancangan Penguk uran
Berulang
1. Sampel pengamatan dari populasi yang berasal dari distribusi normal,
(),
m
N Σµ, dan misalkan C merupakan matriks konstras. Dengan

1
1
n
i
i
n
=
=∑x x dan ( ) ( )
1
1
1
n
i i
i
n
=

= − −
− ∑
S x x x x (0.89)
2. Hipotesis
0
:HC 0µ = lawan
1
:H ≠C 0µ
3. Taraf Signifikansi, α
4. Statistika Uji
()( )
1
2
T n


′= Cx CSC Cx
5. Daerah Kepercayaan untuk kontras Cµ dengan µ sebagai rata-rata
populasi, himpunan semua Cµ, yaitu
( )( )( )
1
n G


′− − ≤Cx C CSC Cx Cµ µ
(0.90)
Dimana
( )( )
( )
( )
1, 1
1 1
1
m n m
n m
G F
n m
α
− − +
− −
=
− + dan
x dan S
sebagaimana yang didefinisikan pada persamaan 0.89.
6. Interval kepercayaan simultan ( )100 1 %α− untuk satu kontras ′cµ
untuk sembarang vektor kontras,

( )( )
( )
1, 1
1 1
1
m n m
n m
F
n m n
− − +
− − ′
′ ′ ±
− +
c Sc
c : c xµ
0.91
7. Keputusan, Tolak
0
H jika
()( )
1
2
T n G


′= >Cx CSC Cx
(0.92)
Untuk G sebagaimana pada persamaan 0.90.
dimana ()
1, 1m n m
F α
− − +
merupakan persentil atas ( )100 1 %α− dari
distribusi F dengan 1m− dan 1n m− + sebagai derajat bebas.
w Contoh 6.1. Pengembangan bius (anestesi)
dikembangkan pertama kali untuk meneliti efeknya terhadap binatang.
Dalam satu penelitian, 19 anjing diberikan pentobarbital. Setiap anjing

95 Ir
selanjutnya di berikan carbon dioxide, CO2, pada setiap dua level.
Selanjutnya ditambahkan halothane (H), kemudian diberikan lagi CO
2.
Respon, heartbeats (denyut jantung) permilisecond, diukur atau
terdapat empat kombinasi perlakuan:

Perlakuan 1 = CO2 tekanan tinggi tanpa H
Perlakuan 2 = CO2 tekanan rendah tanpa H
Perlakuan 3 = CO2 tekanan tinggi dengan H
Perlakuan 4 = CO2 tekanan rendah dengan H
Kita akan menganalisis efek anestesi dari tekanan CO2 Halothane dari
rancangan pengukuran berulang
Solusi 6.2. Terdapat 3 kontras perlakuan yang mungkin untuk
diperhatikan dalam percobaan ini. Misalkan
1 2 3 4
, , ,µ µ µ µ merupakan
rata-rata respon untuk perlakuan 1, perlakuan 2, perlakuan 3 dan
perlakuan 4 yang bersesuaian. Selanjutnya

( ) ( )
( ) ( )
3 4 1 2
2
1 3 2 4
1
Kontras Halothane mewakili
selisih antara ada dan tidak
adanya halothane
Kontras CO mewakili
selisih antara tekanan
tinggi dan rendak
µ µ µ µ
µ µ µ µ
µ
 

  + − + = 
 
 

 
 

  + − + = 
 
 

  
( ) ( )
4 2 3 2
Kontras mewakili pengaruh
halothane pada tekanan CO
"interaksi"
µ µ µ
 

  + − + = 
 
 

 

dengan
1 2 3 4
, , ,µ µ µ µ ′
 
µ = dengan matriks kontras C adalah

96 Ir

1 1 1 1
1 1 1 1
1 1 1 1
 
− −
 
 
= − −
 
 
− − 
 
C


Tabel 6.2 Data Tidurnya Anjing
Anjing Perlakuan
1 2 3 4
1 426 609 556 600
2 253 236 392 395
3 359 433 349 357
4 432 431 522 600
5 405 426 513 513
6 324 438 507 539
7 310 312 410 456
8 326 326 350 504
9 375 447 547 548
10 286 286 403 422
11 349 382 473 497
12 429 410 488 547
13 348 377 447 514
14 412 473 472 446
15 347 326 455 468
16 434 458 637 524
17 364 367 432 469
18 320 395 508 531
19 397 556 645 625

Dari Table 6.2, diperoleh

97 Ir
368.21
404.63
479.26
502.89
 
 
 
 
=
 
 
 
 
 
x dan
2819.29
3568.42 7962.14
2943.49 5303.98 6851.32
2295.35 4065.44 4499.63 4878.99
 
 
 
 
=
 
 
 
 
 
S
Dari matriks kontras dan nilai vektor rata-rata serta matrik variansi,
diperoleh
209.31
60.05
12.79
 
 
 
= −
 
 
− 
 
Cx ;
9432.32 1098.92 927.62
1098.92 5195.84 914.54
927.62 914.54 7557.44
 
 
 
′=
 
 
 
 
CSC
dan
()( )() ()
1
2
10 6.11 166T n


′= = =Cx CSC Cx

Untuk
α=0.05.

( )( )
( )
( )
()
( )
( )
( )
1, 1 3,16
1 1 18 3
0.05
1 16
18 3
3.24
16
10.94
m n m
n m
F F
n m
α
− − +
− −
=
− +
=
=

Untuk
2
116 10.94T= > , tolak
0
:HC = 0µ (tidak ada efek perlakuan)
Untuk melihat apakah kontraks berkaitan dengan penolakan hipotesis
null, untuk mengetahui hal tersebut, berikut penjelasannya.
Konstruksi interval kepecayaan simultan pada taraf kepercayaan 95%
untuk keseluruhan kontras, Kontras

98 Ir
( )( )
1 3 4 1 2
halothanePengaruhµ µ µ µ′ + − + =cµ =
Diestimasi dengan interval
( ) ( )
()
( )
1 1
3 4 1 2 3,16
18 3
0.05
16 19
9432.32
209.31 10.94
19
209.31 73.70
x x x x F

+ − + ±
= ±
= ±
c Sc

Dimana
1
′c adalah baris pertama dari matriks C. Dengan cara yang
sama untuk kontras yang lain diestimasi dengan
( )( )
1 3 2 4 2
halothane COPengaruhµ µ µ µ+ − + =
Diestimasi dengan interval

5195.84
60.05 10.94 60.05 54.70
19
− ± = − ±
( )( )
1 4 2 3 2
H-COInteraksiµ µ µ µ+ − + =
Diestimasi dengan interval

7557.44
12.79 10.94 12.79 65.97
19
− ± = − ±
Interval kepercayaan pertama, menyatakan ada efek halothane
w
2. Membandingkan Vektor Rata-Rata Dua Populasi
Statistic-
2
T untuk menguji kesamaan vektor rata-rata dari dua
populasi multivariate dapat dikembangkan dari prosedur univariat.
Statistik-
2
T tepat untuk membandingkan respon dari satu himpunan
perlakuan (populasi 1) dengan repson lain yan independen (populasi
2). Perbandingan dapat dibuat tanpa secara eksplisit mengontrol
variabilitas unit-ke-unit, sebagaimana kasus perbandingan
berpasangan.

99 Ir
Perhatikan sampel acak beukuran
1
n dari populasi 1 dan sampel acak
berukuran
2
n dari populasi 2. Pengamatan pada p variabel disusun
sebagai berikut
Sampel Ringkasan Statisik
Populasi 1
1
11 12 1
, ,
n
x x x⋯
1
1 1
11
1
n
j
j
x
n
=
=∑x ( ) ( )
1
1 1 1 1 1
11
1
1
n
j j
j
n
=

= − −
− ∑
S x x x x
Populasi 2
2
11 12 1
, ,
n
x x x⋯
1
2 2
12
1
n
j
j
x
n
=
=∑x ( ) ( )
1
2 2 2 2 2
12
1
1
n
j j
j
n
=

= − −
− ∑
S x x x x
Akan dibuat inferensi seputar
( )( )
1 2
vektor rata-rata Pop 1 vektor rata-rata Pop 2− = − µ µ
Asumsi berkenaan dengan Struktur Data
1. Sampel
1
11 12 1
, ,
n
X X X⋯ adalah sampel acak berukuran
1
n dari
populasi p variabel dengan vektor rata-rata
1
µ dan matriks
kovariansi
1
Σ.
2. Sampel
2
11 12 1
, ,
n
X X X⋯ adalah sampel acak berukuran
2
n dari
populasi p variabel dengan vektor rata-rata
2
µ dan matriks
kovariansi
2
Σ.
3.
1
11 12 1
, ,
n
X X X⋯ dan
2
11 12 1
, ,
n
X X X⋯ independen
Asumsi Ketika r
w dan r
w Kecil
1. Kedua populasi berdistribusi normal multivariate
2.
1
Σ =
2
Σ
Asumsi kedua, bahwa
1
Σ =
2
Σ, harus lebih kuat dibanding univariat.
Asumsikan pula bahwa beberapa pasangan variansi dan kovariansi
sangat dekat kesamaannya.

100 Ir
Ketika
1 2
= =Σ Σ Σ , ( ) ( )
1
1 1 1 1
1
n
j j
j
=

− −∑x x x x adalah estimasi dari
( )
1
1n−Σ dan ( ) ( )
2
2 2 2 2
1
n
j j
j
=

− −∑x x x x merupakan estimasi dari
( )
2
1n−Σ. Akibatnya, kita dapat menyatukan (pool) informasi dalam
kedua sampel dalam rangka mengestimasi kovariansi umum Σ.
perhitungannya
( ) ( ) ( ) ( )
1 1
1 1 1 1 2 2 2 2
1 1
1 2
2
n n
j j j j
j j
n n
= =
′ ′
− − + − −
=
+ −∑ ∑
p
x x x x x x x x
S


1 2
1 2
1 2 1 2
1 1
2 2
n n
n n n n
− −
= +
+ − + −
S S (0.93)
Karena ( ) ( )
1 1 1 1
1
n
j j
j
=

− −∑x x x x mempunyai derajat bebas
1
1n− dan
( ) ( )
2 2 2 2
1
n
j j
j
=

− −∑x x x x dengan derajat bebas
2
1n− . Pembagi pada
persaman 0.93 diperoleh dari kombinasi dua derajat bebas.
Untuk menguji hipotesis bahwa
1 2 0
− =µ µ δ ,
karena asumsinya adalah independen, maka ( )
1 2
cov , 0 =X X ,
akibatnya

( ) () ()
1 2 1 2
1 2
1 2
cov cov cov
1 1
1 1
n n
n n
− = +
=
 

=   
X X X X
Σ + Σ
+ Σ (0.94)

101 Ir
Karena
p
S estimasi dari Σ, nampak bahwa
1 2
1 1
n n
 

+   
p
S merupakan estimasi dari
1 2
1 1
n n
 

   
+ Σ
Uji likelihood ratio dari

0 1 2 0
:H − =µ µ δ
Didasarkan pada kuadrat statistic jarak,
2
T. Tolak
0
H jika
( ) ( )
1
2 2
1 2 0 1 2 0
1 2
1 1
T c
n n

  
′  = − − + − − >     
 
p
x x S x xδ δ
0.95
Dimana jarak kritis
2
c ditentukan dari distribusi dua-sampel statistic-
2
T.
Teorema 6.1
Jika
1
11 12 1
, , ,
n
X X X⋯ merupakan sampel acak berukuran
1
n dari
populasi berdistribusi normal, ( )
1
,
p
N Σµ dan sampel acak berukuran
2
n yaitu,
1
21 22 2
, , ,
n
X X X⋯ , independen dari populasi berdistrusi
( )
2
,
p
N Σµ , maka
( ) ( )
1
2
1 2 0 1 2 0
1 2
1 1
T
n n

  
′  = − − + − −      
 
p
x x S x xδ δ
berdistribusi

( )
( )
1 2
1 2
, 1
1 2
2
1
p n n p
n n p
F
n n p
+ − −
+ −
+ − −

akibatnya

102 Ir
( )( )
( )( )
1
1 2 1 2
1 2
2
1 2 1 2
1 1
1
n n
c
α

  
′  − − − +       
− − − ≤ = −
p
x x S
x x µ µ
µ µ
(0.96)
dimana
( )
( )
( )
1 2
1 22
, 1
1 2
2
1
p n n p
n n p
c F
n n p
α
+ − −
+ −
=
+ − −
.
w
w Contoh 6.3. (Mengkonstruksi Daerah Kepercayaan untuk selisih
dua vektor rata-rata.).
50 buah sabungan batangan dibuat dengan dua cara. D ua
karakteristik,
1
X = busa dan
2
X = kelembutan. Ringkasan statistic
untuk batang dihasilkan dengan metode 1 dan metode 2 adalah
1
8.3
4.1
 
 
=
 
  
x ,
1
2 1
1 6
 
 
=
 
  
S
2
10.2
3.9
 
 
=
 
  
x ,
2
2 1
1 4
 
 
=
 
  
S
Menghasil suatu daerah kepercayaan 95% untuk
1 2
−µ µ.
Pertama, perhatikan bahwa
1
S dan
2
S hampir sama, sehingga cukup
beralasan untuk digabungkan. Karena itu,

1 2
2 149 49
1 598 98
 
 
= +
 
  
p
S S S
Demikian halnya

1 2
1.9
0.2
 −
 
− =
 
  
x x

103 Ir
Sehingga daerah kepercayaan adalah terpusat pada [-1.9, 0.2]’. Nilai
eigen dan vektor eigen dari
p
S diperoleh dari persamaan

2
2 1
0 7 9
1 5λ
λ λ λ
λ−
= − = = − +

p
S I
Sehingga,
( )7 49 36 2λ= ± − . Akibatanya,
1
λ =5.303 dan
2
λ
=1.697, dan vektor eigen yang bersesuaian,
1
e dan
2
e ditentukan dari

i i i
λ=
p
S e e , 1,2i=
adalah

1
0.290
0.957
 
 
=
 
   
e dan
2
0.957
0.290
 
 
=
 

   
e

( )( )
( )
( )
2
2,97
1 2
98 21 1 1 1
0.05 0.25
50 50 97
c F
n n
   
  + = +  =       

Karena
( )
2,97
0.05 3.1F =, daerah kepercayaan diperluas

2
1 21 1
0.25
i i
c
n nλ λ
 

+ =    

104 Ir
Unit sepanjang eigen vektor
i
e . atau 1.15 unit dalam arah
1
e dan 0.65
unit dalam arah
2
e .
w
Interval Kepercayaan Simultan
Dimungkinkan untuk menurunkan interval kepercayaan simultan
untuk komponen dari vektor
1 2
−µ µ. Interval kepercayaan tersebut
dikembangkan dari mempertimbangk seluruh kombinasi linear dari
perbedaan dalam vektor rata-rata. Asumsinya adalah populasi
multivariate berasan dari populasi yang berdistribusi normal dengan
kovariansi umum Σ.
Teorema 6.2
Misalkan
( )( ) ()
1 2
2
1 2 1 2 , 1
2 1
p n n p
c n n p n n p F
α
+ − −
 
= + − + − −
  

dengan peluang 1α−.
( )
1 2
1 2
1 1
c
n n
 

′ ′ − ± +     
p
a X X a S a
Akan meliputi ( )
1 2
′−aµ µ untuk semua a. Untuk suatu ( )
1 2j i
µ µ−
akan meliputi
( )
1 2 1.
1 2
1 1
j j i
X X c S
n n
 

− ± +     
p
untuk 1,2, ,j p= ⋯
w
Keadaan Dua Sampel Ketika
1 2
≠Σ Σ
Untuk kasus dimana
1 2
≠Σ Σ , sulit untuk mendapatkan ukuran
“jarak” seperti
2
T, yang distribusinya tidak bergantung pada
1 2
Σ , Σ
yang tidak diketahui. Uji Bartlet digunakan untuk menguji kesamaan
dari
1
Σ dan
2
Σdalam model variasi yang umum. Hal yang kurang
menguntungkan adalah ketika populasinya bukan dari distribusi

105 Ir
normal. Distribusi yang tidak normal dan kovariansi yang tidak sama
tidak dapat dipisahkan dengan uji Bartlet.
Suatu metode pengujian kesamaan dua matriks kovariansi yang
kurang sensitive terhadap asumsi normal multivariate telah
dikemukakan oleh Tiku dan Balakrisnan.
Teorema 6.3.
Misalkan sampel berukuran
1
n p− dan
2
n p− besar. Lalu, suatu
ellipsoid kepercayaan dengan pendekatan ( )100 1 %α− untuk
1 2
−µ µ memenuhi

( )
( ) ()
1
1 2 1 2 1 2
1 2
2
1 2 1 2
1 1
p
n n
χ α

 
′  − − − +
   
 
 − − − ≤
 
x x S S
x x µ µ
µ µ

Dimana
()
2
p
χ α adalah persentil ke-( )100α dari distribusi chi-kuadrat
dengan derajat bebas p.
Demikian halnya interval kepercayaan simultan ( )100 1 %α− untuk
semua kombinasi linear ( )
1 2
′−aµ µ diberikan oleh
( )
1 2
′−aµ µ dibawah
( ) ( )
2
1 2 1 2
1 2
1 1
p
n n
χ α
 

′ ′ − ± +    
a x x a S S a
w
w Contoh 6.4. (Prosedur inferensi tentang selisih dalam rata-rata)
Kita akan menganalisis data konsumsi litrik. Pertama hitung

1 2
1 2
13825.3 23823.4 8632.0 19616.71 1 1 1
23823.4 73107.4 19616.7 55964.545 55
464.17 886.08
886.08 2642.15
n n
   
   
+ = +
   
      
 
 
=
 
  
S S

106 Ir
Interval kepercayaan simultan 96% untuk kombinasi linear

( )
11 21
1 2 11 21
12 22
1, 0
µ µ
µ µ
µ µ
 −
  ′− = = −
  

  
aµ µ
dan

( )
11 21
1 2 12 22
12 22
0,1
µ µ
µ µ
µ µ
 −
  ′− = = −
  

  
aµ µ
adalah

( )
( )
11 21
12 22
: 74.4 5.99 464.17 atau 21.7,127.1
: 201.6 5.99 2642.15 atau 75.8, 327.4
µ µ
µ µ− ±
− ±

Untuk menguji hipotesis
0 1 2
: 0H − =µ µ gunakan statistic-
2
T,
yaitu
( )
1
2
1 2 1 2 1 2
1 1
1
4
1 1
204.4 130.0 464.17 886.08 204.4 130.0
556.6 355.0 886.08 2642.15 556.6 355.0
59.874 20.080
74.4 201.6 10
10.080 10.519
T
n n



 
′    = − + −
    
 

     − −
     
=
     
− −
          
  −
   
=
    −
  
x x S S x x
74.4
201.6
15.66
 
 
  
   
=

Untuk α =0.05, nilai kritisanya adalah
()
2
0.05 5.99
p
χ =
dan
()
2 2
2
15.66 0.05 5.99T χ= > =
, Keputusannya tolak
0
H

Untuk memudahkan pemahaman, perhatikan contoh berikut:

107 Ir
w Contoh 6.5 (Aproksimasi Distribusi
2
T untuk
1 2
Σ ≠ Σ )
Diberikan berapa nilai statistic dari suatu data sampel, aproksimasi
distribusi
2
T untuk kasus matriks kovariansi tidak sama.
Pertama,

1
1
13825.2 23825.4 307.227 529.4091 1
23823.4 73107.4 529.409 1624.60945n
   
   
= =
   
      
S

2
2
8632.0 19616.6 156.945 356.6671 1
19616.7 55964.5 356.667 1017.53655n
   
   
= =
   
      
S
dan
( )
1
4
1 2
1 2
59.874 20.0801 1
10
10.080 10.519n n


   −
  + =
   −
    
S S
akibatnya

( )
1
4
1 1 2
1 1 2
307.227 529.409 59.874 20.0801 1 1
10
529.409 1624.609 20.080 10.519
0.776 20.060
0.092 0.646
n n n


     −
    + =
     −
        
  −
 
=
 

  
S S S

dan

2
1
1 1 2
1 1 2
0.776 20.060 0.776 20.0601 1 1
0.092 0.646 0.092 0.646
0.608 0.085
0.131 0.423
n n n
− 
      − −
      + =         − −           
  −
 
=
 

  
S S S

Demikian halnya dengan
( )
1
4
1 1 2
2 1 2
156.945 356.667 59.874 20.0801 1 1
10
356.667 1017.536 20.080 10.519
0.224 0.060
0.092 0.354
n n n


     −
    + =
     −
        
  −
 
=
 
  
S S S

108 Ir
dan

2
1
1 1 2
2 1 2
0.224 0.060 0.224 0.0601 1 1
0.092 0.354 0.092 0.354
0.055 0.035
0.053 0.131
n n n
− 
      − −
      + =       
           
 
 
=
 
  
S S S

selanjutnya

( ) ( ){ }
2 2
1 1
1 1 2 1 1 2
1 1 1 2 1 1 2
1 1 1 1 1 1 1
1
0.608 0.423 0.776 0.646 0.0678
45
tr tr
n n n n n n n
− −
                               + + +                             
 
      
= + + + =
S S S S S S

( ) ( ){ }
2 2
1 1
1 1 2 1 1 2
2 1 1 2 1 1 2
1 1 1 1 1 1 1
1
0.055 0.131 0.224 0.354 0.009
55
tr tr
n n n n n n n
− −
                               + + +                             
 
      
= + + + =
S S S S S S

Estimasi derajat bebas
v adalah

2
2 2
77.6
0.0678 0.0095
v
+
= =
+

Dan nilai kritis untuk α = 0.05 adalah

( ) ( )
, 1 2,77.6 2 1
77.6 2
0.05 0.05
1 77.6 2 1
155.2
3.12 6.32
76.6
p v p
vp
F F
v p
− + − +
×
=
− + − +
= =

Nilai statistic
2
T dari data hasil pengamatan adalah 15.66 sehingga
hipotesis ditolak pada level 5%
a

109 Ir
3. Membandingkan Beberapa Rata-Rata Populasi Multivariat
(Manova-Satu Arah)
Kenyataan dari kebanyakan penelitian lebih sering k ita
membandingkan lebih dari dua populasi. Sample acak yang
dikumpulkan dari setiap h populasi, disusun sebagai berikut

1
2
11 12 1
11 12 1
1 2
Populasi 1: , , ,
Populasi 2: , , ,
Populasi h: , , ,
h
n
n
h h hn
x x x
x x x
x x x


⋮ ⋮

(0.97)
Manova digunakan untuk menyelidiki apakah vetkor rata-rata populasi
sama atau tidak, jika tidak, komponen rata-rata yang sama yang
berbeda secara signifikan
Asumsi Terkait Struktur Data untuk Manova Satu-Arah
1.
1 2 n
, , ,
l
l l l
x x x⋯ merupakan sampel acak berukuran
l
n dari suatu
populasi dengan
l
µ; 1,2, ,l h= ⋯
2. Semua populasi mempunyai matriks kovarians Σ.
3. Setiap populasi merupakan normal multivariate
Asumsi ketiga dapat dikaitkan dengan teorema limit memusat ketika
ukuran sampel cukup besar.
Untuk memudahkan pemahaman, berikut akan dijelaskan analisis
variansi (Anova) yang berkaitan dengan analisis univariat
Ringkasan ANOVA Univariat
Asumsi dalam kasus univariat
1.
1 2 n
, , ,
i
i i i
x x x⋯ sampel acak dari populasi yang berdisitrubi
normal, (),
i
Nµ σ berukuran.
2. Sampel acak saling independen.
Meskipun hipotesis nol dari kesamaan rata-rata dapat dituliskan
sebagai
1 2 h
µ µ µ= = =⋯ , hal tersebut biasanya berkenaan dengan
i
µ sebagai jumlah dari semua komponen rata-rata, seperti µ dan

110 Ir
suatu komponen berkaitan dengan populasi tertentu. Sebagai contoh,
kita dapat menuliskan ( )
i i
µ µ µ µ= + − atau
i i
µ µ τ= + dimana
i i
τ µ µ= − .
Populasi biasanya berkaitan pada himpunan berbeda dari kondisi
eksperimen, dan oleh karena itu tepat untuk melakukan investigasi
deviasi
i
τ yang berkaitan dengan populasi ke-i (perlakuan).

Rata-rata
Rata-rata Efek perlakuan
populasi ke- populasi ke-
i i
keseluruhani i
µ µ τ
    
                
= + (0.98)
Hipotesis nol adalah
0 1 2
: 0
h
Hτ τ τ= = = =⋯
Respon
lj
x, berdistribusi ( )
2
,
i
Nµ τ σ+ , dapat dituliskan dalam
bentuk

ij i ij
y µ τ ε= + + (0.99)
Dimana
ij
y variabel respon, µ rata-rata keseluruh,
i
τ efek perlakuan
dan ( )
2
0,
ij
NIDε σ∼ variabel acak. Untuk mendefinisikan secara unik
parameter dan estimasi kuadrat terkecilnya, konstrain

1
0
h
i i
i

=
=∑
Dekomposisi dari persamaan 0.99, analisis variansi didasarkan pada
data pengamatan,
( )( )
ij i ij i
x x x x x x= + − + − (0.100)
Dimana x adalah estimator dari µ, ( )ˆ
i i
x xτ= − estimator dari
i
τ,
dan ( )
ij i
x x− estimator dari
ij
ε.
Dekomposisi jumlah kuadrat dijelaskan sebagai berikut, perkurangkan
kedua sisi dengan x dan ambil kuadrat dari persamaan (0.100)

111 Ir

( ) ( ) ( )( )
( ) ( )( )( )
2 2
2 2
ij i ij i
ij i ij i
x x x x x x x x
x x x x x x
− = + − + − −
− = − + −

( )( )( ) ( )( )
2 2 2
2
ij i ij i i ij i
x x x x x x x x x x− = − + − + − −
Ambil jumlah dari persamaan terakhir untuk i ,
( ) ( ) ( ) ( ) ( ){ }
( ) ( ) ( ) ( )
( ) ( )
2 22
1 1
22
1 1 1
2 2
1
2
2
j n
ij i ij i i ij i
i i
n n n
i ij i i ij i
i i i
n
ij i i
i
x x x x x x x x x x
x x x x x x x x
x x n x x
= =
= = =
=
− = − + − + − −
= − + − + − −
= − + −∑ ∑
∑ ∑ ∑


Lalu ambil jumlahan dari persamaan terakhir di atas
j
( ) ( ) ( )
( ) ( ) ( )
2 2 2
1 1
2 2 2
1 1 1 1
m m
ij ij i i
j j
n m n m n
ij ij i i
i j i j i n
x x x x m x x
x x x x m x x
= =
= = = = =
− = − + −
− = − + −∑ ∑
∑∑ ∑∑ ∑

Persaman terakhir merupakan jumlah kuadrat
( ) ( ) ( )
2 2 2
1 1 1 1
n m n m n
ij ij i i
i j i j i n
x x x x m x x
= = = = =
− = − + −∑∑ ∑∑ ∑
(0.101)
Dimana
( )
2
1 1
n m
ij
i j
x x
= =
−∑∑ adalah jumlah kuadrat total terkoreksi,
( )
2
1 1
n m
ij i
i j
x x
= =
−∑∑ adalah jumlah kuadrat perlakuan, jumlah kuadrat
antara sampel (SS Between)

112 Ir
( )
2
1
n
i
i
m x x
=
−∑ adalah jumlah kuadrat respon (jumlah kuadrat antara
responde ( SS Within)
Atau
( )
( ) ( )
2 2
1 2
1 1
22
1 1 1
n m
ij n
i j
n n m
i i ij i
i i j
x n n n x
n x x x x
= =
= = =
= + + + +
− + −∑∑
∑ ∑∑ ⋯
(0.102)
w Contoh 6.5 (dekomposisi Jumlah kuadrat untuk ANOVA
univariat)
Perhatikan sampel independen berikut:
Populas 1 : 9, 6, 9
Populasi 2 : 0, 2
Populasi 3 : 3, 1, 2
Karena itu, statistic dari setiap sampel untuk setiap populasi dapat
dihitung yang hasilnya sebagai berikut:
3
3 1 2
2
3
x
+ +
= = dan
( )9 6 9 0 2 3 1 3
4
8
x
+ + + + + + +
= =
Diperoleh bahwa
( )( )
( ) ( )
()
31 3 31 3
3
4 2 4 3 2
4 2 1
x x x x x x= = + − + −
= + − + −
= + − +

( )( )
( ) ( )
()()
32 3 32 3
1
4 2 4 1 2
4 2 1
x x x x x x= = + − + −
= + − + −
= + − + −

113 Ir
( )( )
( ) ( )
()
33 3 33 3
2
4 2 4 2 2
4 2 0
x x x x x x= = + − + −
= + − + −
= + − +

dan 1
9 6 9
8
3
x
+ +
= = dan
( )9 6 9 0 2 3 1 3
4
8
x
+ + + + + + +
= =
2
0 2
1
2
x
+
= = dan
( )9 6 9 0 2 3 1 3
4
8
x
+ + + + + + +
= =
Lakukan hal yang sama untuk setiap pengamatan sebagaimana pada
populasi 3. Dengan menerapkanny pada persamaan (0.100), diperoleh
array
( )( )
ij i ij i
x x x x x x= + − + −

( )
( ) ( ) ( )
Pengamatan Rata-Rata Efek Perlakuan Residual
9 6 9 4 4 4 4 4 4 1 2 1
0 2 4 4 3 3 1 1
3 1 2 4 4 4 2 2 2 1 1 0
i ij i
ij
x x x x xx − −
       

       
       
= + − − + −
       
       
− − − −       
       
= + +

Pertanyaan akan kesamaan dari rata-rata terjawab dengan menilai
apakah kontribusi dari array perlakuan relative besar terhadap residual
atau tidak. Estimasi
( )ˆ
i i
x xτ= − dari
i
τ selalu memenuhi
1
ˆ0
g
i i
i

=
=∑ .
Dibawah hipotesis
0
H setiap ˆ
i
τ selalu nol.
Jika kontribusi perlakuan besar,
0
H harus ditolak. Ukuran dari suatu
array merupakan besar dengan menyusun baris dari array ke dalam
bentuk vektor dan menghitung panjang kuadrat. Besaran tersebut
disebut dengan jumlah kuadrat (JK). Untuk pengamatan, kita kontruksi

114 Ir
vektor 9, 6, 9, 0, 2, 3, 1, 2 ′=
 
y . Panjang kuadratnya adalah
2 2 2 2 2 2 2 2
9 6 9 0 2 3 1 2 216
pmngt
JK = + + + + + + + =
Dengan cara yang sama untuk,

()
2 2 2 2 2 2 2 2 2
4 4 4 4 4 4 4 4 8 4 128
rt
JK= + + + + + + + = =

()()()()()
()() ()
2 2 2 2
2 2 2
2 2
2
4 4 4 3 3 2 2 2 2
3 4 2 3 3 2 78
prlk
SS= + + + − + − + − + − + −
= + − + − =

Dan jumlah kuadrat residual (JKR)
() () ()
2 2 2
2 2 2 2 2
1 2 1 1 1 1 1 0 10
JKR
SS = + − + + − + + + − + =
Jumlah kuadrat memenuhi beberapa dekomposisi, (0.100), sebagai
pengamatan, akibatnya

pmngt rt tr res
SS SS SS SS= + +
Atau 216=128+78+10. Pecah menjadi jumlah kuadrat d alam
komponene rata-rata, perlakuan dan residual. Suatu analisi variansi
dihasilkan dengan membandingkan ukuran relative dari
tr
SS dan
res
SS
. Jika
0
H benar, hitung variansi dari
tr
SSdan
res
SSharusnya di
perkirakan sama.
a
Dari persamaan (0.102), menjelaskan kepada kita bahwa array
merepresentasikan rata-rata, efek perlakuan, dan residual adalah
orthogonal. Array-array tersebut, merupakan sebuah vektor
pengamatan,
1
11 1 21
, , , , ,
n
n nm
x x x x
 ′=
  
y ⋯ ⋯ yang tegak lurus.
Akibatnya,
pm ngt rt tr res
SS S SS SS− − =

115 Ir
Sebagai ringkasannya, kita punya derajat bebas untuk JK rata-rata
adalah 1, JK perlakuan derajat bebasnya adalah n-1, JK untuk residual
adalah m-n. jumlah derajat bebas secara keseluruhan adalah n.
Menghitung jumlah kuadrat dan derajat bebas yang berkaitan setiap
jumlah kuadrat tersebut diterangkan dalam table berikut:
Tabel ANOVA untuk membandingkan Rara-rata populasi Univariat
Sumber variasi Jumlah Kuadrat df
Perlakuan
( )
2
1
n
tr i i
i
SS n x x
=
= −∑
1n−
Residual
( )
2
1 1
n m
tr ij i
i j
SS x x
= =
= −∑∑
1
n
i
i
n n
=
−∑
Total
( )
2
1 1
n m
tot ij i
i j
SS x x
= =
= −∑∑
1
1
n
i
i
n
=
−∑
Statistik uji yang digunakan adalah Uji-F

( )
1
1
t r r e s
n
i
i
S S S S
F
n
n g
=
 

      =      −  
 −  


Dengan taraf signifikansi α. Tolak
0
H jika
()
1,
i
hit n n n
F F α
− −
>


Dimana, ()
1,
i
n n n
F α
− −∑
merupakan persentil ke-( )100α dari uji-F
dengan 1n− dan
i
n n−∑ sebagai derajat bebas. Hal tersebut sama
dengan menolak
0
H untuk nilai
tr res
SS SS yang besar atau nilai
1
tr res
SS SS− yang besar. Statistik yang tepat untuk multivariate
umum menolak
0
H untuk nilai kecil dari perbandigan

1
1
restr res res tr
S
SS SS SS SS
=
+ + (0.103)

116 Ir
w Contoh 6.6 (Table Anova Univariat dan Uji –F untuk Efek
Perlakuan)
Gunakan nilai dan informasi pada contoh 6.5, Kita punya table ANOVA:
Sumber Variasi Jumlah Kuadrat Derajat Bebas
Perlakuan
tr
SS = 78 1n− = 3-1 =2
Residual
res
SS = 10
1
n
i
i
n n
=
−∑ = (3 + 2 + 3) -3 = 5
Total
tot
SS =88
1
1
n
i
i
n
=
−∑ = (3 + 2 + 3) -1 = 7
Akibatnya,

( )
( )
1 78 2
19.5
10 5
tr
res i
SS n
F
SS n n

= = =



Karena, F = 19.5 >
2,5
(0.01)F = 13.27, tolak
0 1 2 3
: 0Hτ τ τ= = =
(tidak ada efek perlakuan) pada taraf signifikansi 0.01.
a
a. Multivariat Analisis Variansi (MANOVA)
Sejalanan dengan reparameterisasi untuk kasus univariat, model
MANOVA dapat ditentukan dengan mengunakan hal tersebut:
Sampel
1 2 3 ⋯ k

11
x
21
x
31
x ⋯
1k
x

12
x
21
x
32
x ⋯
2k
x
⋮ ⋮ ⋮ ⋮

1n
x
2n
x
3n
x ⋯
kn
x
Total
1.
x
2.
x
3.
x ⋯
.k
x
Rata-rata
1.
x
2.
x
3.
x ⋯
.k
x

117 Ir
Total Sampel ke-i :
.
1
n
i ij
j
x
=
=∑y
Total Keseluruh :
..
1 1
k n
ij
i j
x
= =
=∑∑x
Rata-rata sample ke-i:
.
.
.
i
i
n
=
x
x
Rata-rata Keseluruhan:
..
ij
kn
=
x
x
Model Manova untuk Membandingkan Vektor Rata-Rata Populasi
ij i ij
= +X µ + τ ε ; 1,2, ,j m= ⋯ dan 1,2, ,i n= ⋯ 0.104
Dimana variabel ( , )
ij p
NID0Σ∼ε . Parameter vektor µ merupakan
rata-rata total,
i
τ merupakan efek perlakuan ke-i dengan
1
0
n
i i
i

=
=∑
.
Dalam model variabel ke-p dalam
ij
X menjadi
1 1 1 1
2 2 2 2
ij i ij
ij i ij
ijp p ip ijp
x
x
x
µ τ ε
µ τ ε
µ τ ε
       
      
                     
      = + +      
      
      
      
                         
⋮ ⋮ ⋮ ⋮

Sehingga model untuk variabel ke-r dalam setiap vektor
ij
y adalah

ijr r ir ijr
y µ τ ε= + +
Perhatikan model pada persamaan 0.104, setiap komponen dari
vektor pengamatan,
ij
X sesuai dengan model univariat pada
persamaan 0.99. Error untuk komponen
ij
X adalah saling berkorelasi,
tapi matriks kovariansi Σ adalah sama untuk semua populasi.

118 Ir
Vektor pengamatan dimungkin untuk didekomposisi dengan model.
yaitu
( )( )
ij i ij i
= + − + −x x x x x x (0.105)
Dimana
ij
x merupakan vektor pengamatan ke-i untuk perlakuan ke-j
, x estimator rata-rata total sampel,
i
−x x adalah estimator dari τ,
dan
ij i
−x x merupakan estimator dari parameter residual.
Dekomposisi dari persamaan (0.105) sama dengan kasus univariat.
Pertama, perhatikan hasil kali
( )( )
ij ij

− −x x x x
Dapat dituliskan sebagai

( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
( )( )( )( )
ij ij ij i i ij i i
ij i i ij i i
ij i ij i ij i i
i ij i i i
′ ′
− − = − + − − + −
′   = − + − − + −
   
′ ′
= − − + − −
′ ′
+ − − + − −
x x x x x x x x x x x x
x x x x x x x x
x x x x x x x x
x x x x x x x x

Ambil jumlahan dari kedua ruas dari persamaan diatas,
( ) ( ) ( ) ( )
( ) ( )
( ) ( )
( ) ( )
1 1 1 1
1 1
1 1
1 1
n m n m
ij ij ij i ij i
i j i j
n m
ij i i
i j
n m
i ij i
i j
n m
i i
i j
= = = =
= =
= =
= =
′ ′
− − = − −

+ − −

+ − −

+ − −
∑∑ ∑∑
∑∑
∑∑
∑∑x x x x x x x x
x x x x
x x x x
x x x x

Karena ( )
1
0
m
ij i
j
=
− =∑x x , maka

119 Ir
( ) ( ) ( ) ( )
( ) ( )
1 1 1 1
1 1
n m n m
ij ij ij i ij i
i j i j
n m
i i
i j
= = = =
= =
′ ′
− − = − −

+ − −
∑∑ ∑∑
∑∑x x x x x x x xx x x x

( ) ( ) ( ) ( )
( ) ( )
1 1 1
1 1
n m n
ij ij i i
i j i
n m
ij i ij i
i j
m
= = =
= =
′ ′
− − = − −

+ − −
∑∑ ∑
∑∑x x x x x x x xx x x x
(0.106)
dimana
( ) ( )
1 1
n m
ij ij
i j
= =

− −∑∑x x x x merupakan jumlah kuadrat total dan hasil
kali
( ) ( )
1
n
i i
i
m
=

− −∑ x x x x merupakan jumlah kuadrat perlakuan dan hasil
kali (Between)
( ) ( )
1 1
n m
ij i ij i
i j= =

− −∑∑x x x x merupakan jumlah kuadrat residual (within)
Matriks Jumlah kuadrat residual (within) dapat dituliskan sebagai
( ) ( )
( ) ( ) ( )
1 1
1 1 2 2
1 1 1
n m
i j i i j i
i j
n n
n n n
= =

= − −
= − + − + + −
∑ ∑W x x x x
S S S ⋯
(0.107)
Dimana
n
S matriks kovariansi sampel untuk sampel kei .
Uji Wilk
Hipotesis yang akan diuji adalah, hipotesis yang berkaitan dengan
tidak ada efek perlakuan, dirumus sebagai berikut
0 1 2
:
n
H = = = = 0⋯τ τ τ

120 Ir
Diuji dengan mempertimbangkan ukuran relative perlakuan dan
jumlah kuadrat residual dan hasilkali silang. Secara formal, ringkasan
perhitungan uji statistic dalam table MANOVA.
Tabel Manova untuk membandingkan Vektor rata-rata populasi.
Sumber
Variansi
Matriks Jumlah Kuadrat dan
Hasil Kali Silang (SSP)
Derajat
bebas
Perlakua
n ( ) ( )
1
n
i i
i
m
=

= − −∑B x x x x
1n−
Residual
( ) ( )
1 1
n m
ij i ij i
i j= =

= − −∑∑W x x x x
1
n
i
i
n n
=
−∑
Total
( ) ( )
1 1
n m
ij ij
i j
= =

= − −∑∑B + W x x x x
1
1
n
i
i
n
=
−∑

Tolak
0
H jika rasio dari variansi umum terlalu kecil,

( ) ( )
( ) ( )
1 1
1 1
n m
ij i ij i
i j
n m
ij ij
i j= =
= =

− −
Γ =

− −
∑∑
∑∑x x x x
W
B + W
x x x x
=
(0.108)
Persamaan (0.108), dikemukakan pertama kalinya oleh Wilks.,
berkaitan dengan bentuk persamaan (0.103) uji-F dari uji
0
H : tidak
ada efek perlakuan dalam kasus univariat. Lambda Wilk mempunyai
sifat yang mirip dengan kriteria rasio likelihood. Distribusi eksak dari Γ
dapat diturunkan untuk kasus khusus yang ditampilkan dalam table
berikut. Untuk kasus lain, sampel berukuran besar, sebagai modifikasi
dari Γ, gunakan bartlet dapat digunakan untuk menguji
0
H.

121 Ir
Tabel 6.1 Distribusi Lambda Wilk
Jumlah Variabel Jumlah Group Distribusi sampel untuk data multivariate
1p= 2n≥
1,
1
1
i
i
n n n
n n
F
n
− −
   − − Γ    ∑  −  Γ  


2p= 2n≥
( ) ( )2 1 ,1 1
11
1
i
i
n n n
n n
F
n
− − −
  − − − Γ
  ∑   −   Γ 


1p≥ 2n=
, 1
11
i
i
p n p
n p
F
p
− −
   − − − Γ    ∑    Γ  


1p≥ 3n=
( )2 ,2 2
11
i
i
p n p
n p
F
p
− −
  − − − Γ
  ∑      Γ 


Bartlet Menunjukkan bahwa jika
0
H benar dan
i
n∑ =n besar,
( ) ( )
1 ln 1 ln
2 2
p n p n
n n
    + +
   
   − − − Γ = − − −            +     
W
B W
(0.109)
Mempunyai disitrbusi chi-square dengan derajat bebas ( )1p n−.
Akibatnya, untuk
i
n∑ =n besar, tolak
0
H pada level signifikansi

( )
( )
( )
2
1
1 ln
2
p n
p n
n
χ α

   +

− − − >     +   
W
B W

0.110
Dimana
( )
()
2
1
p n
χ α

adalah persentil ke-( )100α dari distribusi chi-
kuadrat dengan derajat bebas ( )1p n−.
w Contoh 6.6 (Table Manova dan Lambda Wilks untuk Menguji
Kesamaan Tiga Vektor Rata-Rata)
Andaikan bahwa suatu variabel tambahan telah diamati bersama
dengan variabel yang ditampilkan pada contoh 6.4 Ukuran sampelnya

122 Ir
adalah
1
3n=
2
n= 2,
3
n= 3. Susun pasangan hasil pengamatan
ij
X
dalam bentuk baris, diperoleh
9 6 9
3 2 7
0 2
4 0
3 1 2
8 9 7
     
    
                     
 
   
                   
 
      
                           
dengan
1 2 3 4
8 1 2 4
, ; ;
4 2 8 5
       
      
      = = = =                      
x x x x
Pada contoh sebelumnya kita telah menghitung jumlah total rata-rata,
efek perlakuan, dan residual dari univariat ANOVA. Yaitu
( )
( ) ( ) ( )
Pengamatan Rata-Rata Efek Perlakuan Residual
9 6 9 4 4 4 4 4 4 1 2 1
0 2 4 4 3 3 1 1
3 1 2 4 4 4 2 2 2 1 1 0
i ij i
ij
x x x x xx − −
       

       
       
= + − − + −
       
       
− − − −       
       
= + +

dan

216 128 78 10
pgmt rt tr res
SS SS SS SS= + +
= + +

Total SS = 216 126 88
pgmt rt
SS SS− = − =
Lakukan perhitung yang sama pada varibel kedua, hasilnya

3 2 7 5 5 5 1 1 1 1 2 3
4 0 0 5 5 3 3 2 2
8 9 7 5 5 5 3 3 3 0 1 1
       
− − − − −      
                  = + − − + −   
      
      
      
−             

dan
272 200 48 24
pgmt rt tr res
SS SS SS SS= + +
= + +

Total SS = 272 200 72
pgmt rt
SS SS− = − =

123 Ir
Kedua analisis komponen tunggal tersebut harus diperbesar dengan
jumlah elemen hasil kali dalam rangka melengkapkan elemen-elemen
dalam table MANOVA. Tampilkan baris demi baris dalam array untuk
dua variabel, diperoleh hasil kali
Rata-rata : 4(5)+4(5)+…+4(50=8(4)(5) =160
Perlakuan : 3(4)(-1)+2(-3)(-3)+3(-2)(-3)=-12
Residual : 1(-1)+(-2)(-2)+1(2)+(-1)(2)+…+0(-1) = 1
Total : 9(3)+6(2)+9(7)+0(4)+…+2(7)=149
Total (terkoreksi) hasil kali = (total hasil kali) – (rata-rata hasil kali)
= 149-160 =-11
Selanjutnya, table MANOVA:
Sumber Variansi
Matriks Jumlah
Kuadrat dan Hasil
Kali
Derajat Bebas
Perlakuan
78 12
12 48
 −
 
 

  
3 – 1 = 2
Residual
10 1
1 24
 
 
 
  
3 + 2 + 3 - 3 = 5
Total (Koreksi)
88 11
11 72
 −
 
 

  
7
Persamaan 0.106 menyatakan bahwa

88 11 78 12 10 1
11 72 12 48 1 24
     − −
     
= +
     
− −
          

Gunakan persamaan (0.108) diperoleh

124 Ir

1 0 1
1 2 4
8 8 1 1
1 1 7 2
Γ = =
+ −

W
B W

()()
()()
2
2
10 24 1 239
0.0385
6215
88 72 11

= = =
− −

Karena
p = 2 dan n= 3, mengindikasikan bahwa uji eksak (asumsi
normal dan matriks kovariansi sama) dari
0 1 2 3
:H = = = 0τ τ τ
(tidak ada efek perlakuan) lawan
1
H: paling sedikit terdapat satu
i
≠0τ . Untuk melakukan uji, bandingkan uji statistik

11 1 0.0385 8 3 1
8.19
1 3 1 0.0385
i
n n
n
      − −− Γ − − −          = =              −  −    Γ   


Dengan suatu titik persentase dari distribusi-F mempunyai
( )
1
2 1 4v n= − = dan ( )
2
2 1 8
i
v n n= − − =∑ . Karena
()
4,8
8.19 0.01 7.01F> = , tolak
0
H pada taraf signifikansi dan
disimpulkan bahwa terdapat perbedaan dalam perlakuan
a
w Contoh 6.7 (Analisis Multivariat Data Perawat Pribadi)
Departemen kesehatan membayar rumah perawat pribadi untuk
penyediaan layanan. Departemen kesehatan mengembang kan
sekumpulan rumusan untuk tariff dari setip fasilitas, didasarkan pada
factor; level perawatan, upah minimum propinsi, dan upah minimum
regional.
Perawat pribadi dapat diklasifikasi pada basis kepemilikan (pribadi,
organisasi non-profit, dan pemerintah) dan sertifikasi (Keahlian
perawat, intermediasi fasilitas keperdulin (ketersediaan), atau
kombinasi dari dua).

125 Ir
Satu tujuan dari penelitian tersebut adalah meneliti efek kepemilikan
atau sertifikasi (atau kedua) terhadap biaya. Terdapat empat biaya,
Basis hari-per pasien dan diukur dalam jam perpasien perhari,
variabelnya adalah
1
X biaya gaji perawat,
2
X biaya makanan,
3
X biaya
operational perencanaa dan perawatan,
4
X biaya penjaga rumah dan
laundry. Total pengamatan yang telah dilakukan sebanyak 516n=
pada setiap dari 4p= variabel biaya.
Ringkasan statistic untuk setiap 3g= diberikan pada table berikut
Kelompok Jumlah
Pengamatan
Vektor rata-rata
sampel
i = 1 (Pribadi)
1
n = 271
1
2.066
0.480
0.082
0.260
 
 
 
 
=
 
 
 
 
 
x
i = 2 (Non-Provit)
2
n = 138
2
2.167
0.596
0.124
0.418
 
 
 
 
=
 
 
 
 
 
x
i = 3 (Pemerintah)
3
n = 107
3
2.273
0.521
0.125
0.383
 
 
 
 
 
 
 
 
 
x

1
1
n
i
n
=
∑ = 516

1
0.291
0.001 0.011
0.002 0.000 0.001
0.010 0.003 0.000 0.010
 
 
 

 
=
 
 
 
 
 
S ;
1
0.561
0.011 0.025
0.001 0.004 0.005
0.037 0.007 0.002 0.019
 
 
 
 
=
 
 
 
 
 
S

126 Ir
3
0.261
0.030 0.017
0.003 0.000 0.004
0.018 0.006 0.001 0.013
 
 
 
 
=
 

 
 
 
 
S
Karena
i
S nampak hampir sama, dihitung gabungannya (pooled)

( ) ( ) ( )
1 1 2 2 3 3
1 1 1
182.962
4.408 8.200
1.695 0.633 1.484
9.581 2.428 0.394 6.538
n n n= − + − + −
 
 
 
 
=
 
 
 
 
 
W S S S

juga

1 1 2 2 3 3
1 2 3
2.136
0.519
0.102
0.380
n n n
n n n
 
 
 
+ +
 
= =
 
+ +  
 
 
 
x x x
x

dan

( ) ( )
3
1 1 1
1
3.475
1.111 1.225
0.821 0.453 0.235
0.584 0.610 0.230 0.304
i
n
=
 
 
 
′ 
= − − =
 
 
 
 
 
∑B x x x x
Untuk menguji
0 1 2 3
:H= =τ τ τ (tidak ada efek kepemilikan) atau
sama, tidak ada perbedaan biaya antara tidak jenis kepemilikan,
pribadi, non-profit, pemerintah).
Untuk 3g=, dengan menggunakan computer, diperoleh

127 Ir
0.7714Γ = =
+
W
B W

dan

21 516 4 2 1 0.7714
17.67
4 0.7714
i
n p
p
      − − − Γ − − −      = =                 Γ   


Misalkan taraf signifikansi α=0.01 sedemikian hingga
( ) ( )()
2 4 ,2 510
0.01F
=()
2
8
0.01 8χ 2.51= . Karena 17.67> ()
8,1020
0.01F 2.51= , tolak
0
H pada
taraf signifikansi 0.01 dan disimpulkan bahwa rata-rata biaya berbeda,
bergantung pada jenis kepemilikan.
a
Uji Roy
Dalam pendekatan gabungan-irisan, kita mencari kombinasi linear
ij ij
z ′=a y yang memaksimumkan sebaran dari transformasi rata-rata
. .i i
z ′=a y relative terhadap variasi didalam sebaran sampel dari titik.
Kemudian kita mencari vektor yang memaksimumkan

( ) ( )
( ) ( )
2
. ..
1
2
.
1 1
1
a
i
i
a b
ij i
i j
n z z a
F
z z ab a
=
= =
− −
=
− −∑
∑∑
(0.111)
Persamaan 0.111 dapat dituliskan dalam bentuk

( )
( ) ( )
1a
F
ab a
′ −
= =
′ −a Wa
W
a Ba W + B
(0.112)
Persamaan terakhir maksimum dengan
1
a , nilai eigen yang berkaitan
dengan
1
λ, nilai eigen yang terbesar dari
1−
B W , kita punya

128 Ir

( )
1
1
max
1
a b
F
a
λ

=
−a
(0.113)
Untuk menguji
0
H yang didasarkan pada
1
λ, Uji akar terbesar Roy,
yaitu

1
1
1
λ
θ
λ
=
+ (0.114)
Nilai kritis dari
θ diberikan dalam table. Tolak
0
H jika
, , ,s m Nα
θ θ≥
dimana,
( )min ,
W
s v p= , ( )
1
2
1
W
m v p= − − , ( )
1
2
1
B
N v p= − −
4. Interval Kepercayaan Simultan untuk Efek Perlakuan
Ketika hipotesis tentang kesamaan efek perlakuan ditolak, efek-efek
mengarah pada bagaiamanan keadaan dari hipotesis yang ditolak.
Perbandingan pairwise, pendekatan Banferroni dapat digunakan untuk
mengkonstruksi interval kepercayaan simultan untuk komponen
perbedaan
j i
τ τ− . interval-interval tersebut lebih pendek dibanding
seluruh konstras yang diperoleh, dan membutuhkan nilai kritis hanya
untuk statistic-t univariat.
Misalkan
ij
τ komponen ke-i dari
j
τ , Karena
j
τ diestimasi dengan
ˆ
j k
τ= −x x
ˆ
ij ij j
x xτ= − (0.115)
Dan ˆ ˆ
ij kj ij kj
τ τ− = −x x adalah selisih antara dua rata-rata sampel
independen. Interval kepercayaan untuk dua sampel didasarkan pada
statistic-t adalah valid dengan perubahan pada α . Perhatikan bahwa

( )
( )
1 1
ˆ ˆvar var
ki li ki li ii
k l
X X
n n
τ τ σ
 

− = − = +    

129 Ir
Dimana
ii
σ elemen diagonal dari Σ . estimasi dari ( )var
ki li
X X−
adalah

U
( )
1 1
var
ii
ki li
k l
w
X X
n n n g
 

− = +   − 

Dimana
ii
w elemen diagonal dari W dan
1 2 g
n n n n= + + + ⋯ .
Terdapat p variabel dan ( )1 2g g− pasangan berbeda, sehingga
interval-t dua sampel akan dikerjakan dalam nilai kritis ( )2 ,
n g
t mα


dimana

( )1
2
pg g
m

=
(0.116)
Adalah jumlah pernyataan kepercayaan simultan.
Teorema 6.5
Misalkan
1
g
k
k
n n
=
=∑ untuk model pada persamaan…, dengan
kepercayaan paling sedikit ( )1α−,
ki li
τ τ− dibawah
( )
1 1
1
ii
ki li n g
k l
w
x x t
pg g n g n n
α

   
  − ± +     − −   

Untuk semua komponen 1,2, ,i p= ⋯ dan perbedaan semua
1,l k g< = ⋯ dimana
ii
w adalah elemen diagonal W
w
Contoh berikut menggambarkan bagaimana mengkonstruksi estimasi
interval kepercayaan untuk perbedaan berpasangan dalam rata-rata
perlakuan menggunakan data perawatan-pribadi sebagaimana
disajikan dalam contoh 6.7.

130 Ir
w Contoh 6.8 (Interval kepercayaan untuk perbedaan perlakuan-
Perawat-Rumah).
Dari contoh sebelumnya (6.7), bahwa biaya rata-rata untuk perawat
rumah yang berbeda, bergantung pada jenis kepemilikan. Gunakan
hasil pada contoh 6.7 untuk mengestimasi perbedaan. Suatu
perbandingan dari variabel
3
X, biaya rencan operasional dan
perawatan tenaga kerja, antara kepemilikan pribadi dan pemerintah
dapat dibuat estimasi
13 33
τ τ− . Dengan menggunakan persamaan
(0.105) dan informasi yang ada pada contoh sebelumnya, kita punya
( )
1 1
0.070
0.039
ˆ
0.020
0.020
 −
 
 

 
= − =
 

 
 
− 
 
x xτ ; ( )
3 3
0.137
0.002
ˆ
0.023
0.003
 
 
 
 
= − =
 
 
 
 
 
x xτ

182.962
4.408 8.200
1.695 0.633 1.484
9.581 2.428 0.394 6.538
 
 
 
 
=
 
 
 
 
 
W
Akibatnya,

13 33
ˆ ˆ 0.020 0.023 0.043τ τ− = − − =
dan 271 138 107 516n= + + = sehingga

33
1 3
1 1 1 1 1.848
0.00614
271 107 516 3
w
n n n g
   
  + = + =      −   − 

Karena
4p= dan 3g= , untuk pernyataan kepercayaan simultan
95% diperlukan ()( )
513
0.05 4 3 2 2.87t = . pernyataan kepercayaan
simultan 95% adalah

131 Ir
13 33
τ τ− dibawah
( )
33
13 33 513
1 3
1 1
ˆ ˆ 0.00208w
t n n n g
τ τ
 

− ± +    − 

( )0.043 2.87 0.00614
0.043 0.018
= − ±
= − ±

Disimpulkan bahwa rata-rata perawatan dan biaya tenaga kerja untuk
kepemilikan pemerintah lebih tinggi sekitar 0.025 hingga 0.061 per
pasien per hari di banding untuk kepemilikan pribadi. Dengan
kepercayaan yang sama, 95%, dikatakan bahwa
13 23
τ τ− dibawah
( )
23
13 23 513
1 3
1 1
ˆ ˆ 0.00208w
t n n n g
τ τ
 

− ± +    − 

= ( )0.058, 0.026− −
dan
223 33
τ τ− dibawah
( )
33
23 33 513
2 3
1 1
ˆ ˆ 0.00208w
t n n n g
τ τ
 

− ± +    − 

= ( )0.021, 0.019−
a
5. Uji Kesamaan Matriks Kovariansi
Salah satu asumsi yang dibuat ketika membandikan dua atau lebih
vektor rata-rata multivariate adalah matriks kovariansi dari populasi
yang secara pontensil berbeda adalah sama. Sebelum
menggabungkan variansi antara sampel untuk membentuk matrisk
kovariansi gabungan ketika membanding vektor kovariansi, hal
tersebut dapat bermanfaat ketika pengujian kesamaan matriks
kovariansi. Satu uji yang umum digunakan untuk kesamaan matriks
kovariansi adalah Uji Box-M.

132 Ir
dengan g populasi, hipotesis nolnya adalah

0 1 2
:
g
H
= = = =Σ Σ Σ Σ ⋯ (0.117)
dimana
l
Σadalah matriks kovariansi untuk populasi ke-l, 1,2, ,l g= ⋯
dan Σadalah asumsi awal dari matriks kovariansi. Hipotesis
altenatifnya adalah paling sedikit dua diantara matriks kovarians tidak
sama.
Andaikan bahwa populasinya berdistribusi normal multivariate, suatu
uji likelihood rasio untuk menguji hipotesis diberikan oleh

()
( )1
2
n
l
l
l p

 

ϒ =   
 

S
S
(0.118)
dimana
l
n ukuran sampel untuk kelompok ke-l,
l
S adalah matriks
kovariansi sampel kelompok ke-l dan
p
S adalah matriks kovariansi
gabungan dengan rumus
( )
( ) ( ) ( ){ }
1 1 2 2
1
1 1
1
p g g
l
l
n n n l
n
= − − + − + + −


S S S S ⋯ (0.119)
Uji Box didasarkan pada pendakatan
2
χ pada distribusi sampel
2ln− ϒ. Penetapan 2lnM− ϒ = (Statistik M-Box) diberikan oleh

( )
( )1 ln 1 ln
l p l l
l l
M n n
   
   = − − −
   
   
∑ ∑ S S (0.120)
Jika hipotesis nol benar, sample individual matriks kovariansi tidak
mengekspektasi pada perbedaan yang terlalu besar dan, akibatnya
tidak ada perbedaan dari matriks kovariansi matriks gabungan.

133 Ir
Uji Box Untuk kesamaan Matriks kovariansi
Diberikan
( )
( ) ( )( )
2
1 1 2 3 1
1 1 6 1 1
l ll
l
p p
n n p g
 
   
+ −
   
= −
   
− − + −     
  

∑u (0.121)
Dimana
p adalah jumlah variabel dan g adalah jumlah kelompok.
Maka
( ) ( ) ( )
( )1 1 1 ln 1 ln
l p l l
l l
C M u n n
   
    = − = − − − − 
   
   
∑ ∑u S S (0.122)
Berdistribusi chi-kuadrat dengan
( ) ( ) ( )( )
1 1 1
1 1 1 1
2 2 2
v g p p p p p p g= + − + = + − (0.123)
Sebagai derajat bebas. Pada taraf signifikansi α , tolak
0
H jika
( )( )
()
2
1 1 2p p g
C
χ α
+ −
>
w Contoh 6.9. (Pengujian Kesamaan matriks kovariansi-Rumah
Perawat)
Dengan menggunakan data dan informasi pada contoh 6.7, 6.78,
matriks kovariansi untuk 4p= variabel biaya yang berkaitan dengan
3g= telah dihitung. Andaikan bahwa data normal multivariate, kita
akan menguji hipotesis
0 1 2 3
:H = = =Σ Σ Σ Σ .
Gunakan informasi pada contoh 6.8, bahwa
1
n = 271,
2
n =138,
3
n =
107 dan
8
1
2.783 10

= ×S ,
8
2
89.539 10

= ×S ,
8
3
14.579 10

= ×S
dan
8
17.397 10
p

= ×S . Ambil logaritma asli dari setiap matriks
kovarians sampel yang diberikan, -17,397, -13, 926, -15741 dan -
15,564 secara berturut-turut.
Selanjutnya hitung

134 Ir

()()
( )( )
( )
( ) ( ) ( )
2
2 4 2 4 1
1 1 1 1
270 137 106 270 137 106 6 4 1 3 1
0.0133
270 137 106 15.564
270 17.397 137 13.926 106 15.741
289.3
u
M
 
+ − 
 
 = + + +  
 + + + −   
 
=
 = + + − −
 
 − + + −
 
=

dan C=(1-0.0133)289.3 =285.5. Rujuk C pada table chi-kuadrat
dengan ( )( )4 4 1 3 1 / 2 20v= + − = . Hal tersebut menjelaskan kepada
kita bahwa
0
H ditolak pada semua level signifikansi. Kesimpulannya,
bahwa matriks kovariansi dari variabel biaya berkaitan dengan tiga
populasi dari rumah perawat adalah tidak sama.
a
6. Multivariat Analisis Variansi Dua-Arah
Dengan menggunakan pendekatan penjelasan dari MANOVA satu
arah, kita juga akan membahas MANOVA dua arah dengan cara yang
sama
Model Efek-Tetap Univariat Dua-Arah dengan Interaksi
Kita asumsikan bahwa pengukuran dilakukan pada beberapa level dari
dua factor. Misalkan dua eksperimen dengan level-levelnya, factor 1
dan factor 2. Andaikan bahwa terdapat a level pada factor 1 dan b
level pada factor dua, dan bahwa pengamatan sebanyak n yang saling
independen telah dilakukan pada setiap kombinasi level ab.
Pengamatan ke-k pada level i factor 1 dan pengamatan level ke-j
pada factor 2 dengan
ijk
X , model dua-arah univariat adalah

ijk i j ij ijk
X µ τ β γ ε= + + + + (0.124)
Untuk 1, 2, ,i a= ⋯ , 1, 2, ,j b= ⋯ dan 1,2, ,k n= ⋯

135 Ir
Dimana
1
a
i
i
τ
=
∑=
1
b
j
j
β
=
∑ =
1
a
ij
i
γ
=
∑=
1
b
ij
j
γ
=
∑= 0 dan ( )
2
0, .
ijk
NIIDε σ∼ dari
model µ merupakan rata-rata keseluruhan,
i
τ efek factor 1,
j
β efek
factor 2 dan
ij
γ efek factor interaksi factor 1 dan factor 2.
Eskpektasi respon pada level kei factor 1 dan level ke-j factor 2
adalah

S ˆˆˆ ˆijk
i j ij
X µ τ β γ= + + + (0.125)
Analogi dengan persamaan (0.125), setiap pengamatan dapat
didekomposisi sebagai
( )( )
( )( )
. .
ijk i j
ij i j ijk ijk
x x x x x x
x x x x x x
= + − + − +
− − + + −
(0.126)
dimana
x rata-rata keseluruhan,
.i
x rata-rata level ke-i factor 1, .x j
rata-rata level ke-j factor 2 dan
ij
x level ke-ifactor 1 dan level- j
factor 2. Perkurangkan kedua ruang dengan x lalu kuadratkan serta
jumlah, diperoleh
( )
( )( )
( ) ( )
( ) ( ) ( ) ( )
( )
. .
. .
i j
ijk
ij i j ijk ijk
ijk i j ij i j
ijk ijk
x x x x x
x x x
x x x x x x
x x x x x x x x x x
x x
  + − + −
 
− = − 
 + − − + + −
  
− = − + − + − − +
+ −

( )
( ) ( ) ( )
( )
2
2
. .
i j ij i j
ijk
ijk ijk
x x x x x x x x
x x
x x
  − + − + − − +
 
− =  
 + −
  

Lalu ambil jumlah dari kuadrat residual

136 Ir
( )
( ) ( )
( )
( )
2
2
. .
1 1 1 1 1
i ja b n a b n
ijk ij i j
i j k i j k
ijk ijk
x x x x
x x x x x x
x x
= = = = =
  − + −
 
 
 
− = + − − +  
 
 
 + −
  
∑∑∑ ∑∑∑

Karena ( ) ( )
1 1 1
0
a b n
i j
i j k
x x x x
= = =
− − =∑∑∑ maka

( ) ( ) ( )
( ) ( )
2 2
1 1 1 1 1 1 1
2 2
. .
1 1 1 1
a b n a b n a b n
ijk i j
i j k i j k i j k
a b n a b n
ij i j ijk ijk
i j k i j k
x x x x x x
x x x x x x
= = = = = = =
= = = =
− = − + −
+ − − + + −∑∑∑ ∑∑∑ ∑∑∑
∑∑∑ ∑∑∑

( ) ( ) ( )
( )
( )
2 22
. .
1 1 1 1 1
2
. .
1 1
2
1 1 1
a b n a b
ijk i j
i j k i j
a b
ij i j
i j
a b n
ijk ij
i j k
x x bn x x an x x
n x x x x
x x
= = = = =
= =
= = =
− = − + −
+ − − +
+ −∑∑ ∑ ∑ ∑
∑ ∑
∑ ∑ ∑
(0.127)
Atau
1 2 1 2t o t r e s
S S S S S S S S S S= + + +
Derajat bebas yang terkait dengan setiap jumlah pada persamaan
(0.127) adalah
( )( )( )( ) ( )1 1 1 1 1 1abn a b a b ab n− = − + − + − − + − (0.128)
Table Anova dari hasil tersebut adalah:

137 Ir
Table Anova untuk membandingkan efek dua factor dan interaksinya
Sumber
Variasi
Jumlah Kuadrat df MS F
Faktor 1
SS1 = ( )
2
.
1
a
i
i
bn x x
=
−∑

( )1a−
SS1/
( )1a−
( )
( )
1
1
1
res
SS a
SS ab n



Faktor 2
SS2 =
( )
2
.
1
b
j
j
an x x
=
−∑
( )1b−
SS2/
( )1b−
( )
( )
2
1
1
res
SS a
SS ab n



Interaksi SS12 =
( )
2
. .
1 1
a b
ij i j
i j
n x x x x
= =
− − +∑ ∑

( )( )1 1a b− − SS12/
( )( )1 1a b− −
( )
( )
12
1
1
res
SS a
SS ab n



Residual SSres =
( )
2
1 1 1
a b n
ijk ij
i j k
x x
= = =
−∑∑∑

( )1ab n−
SSres/
( )1ab n−

Total SStot =
( )
2
1 1 1
a b n
ijk
i j k
x x
= = =
−∑∑∑
1abn− SStot/
1abn−


Multivariat Model Efek Dua-Arah dengan Interaksi
Analog dengan model efek-tetap dua-arah untuk suatu vektor yang
memuat p komponen,
ijk i j ij ijk
= + + + +X µ τ β γ ε (0.129)
Untuk 1, 2, ,i a= ⋯ , 1, 2, ,j b= ⋯ dan 1,2, ,k n= ⋯
Dimana
1
a
i
i=
∑τ=
1
b
j
j=
∑β =
1
a
ij
i=
∑γ=
1
b
ij
j=
∑γ 0. Semua vektor tersebut
berukuran 1p×, dan ()0, .
ijk
NIIDΣ∼ε dari model µ merupakan
rata-rata keseluruhan,
i
τ efek factor 1,
j
β efek factor 2 dan
ij
γ efek
factor interaksi factor 1 dan factor 2.

138 Ir
Eskpektasi respon pada level kei factor 1 dan level ke-j factor 2
adalah

S ˆˆˆ ˆijk
i j ij
= + + +X µ τ β γ (0.130)
Analogi dengan persamaan (0.125), setiap pengamatan dapat
didekomposisi sebagai
( )( )
( )( )
. .
ijk i j
ij i j ijk ijk
= + − + − +
− − + + −
x x x x x x
x x x x x x
(0.131)
Dimana
x rata-rata keseluruhan,
.i
x rata-rata level ke-i factor 1,
.j
x
rata-rata level ke-j factor 2 dan
ij
x level ke-ifactor 1 dan level- j
factor 2. Perkurangkan kedua ruang dengan x lalu kuadratkan serta
jumlah, diperoleh
( ) ( )
( )( )( )
( )
( ) ( ) ( )
( )
. .
. .
i j ij i j
ijk ijk
ijk ijk
i j ij i j
ijk ijk
  − + − + − − +
′ 
− − =  
 + −
  
′  − + − + − − +
 
 
 + −
  
x x x x x x x x
x x x x
x x
x x x x x x x x
x x

Lalu ambil jumlah dari kuadrat residual dan Karena
( ) ( )
1 1 1
0
a b n
i j
i j k= = =
− − =∑∑∑ x x x x maka
( ) ( ) ( ) ( )
( ) ( )
( ) ( )
( ) ( )
. .
1 1 1 1
. .
1
. . . .
1 1
1 1 1
a b n a
ijk ijk i i
i j k i
b
j j
j
a b
ij i j ij i j
i j
a b n
ijk ij ijk ij
i j k
bn
an
n
= = = =
=
= =
= = =
′ ′
− − = − −

+ − −

+ − − + − − +

+ − −
∑∑∑ ∑

∑∑
∑∑∑ x x x x x x x x
x x x x
x x x x x x x x
x x x x
(0.132)
atau

139 Ir
1 2 1 2t o t r e s
S S S S S S S S S S= + + +
Derajat bebas yang terkait dengan setiap jumlah pada persamaan
(0.127) adalah
( )( )( )( ) ( )1 1 1 1 1 1abn a b a b ab n− = − + − + − − + − (0.133)

140
Ir
Table Anova dari hasil tersebut adalah:
Sumber Variasi

Jumlah Kuadrat

df

MS

F

Faktor 1
SS
1
=
( )
2
.
1
a
i
i
bn
=


x x

(
)
1
a−
SS
1
/
(
)
1
a−

(
)
( )
1
1
1
resSS a
SS ab n




Faktor 2
SS
2
=
( )
2
.
1
b
j
j
an
=


x x

(
)
1
b−
SS
2
/
(
)
1
b−

(
)
( )
2
1
1
resSS a
SS ab n



Interaksi
SS
12
=
( )
2
. .
1 1
a b
ij i j
i j
n
= =
− − +
∑∑
x x x x

(
)
(
)
1 1
a b
− −

SS
12
/
(
)
(
)
1 1
a b− −

(
)
( )
12
1
1
res
SS a
SS ab n



Residual
SS
res
=
( )
2
1 1 1
a b n
ijk ij
i j k = = =

∑∑∑
x x

(
)
1
ab n−
SS
res
/
(
)
1
ab n−

Total
SS
tot
=
( )
2
1 1 1
a b n
ijk
i j k = = =

∑∑∑
x x

1
abn

SS
tot
/
1
abn


141 Ir
Uji (likelihood rasio) dari hipotesis

0 1 1 1 2
:
a b
H γ γ γ= = = = 0⋯ (0.134)
Lawan

1
H : Paling sedikit terdapat satu tidak sama dengan nol
Dilakukan dengan menolak
0
H untuk nilai kecil dari rasio

int
res
res
SSP
SSP SSP
Γ =
+
(0.135)
Untuk sample besar, Lambda Wilk dapat didekati dengan distribusi chi-
kuadrat. Menggunakan Bartlet untuk menaikkan kesuaian dengan chi-
kuadrat, tolak
0
H jika

( )
( )( )
( )( )
( )
2
1 1
1 1 1
1 ln
2
a b p
p a b
ab n
χ α
− −
  + − − −
 
− − = Γ >
 
  
(0.136)
Dimana Γ diberikan dalam persamaan (0.135) dan
( )( )
()
2
1 1a b p
χ α
− −

persentil ke ( )100α dari distribusi chi-kuadrat dengan derajat bebas
( )( )1 1a b p− −
Dalam model multivariate, pengujian terhadap efek factor utama
dilakukan setelah melakukan pengujian terhadap factor interaksi.
w Contoh 6.10 (Analisis Multivariat dua-arah dari variansi data
Pita Film)
Syarat optimum yang ditekan pada pita film telah diuji menggunakan
suatu teknologi yang disebut operasi evolusioner. Dalam pembicaraan
ini, tiga respon
1
X = tahan arah (basah),
2
X=kehalusan permukaan,
3
X= kedap cahaya, dimana ketiga diukur dalam dua level, rata-rata
dan jumlah aditif. Pengukuran dilakukan sebanyak 5 kali pada setiap
kombinasi factor. Datanya ditampilkan pada table berikut:

142 Ir
Faktor 1: Jumlah Aditif
Low High
1
x
2
x
3
x
1
x
2
x
3
x
Rata-rata Perubahan
Extrude

Low
6.5 9.5 4.4 6.9 9.1 5.7
6.2 9.9 6.4 7.2 10.0 2.0
5.8 9.6 3.0 6.9 9.9 3.9
6.5 9.6 4.1 6.1 9.5 1.9
6.5 9.2 0.8 6.3 9.4 5.7
High
6.7 9.1 2.8 7.1 9.2 8.4
6.6 9.3 4.1 7.0 8.8 5.2
7.2 8.3 3.8 7.2 9.7 6.9
7.1 8.4 1.6 7.5 10.1 2.7
6.8 8.5 3.4 7.6 9.2 1.9

ANOVA: Tear; Gloss; Opacity versus Extrusion; Additive

MANOVA for Extrusion
s = 1 m = 0,5 n = 6,0

Test DF
Criterion Statistic F Num Denom P
Wilks' 0,38186 7,554 3 14 0,0 03
Lawley-Hotelling 1,61877 7,554 3 14 0,00 3
Pillai's 0,61814 7,554 3 14 0,0 03
Roy's 1,61877


SSCP Matrix for Extrusion

Tear Gloss Opacity
Tear 1,740 -1,504 0,8555
Gloss -1,504 1,301 -0,7395
Opacity 0,855 -0,739 0,4205


SSCP Matrix for Error

Tear Gloss Opacity
Tear 1,764 0,0200 -3,070
Gloss 0,020 2,6280 -0,552

143 Ir
Opacity -3,070 -0,5520 64,924


Partial Correlations for the Error SSCP Matrix

Tear Gloss Opacity
Tear 1,00000 0,00929 -0,28687
Gloss 0,00929 1,00000 -0,04226
Opacity -0,28687 -0,04226 1,00000

EIGEN Analysis for Extrusion

Eigenvalue 1,619 0,00000 0,00000
Proportion 1,000 0,00000 0,00000
Cumulative 1,000 1,00000 1,00000


Eigenvector 1 2 3
Tear 0,6541 0,4315 0,0604
Gloss -0,3385 0,5163 0,0012
Opacity 0,0359 0,0302 -0,1209


MANOVA for Additive
s = 1 m = 0,5 n = 6,0

Test DF
Criterion Statistic F Num Denom P
Wilks' 0,52303 4,256 3 14 0,0 25
Lawley-Hotelling 0,91192 4,256 3 14 0,02 5
Pillai's 0,47697 4,256 3 14 0,0 25
Roy's 0,91192

SSCP Matrix for Additive

Tear Gloss Opacity
Tear 0,7605 0,6825 1,931
Gloss 0,6825 0,6125 1,732
Opacity 1,9305 1,7325 4,901


EIGEN Analysis for Additive


Eigenvalue 0,9119 0,00000 0,00000

144 Ir
Proportion 1,0000 0,00000 0,00000
Cumulative 1,0000 1,00000 1,00000


Eigenvector 1 2 3
Tear -0,6330 0,4480 -0,1276
Gloss -0,3214 -0,4992 -0,1694
Opacity -0,0684 0,0000 0,1102

MANOVA for Extrusion*Additive
s = 1 m = 0,5 n = 6,0
Test DF
Criterion Statistic F Num Denom P
Wilks' 0,77711 1,339 3 14 0,3 02
Lawley-Hotelling 0,28683 1,339 3 14 0,30 2
Pillai's 0,22289 1,339 3 14 0,3 02
Roy's 0,28683


SSCP Matrix for Extrusion*Additive

Tear Gloss Opacity
Tear 0,000500 0,01650 0,04450
Gloss 0,016500 0,54450 1,46850
Opacity 0,044500 1,46850 3,96050

EIGEN Analysis for Extrusion*Additive

Eigenvalue 0,2868 0,00000 0,00000
Proportion 1,0000 0,00000 0,00000
Cumulative 1,0000 1,00000 1,00000

Eigenvector 1 2 3
Tear -0,1364 0,1806 0,7527
Gloss -0,5376 -0,3028 -0,0228
Opacity -0,0683 0,1102 -0,0000

Untuk uji interaksi, hitung

int
275.7098
0.7771
354.7906
res
Γ = = =
+
res
SSP
SSP SSP

Untuk
( )( )1 1 1a b− − =

145 Ir

( )( )
( )( )( )
1 1 2
1
1 1 1 2
ab n p
F
a b p
− − + − Γ

=    Γ  − − − +

Berdistribusi-F dengan
( )( )
1
1 1 1v a b p= − − − + dan
( )
2
1 1v ab n p= − − + . Sebagai contoh

()()( )
( )( )
( )( )
()()( )
1
2
2 2 4 3 1 2
1 0.7771
1.34
0.7771 1 1 0.3 1 2
1 1 3 1 3
2 2 4 3 1 14
F
v
v
− + −

= =     +
= − =
= − + =

dan
()
3,14
0.05 3.34F = . Karena ()
3,14
1.34 0.05 3.34F F= < = ,
keputusannya adalah tidak tolak hipotesis
0
H atau tidak ada interaksi
factor.
Perhatikan bahwa pendekatan statistic chi-kuadrat untuk uji ini adalah
sesuai dengan persamaan (0.136), yaitu
( )
( )( )
( )( )
( )( )
( )
1 1 1
1 ln
2
3 1 1 1
2 2 4 ln 0.7771
2
3.66
p a b
ab n
 + − − −
 − − = Γ
 
  
  + −
 − =
 
   
=

Karena ()
2
3
0.05 7.81χ = , kita dapat mengambil kesimpulan yang sama
sebagaimana yang disajikan dalam uji-F.
Untuk menguji efek factor 1 dan factor 2, hitung

1
275.7098
0.3819
722.0212
res
fac res
Γ = = =
+
SSP
SSP SSP
dan

146 Ir
2
275.7098
0.5230
527.1347
res
fac res
Γ = = =
+
SSP
SSP SSP
Untuk derajat bebas dari kedua factor tersebut adalah
1a− dan
1,b−

( )( )
( )( )
1
1 1 2
1
1 1 2
ab n p
F
a p
− − + − Γ

=    Γ  − − +

Berdistribusi F dengan derajat bebas

( )( )
1
1 1v a p= − − + dan ( )( )
2
1 1v ab n p= − − +
dan
( )( )
( )( )
1
1 1 2
1
1 1 2
ab n p
F
b p
− − + − Γ

=    Γ  − − +

Berdistribusi F dengan derajat bebas

( )( )
1
1 1v b p= − − + dan ( )( )
2
1 1v ab n p= − − +
Dalam kasus di atas,

( )
( )
1
16 3 1 2
1 0.3819
7.55
0.3819 1 3 1 2
F
− + −

= =     − +

( )
( )
2
16 3 1 2
1 0.5230
4.26
0.5230 1 3 1 2
F
− + −

= =     − +

dan

1
1 3 1 3v= − + = ; ( )
2
16 3 1 14v= − + =
dari perhitungan sebelumnya, ()
3,14
0.05 3.34F = . Karena
()
1 3,14
7.55 0.05 3.34F F= > = . Keputusannya adalah tolak
0
H pada
taraf signifikansi 0.05. Dengan cara yang sama

147 Ir
()
2 3,14
4.26 0.05 3.34F F= > = , keputusannya adalah tolak
0
H pada
taraf signinfikansi 0.05.
6. 1. Konstruksi dan Gambarkan gabugan daerah kepercayaan 95%
untuk perbedaan vektor rata-rata menggunakan data pada contoh
6.1. Perhatikan bahwa titik =0δ jatuh diluar kontur 95%. Apakah
sesuai dengan
0
:H =0δ yang dijelaskan dalam contoh 6.1?
Jelaskan
6. 2. Gunakan informasi dalam contoh 6.1. Konstruksi interval
kepercayaan simultan Banferroni untuk komponen perbedaan
rata-rata vektor δ. Bandingkan panjang tersebut dengan panjang
interval pada contoh.
6. 3. Seorang peneliti memperhatikan tiga indikasi pengukuran
kerusakan serangan jantung. Nilai dari indikasi-indikasi tersebut
untuk 40n= pasien serangan jantung yang datang ke rumah
sakit menghasilkan rangkuman statistic berikut

46.1
57.3
50.4
 
 
 
=
 
 
 
 
x dan
101.3 63.0 71.0
63.0 80.2 55.6
71.0 55.6 97.4
 
 
 
=
 
 
 
 
S
(a) Dari ketiga indikasi tersebut dievaluasi untuk setiap pasien.
Uji kesamaan rata-rata indikasi dengan menggunakan
persamaan 0.92. dengan 0.05α=
(b) Buat keputusan dari perbedaan pasangan rata-rata indikasi
menggunakan interval kepercayaan simultasn 95%.
6. 4. Gunakan data perlakuan (2) dan perlakuan (3) dalam latihan 6.6
Untuk
(a) Hitung
p
S
(b) Uji hipotesis
0 1 2
: 0H − =µ µ lakukan untuk dua sampel
dengan 0.01α=
Latihan Soal

148 Ir
(c) Konstruksi interval kepercayaan simultan 95% untuk
perbedaan
2 3i i
µ µ− , untuk 1, 2i=
6. 5. Gunakan ringkasan statistic pada latihan 6.3, untuk menghitung
2
T dan uji hipotesis
0 1 2
: 0H − =µ µ , dengan asumsi bahwa
1 2
=Σ Σ . Nyatakan 0.05α= . Tentukan kombinasi linear dari
komponen rata-rata yang memberikan peran lebih dalam
penolakan
0 1 2
: 0H − =µ µ .
6. 6. Pengamatan pada dua respon telah dilakukan untuk tiga
perlakuan. Vektor pengamatan
1
2
x
x
 
 
 
  
adalah
6 5 8 4 7
Perlakuan 1: , , , ,
7 9 6 9 9
         
         
         
                  

3 1 2
Perlakuan 2: , ,
3 6 3
     
     
     
          

2 5 3 2
Perlakuan 3: , , ,
3 1 1 3
       
       
       
              

(a) Pecah pengamatan tersebut menjadi komponen rata-rata,
perlakuan, dan residual. Konstruksi array yang berkaitan untuk
setiap variabel.
(b) Gunakan transformasi pada bagian (a), konstruksi table
MANOVA satu arah
(c) Evaluasi lambda wilk, dan gunakan table 6.3 untuk
menguji efek perlakuan, untuk 0.01α= . Ulangi pengujian
dengan menggunakan pendekatan chi-kuadrat dengan
Perbaikan Bartlet. Bandingkan kesimpulannya.
6. 7. MANOVA dua arah tanpa pengulangan). Perhatikan pengamatan
pada dua respon,
1
x dan
2
x , sebagaimana ditampilkan dalam
bentuk table dua arah

149 Ir
Faktor 2
Level 1 Level 2 Level 3 Level 4
Faktor 1
Level 1
6
8
 
 
 
  

4
6
 
 
 
  

8
12
 
 
 
  

2
6
 
 
 
  

Level 2
3
8
 
 
 
  

3
2
 −
 
 
  

4
3
 
 
 
  

4
3
 −
 
 
  

Level 3
3
2
 −
 
 
  

4
5
 −
 
 

  

3
3
 
 
 

  

4
6
 −
 
 

  

Dengan tanpa pengulangan, model MANOVA dua-aray adalah
lk l k lk
= + + +Xµ τ β ε
(a) Dekomposisi pengamatan untuk setiap dua variabel sebagai
( )( )( )
. . . .lk l k lk l k
x x x x x x x x x x= + − + − + − − +
(b) Hitung jumlah kuadrat
1 2
tot rt f f res
SS SS SS SS SS= + + +
Dan hasil kali
1 2
tot rt f f res
SCP SCP SCP SCP SCP= + + +
Dari dua hal tersebut, susun matriks
1 2
, , ,
tot f f
SSP SSP SSP dan
res
SSP dengan derajat bebas 1, 1, 1,ab a b− − − dan
( )( )1 1a b− −
(c) Tuangkan seluruh hasil perhitungan pada bagian (b) dalam table
MANOVA.
(d) Dari table MANOVA pada bagian (c), uji efek factor 1 dan factor 2
pada taraf signifikansi 0.01α=
6. 8. Suatu eksperimen dengan pengamatan berulang dari data pada
latihan 6.7 dan hasilnya sebagaimana data berikut

150 Ir
Faktor 2
Level 1 Level 2 Level 3 Level 4
Faktor 1
Level 1
6
8
 
 
 
  

4
6
 
 
 
  

8
12
 
 
 
  

2
6
 
 
 
  

Level 2
3
8
 
 
 
  

3
2
 −
 
 
  

4
3
 
 
 
  

4
3
 −
 
 
  

Level 3
3
2
 −
 
 
  

4
5
 −
 
 

  

3
3
 
 
 

  

4
6
 −
 
 

  

(a) Gunakan data tersebut untuk mendekomposisi setiap dari dua
pengukuran dalam vektor pengamatan sebagai
( )( )( )
. . . .lk l k lk l k
x x x x x x x x x x= + − + − + − − +
(b) Kombinasikan dengan hasil yang diperoleh pada latihan 6.7
untuk mendapatkan table MANOVA dua arah
(c) Dari hasil yang diperoleh pada bagian ( c ), uji factor interaksi,
dan jika tidak ada pengaruhnya, lanjutkan dengan uji factor
utama 1, dan factor utama 2. Gunakan rasio likelihood dengan
0.05α=
(d) Jika efek utama, tapi bukan efek inteaksi, ada, uji efek utama
dengan mengkonstruksi interval kepercayaan simultan
Banferroni untuk perbedaan komponene dari parameter factor
efek.
6. 9. Merujuk pada latihan 6.7.
(a) Uji dengan pendekatan chi-kuadrat (ratio likelihood) untuk
efek factor 1 dan factor 2 dengan taraf signifikansi 0.05.α=
Bandingkan hasil-hasil tersebut dengan hasil untuk uji-F .
jelaskan perbedaannya
Gunakan persamaan 6.70, konstruksi interval kepercayaan
simultan 95% dalam parameter efek factor 1 untuk ketiga
pasangan respon. Interpretasi interval tersebut. Ulangi
perhitungan untuk parameter efek factor 2.

152 Ir
DAFTAR PUSTAKA





Chen, Zexun. "Multivariate Gaussian and Student-t process regression
for multi-output prediction." Neural Computing and
Applications 32.8 (2020): 3005-3028.

Demšar, Janez. "Statistical comparisons of classifiers over multiple
data sets." Journal of Machine Learning Research (2006).
Fletcher, Jonathan. "Model comparison tests of linear factor models in
U.K. stock returns." Finance Research Letters 28 (2019): 281-
291.
Hahs-Vaughn, Debbie L. Applied Multivariate Statistical Concepts. New
York, NY : Routledge: TaylorFrancis, 2017.
Hair, Joshep F, et al. Multivariate Data Analysis. Seventh Edition. New
Jersey: John Wiley & Sons, 2012.
Harris, Richard J. A Primer of Multivariate Statistics. Third Edition. New
Jersey: Lawrence Erlbaum Associates, 2001.
Le Maître, Anne. "Multivariate comparison of variance in R." Methods in
Ecology and Evolution (2019): 1380-1392.
Markowitz, Jeffrey S. "SpringerBriefs in Public Health." Markowitz,
Jeffrey S. Multivariate Analysis . New York: Springer, 2018. 71-
81.
Midway, Stephen. "Comparing multiple comparisons: practical
guidance for choosing the best multiple comparisons test."
PeerJ 8 (2020): e10387.

153 Ir
Rencher, Alvin C and William F Christensen. Method of Multivariate
Analysis. Third Edition. New Jersey: John Wiley & Sons Inc,
2012.
Seber, George A.F. A Matrix Handbook for Statisticians. New York: A
John Wiley & Sons. Inc, 2007.
Tabachnick, Barbara G and Linda S Fidell. Using Multivariate Statistics.
Sixth Edition. New Jersey: Pearson, 2013.
Timm, Neil H. Applied Multivariate Analysis. New York: Springer, 2002.
Wichern, Dean W and Richard A Johnson. Applied Multivariate
Statistical Analysis. Sixth Edition. New Jersey: Pearson Prentice
Hall, 2007.

154 Ir

INDEKS
Acak, 3, 4, 15, 35
analisis variansi, 109, 110
bartlet, 120
Berdistribusi, 37, 85, 132,
144, 145
Bivariate, 4, 49
chi-kuadrat, 35, 51, 53, 77,
104, 121, 132, 133, 140,
144, 147, 149
Data, 1, 9, 47, 52, 71, 78
Data multivariate, 1
definit positif, 33, 34, 42, 77
dekomposisi, 111, 114
derajat bebas, 35, 38, 43, 44,
51, 60, 63, 85, 88, 94, 100,
104, 108, 114, 115, 121,
133, 140, 145, 148
Dua-Arah, 134, 137
efek, 84, 95, 97, 98, 110, 114,
116, 117, 119, 120, 121,
123, 124, 126, 128, 134,
136, 137, 140, 144, 147,
148, 149
Efek, 115, 128, 134, 137
eksperimen, 1, 84, 86, 91, 92,
109, 134, 148
factor interaksi, 134, 137, 140,
149
independen, 16, 18, 38, 43,
44, 62, 87, 91, 93, 98, 99,
100, 101, 109, 111, 128,
134
Interaksi, 134, 136, 137, 139
Interval kepercayaan, 85, 88,
90, 94, 98, 103, 105, 128,
129
Interval Kepercayaan, 76, 103,
128
item, 1
jumlah kuadrat, 22, 43, 110,
111, 113, 114, 119, 148
Jumlah kuadrat residual, 119
koefisien korelasi, 31, 48, 53
komponen, 7, 18, 36, 37, 65,
75, 79, 81, 93, 103, 108,
109, 117, 122, 128, 129,
137, 146, 147
Korelasi, 4, 5, 6, 8, 20, 54
korelasi sampel, 6, 22
Kovariansi, 4, 6, 20, 25, 131
Kovarinsi, 4
kuadrat residual, 113, 119,
135, 138
Lambda Wilk, 120, 140
likelihood rasio, 140
Manova, 108, 109, 117, 119,
121
MANOVA, 116, 119, 122, 123,
134, 141, 142, 143, 147,
148, 149

155 Ir
matriks, 2, 3, 4, 11, 12, 13, 14,
15, 16, 17, 19, 20, 21, 22,
23, 27, 30, 31, 33, 37, 40,
41, 42, 44, 62, 64, 69, 77,
79, 80, 83
Membandingkan, 84, 86, 91,
92, 98, 108, 117
Model, 30, 117, 134, 137
nilai eigen, 33, 34, 35, 40, 71,
72
nilai statistik, 3, 80
Nilai Statistik Uji, 86, 91
pengamatan, 1, 2, 3, 4, 5, 7, 8,
11, 12, 14, 15, 16, 24, 25,
26, 30, 39, 40, 45, 47, 49,
50, 51, 52, 54, 58, 61, 63,
71, 77, 78, 80, 82, 83
Perbandingan, 69, 75, 84, 86,
91, 98, 128
perlakuan, 84, 85, 86, 89, 91,
92, 93, 94, 95, 97, 98, 109,
110, 111, 113, 114, 116,
117, 119, 120, 121, 123,
124, 128, 129, 146, 147
persentil, 35, 38, 51, 68, 77,
78, 85, 88, 94, 104, 115,
121, 140
Prosedur Pengujian, 86
Rancangan Pengukuran
Berulang, 84, 92, 93
rata-rata, 3, 12, 14, 15, 16, 21,
25, 27, 28, 29, 30, 31, 37,
39, 42, 44, 53, 57, 70, 76,
77, 79, 85, 86, 87, 88, 89,
90, 91, 92, 93, 94, 95, 97,
98, 99, 101, 103, 105, 108,
109, 110, 113, 114, 117,
119, 121, 122, 124, 127,
128, 129, 130, 131, 134,
135, 137, 140, 146, 147
respon, 84, 85, 86, 92, 93, 95,
98, 110, 111, 134, 137,
140, 147, 149
Selisih, 86, 91
Simultan, 69, 103, 128
taraf signifikansi, 77, 82, 86,
91, 115, 116, 124, 127,
133, 145, 148, 149
uji Bartlet, 104
Uji Box, 131, 132
uji hipotesis, 77, 85, 147
uji likelihood rasio, 131
Uji Roy, 127
Uji Wilk, 119
ukuran relative, 114, 119
unit eksperimen., 1
variable, 1, 2, 3, 4, 5, 7, 9, 11,
13, 15, 16, 29, 30, 32, 35,
36, 39, 43, 44, 51, 52, 53,
54, 55, 57, 58, 63, 69, 78
Variansi, 3, 6, 7, 25
Variansi Dua-Arah, 134
Variansi sampel, 3, 25
variansi-kovariansi, 30
variasi, 11, 84, 91, 104, 114,
127
vektor, 5, 12, 13, 14, 15, 16,
20, 21, 27, 28, 30, 33, 34,
35, 36, 37, 39, 40, 42, 57,
58, 69, 71, 72, 73, 79, 80
vektor eigen, 33, 34, 35, 71, 72
Wilks, 68, 120, 121, 141, 142,
143

156 Ir
TENTANG PENULIS








Irwan, S.Si., M.Si, lahir di Lisu-Kabupaten Barru pada
Tahun 1978 bulan September tanggal 22.
Menyelesaikan Pendidikan magister pada Jurusan
Statistika Institut Teknologi Sepuluh November
Surabaya pada Tahun 2006, Tahun 2003
menyelesaikan studi pada Jurusan Matematika
Universitas Negeri Makassar. Selama mengikuti
Pendidikan penulis terlibat pada beberapa organisasi,
asisten dosen, tim asisten di Laboratorium Komputer Matematika.
Sejak Tahun 2006, penulis mulai aktif mengajar di Jurusan
Matematika Fakultas Sains dan Teknologi Univeristas Islam Negeri
Makassar hingga sekarang. Mengikuti berbagai pelatihan professional
dan juga sebagai trainer-Pelatihan Modul Dasar BTL, LSE, ICT bagi guru
SMT/MTS mitra DBE3 USAID Indonesia-2008-2009, fasilitator pada
workshop pembelajaran PAKEM dan penggunaan alat per aga
matematika bagi guru SD/MI se-kabupaten Bulukumba.
Jabatan Struktural- Ketua Jurusan Matematika, Sekretaris LPM UIN
Alauddin Makassar.

157 Ir
Adnan Sauddin, lahir Teomokole pada Tahun 1974
bulan Mei tanggal 17. Suatu daerah kepulauan
(Pulau Kabaena) di Kabupaten Bombana. Anak ke-
16 dari enambelas bersaudara.
Menyelesaikan Pendidikan magister pada Jurusan
Statistika Institut Teknologi Sepuluh November
Surabaya pada Tahun 2007, Tahun 2000
menyelesaikan studi pada Jurusan Pendidikan Matematika Institut
Keguruan dan Ilmu Pendidikan (Tahun 1998 berubah menjadi UNM).
Selama mengikuti Pendidikan penulis terlibat pada beberapa
organisasi .
Sejak Tahun 2000, penulis mulai aktif mengajar di Lembaga
Pendidikan-STMIK Balikpapan-dan berkesempatan mengiktui berbagai
pelatihan professional. Pada Tahun 2013 penulis hijrah ke Sulawesi
selatan dan terdaftar sebaik pengajar pada Jurusan Matematika
Fakultas Sains dan Teknologi Univeristas Islam Negeri Makassar
hingga sekarang.

STATISTIKASTATISTIKASTATISTIKA
MULTIVARIATMULTIVARIATMULTIVARIAT
Irwan, S.Si., M.Si.
Adnan Sauddin, S.Pd., M.Si.
Alauddin University Press
9786023284566
ISBN 602-328-456-6
Irwan, S.Si., M.Si, lahir di Lisu, Kabupaten Barru pada Tahun 1978
bulan September tanggal 22. Menyelesaikan Pendidikan Magister
pada Jurusan Statistika Institut Teknologi Sepuluh November
Surabaya pada tahun 2006, Tahun 2003 menyelesaikan studi pada
Jurusan Pendidikan Matematika Universitas Negeri Makassar.
Selama mengikuti Pendidikan penulis terlibat pada beberapa
organisasi, asisten dosen, tim asisten di Laboratorium Komputer
Matematika.
Sejak tahun 2006, penulis mulai aktif mengajar di Jurusan
Matematika Fakultas Sains dan Teknologi Universitas Islam Negeri
Alauddin Makassar hingga sekarang. Mengikuti berbagai pelatihan
profesional dan juga sebagai trainer-Pelatihan Modul Dasar BTL,
LSE, ICT bagi guru SMT/MTS mitra DBE3 USAID Indonesia-2008-
2009, fasilitator pada workshop pembelajaran PAKEM dan
penggunaan alat peraga matematika bagi guru SD/MI se-
kabupaten Bulukumba. Jabatan Struktural, Ketua Jurusan
Matematika, Sekretaris LPM UIN Alauddin Makassar.
Adnan Sauddin, lahir Teomokole pada Tahun 1974 bulan Mei
tanggal 17. Suatu daerah kepulauan (Pulau Kabaena) di Kabupaten
Bombana. Anak ke-16 dari enam belas bersaudara. Menyelesaikan
Pendidikan Magister pada Jurusan Statistika Institut Teknologi
Sepuluh November Surabaya pada tahun 2007, Tahun 2000
menyelesaikan studi pada Jurusan Pendidikan Matematika Institut
Keguruan dan Ilmu Pendidikan (tahun 1998 berubah menjadi
UNM). Selama mengikuti Pendidikan penulis terlibat pada
beberapa organisasi .
Sejak tahun 2000, penulis mulai aktif mengajar di Lembaga
Pendidikan -STMIK Balikpapan- dan berkesempatan mengikuti
berbagai pelatihan profesional. Pada tahun 2013 penulis hijrah ke
Sulawesi Selatan dan terdaftar sebaik pengajar pada Jurusan
Matematika Fakultas Sains dan Teknologi Universitas Islam Negeri
Alauddin Makassar hingga sekarang.
Alauddin University Press
STATISTIKA MULTIVARIAT
Alauddin University Press
Irwan, S.Si., M.Si. & Adnan Sauddin, S.Pd., M.Si.