Bootstrap

Beberapa waktu yg lalu (2 minggu kemaren, klo ga salah) saya dapet tugas untuk mata kuliah simulasi statistika. Saat itu qta di kasih permasalahan untuk melakukan pengujian hipotesis untuk data yang berukuran kecil..

Nah, bwat melakukan suatu uji hipotesis, kita kan mesti tau dulu sebaran data yang mau kita uji itu normal atau ngga? Kalo datanya normal, baru kita bisa uji hipotesisnya.. Bwat nguji kenormalan ada beberapa cara, pake uji Anderson-Darling atau Kolmogorov-Smirnov, dll. Nah, klo datanya banyak, hasil pengujian kenormalannya akan sesuai dengan keadaan sebenernya.. yang jadi masalah adalah klo data yang kita punya sedikit. Hasil pengujiannya bisa aja salah… Mungkin aja data yang ada berasal dari populasi yang menyebar normal, tp pas di uji ternyata hasilnya ga normal. Atau bisa juga sebaliknya…

Nah, bwat ngatasin masalah ini, ada beberapa metode yang bisa di pake. Salah satu nya Bootstrap. Bootstap adalah penarikan contoh dari contoh, atau di kenal dengan istilah resampling. Nah, bootstrap ini sendiri ada 2 macem, bootstrap parametrik sama bootstrap non parametrik. yang saya pake kemaren bootstrap non parametrik. Salah satu perbedaan antara yg parametrik sm non parametrik adalah dalam hal pemenuhan asumsi. Klo di bootstrap non parametrik ga ada asumsi.. Selain itu, klo pake bootstrap parametrik kita udah tau sebaran awal data yg kita punya, klo di bootstrap non parametrik kita ga mesti tau sebaran datanya.

Jadi prosedur bootstrap itu begini… Misalkan kita punya contoh yang berukuran n (n ini kecil, klo di tugas yg kami dapet n=6). Dari sini kita ambil contoh acak berulang dengan pengembalian sebanyak d. Nilai d ini bisa lebih kecil, sama dengan, ato lebih besar dari n. Misal kita pake d=10, jadi kita akan punya d1-d10. Nah dari sepuluh nilai yang udah kita dapetin, kita cari rataannya, dapet deh satu data baru.. prosedur ini kita ulangi sebanyak B kali. dan B ini adalah jumlah contoh bootstrap.  Pengujian kenormalan ini kita lakukan terhadap B contoh bootstrap yang kita dapet…

Contohnya gini..

1. data yang kita punya : 5 ; 7 ; 4 ; 8 ; 9 ; 2

2. lakukan resampling sebanyak d kali (misal d=10) –> 5, 2, 4, 2, 7, 5, 7, 9, 9, 7 –> rataannya (xbar1) = 5.7

3. ulangi langkah ke dua sampai B kali (misal B=100), sehingga kita bakal punya 100 nilai rataan. xbar1=5.7, xbar2 = …, sampe xbar100=…

4. kita uji kenormalan dengan menggunakan statistik bootstrap td.. jd pake xbar1 – xbar100

5. klo udah liat hasilnya, normal atau ngga, klo normal baru bisa kita uji hipotesis, klo ga normal stop disini..

6. cari t hitung untuk n data yg kita punya.. xbar/(stdev x/(sqtr(n))

7. cari t-hitung untuk setiap contoh bootstrap. misalkan untuk contoh yg di poin 2, berarti t hitung nya : xbar1/(stdev x1/(sqtr(d)), lakukan untuk semua contoh bootstrap yang kita peroleh di poin 2. jadi kita akan punya 100 nilai t-hitung.

8. Bandingkan t hitung di poin 6 sama yg di poin 7. Lihat berapa banyak t-hitung di poin 7 yang lebih besar dari mutlak t-hitung di poin 6. dari sini bisa di cari nilai-p nya.. yaitu (jumlah (t-hitung poin 7>t-hitung poin 6)) / B

9. setelah dapet nilai p, bandingkan sama alpha untuk pengambilan keputusannya dari pengujian hipotesisnya..

Nah, itu prosedur bootstrap yang saya tau. mungkin pasti masih ada salahnya, karena saya juga lagi belajar, hehe… klo mw ada yg ngoreksi, nambahin, ngurangin, ato apapun silakan… biar makin akurat… klo mw dijadiin referensi jangan lupa dibandingin sama yg lain… ok….

9 comments so far

  1. visakana on

    ohh gitu cul…
    makasih buat tulisannya,, kebetulan gw lagi belajar simulasi statistika neh…
    ntar gw nanya2 lagi dah tentang bootstrap,,,
    metode laen yang bisa dipake selain bootstrap apaan nad?

    baca tugas gw yg lo copy aja mel… lebih lengkap… selain pake bootstrap bisa juga pake jackknife, monte carlo, dll.

  2. visakana on

    emang ada yah,, gw pernah ngopi ga’ c..,, kayaknya pernah yah.. hahaha
    Oh yah,, hipotesis pengujian di atas ntu apaan?
    satu arah or dua arah?
    klo ga’ normal yang statistik boostrap itu pake apa???
    bukannya ada yang boostrap non parametrik,,,
    terus harus diuji kenormalan juga tak?

    iya pernah… pas kuliah simulasi ama mba dian..
    hipotesisnya dua arah, hipotesisnya miu=k, k nya konstanta,
    klo ga normal uji hipotesisnya bisa kaya yg diajarin mba dian itu loh… (agak sedikit lupa)

  3. visakana on

    eh kemaren gw ngopinya se-folder yah,, namanya apa? lupa euy…

    simstat_bootstrap kalo ga salah.. lupa…. :D

  4. Mardian on

    salam
    mau nanya,
    selain dalam menguji hipotesis..
    apakh bootstrap juga bs menentukan koefisien regresi multivatiabel,dan mse nya..
    bgmn prosedurnya..?
    terima kasih..

  5. Danar si Sappii on

    Ohmygoddd..

    Knapa pagi ini mesti gw rusak dengan membaca tentang statistika??

    (o_0)

  6. erni on

    salam
    bisa kasih tahu algoritma untuk pairs bootstrap pd regresi linier ga?
    trus perbandingan antara residual,wild,pairs bootstrap mana yang lebih baik penggunaannya?

  7. naD2ieDhiYa on

    @mardian n erni :

    waduhh.. mba dan mas.. saya juga masih belom tau penggunaan bootstrap bwat regresi..
    mungkin mba dan mas bisa liat di http://people.revoledu.com/kardi/tutorial/Bootstrap/index.html

    coba di utak atik di situ yah mas.. mba…
    klo ga salah ada bahasan bootstrap untuk regresi…

    maaf blom bisa bantu..

  8. Wini on

    Halo..Sy lg bljr ttg bootstrap nih..Emg byk d ga harus sama dgn n y??Klo anda,pk software ap?Kl bs,lwat email j blzny yah.Makasi


Leave a reply