[Buku Bahasa Indonesia] Thinking Fast and Slow - Daniel Kahneman
Bagian 2
Heuristik dan Bias
Hukum Bilangan Kecil
Sebuah studi mengenai tingkat kejadian kanker ginjal di 3.141 county di Amerika Serikat memperlihatkan pola yang mencolok. County-county dengan tingkat kanker ginjal paling rendah umumnya merupakan wilayah pedesaan, berpenduduk jarang, dan terletak di negara bagian yang secara tradisional cenderung memilih Partai Republik di kawasan Midwest, Selatan, dan Barat. Apa yang dapat Anda simpulkan dari hal ini?
Dalam beberapa detik terakhir, pikiran Anda kemungkinan besar bekerja cukup aktif—dan sebagian besar merupakan operasi Sistem 2. Anda dengan sengaja menelusuri ingatan dan merumuskan hipotesis. Ada upaya yang terlibat; pupil mata Anda melebar dan detak jantung Anda meningkat secara terukur. Namun Sistem 1 tidaklah menganggur: operasi Sistem 2 bergantung pada fakta dan saran yang diambil dari memori asosiatif. Anda mungkin segera menolak gagasan bahwa politik Republik memberikan perlindungan terhadap kanker ginjal. Kemungkinan besar Anda kemudian berfokus pada fakta bahwa county dengan tingkat kanker rendah kebanyakan merupakan wilayah pedesaan. Para ahli statistik yang cerdas, Howard Wainer dan Harris Zwerling—dari merekalah saya mempelajari contoh ini—berkomentar: “Sangat mudah dan menggoda untuk menyimpulkan bahwa rendahnya tingkat kanker tersebut secara langsung disebabkan oleh gaya hidup pedesaan yang bersih—tanpa polusi udara, tanpa polusi air, serta akses pada makanan segar tanpa bahan tambahan.” Penjelasan ini terdengar sangat masuk akal.
Sekarang perhatikan county-county dengan tingkat kanker ginjal paling tinggi. County-county yang bermasalah ini juga cenderung merupakan wilayah pedesaan, berpenduduk jarang, dan terletak di negara bagian yang secara tradisional memilih Partai Republik di Midwest, Selatan, dan Barat. Dengan nada berseloroh, Wainer dan Zwerling menambahkan: “Mudah pula menyimpulkan bahwa tingginya tingkat kanker mungkin disebabkan langsung oleh kemiskinan gaya hidup pedesaan—tidak adanya akses pada layanan medis yang baik, pola makan tinggi lemak, serta konsumsi alkohol dan tembakau yang berlebihan.”
Tentu saja ada sesuatu yang keliru. Gaya hidup pedesaan tidak mungkin sekaligus menjelaskan tingkat kanker yang sangat tinggi dan sangat rendah.
Faktor kuncinya bukanlah bahwa county-county tersebut bersifat pedesaan atau mayoritas memilih Partai Republik. Faktor yang menentukan adalah bahwa county pedesaan memiliki populasi yang kecil. Dan pelajaran utama dari kisah ini bukan tentang epidemiologi, melainkan tentang hubungan yang sulit antara pikiran kita dan statistik. Sistem 1 sangat mahir dalam satu jenis pemikiran: ia secara otomatis dan tanpa usaha mengenali hubungan sebab-akibat antara peristiwa, bahkan kadang ketika hubungan itu sebenarnya semu. Ketika Anda diberi tahu tentang county dengan tingkat kejadian tinggi, Anda segera berasumsi bahwa county-county tersebut berbeda dari yang lain karena suatu alasan—bahwa pasti ada sebab yang menjelaskan perbedaan itu. Namun, sebagaimana akan kita lihat, Sistem 1 sangat tidak cakap ketika berhadapan dengan fakta yang “sekadar statistik”, yakni fakta yang hanya mengubah probabilitas hasil tanpa benar-benar menyebabkan hasil itu terjadi.
Peristiwa acak, menurut definisinya, tidak mengundang penjelasan sebab-akibat. Namun kumpulan peristiwa acak justru memperlihatkan pola yang sangat teratur.
Bayangkan sebuah guci besar yang dipenuhi kelereng. Separuh kelereng berwarna merah, separuh lainnya putih. Sekarang bayangkan seorang yang sangat sabar (atau sebuah robot) yang secara buta mengambil 4 kelereng dari guci tersebut, mencatat jumlah kelereng merah dalam sampel itu, lalu mengembalikan semuanya ke dalam guci, dan mengulanginya lagi—berkali-kali. Jika Anda merangkum hasilnya, Anda akan menemukan bahwa hasil “2 merah, 2 putih” muncul hampir tepat enam kali lebih sering daripada hasil “4 merah” atau “4 putih”. Hubungan ini adalah fakta matematis. Anda dapat memprediksi hasil dari pengambilan sampel berulang dari sebuah guci dengan keyakinan yang sama seperti ketika Anda memprediksi apa yang terjadi jika sebuah telur dipukul dengan palu. Anda mungkin tidak dapat meramalkan setiap detail bagaimana cangkangnya pecah, tetapi Anda yakin akan gambaran umumnya. Ada satu perbedaan: rasa puas akan hubungan sebab-akibat yang Anda rasakan ketika membayangkan palu memukul telur sama sekali tidak muncul ketika Anda memikirkan pengambilan sampel.
Fakta statistik lain yang berkaitan dengan contoh kanker tadi adalah sebagai berikut. Dari guci yang sama, dua penghitung kelereng yang sangat sabar bergiliran melakukan percobaan. Jack mengambil 4 kelereng setiap kali percobaan, sementara Jill mengambil 7. Keduanya mencatat setiap kali mereka memperoleh sampel homogen—semuanya merah atau semuanya putih. Jika mereka melanjutkan cukup lama, Jack akan menemukan hasil ekstrem seperti itu jauh lebih sering daripada Jill—dengan perbandingan sekitar delapan banding satu (persentase yang diharapkan masing-masing sekitar 12,5% dan 1,56%). Sekali lagi, tidak ada palu, tidak ada sebab-akibat—hanya fakta matematis: sampel berisi 4 kelereng menghasilkan hasil ekstrem lebih sering daripada sampel berisi 7 kelereng.
Sekarang bayangkan populasi Amerika Serikat sebagai kelereng dalam sebuah guci raksasa. Sebagian kelereng diberi tanda KC, singkatan dari kidney cancer. Anda mengambil sampel kelereng dan mengisi setiap county secara bergiliran. Sampel pedesaan lebih kecil daripada sampel lainnya. Sama seperti dalam permainan Jack dan Jill, hasil ekstrem—baik sangat tinggi maupun sangat rendah—paling mungkin muncul pada county yang berpenduduk jarang. Itulah seluruh kisahnya.
Kita memulai dari suatu fakta yang tampaknya menuntut penjelasan sebab: tingkat kejadian kanker ginjal sangat bervariasi antarcounty, dan perbedaan itu tampak sistematis. Penjelasan yang saya tawarkan bersifat statistik: hasil ekstrem (baik tinggi maupun rendah) lebih mungkin muncul pada sampel kecil dibanding pada sampel besar. Penjelasan ini bukanlah sebab-akibat. Populasi kecil suatu county tidak menyebabkan ataupun mencegah kanker; ia hanya memungkinkan tingkat kejadian kanker tampak jauh lebih tinggi atau jauh lebih rendah daripada yang terlihat dalam populasi yang lebih besar.
Kebenaran yang lebih dalam adalah bahwa sebenarnya tidak ada yang perlu dijelaskan. Tingkat kejadian kanker di sebuah county berpenduduk kecil tidak benar-benar lebih rendah atau lebih tinggi dari normal; ia hanya tampak demikian pada tahun tertentu karena kebetulan dalam pengambilan sampel. Jika kita mengulangi analisis itu tahun depan, kita akan melihat pola umum yang sama—hasil ekstrem lebih sering muncul dalam sampel kecil—namun county yang tahun lalu memiliki tingkat kanker tinggi belum tentu memiliki tingkat yang tinggi tahun ini. Jika demikian, perbedaan antara county padat dan county pedesaan sebenarnya bukanlah fakta yang sejati: ia adalah apa yang oleh ilmuwan disebut artefak, yakni pengamatan yang sepenuhnya dihasilkan oleh aspek metode penelitian—dalam hal ini, perbedaan ukuran sampel.
Kisah yang baru saja saya ceritakan mungkin mengejutkan Anda, tetapi sebenarnya bukanlah wahyu baru. Anda telah lama mengetahui bahwa hasil dari sampel besar lebih dapat dipercaya daripada hasil dari sampel kecil, dan bahkan orang yang tidak memiliki pengetahuan statistik pun pernah mendengar tentang hukum bilangan besar. Namun “mengetahui” bukanlah perkara hitam-putih, dan mungkin Anda merasa bahwa pernyataan berikut berlaku bagi Anda:
- Ciri “berpenduduk jarang” tidak segera tampak relevan ketika Anda membaca kisah epidemiologis tadi.
- Anda setidaknya sedikit terkejut oleh besarnya perbedaan antara sampel berisi 4 dan sampel berisi 7.
- Bahkan sekarang pun, Anda perlu sedikit usaha mental untuk melihat bahwa dua pernyataan berikut sebenarnya berarti hal yang persis sama:
Sampel besar lebih presisi daripada sampel kecil.
Sampel kecil menghasilkan hasil ekstrem lebih sering daripada sampel besar.
Pernyataan pertama terdengar jelas benar, tetapi sebelum versi kedua terasa masuk akal secara intuitif, Anda sebenarnya belum benar-benar memahami yang pertama.
Kesimpulannya sederhana: ya, Anda memang tahu bahwa hasil dari sampel besar lebih presisi—tetapi mungkin sekarang Anda menyadari bahwa Anda tidak benar-benar mengetahuinya dengan baik.
Dan Anda tidak sendirian. Studi pertama yang saya lakukan bersama Amos menunjukkan bahwa bahkan para peneliti yang sangat terampil pun memiliki intuisi yang lemah dan pemahaman yang goyah mengenai efek pengambilan sampel.
Hukum Bilangan Kecil
Kolaborasi saya dengan Amos pada awal 1970-an bermula dari diskusi mengenai klaim bahwa orang yang tidak memiliki pelatihan statistik pun merupakan “ahli statistik intuitif” yang baik. Ia menceritakan kepada seminar saya tentang para peneliti di University of Michigan yang cukup optimistis terhadap statistik intuitif. Saya memiliki perasaan kuat terhadap klaim tersebut—dan menerimanya secara pribadi. Saya baru saja menyadari bahwa saya sendiri bukanlah ahli statistik intuitif yang baik, dan saya tidak percaya bahwa kemampuan saya lebih buruk daripada orang lain.
Bagi seorang psikolog peneliti, variasi dalam pengambilan sampel bukanlah sekadar keingintahuan; ia merupakan gangguan dan hambatan mahal yang menjadikan setiap proyek penelitian sebagai semacam pertaruhan. Misalkan Anda ingin menguji hipotesis bahwa kosakata rata-rata anak perempuan berusia enam tahun lebih besar daripada kosakata rata-rata anak laki-laki pada usia yang sama. Hipotesis ini benar dalam populasi; rata-rata kosakata anak perempuan memang lebih besar. Namun variasi antara anak perempuan dan laki-laki sangat besar, sehingga karena kebetulan pemilihan sampel Anda bisa saja memperoleh sampel yang menunjukkan perbedaan tidak meyakinkan—atau bahkan sampel di mana anak laki-laki justru memperoleh skor lebih tinggi. Jika Anda adalah penelitinya, hasil seperti itu merugikan: waktu dan usaha Anda terbuang, dan Anda gagal mengonfirmasi hipotesis yang sebenarnya benar. Satu-satunya cara mengurangi risiko ini adalah menggunakan sampel yang cukup besar. Peneliti yang memilih sampel terlalu kecil menyerahkan diri pada keberuntungan dalam pengambilan sampel.
Risiko kesalahan dapat diperkirakan untuk ukuran sampel tertentu melalui prosedur yang relatif sederhana. Namun secara tradisional para psikolog tidak menggunakan perhitungan untuk menentukan ukuran sampel. Mereka menggunakan penilaian mereka sendiri—yang sering kali keliru. Sebuah artikel yang saya baca tidak lama sebelum perdebatan dengan Amos menunjukkan kesalahan para peneliti tersebut melalui pengamatan yang mencolok. Penulis artikel itu menunjukkan bahwa para psikolog sering memilih sampel yang begitu kecil sehingga mereka menghadapi risiko 50% untuk gagal mengonfirmasi hipotesis yang sebenarnya benar. Tidak ada peneliti yang waras yang dengan sadar akan menerima risiko sebesar itu. Penjelasan yang masuk akal adalah bahwa keputusan para psikolog tentang ukuran sampel mencerminkan kesalahpahaman intuitif yang umum mengenai besarnya variasi dalam pengambilan sampel.
Artikel itu mengejutkan saya, karena ia menjelaskan beberapa kesulitan yang pernah saya alami dalam penelitian saya sendiri. Seperti kebanyakan psikolog peneliti lainnya, saya secara rutin memilih sampel yang terlalu kecil dan sering memperoleh hasil yang tidak masuk akal. Kini saya mengetahui sebabnya: hasil aneh tersebut sebenarnya adalah artefak dari metode penelitian saya sendiri. Kesalahan saya terasa sangat memalukan, karena saya mengajar statistik dan tahu bagaimana menghitung ukuran sampel yang dapat menurunkan risiko kegagalan hingga tingkat yang dapat diterima. Namun saya tidak pernah menentukan ukuran sampel melalui perhitungan. Seperti rekan-rekan saya, saya mempercayai tradisi dan intuisi ketika merencanakan eksperimen, dan tidak pernah benar-benar memikirkan persoalan itu secara serius. Ketika Amos mengunjungi seminar tersebut, saya sudah sampai pada kesimpulan bahwa intuisi saya sendiri tidak dapat diandalkan, dan dalam diskusi seminar itu kami segera sepakat bahwa para optimis dari Michigan keliru.
Amos dan saya kemudian berusaha meneliti apakah saya satu-satunya orang bodoh, atau hanya anggota dari mayoritas orang bodoh, dengan menguji apakah para peneliti yang dipilih karena keahlian matematis mereka akan membuat kesalahan serupa. Kami menyusun sebuah kuesioner yang menggambarkan situasi penelitian yang realistis, termasuk pengulangan eksperimen yang pernah berhasil. Para responden diminta memilih ukuran sampel, menilai risiko kegagalan yang dihadapi oleh keputusan mereka, serta memberikan saran kepada mahasiswa pascasarjana hipotetis yang sedang merencanakan penelitian. Amos mengumpulkan jawaban dari sekelompok peserta yang sangat berpengalaman—termasuk penulis dua buku teks statistik—dalam sebuah pertemuan.
Amos dan saya memberi judul artikel bersama pertama kami “Keyakinan terhadap Hukum Bilangan Kecil.” Dengan nada sedikit jenaka, kami menjelaskan bahwa “intuisi tentang pengambilan sampel acak tampaknya mengikuti hukum bilangan kecil, yang menyatakan bahwa hukum bilangan besar juga berlaku untuk bilangan kecil.” Kami juga menambahkan rekomendasi tegas agar para peneliti memandang “intuisi statistik mereka dengan kecurigaan yang wajar dan, sejauh mungkin, menggantikan pembentukan kesan dengan perhitungan.”
Bias Keyakinan yang Mengalahkan Keraguan
Dalam sebuah jajak pendapat melalui telepon terhadap 300 warga lanjut usia, 60% menyatakan dukungan kepada presiden.
Jika Anda diminta merangkum pesan kalimat ini tepat dalam tiga kata, apa yang akan Anda pilih? Hampir pasti jawabannya adalah “lansia dukung presiden.” Tiga kata itu menangkap inti cerita. Rincian yang dihilangkan—bahwa jajak pendapat dilakukan melalui telepon dengan sampel 300 orang—tidak menarik perhatian pada dirinya sendiri; ia sekadar menyediakan informasi latar yang jarang mendapat sorotan. Ringkasan Anda akan tetap sama sekalipun ukuran sampelnya berbeda. Tentu saja, angka yang sepenuhnya tidak masuk akal akan segera menarik perhatian (“sebuah jajak pendapat telepon terhadap 6 [atau 60 juta] pemilih lansia…”). Namun kecuali Anda seorang profesional, kemungkinan besar Anda tidak akan bereaksi sangat berbeda terhadap sampel berjumlah 150 dibandingkan dengan 3.000. Inilah yang dimaksud dengan pernyataan bahwa “orang tidak cukup peka terhadap ukuran sampel.”
Pesan tentang jajak pendapat itu memuat dua jenis informasi: cerita dan sumber cerita. Secara alami Anda memusatkan perhatian pada ceritanya, bukan pada keandalan hasilnya. Namun bila keandalannya jelas rendah, pesan tersebut akan kehilangan kredibilitas. Jika Anda diberi tahu bahwa “sebuah kelompok partisan melakukan jajak pendapat yang cacat dan bias untuk menunjukkan bahwa para lansia mendukung presiden…,” tentu Anda akan menolak temuan jajak pendapat itu, dan hasilnya tidak akan menjadi bagian dari apa yang Anda yakini. Sebaliknya, jajak pendapat partisan beserta hasil palsunya akan menjadi sebuah cerita baru tentang kebohongan politik. Dalam kasus yang begitu jelas, Anda dapat memilih untuk tidak mempercayai suatu pesan.
Tetapi apakah Anda cukup membedakan antara “Saya membaca di The New York Times…” dan “Saya mendengarnya di sekitar dispenser air kantor…”? Dapatkah Sistem 1 Anda membedakan derajat keyakinan? Prinsip WYSIATI menunjukkan bahwa ia tidak dapat.
Seperti telah saya uraikan sebelumnya, Sistem 1 tidak cenderung meragukan. Ia menekan ambiguitas dan secara spontan membangun cerita yang sekoheren mungkin. Selama sebuah pesan tidak segera disangkal, asosiasi yang dipicunya akan menyebar seolah-olah pesan itu benar. Sistem 2 mampu meragukan, karena ia dapat mempertahankan kemungkinan-kemungkinan yang saling bertentangan pada saat yang sama. Namun mempertahankan keraguan menuntut kerja yang lebih berat dibandingkan meluncur menuju kepastian.
Hukum bilangan kecil merupakan manifestasi dari bias yang lebih umum—bias yang lebih menyukai kepastian daripada keraguan—yang akan muncul dalam berbagai bentuk pada bab-bab berikutnya. Kecenderungan kuat untuk mempercayai bahwa sampel kecil sangat menyerupai populasi asalnya juga merupakan bagian dari kisah yang lebih besar: kita cenderung melebih-lebihkan konsistensi dan koherensi dari apa yang kita lihat.
Keyakinan para peneliti yang berlebihan terhadap apa yang dapat dipelajari dari segelintir pengamatan berkaitan erat dengan efek halo, yaitu perasaan yang kerap muncul bahwa kita mengenal dan memahami seseorang, padahal sebenarnya kita hanya mengetahui sangat sedikit tentang dirinya. Sistem 1 melampaui fakta-fakta yang tersedia dengan membangun gambaran yang kaya dari potongan-potongan bukti yang terbatas. Sebuah mesin yang gemar melompat ke kesimpulan akan bertindak seolah-olah ia mempercayai hukum bilangan kecil. Secara lebih umum, ia akan menghasilkan representasi realitas yang tampak terlalu masuk akal.
Sebab dan Kebetulan
Mesin asosiasi di dalam pikiran selalu mencari sebab. Kesulitan kita menghadapi keteraturan statistik muncul karena keteraturan semacam itu menuntut pendekatan yang berbeda. Alih-alih memusatkan perhatian pada bagaimana suatu peristiwa terjadi, sudut pandang statistik mengaitkannya dengan apa saja yang mungkin terjadi sebagai alternatif. Tidak ada penyebab khusus yang menjadikannya seperti yang kita lihat—kebetulanlah yang memilihnya dari sekian banyak kemungkinan.
Kecenderungan kita untuk berpikir secara kausal membuat kita rentan terhadap kesalahan serius ketika menilai keacakan peristiwa yang sungguh-sungguh acak.
Sebagai contoh, bayangkan jenis kelamin enam bayi yang lahir secara berurutan di sebuah rumah sakit. Urutan bayi laki-laki dan perempuan jelas bersifat acak; setiap peristiwa berdiri sendiri, dan jumlah bayi laki-laki atau perempuan yang lahir beberapa jam sebelumnya sama sekali tidak memengaruhi jenis kelamin bayi berikutnya.
Sekarang perhatikan tiga kemungkinan urutan berikut:
BBBGGG
GGGGGG
BGBBGB
Apakah ketiganya sama-sama mungkin terjadi?
Jawaban intuitif—“tentu tidak!”—sebenarnya keliru. Karena setiap kelahiran bersifat independen dan karena peluang bayi laki-laki (B) dan perempuan (G) kira-kira sama, maka setiap kemungkinan urutan dari enam kelahiran sama mungkin terjadi dengan urutan lainnya.
Bahkan setelah Anda mengetahui bahwa kesimpulan ini benar, ia tetap terasa bertentangan dengan intuisi, karena hanya urutan ketiga yang tampak acak. Seperti yang dapat diduga, BGBBGB dinilai jauh lebih mungkin daripada dua urutan lainnya.
Kita adalah pencari pola, penganut keyakinan akan dunia yang koheren, di mana keteraturan—seperti enam bayi perempuan berturut-turut—tidak muncul secara kebetulan, melainkan sebagai akibat dari sebab mekanis atau dari niat seseorang. Kita tidak mengharapkan keteraturan muncul dari proses acak, dan ketika kita melihat sesuatu yang tampak seperti aturan, kita segera menolak gagasan bahwa proses tersebut sungguh-sungguh acak. Proses acak menghasilkan banyak urutan yang justru meyakinkan orang bahwa proses itu tidak acak.
Anda dapat melihat mengapa asumsi tentang sebab mungkin memiliki keuntungan evolusioner. Ia merupakan bagian dari kewaspadaan umum yang kita warisi dari para leluhur. Kita secara otomatis waspada terhadap kemungkinan bahwa lingkungan telah berubah. Singa mungkin muncul di padang pada waktu-waktu acak, tetapi akan lebih aman jika kita memperhatikan dan menanggapi peningkatan yang tampak dalam frekuensi kemunculan kawanan singa—meskipun peningkatan itu sebenarnya hanya akibat fluktuasi dari proses acak.
Kesalahpahaman luas mengenai keacakan kadang memiliki konsekuensi penting. Dalam artikel kami tentang representativitas, Amos dan saya mengutip ahli statistik William Feller, yang menunjukkan betapa mudahnya orang melihat pola di tempat yang sebenarnya tidak ada pola.
Baca Juga: Lighten PDF Converter OCR 6.1.1 Full Version
Selama pengeboman roket intensif terhadap London dalam Perang Dunia II, banyak orang percaya bahwa pengeboman itu tidak mungkin acak, karena peta lokasi ledakan memperlihatkan celah-celah mencolok. Sebagian orang bahkan mencurigai bahwa mata-mata Jerman berada di wilayah-wilayah yang tidak terkena bom. Namun analisis statistik yang cermat menunjukkan bahwa penyebaran titik-titik ledakan sepenuhnya khas dari proses acak—dan khas pula dalam menimbulkan kesan kuat bahwa ia tidak acak. “Bagi mata yang tidak terlatih,” kata Feller, “keacakan tampak sebagai keteraturan atau kecenderungan untuk mengelompok.”
Tak lama kemudian saya memiliki kesempatan menerapkan apa yang saya pelajari dari Feller.
Perang Yom Kippur pecah pada tahun 1973, dan satu-satunya kontribusi berarti saya terhadap upaya perang adalah memberi saran kepada para perwira tinggi Angkatan Udara Israel untuk menghentikan sebuah penyelidikan. Pada tahap awal, perang udara berjalan cukup buruk bagi Israel, terutama karena kinerja rudal darat-ke-udara Mesir yang tak terduga baiknya. Kerugian pesawat cukup besar dan tampak tidak merata.
Saya diberi tahu tentang dua skuadron yang terbang dari pangkalan yang sama: satu kehilangan empat pesawat, sementara yang lain tidak kehilangan satu pun. Sebuah penyelidikan dimulai dengan harapan menemukan kesalahan yang dilakukan skuadron yang kurang beruntung itu. Tidak ada alasan sebelumnya untuk percaya bahwa salah satu skuadron lebih efektif daripada yang lain, dan tidak ditemukan perbedaan operasional apa pun. Namun tentu saja kehidupan para pilot berbeda dalam banyak hal yang bersifat acak—termasuk, sejauh yang saya ingat, seberapa sering mereka pulang ke rumah di antara misi serta hal-hal tertentu dalam pelaksanaan sesi evaluasi setelah penerbangan.
Saran saya adalah agar komando menerima bahwa perbedaan hasil tersebut semata-mata disebabkan oleh keberuntungan buta, dan bahwa wawancara terhadap para pilot harus dihentikan. Alasan saya sederhana: keberuntungan adalah penjelasan yang paling mungkin; pencarian acak terhadap penyebab tersembunyi hampir pasti sia-sia; dan sementara itu para pilot dalam skuadron yang mengalami kerugian tidak membutuhkan beban tambahan berupa kesan bahwa mereka—dan rekan-rekan mereka yang telah gugur—bersalah.
Beberapa tahun kemudian, Amos bersama murid-muridnya, Tom Gilovich dan Robert Vallone, menimbulkan kehebohan dengan penelitian mereka tentang salah persepsi terhadap keacakan dalam bola basket.
“Fakta” bahwa pemain kadang-kadang memperoleh hot hand—tangan panas—diterima luas oleh pemain, pelatih, dan penggemar. Inferensi yang muncul hampir tak terelakkan: seorang pemain memasukkan tiga atau empat tembakan berturut-turut, dan kita segera membuat penilaian kausal bahwa pemain itu sedang “panas”, seolah-olah untuk sementara memiliki kecenderungan lebih besar untuk mencetak angka. Pemain di kedua tim menyesuaikan diri dengan penilaian ini—rekan setim lebih sering mengoper bola kepada pencetak angka yang sedang panas, dan pertahanan lawan lebih sering melakukan penjagaan ganda.
Namun analisis terhadap ribuan rangkaian tembakan menghasilkan kesimpulan yang mengecewakan: tidak ada yang namanya hot hand dalam bola basket profesional, baik dalam tembakan lapangan maupun lemparan bebas. Memang benar sebagian pemain lebih akurat daripada yang lain, tetapi urutan keberhasilan dan kegagalan tembakan memenuhi semua kriteria keacakan. Hot hand sepenuhnya berada dalam persepsi para pengamat, yang terlalu cepat melihat keteraturan dan sebab dalam sesuatu yang sebenarnya acak. Hot hand adalah ilusi kognitif yang besar dan tersebar luas.
Reaksi publik terhadap penelitian ini juga menjadi bagian dari ceritanya. Temuan tersebut diangkat oleh media karena kesimpulannya mengejutkan, dan tanggapan umum adalah ketidakpercayaan. Ketika pelatih legendaris Boston Celtics, Red Auerbach, mendengar tentang studi Gilovich, ia menanggapi, “Siapa orang ini? Dia membuat penelitian. Saya tidak peduli.” Kecenderungan melihat pola dalam keacakan begitu kuat—jauh lebih meyakinkan daripada seorang peneliti yang melakukan studi.
Ilusi pola memengaruhi kehidupan kita dalam banyak cara di luar lapangan bola basket. Berapa banyak tahun keberhasilan yang perlu Anda lihat sebelum menyimpulkan bahwa seorang penasihat investasi benar-benar sangat terampil? Berapa banyak akuisisi yang berhasil diperlukan sebelum dewan direksi percaya bahwa CEO memiliki bakat luar biasa dalam kesepakatan semacam itu?
Jawaban sederhana atas pertanyaan-pertanyaan ini adalah: jika Anda mengikuti intuisi, Anda lebih sering daripada tidak akan keliru—dengan mengklasifikasikan peristiwa acak sebagai sesuatu yang sistematis. Kita terlalu mudah menolak keyakinan bahwa banyak hal yang kita lihat dalam hidup sebenarnya bersifat acak.
Saya memulai bab ini dengan contoh tingkat kejadian kanker di berbagai wilayah Amerika Serikat. Contoh itu muncul dalam sebuah buku yang ditujukan bagi para pengajar statistik, tetapi saya mengetahuinya dari sebuah artikel jenaka oleh dua ahli statistik yang telah saya kutip sebelumnya, Howard Wainer dan Harris Zwerling.
Esai mereka berfokus pada sebuah investasi besar—sekitar 1,7 miliar dolar—yang dilakukan oleh Gates Foundation untuk menindaklanjuti temuan-temuan menarik mengenai karakteristik sekolah yang paling berhasil. Banyak peneliti berusaha menemukan rahasia pendidikan yang sukses dengan mengidentifikasi sekolah-sekolah paling berhasil, dengan harapan menemukan apa yang membedakan mereka dari sekolah lainnya.
Salah satu kesimpulan penelitian tersebut adalah bahwa sekolah yang paling berhasil, rata-rata, berukuran kecil. Dalam sebuah survei terhadap 1.662 sekolah di Pennsylvania, misalnya, 6 dari 50 sekolah terbaik berukuran kecil—sebuah representasi yang berlebihan hingga empat kali lipat.
Data ini mendorong Gates Foundation melakukan investasi besar dalam pendirian sekolah-sekolah kecil, kadang dengan memecah sekolah besar menjadi unit-unit yang lebih kecil. Setidaknya setengah lusin lembaga terkemuka lainnya—seperti Annenberg Foundation dan Pew Charitable Trust—ikut bergabung dalam upaya tersebut, demikian pula program Smaller Learning Communities dari Departemen Pendidikan Amerika Serikat.
Semua ini barangkali terasa masuk akal secara intuitif. Sangat mudah membangun cerita kausal yang menjelaskan bagaimana sekolah kecil mampu memberikan pendidikan yang lebih unggul dan menghasilkan siswa berprestasi tinggi, karena mereka dapat memberikan perhatian dan dorongan pribadi yang lebih besar dibandingkan sekolah besar.
Sayangnya, analisis kausal tersebut tidak ada gunanya, karena fakta dasarnya keliru. Seandainya para ahli statistik yang melaporkan kepada Gates Foundation juga menanyakan karakteristik sekolah yang paling buruk, mereka akan menemukan bahwa sekolah yang buruk pun cenderung lebih kecil daripada rata-rata. Kebenarannya adalah bahwa sekolah kecil tidak lebih baik secara rata-rata; mereka hanya lebih bervariasi. Bahkan, menurut Wainer dan Zwerling, sekolah besar justru cenderung menghasilkan hasil yang lebih baik, terutama pada tingkat kelas yang lebih tinggi, ketika beragam pilihan kurikulum menjadi penting.
Berkat kemajuan mutakhir dalam psikologi kognitif, kini kita dapat melihat dengan jelas apa yang dulu hanya dapat saya dan Amos tangkap sekilas: hukum bilangan kecil merupakan bagian dari dua kisah yang lebih besar tentang cara kerja pikiran.
- Kepercayaan yang berlebihan terhadap sampel kecil hanyalah salah satu contoh dari ilusi yang lebih umum—kita memberi perhatian lebih besar pada isi pesan daripada pada informasi tentang keandalannya, dan akibatnya kita membangun gambaran dunia yang lebih sederhana dan lebih koheren daripada yang dibenarkan oleh data. Melompat ke kesimpulan adalah olahraga yang aman di dunia imajinasi kita, tetapi tidak demikian dalam kenyataan.
- Statistik menghasilkan banyak pengamatan yang tampak seolah-olah menuntut penjelasan kausal, padahal sebenarnya tidak memungkinkan penjelasan semacam itu. Banyak fakta di dunia terjadi karena kebetulan, termasuk kebetulan dalam pengambilan sampel. Penjelasan kausal atas peristiwa yang disebabkan oleh kebetulan hampir pasti keliru.
Berbicara tentang Hukum Bilangan Kecil
“Ya, studio itu memang menghasilkan tiga film sukses sejak CEO baru mengambil alih. Tetapi masih terlalu dini untuk menyatakan bahwa ia sedang memiliki tangan panas.”
“Saya tidak akan percaya bahwa trader baru itu seorang jenius sebelum berkonsultasi dengan seorang ahli statistik yang dapat memperkirakan kemungkinan bahwa rangkaian keberhasilannya hanyalah peristiwa kebetulan.”
“Sampel pengamatan ini terlalu kecil untuk menarik kesimpulan apa pun. Jangan sampai kita mengikuti hukum bilangan kecil.”
“Saya berencana merahasiakan hasil eksperimen ini sampai kita memiliki sampel yang cukup besar. Jika tidak, kita akan menghadapi tekanan untuk menarik kesimpulan terlalu dini.”







Comments (0)