[Buku Bahasa Indonesia] Thinking Fast and Slow - Daniel Kahneman
Penyebab Mengalahkan Statistika
Pertimbangkan skenario berikut dan catat jawaban intuitif Anda terhadap pertanyaan ini.
Sebuah taksi terlibat dalam kecelakaan tabrak lari pada malam hari.
Dua perusahaan taksi, Green dan Blue, beroperasi di kota tersebut. Anda diberikan data berikut:
85% taksi di kota ini adalah Green dan 15% adalah Blue. Seorang saksi mengidentifikasi taksi tersebut sebagai Blue. Pengadilan menguji keandalan saksi di bawah kondisi yang terjadi pada malam kecelakaan dan menyimpulkan bahwa saksi tersebut mengidentifikasi masing-masing warna dengan benar 80% dari waktu dan salah 20% dari waktu.
Berapa probabilitas bahwa taksi yang terlibat dalam kecelakaan itu adalah Blue, bukan Green?
Ini adalah masalah standar inferensi Bayesian. Ada dua informasi yang diberikan: tingkat dasar (base rate) dan kesaksian saksi yang tidak sepenuhnya dapat diandalkan.
Tanpa adanya saksi, probabilitas taksi yang bersalah adalah Blue adalah 15%, yang merupakan base rate dari kemungkinan itu. Jika kedua perusahaan taksi sama besarnya, base rate tidak memberikan informasi dan Anda hanya akan mempertimbangkan keandalan saksi.
Stereotip Kausal
Sekarang pertimbangkan variasi dari cerita yang sama, di mana hanya penyajian base rate yang diubah.
Data yang diberikan:
Kedua perusahaan memiliki jumlah taksi yang sama, tetapi taksi Green terlibat dalam 85% kecelakaan.
Informasi tentang saksi sama seperti versi sebelumnya.
Kedua versi masalah ini secara matematis tidak dapat dibedakan, tetapi secara psikologis berbeda secara signifikan. Orang yang membaca versi pertama tidak tahu cara menggunakan base rate dan sering mengabaikannya. Sebaliknya, orang yang melihat versi kedua memberikan bobot yang cukup besar pada base rate, dan rata-rata penilaian mereka tidak terlalu jauh dari solusi Bayesian. Mengapa?
Dalam versi pertama, base rate taksi Blue adalah fakta statistik tentang taksi di kota itu. Pikiran yang mencari cerita kausal tidak menemukan hal yang bisa diolah: Bagaimana jumlah taksi Green dan Blue di kota menyebabkan pengemudi taksi ini menabrak dan kabur?
Dalam versi kedua, sebaliknya, pengemudi taksi Green menyebabkan lebih dari lima kali lipat kecelakaan dibanding taksi Blue. Kesimpulannya langsung: pengemudi Green pasti sekelompok orang nekat!
Sekarang Anda telah membentuk stereotip tentang kecerobohan pengemudi Green, yang Anda terapkan pada pengemudi individu yang tidak dikenal di perusahaan tersebut. Stereotip ini mudah dimasukkan ke dalam cerita kausal, karena kecerobohan adalah fakta kausal yang relevan tentang pengemudi individu. Dalam versi ini, ada dua cerita kausal yang perlu digabungkan atau direkonsiliasi. Cerita pertama adalah tabrak lari, yang secara alami membangkitkan ide bahwa pengemudi Green yang ceroboh bertanggung jawab. Cerita kedua adalah kesaksian saksi, yang sangat menunjukkan bahwa taksi tersebut adalah Blue. Inferensi dari kedua cerita tentang warna taksi saling bertentangan dan kira-kira saling meniadakan. Peluang kedua warna menjadi hampir sama (estimasi Bayesian adalah 41%, mencerminkan fakta bahwa base rate taksi Green sedikit lebih ekstrem daripada keandalan saksi yang melaporkan taksi Blue).
Contoh taksi ini menggambarkan dua jenis base rate. Base rate statistik adalah fakta tentang populasi tempat suatu kasus berasal, tetapi tidak relevan untuk kasus individu. Base rate kausal mengubah pandangan Anda tentang bagaimana kasus individu itu terjadi. Kedua jenis informasi base rate diperlakukan berbeda:
- Base rate statistik umumnya kurang diperhitungkan, dan terkadang diabaikan sama sekali, ketika informasi spesifik tentang kasus yang bersangkutan tersedia.
- Base rate kausal diperlakukan sebagai informasi tentang kasus individu dan mudah digabungkan dengan informasi spesifik kasus lainnya.
Versi kausal dari masalah taksi berbentuk stereotip: pengemudi Green berbahaya. Stereotip adalah pernyataan tentang kelompok yang diterima (setidaknya sementara) sebagai fakta tentang setiap anggotanya. Berikut dua contoh:
- Sebagian besar lulusan sekolah di pusat kota ini melanjutkan ke perguruan tinggi.
- Minat bersepeda tersebar luas di Prancis.
Pernyataan ini mudah diinterpretasikan sebagai menunjukkan kecenderungan pada anggota individu kelompok tersebut, dan mereka cocok dalam cerita kausal. Banyak lulusan sekolah pusat kota ini bersemangat dan mampu melanjutkan ke perguruan tinggi, kemungkinan karena beberapa fitur kehidupan di sekolah tersebut yang menguntungkan. Ada kekuatan dalam budaya dan kehidupan sosial Prancis yang menyebabkan banyak orang Prancis tertarik pada bersepeda. Anda akan diingatkan akan fakta-fakta ini ketika mempertimbangkan kemungkinan seorang lulusan tertentu akan kuliah, atau ketika mempertimbangkan apakah akan menyebut Tour de France dalam percakapan dengan seorang Prancis yang baru Anda temui.
Stereotip adalah kata yang buruk dalam budaya kita, tetapi dalam penggunaanku netral. Salah satu karakteristik dasar Sistem 1 adalah bahwa ia merepresentasikan kategori sebagai norma dan contoh prototipikal. Begitulah cara kita memandang kuda, lemari es, dan polisi New York; kita menyimpan dalam memori representasi satu atau lebih anggota “normal” dari masing-masing kategori ini. Ketika kategori tersebut bersifat sosial, representasi ini disebut stereotip. Beberapa stereotip sangat salah dan berbahaya, dan stereotip bermusuhan bisa menimbulkan konsekuensi buruk, tetapi fakta psikologis tidak bisa dihindari: stereotip, baik yang benar maupun salah, adalah cara kita memandang kategori.
Anda mungkin mencatat ironi ini. Dalam konteks masalah taksi, pengabaian informasi base rate adalah kelemahan kognitif, kegagalan penalaran Bayesian, dan ketergantungan pada base rate kausal adalah hal yang diinginkan. Menytereotip pengemudi Green meningkatkan akurasi penilaian. Dalam konteks lain, seperti perekrutan atau profiling, ada norma sosial yang kuat menentang stereotip, yang juga tertanam dalam hukum. Hal ini memang seharusnya demikian. Dalam konteks sosial yang sensitif, kita tidak ingin menarik kesimpulan yang mungkin salah tentang individu dari statistik kelompok. Kita menganggap secara moral bahwa base rate harus diperlakukan sebagai fakta statistik tentang kelompok, bukan sebagai fakta yang bersifat presumtif tentang individu. Dengan kata lain, kita menolak base rate kausal.
Norma sosial terhadap stereotip, termasuk penolakan terhadap profiling, telah sangat bermanfaat dalam menciptakan masyarakat yang lebih beradab dan setara. Namun, penting diingat bahwa mengabaikan stereotip yang valid akan menghasilkan penilaian yang suboptimal. Menolak stereotip adalah posisi moral yang terpuji, tetapi gagasan sederhana bahwa penolakan itu tanpa biaya adalah salah. Biaya tersebut layak dibayar untuk mencapai masyarakat yang lebih baik, tetapi menyangkal bahwa biaya itu ada—meskipun memuaskan secara moral dan politis—tidak dapat dibenarkan secara ilmiah. Ketergantungan pada heuristik afektif umum terjadi dalam argumen yang sarat politik. Posisi yang kita dukung dianggap tanpa biaya, dan yang kita tolak dianggap tanpa manfaat. Kita seharusnya mampu melakukan lebih baik.
Situasi Kausal
Amos dan saya menyusun varian masalah taksi, tetapi kami tidak menemukan konsep base rate kausal yang kuat; kami meminjamnya dari psikolog Icek Ajzen. Dalam eksperimennya, Ajzen menunjukkan kepada partisipan vignette singkat tentang beberapa siswa yang mengikuti ujian di Yale dan meminta partisipan menilai probabilitas setiap siswa lulus ujian. Manipulasi base rate kausal sangat sederhana: Ajzen memberi tahu satu kelompok bahwa siswa yang mereka lihat berasal dari kelas di mana 75% lulus ujian, dan memberi tahu kelompok lain bahwa siswa yang sama berasal dari kelas di mana hanya 25% yang lulus. Manipulasi ini sangat kuat, karena base rate kelulusan langsung memunculkan inferensi bahwa ujian dengan 25% lulus pasti sangat sulit. Tingkat kesulitan ujian adalah, tentu saja, salah satu faktor kausal yang menentukan hasil setiap siswa. Seperti yang diharapkan, subjek Ajzen sangat sensitif terhadap base rate kausal, dan setiap siswa dinilai lebih mungkin lulus dalam kondisi keberhasilan tinggi dibandingkan dalam kondisi kegagalan tinggi.
Ajzen menggunakan metode cerdik untuk menyarankan base rate non-kausal. Ia memberi tahu partisipannya bahwa siswa yang mereka lihat diambil dari sampel, yang dibentuk dengan memilih siswa yang lulus atau gagal ujian. Misalnya, informasi untuk kelompok kegagalan tinggi berbunyi:
“Peneliti terutama tertarik pada penyebab kegagalan dan membentuk sampel di mana 75% gagal ujian.”
Perhatikan perbedaannya. Base rate ini adalah fakta murni statistik tentang kumpulan dari mana kasus-kasus diambil. Ini tidak relevan dengan pertanyaan yang diajukan, yaitu apakah siswa individu lulus atau gagal ujian. Seperti yang diharapkan, base rate yang secara eksplisit dinyatakan memiliki beberapa pengaruh pada penilaian, tetapi dampaknya jauh lebih kecil dibandingkan base rate kausal yang secara statistik setara. Sistem 1 dapat menangani cerita di mana elemen-elemen saling terkait secara kausal, tetapi lemah dalam penalaran statistik. Bagi pemikir Bayesian, tentu saja, kedua versi ini setara.
Sangat menggoda untuk menyimpulkan bahwa kita telah mencapai kesimpulan memuaskan: base rate kausal digunakan; fakta statistik semata (lebih atau kurang) diabaikan. Studi berikutnya, salah satu favorit saya sepanjang masa, menunjukkan bahwa situasinya ternyata lebih kompleks.
Apakah Psikologi Bisa Diajarkan?
Pengemudi taksi yang ceroboh dan ujian yang mustahil sulitnya menggambarkan dua inferensi yang dapat ditarik orang dari base rate kausal: sebuah sifat stereotip yang dikaitkan pada individu, dan fitur signifikan dari situasi yang memengaruhi hasil individu tersebut. Partisipan dalam eksperimen membuat inferensi yang tepat dan penilaian mereka meningkat. Sayangnya, hal-hal tidak selalu berjalan sesempurna itu. Eksperimen klasik yang akan saya jelaskan berikut ini menunjukkan bahwa orang tidak akan menarik inferensi dari informasi base rate jika bertentangan dengan keyakinan lain. Hal ini juga mendukung kesimpulan yang tidak nyaman: mengajarkan psikologi sebagian besar adalah buang-buang waktu.
Eksperimen ini dilakukan lama sekali oleh psikolog sosial Richard Nisbett dan muridnya Eugene Borgida di Universitas Michigan. Mereka menceritakan kepada mahasiswa tentang “eksperimen bantuan” terkenal yang telah dilakukan beberapa tahun sebelumnya di Universitas New York. Partisipan dalam eksperimen itu dibawa ke bilik masing-masing dan diundang berbicara melalui interkom tentang kehidupan dan masalah pribadi mereka. Mereka bergiliran berbicara sekitar dua menit. Hanya satu mikrofon yang aktif pada satu waktu. Setiap kelompok terdiri dari enam partisipan, salah satunya adalah aktor yang telah disiapkan. Aktor itu berbicara pertama, mengikuti naskah yang disiapkan oleh peneliti. Ia menceritakan kesulitannya menyesuaikan diri di New York dan mengakui dengan jelas rasa malu bahwa ia rentan terhadap kejang, terutama ketika stres.
Kemudian semua partisipan bergiliran berbicara. Ketika mikrofon dikembalikan pada aktor, ia menjadi gelisah dan tidak koheren, berkata bahwa ia merasakan kejang akan datang, dan meminta seseorang menolongnya. Kata-kata terakhir yang terdengar darinya adalah, “Ccould somebody-er-er-help-er-uh-uh-uh [bunyi tersedak]. I…I’m gonna die-er-er… [tersedak, kemudian hening].” Pada titik ini, mikrofon partisipan berikutnya otomatis aktif, dan tidak ada lagi suara dari orang yang mungkin sekarat itu.
Apa yang Anda kira dilakukan partisipan dalam eksperimen ini? Sejauh yang mereka tahu, seseorang sedang kejang dan meminta pertolongan. Namun, ada beberapa orang lain yang mungkin bisa merespons, jadi mungkin seseorang memilih tetap aman di biliknya. Hasilnya: hanya empat dari lima belas partisipan yang segera menanggapi permintaan pertolongan. Enam tidak keluar dari biliknya sama sekali, dan lima lainnya baru keluar jauh setelah “korban kejang” tampaknya tersedak. Eksperimen ini menunjukkan bahwa individu merasa terbebas dari tanggung jawab ketika mereka tahu orang lain telah mendengar permintaan pertolongan yang sama.
Apakah hasil ini mengejutkan Anda? Sangat mungkin. Kebanyakan dari kita menganggap diri kita orang yang baik dan akan segera menolong dalam situasi seperti itu, dan kita berharap orang baik lain akan melakukan hal yang sama. Tujuan eksperimen ini, tentu saja, adalah menunjukkan bahwa ekspektasi tersebut salah. Bahkan orang normal dan baik tidak segera menolong ketika mereka mengharapkan orang lain menangani ketidaknyamanan menghadapi kejang. Dan itu berarti Anda juga.
Apakah Anda bersedia menyetujui pernyataan berikut?
“Ketika saya membaca prosedur eksperimen bantuan, saya pikir saya akan segera menolong orang asing itu, sebagaimana kemungkinan besar saya lakukan jika berada sendirian dengan korban kejang. Ternyata saya salah. Jika saya berada dalam situasi di mana orang lain berkesempatan menolong, saya mungkin tidak maju. Kehadiran orang lain mengurangi rasa tanggung jawab pribadi saya lebih dari yang saya kira.”
Inilah yang diharapkan seorang pengajar psikologi agar Anda pelajari. Apakah Anda akan membuat inferensi yang sama sendiri?
Profesor psikologi yang menjelaskan eksperimen bantuan ingin mahasiswa melihat base rate rendah sebagai kausal, sama seperti pada kasus ujian fiktif di Yale. Ia ingin mereka menarik kesimpulan, dalam kedua kasus, bahwa tingkat kegagalan yang mengejutkan tinggi mengindikasikan ujian yang sangat sulit. Pelajaran yang dimaksudkan adalah bahwa fitur kuat dari situasi, seperti difusi tanggung jawab, membuat orang normal dan baik seperti mereka bertindak dengan cara yang mengejutkan tidak membantu.
Mengubah pandangan seseorang tentang sifat manusia adalah pekerjaan yang sulit, dan mengubah pandangan buruk tentang diri sendiri bahkan lebih sulit. Nisbett dan Borgida menduga bahwa mahasiswa akan menolak pekerjaan dan ketidaknyamanan ini. Tentu, mahasiswa mampu dan bersedia mengulang rincian eksperimen bantuan dalam ujian, bahkan mengulang interpretasi “resmi” dalam istilah difusi tanggung jawab. Tetapi apakah keyakinan mereka tentang sifat manusia benar-benar berubah?
Untuk mengetahuinya, Nisbett dan Borgida menayangkan video wawancara singkat yang konon dilakukan dengan dua orang yang berpartisipasi dalam studi New York. Wawancara singkat dan datar. Para pewawancara tampak baik, normal, dan sopan. Mereka menceritakan hobi, kegiatan waktu luang, dan rencana masa depan yang sepenuhnya konvensional. Setelah menonton video wawancara, mahasiswa menebak seberapa cepat orang tersebut menolong orang asing yang terkena musibah.
Untuk menerapkan penalaran Bayesian pada tugas yang diberikan, Anda harus menanyakan terlebih dahulu apa tebakan Anda tentang dua individu tersebut jika belum menonton wawancara mereka. Pertanyaan ini dijawab dengan merujuk pada base rate. Kita diberi tahu bahwa hanya 4 dari 15 partisipan yang segera menolong setelah permintaan pertama. Probabilitas bahwa partisipan yang tidak diidentifikasi segera menolong adalah 27%. Dengan demikian, keyakinan awal Anda tentang partisipan yang tidak ditentukan adalah bahwa ia tidak segera menolong.
Selanjutnya, logika Bayesian mengharuskan Anda menyesuaikan penilaian berdasarkan informasi relevan tentang individu. Namun, video dibuat sedemikian rupa agar tidak informatif; tidak ada alasan untuk menduga individu akan lebih atau kurang membantu daripada mahasiswa yang dipilih secara acak. Tanpa informasi baru yang berguna, solusi Bayesian adalah tetap pada base rate.
Nisbett dan Borgida meminta dua kelompok mahasiswa menonton video dan memprediksi perilaku dua individu. Mahasiswa kelompok pertama hanya diberitahu prosedur eksperimen, bukan hasilnya. Prediksi mereka mencerminkan pandangan mereka tentang sifat manusia dan pemahaman mereka tentang situasi. Seperti yang bisa Anda duga, mereka memprediksi kedua individu segera menolong korban.
Kelompok kedua mengetahui prosedur eksperimen dan hasilnya. Perbandingan prediksi kedua kelompok memberikan jawaban atas pertanyaan penting: Apakah mahasiswa belajar dari hasil eksperimen bantuan sesuatu yang benar-benar mengubah cara berpikir mereka? Jawabannya jelas: mereka tidak belajar apa pun. Prediksi mereka tentang dua individu tidak berbeda dari prediksi mahasiswa yang tidak mengetahui hasil statistik eksperimen. Mereka tahu base rate dalam kelompok dari mana individu diambil, tetapi tetap yakin bahwa orang yang mereka lihat dalam video cepat menolong orang asing yang terkena musibah.
Bagi pengajar psikologi, implikasi studi ini mengecewakan. Saat mengajarkan mahasiswa tentang perilaku orang dalam eksperimen bantuan, kita berharap mereka mempelajari sesuatu yang sebelumnya tidak diketahui; kita ingin mengubah cara mereka berpikir tentang perilaku orang dalam situasi tertentu. Tujuan ini tidak tercapai dalam studi Nisbett-Borgida, dan tidak ada alasan untuk percaya hasilnya akan berbeda jika eksperimen psikologi mengejutkan lain dipilih. Memang, Nisbett dan Borgida melaporkan temuan serupa dalam pengajaran studi lain, di mana tekanan sosial ringan membuat orang menerima kejutan listrik yang jauh lebih menyakitkan daripada yang diperkirakan. Mahasiswa yang tidak mengembangkan apresiasi baru terhadap kekuatan pengaruh situasi sosial tidak belajar apa pun yang bernilai dari eksperimen. Prediksi mereka tentang orang asing acak, atau perilaku mereka sendiri, menunjukkan bahwa mereka tidak mengubah pandangan tentang bagaimana mereka akan bertindak. Dalam kata-kata Nisbett dan Borgida, mahasiswa “diam-diam mengecualikan diri” (dan teman serta kenalan mereka) dari kesimpulan eksperimen yang mengejutkan.
Namun, pengajar psikologi tidak perlu putus asa, karena Nisbett dan Borgida melaporkan cara membuat mahasiswa menghargai inti eksperimen bantuan. Mereka mengambil kelompok mahasiswa baru dan mengajarkan prosedur eksperimen tetapi tidak memberi tahu hasil kelompok. Mereka menayangkan dua video dan hanya memberi tahu mahasiswa bahwa kedua individu yang baru saja mereka lihat tidak menolong orang asing, lalu meminta mereka menebak hasil global. Hasilnya dramatis: tebakan mahasiswa sangat akurat.
Untuk mengajarkan psikologi kepada mahasiswa tentang hal yang belum mereka ketahui sebelumnya, Anda harus mengejutkan mereka. Tetapi kejutan apa yang efektif? Nisbett dan Borgida menemukan bahwa ketika mereka menyajikan fakta statistik mengejutkan, mahasiswa sama sekali tidak belajar apa pun. Namun ketika mahasiswa terkejut oleh kasus individu—dua orang baik yang tidak menolong—mereka segera membuat generalisasi dan menyimpulkan bahwa menolong lebih sulit daripada yang mereka kira.
Nisbett dan Borgida merangkum hasil ini dalam satu kalimat yang mudah diingat:
“Keengganan subjek untuk menarik kesimpulan khusus dari yang umum hanya tertandingi oleh kesediaan mereka menarik kesimpulan umum dari yang khusus.”
Ini adalah kesimpulan yang sangat penting. Orang yang diajarkan fakta statistik mengejutkan tentang perilaku manusia mungkin terkesan sampai menceritakan kepada teman, tetapi itu tidak berarti pemahaman mereka tentang dunia benar-benar berubah. Ujian sejati pembelajaran psikologi adalah apakah pemahaman Anda tentang situasi yang Anda hadapi berubah, bukan apakah Anda belajar fakta baru. Ada kesenjangan mendalam antara cara kita berpikir tentang statistik dan cara kita berpikir tentang kasus individu. Hasil statistik dengan interpretasi kausal memiliki efek lebih kuat pada pemikiran kita dibanding informasi non-kausal. Namun, bahkan statistik kausal yang meyakinkan tidak akan mengubah keyakinan lama atau keyakinan yang berakar pada pengalaman pribadi. Sebaliknya, kasus individu yang mengejutkan memiliki dampak kuat dan merupakan alat lebih efektif untuk mengajarkan psikologi karena inkonsistensi itu harus diselesaikan dan dimasukkan ke dalam cerita kausal.
Itulah sebabnya buku ini berisi pertanyaan yang ditujukan langsung kepada pembaca. Anda lebih mungkin belajar sesuatu dengan menemukan kejutan dalam perilaku sendiri daripada mendengar fakta mengejutkan tentang orang secara umum.
Berbicara tentang Penyebab dan Statistik
Baca Juga: Lighten PDF Converter OCR 6.1.1 Full Version
“Kita tidak bisa menganggap mereka benar-benar belajar hanya dari statistik. Mari tunjukkan satu atau dua kasus individu sebagai representasi untuk memengaruhi Sistem 1 mereka.”
“Tidak perlu khawatir informasi statistik ini diabaikan. Sebaliknya, hal itu segera digunakan untuk membentuk stereotip.”
Regresi ke Rata-rata
Saya mengalami salah satu momen “eureka” paling memuaskan dalam karier saya saat mengajar instruktur penerbangan di Angkatan Udara Israel tentang psikologi pelatihan yang efektif. Saya menjelaskan prinsip penting dalam pelatihan keterampilan: penghargaan untuk peningkatan kinerja bekerja lebih baik dibandingkan hukuman atas kesalahan. Proposisi ini didukung oleh banyak bukti dari penelitian pada merpati, tikus, manusia, dan hewan lain.
Setelah saya menyelesaikan pidato bersemangat itu, salah satu instruktur paling berpengalaman mengangkat tangan dan memberi komentar singkat. Ia memulai dengan mengakui bahwa penghargaan atas peningkatan kinerja mungkin baik untuk burung, tetapi ia menolak bahwa hal itu optimal untuk kadet penerbangan.
Ia berkata:
“Dalam banyak kesempatan saya memuji kadet penerbangan karena melakukan manuver aerobatik dengan bersih. Kali berikutnya mereka mencoba manuver yang sama, biasanya mereka malah lebih buruk. Sebaliknya, saya sering menjerit ke earphone kadet karena eksekusi yang buruk, dan secara umum mereka tampil lebih baik pada percobaan berikutnya. Jadi jangan bilang kepada kami bahwa penghargaan bekerja dan hukuman tidak, karena yang terjadi justru sebaliknya.”
Momen itu adalah wawasan yang menggembirakan bagi saya. Sang instruktur benar—tapi sekaligus salah total! Observasinya tajam dan benar: saat ia memuji kinerja, kinerja berikutnya cenderung mengecewakan, dan hukuman biasanya diikuti perbaikan. Namun inferensi yang ia tarik tentang efektivitas penghargaan dan hukuman salah sama sekali. Apa yang ia amati dikenal sebagai regresi ke rata-rata, yang dalam kasus ini disebabkan oleh fluktuasi acak dalam kualitas kinerja. Secara alami, ia memuji kadet yang tampil jauh lebih baik dari rata-rata. Namun kadet itu mungkin hanya beruntung pada percobaan tersebut sehingga kemungkinan akan menurun, terlepas dari pujian. Demikian pula, instruktur menjerit hanya ketika kinerja kadet sangat buruk, sehingga kemungkinan akan membaik tanpa memandang tindakan instruktur. Dengan demikian, ia menempelkan interpretasi kausal pada fluktuasi acak yang tak terelakkan.
Tantangan ini membutuhkan respons, tetapi pelajaran dalam aljabar prediksi tidak akan disambut dengan antusias. Sebagai gantinya, saya menggunakan kapur untuk menandai target di lantai. Saya meminta setiap perwira di ruangan membelakangi target dan melempar dua koin secara berurutan tanpa melihat. Kami mengukur jarak dari target dan menuliskan hasil kedua lemparan setiap peserta di papan tulis. Lalu kami menyusun ulang hasil dari yang terbaik hingga terburuk pada percobaan pertama.
Terlihat bahwa sebagian besar (tidak semua) yang terbaik pada percobaan pertama menurun pada percobaan kedua, dan mereka yang buruk pada percobaan pertama umumnya meningkat. Saya menunjukkan kepada instruktur bahwa apa yang mereka lihat sama dengan yang kita dengar tentang manuver aerobatik: kinerja buruk biasanya diikuti perbaikan, dan kinerja baik diikuti penurunan, tanpa bantuan pujian atau hukuman.
Penemuan hari itu adalah bahwa instruktur penerbangan terjebak dalam kontingensi yang tidak menguntungkan: karena mereka menghukum kadet saat kinerjanya buruk, mereka sering “dihargai” oleh perbaikan berikutnya, meskipun hukuman sebenarnya tidak efektif. Lebih jauh, instruktur bukan satu-satunya yang mengalami ini. Saya menemukan fakta signifikan tentang kondisi manusia: umpan balik yang diberikan kehidupan bersifat pervers. Karena kita cenderung baik pada orang yang menyenangkan kita dan bersikap buruk pada yang tidak, secara statistik kita dihukum karena bersikap baik dan dihargai karena bersikap buruk.
Bakat dan Keberuntungan
Beberapa tahun lalu, John Brockman, editor majalah daring Edge, meminta sejumlah ilmuwan untuk melaporkan “persamaan favorit” mereka. Ini adalah jawaban saya:
- kesuksesan = bakat + keberuntungan
- kesuksesan besar = sedikit lebih banyak bakat + banyak keberuntungan
Ide bahwa keberuntungan sering berkontribusi pada kesuksesan memiliki konsekuensi mengejutkan jika diterapkan pada dua hari pertama turnamen golf tingkat tinggi. Misalkan rata-rata skor peserta pada kedua hari adalah par 72. Fokus pada pemain yang sangat baik pada hari pertama, misalnya skor 66.
Apa yang bisa kita pelajari dari skor luar biasa ini? Inferensi langsung: golfer ini lebih berbakat dari rata-rata peserta. Namun, formula kesuksesan juga menyarankan inferensi lain: golfer ini mungkin juga beruntung lebih dari rata-rata pada hari itu. Jika kita menerima bahwa bakat dan keberuntungan sama-sama berkontribusi, kesimpulan bahwa golfer itu beruntung sama sahnya dengan kesimpulan bahwa ia berbakat.
Begitu juga, jika seorang pemain mencetak 5 di atas par, kita beralasan menyimpulkan ia kurang berbakat dan mengalami hari buruk. Tentu saja, tidak ada inferensi yang pasti. Pemain skor 77 mungkin sangat berbakat, tetapi hanya beruntung buruk pada hari itu. Namun inferensi berikut cukup masuk akal dan lebih sering benar daripada salah:
- Skor di atas rata-rata hari 1 = bakat di atas rata-rata + beruntung pada hari 1
- Skor di bawah rata-rata hari 1 = bakat di bawah rata-rata + sial pada hari 1
Sekarang, jika kita tahu skor pemain hari 1 dan diminta memprediksi skor hari 2, bakat tetap sama. Jadi tebakan terbaik: “di atas rata-rata” untuk pemain pertama dan “di bawah rata-rata” untuk pemain kedua. Keberuntungan berbeda: kita tidak bisa memprediksi keberuntungan mereka pada hari kedua, sehingga tebakan terbaik adalah rata-rata.
Artinya, tanpa informasi lain, tebakan terbaik tentang skor hari 2 tidak boleh mengulang skor hari 1. Golfer yang baik pada hari 1 kemungkinan tetap baik hari 2, tetapi kurang baik karena keberuntungan luar biasa pada hari 1 mungkin tidak berlanjut. Pemain buruk pada hari 1 mungkin tetap di bawah rata-rata, tetapi akan membaik karena rangkaian sialnya kemungkinan berakhir.
Kita juga mengharapkan perbedaan antara dua pemain menyempit pada hari kedua, meskipun tebakan terbaik masih pemain pertama lebih baik daripada kedua. Mahasiswa saya selalu terkejut mendengar bahwa prediksi terbaik hari 2 lebih moderat, lebih dekat ke rata-rata daripada skor hari 1. Inilah sebabnya pola ini disebut regresi ke rata-rata. Semakin ekstrem skor awal, semakin besar regresi yang diharapkan, karena skor sangat baik menunjukkan keberuntungan luar biasa.
Prediksi regresif masuk akal, tetapi tidak dijamin akurat. Beberapa golfer skor 66 hari 1 bisa lebih baik hari 2 jika keberuntungan meningkat. Namun sebagian besar akan menurun karena keberuntungan tidak lagi di atas rata-rata.
Jika kita melihat mundur: urutkan pemain berdasarkan hari 2 dan lihat hari 1. Pola regresi ke rata-rata tetap muncul: mereka yang terbaik pada hari 2 kemungkinan beruntung, dan tebakan terbaik adalah mereka kurang beruntung dan kurang baik pada hari 1. Fakta ini menunjukkan regresi tidak perlu penjelasan kausal.
Efek regresi tersebar luas, begitu pula kisah kausal yang salah untuk menjelaskannya. Contoh terkenal: “kutukan Sports Illustrated”, klaim bahwa atlet yang muncul di sampul majalah akan performa buruk musim berikutnya. Penjelasan umum: overconfidence dan tekanan ekspektasi tinggi. Namun penjelasan lebih sederhana: atlet di sampul pasti tampil luar biasa sebelumnya, mungkin karena keberuntungan—dan keberuntungan itu tidak stabil.
Saya menonton lompat ski putra di Olimpiade Musim Dingin saat Amos dan saya menulis artikel tentang prediksi intuitif. Setiap atlet memiliki dua lompatan, digabung untuk skor akhir. Komentator berkata:
- “Norwegia melompat baik pertama; ia akan tegang dan mungkin menurun.”
- “Swedia buruk pertama; ia tahu tidak ada yang hilang dan akan santai, yang membantu lebih baik.”
Komentator jelas mendeteksi regresi ke rata-rata dan membuat cerita kausal tanpa bukti. Cerita itu bisa benar, misal detak jantung atlet diukur. Namun poin penting: perubahan dari lompatan pertama ke kedua tidak memerlukan penjelasan kausal. Ini adalah konsekuensi matematis karena keberuntungan berperan pada lompatan pertama. Bukan cerita yang memuaskan—kita semua ingin penjelasan kausal—tapi begitulah adanya.
Memahami Regresi
Fenomena regresi, baik yang tidak terdeteksi maupun dijelaskan secara keliru, terasa aneh bagi pikiran manusia. Begitu aneh, bahkan baru diidentifikasi dan dipahami dua ratus tahun setelah teori gravitasi dan kalkulus diferensial. Lebih jauh, dibutuhkan salah satu pemikir terbesar Inggris abad kesembilan belas untuk memahaminya, dan itu pun dengan kesulitan besar.
Regresi ke rata-rata ditemukan dan dinamai pada akhir abad kesembilan belas oleh Sir Francis Galton, sepupu setengah Charles Darwin dan seorang polimat ternama. Anda bisa merasakan kegembiraan penemuan itu dalam artikel yang ia terbitkan pada 1886, berjudul “Regression towards Mediocrity in Hereditary Stature”, yang melaporkan pengukuran ukuran pada generasi biji berturut-turut dan perbandingan tinggi anak dengan tinggi orang tua. Ia menulis tentang penelitiannya pada biji-bijian:
Baca Juga: [Buku Bahasa Indonesia] Cosmos - Carl Sagan
“Hasilnya tampak sangat penting, dan saya menggunakannya sebagai dasar ceramah di Royal Institution pada 9 Februari 1877. Dari percobaan ini terlihat bahwa keturunan tidak cenderung menyerupai biji induknya dalam ukuran, tetapi selalu lebih ‘biasa’—lebih kecil daripada induk jika induk besar, lebih besar jika induk sangat kecil… Percobaan ini menunjukkan bahwa regresi rata-rata keturunan ke arah mediokritas sebanding langsung dengan deviasi orang tua dari rata-rata.”
Galton jelas mengharapkan audiens terpelajar di Royal Institution—masyarakat riset independen tertua di dunia—terkejut seperti dirinya atas “pengamatan penting” itu. Yang benar-benar menakjubkan adalah ia terkejut terhadap pola statistik yang sesungguhnya umum seperti udara yang kita hirup. Efek regresi bisa ditemukan di mana-mana, namun sering tidak dikenali. Mereka tersembunyi di depan mata.
Galton membutuhkan beberapa tahun untuk mengembangkan pemahamannya, dari regresi keturunan terhadap ukuran menjadi gagasan lebih luas: regresi terjadi secara tak terelakkan bila korelasi antara dua ukuran tidak sempurna, dan ia memerlukan bantuan ahli statistik paling brilian di masanya untuk sampai pada kesimpulan itu.
Salah satu tantangan yang harus dihadapi Galton adalah bagaimana mengukur regresi antara variabel yang diukur dengan skala berbeda, misalnya berat badan dan kemampuan bermain piano. Ini dilakukan dengan menggunakan populasi sebagai standar referensi. Misalkan berat badan dan kemampuan piano diukur pada 100 anak di seluruh tingkat sekolah dasar, dan diberi peringkat dari tinggi ke rendah. Jika Jane menempati peringkat ketiga dalam bermain piano dan ke-27 dalam berat badan, wajar untuk mengatakan bahwa ia lebih mahir bermain piano daripada tinggi badannya.
Mari buat beberapa asumsi sederhana:
- Kesuksesan bermain piano hanya bergantung pada jam latihan mingguan.
- Berat badan hanya bergantung pada konsumsi es krim.
- Konsumsi es krim dan jam latihan mingguan tidak terkait.
Dengan menggunakan peringkat (atau skor standar yang disukai ahli statistik), kita dapat menulis persamaan:
kemampuan piano = umur + jam latihan mingguan
Dari sini, akan terjadi regresi ke rata-rata ketika memprediksi kemampuan piano dari berat badan, atau sebaliknya.
Contoh:
- Jika yang diketahui tentang Tom adalah peringkat ke-12 dalam berat badan (di atas rata-rata), secara statistik dapat disimpulkan bahwa ia mungkin lebih tua dari rata-rata dan cenderung mengonsumsi lebih banyak es krim.
- Jika yang diketahui tentang Barbara adalah peringkat ke-85 dalam piano (jauh di bawah rata-rata), kita dapat menyimpulkan bahwa ia cenderung muda dan berlatih lebih sedikit.
Koefisien korelasi antara dua ukuran, yang berkisar 0–1, mengukur proporsi faktor yang mereka bagi bersama. Misal, kita berbagi setengah gen dengan orang tua; untuk sifat yang dipengaruhi sedikit oleh lingkungan, seperti tinggi badan, korelasi antara orang tua dan anak sekitar 0,5.
Contoh koefisien korelasi:
- Ukuran objek diukur dengan presisi dalam satuan Inggris atau metrik = 1 (100% faktor yang sama).
- Korelasi tinggi badan dan berat badan laki-laki dewasa AS = 0,41. Jika ditambah wanita dan anak-anak, korelasi lebih tinggi.
- Korelasi skor SAT dan IPK kuliah ≈ 0,6. Korelasi kemampuan tes dan sukses pascasarjana lebih rendah karena variasi kemampuan kecil pada kelompok terpilih.
- Korelasi pendapatan dan tingkat pendidikan di AS ≈ 0,4.
- Korelasi pendapatan keluarga dan empat digit terakhir nomor telepon = 0.
Galton memerlukan beberapa tahun untuk menyadari bahwa korelasi dan regresi bukan konsep berbeda—mereka perspektif berbeda dari konsep yang sama. Aturan umumnya sederhana namun konsekuensinya mengejutkan: setiap kali korelasi antara dua skor tidak sempurna, akan terjadi regresi ke rata-rata.
Contoh menarik:
Wanita sangat cerdas cenderung menikah dengan pria yang kurang cerdas dari mereka.
Ini sering memicu percakapan panjang karena kita cenderung mencari penjelasan kausal, misalnya wanita cerdas menghindari kompetisi dengan pria cerdas atau harus kompromi.
Sekarang pertimbangkan:
Korelasi skor kecerdasan pasangan kurang dari sempurna.
Pernyataan ini jelas benar dan tidak menarik. Tidak ada yang perlu dijelaskan. Namun secara aljabar, ini setara dengan pernyataan yang menarik sebelumnya. Bila korelasi kurang dari sempurna, secara matematis wanita cerdas akan menikah dengan pria yang rata-rata kurang cerdas (dan sebaliknya). Regresi ke rata-rata adalah konsekuensi matematis, bukan fenomena yang memerlukan penyebab.
David Freedman, ahli statistik, pernah berkata: jika topik regresi muncul di persidangan, pihak yang harus menjelaskannya ke juri biasanya kalah. Mengapa sulit? Alasan utamanya: pikiran kita bias kuat terhadap penjelasan kausal dan sulit menerima “sekadar statistik.” Ketika perhatian kita tertuju pada suatu peristiwa, memori asosiasi mencari penyebabnya. Penjelasan kausal muncul ketika regresi terdeteksi, tetapi itu salah karena regresi ke rata-rata memiliki penjelasan, tapi tidak memiliki penyebab.
Misal dalam turnamen golf: menurunnya kinerja pemain yang baik hari pertama dijelaskan terbaik sebagai keberuntungan yang berlebih pada hari itu—logis, tapi kurang memuaskan bagi pikiran manusia yang ingin sebab-akibat.
Kesulitan kita memahami konsep regresi berasal dari kedua sistem berpikir, Sistem 1 dan Sistem 2. Tanpa instruksi khusus, dan bahkan dalam beberapa kasus setelah diberi pelatihan statistik, hubungan antara korelasi dan regresi tetap sulit dipahami. Sistem 2 mengalami kesulitan memahaminya dan belajar konsep ini. Hal ini sebagian disebabkan oleh dorongan kuat untuk mencari penjelasan kausal, yang merupakan ciri khas Sistem 1.
Misal, sebuah judul koran berbunyi:
“Anak-anak depresi yang diberi minuman energi menunjukkan peningkatan signifikan selama tiga bulan.”
Saya membuat judul ini, tetapi faktanya benar: jika sekelompok anak depresi diberi minuman energi selama beberapa waktu, mereka akan menunjukkan perbaikan yang signifikan secara klinis. Hal yang sama juga berlaku bagi anak-anak depresi yang berdiri dengan kepala di bawah atau memeluk kucing selama dua puluh menit sehari—mereka pun akan menunjukkan perbaikan.
Sebagian besar pembaca judul seperti ini akan langsung menyimpulkan bahwa minuman energi atau memeluk kucing menyebabkan perbaikan, padahal kesimpulan itu tidak berdasar sama sekali. Anak-anak depresi termasuk kelompok ekstrem—lebih depresi dibanding anak lain—dan kelompok ekstrem cenderung mengalami regresi ke rata-rata seiring waktu. Korelasi skor depresi antar tes berturut-turut tidak sempurna, sehingga regresi ke rata-rata akan terjadi: anak-anak depresi akan membaik sedikit demi sedikit bahkan tanpa memeluk kucing atau minum Red Bull.
Untuk menyimpulkan bahwa minuman energi—atau pengobatan apa pun—efektif, perlu membandingkan kelompok yang diberi perlakuan dengan kelompok kontrol yang tidak mendapat perlakuan (atau lebih baik, menerima placebo). Kelompok kontrol diharapkan menunjukkan perbaikan karena regresi saja, dan tujuan eksperimen adalah menentukan apakah kelompok yang mendapat perlakuan meningkat lebih dari yang bisa dijelaskan oleh regresi.
Interpretasi kausal yang salah terhadap efek regresi tidak terbatas pada pembaca koran populer. Statistikawan Howard Wainer menyusun daftar panjang peneliti terkemuka yang melakukan kesalahan sama—mengacaukan korelasi semata dengan kausalitas. Efek regresi adalah sumber masalah umum dalam penelitian, dan ilmuwan berpengalaman mengembangkan ketakutan sehat terhadap perangkap inferensi kausal yang tidak berdasar.
Salah satu contoh favorit saya tentang kesalahan prediksi intuitif diambil dari buku Max Bazerman, Judgment in Managerial Decision Making:
Anda adalah peramal penjualan untuk rantai department store. Semua toko serupa dari segi ukuran dan pilihan barang, tetapi penjualan berbeda karena lokasi, kompetisi, dan faktor acak. Anda diberikan hasil penjualan tahun 2011 dan diminta meramalkan penjualan tahun 2012. Anda diberi instruksi untuk mengikuti ramalan ekonom bahwa penjualan akan meningkat 10% secara keseluruhan.
Tabelnya:
| Store | 2011 | 2012 |
|---|---|---|
| 1 | $11,000,000 | ________ |
| 2 | $23,000,000 | ________ |
| 3 | $18,000,000 | ________ |
| 4 | $29,000,000 | ________ |
| Total | $61,000,000 | $67,100,000 |
Setelah membaca bab ini, Anda tahu bahwa solusi menambahkan 10% ke masing-masing toko adalah salah. Ramalan Anda harus bersifat regresif: menambahkan lebih dari 10% pada cabang berkinerja rendah, dan menambahkan lebih sedikit (atau bahkan mengurangi) pada cabang berkinerja tinggi.
Jika Anda menanyakan orang lain, mereka mungkin bingung: “Mengapa repot-repot dengan pertanyaan yang jelas?” Seperti yang Galton temukan dengan susah payah, konsep regresi jauh dari jelas.
Contoh Percakapan tentang Regresi ke Mediokritas
- “Ia bilang pengalamannya mengajarkan bahwa kritik lebih efektif daripada pujian. Yang tidak ia mengerti, semua itu karena regresi ke rata-rata.”
- “Mungkin wawancara keduanya kurang mengesankan karena ia takut mengecewakan kami, tapi lebih mungkin wawancara pertamanya yang luar biasa baik.”
- “Prosedur seleksi kami baik, tapi tidak sempurna, jadi kami harus mengantisipasi regresi. Tidak perlu heran jika kandidat terbaik sering gagal memenuhi ekspektasi.”
Menjinakkan Prediksi Intuitif
Hidup sering menghadirkan banyak kesempatan untuk membuat prediksi. Ekonom meramalkan inflasi dan pengangguran, analis keuangan meramalkan laba, ahli militer memprediksi jumlah korban, pemodal ventura menilai profitabilitas, penerbit dan produser meramalkan audiens, kontraktor memperkirakan waktu penyelesaian proyek, koki mengantisipasi permintaan hidangan, insinyur menghitung kebutuhan beton untuk sebuah bangunan, komandan pemadam kebakaran menilai jumlah truk yang dibutuhkan untuk memadamkan api.
Dalam kehidupan pribadi, kita memprediksi reaksi pasangan terhadap rencana tertentu atau kemampuan diri kita menyesuaikan diri dengan pekerjaan baru. Beberapa penilaian prediktif, seperti yang dilakukan insinyur, sebagian besar bergantung pada tabel referensi, perhitungan presisi, dan analisis eksplisit dari hasil yang diamati pada kasus serupa. Lainnya melibatkan intuisi dan Sistem 1, yang muncul dalam dua bentuk utama:
- Intuisi berbasis keterampilan dan pengalaman:
Contohnya adalah penilaian cepat dan otomatis para master catur, komandan pemadam kebakaran, dan dokter, seperti yang dijelaskan Gary Klein dalam Sources of Power. Solusi muncul dengan cepat karena isyarat yang familiar dikenali. - Intuisi berbasis heuristik:
Intuisi ini kadang tak bisa dibedakan secara subjektif dari yang pertama, tetapi muncul dari heuristik yang menggantikan pertanyaan sulit dengan pertanyaan yang lebih mudah. Penilaian intuitif bisa dibuat dengan tingkat keyakinan tinggi bahkan ketika didasarkan pada bukti lemah yang non-regresif.
Tentu saja, banyak penilaian profesional dipengaruhi gabungan analisis dan intuisi.
Intuisi Non-Regresif
Mari kita kembali ke contoh yang sudah kita kenal:
Julie, mahasiswa senior di sebuah universitas negeri, sudah bisa membaca lancar saat berusia empat tahun. Berapa IPK (GPA) Julie?
Orang yang familiar dengan sistem pendidikan Amerika biasanya langsung menebak angka sekitar 3,7–3,8. Bagaimana hal ini terjadi? Beberapa operasi Sistem 1 terlibat:
- Mencari hubungan kausal antara bukti (kemampuan membaca Julie) dan target prediksi (IPK). Hubungan ini bisa tidak langsung; misalnya, membaca dini dan IPK tinggi sama-sama menunjukkan bakat akademik. Sistem 2 Anda mungkin menolak laporan Julie memenangkan lomba memancing atau angkat besi sebagai relevan. Sistem 1 tidak menyesuaikan bukti yang lemah, sehingga prediksi intuitif hampir tidak sensitif terhadap kualitas prediktif bukti.
- Membangun narasi terbaik dari bukti yang ada: memori asosiatif secara cepat menggabungkan informasi menjadi cerita koheren.
- Evaluasi bukti terhadap norma relevan: seberapa luar biasa seorang anak yang membaca lancar di usia empat? Kelompok pembanding (reference group) mungkin tidak disebutkan secara spesifik, tetapi ini aturan umum dalam bahasa sehari-hari.
- Substitusi dan intensity matching: penilaian kemampuan kognitif masa kecil digantikan sebagai jawaban atas pertanyaan tentang GPA. Julie akan diberikan persentil yang sama untuk membaca dini dan pencapaian akademiknya.
- Penerjemahan ke skala GPA: dari kesan relatif akademik Julie ke GPA yang sesuai.
Hasilnya: prediksi yang sangat ekstrem sesuai bukti awal, sehingga orang memberi jawaban sama untuk pertanyaan berbeda:
- Persentil kemampuan membaca dini Julie?
- Persentil GPA Julie?
Semua operasi ini adalah ciri khas Sistem 1. Aktivasi dalam memori asosiatif menyebar secara otomatis, dipicu oleh bukti dan pertanyaan, hingga mencapai solusi paling koheren.
Contoh Eksperimen
Amos dan penulis meminta peserta menilai deskripsi delapan mahasiswa baru, masing-masing dengan lima kata sifat:
cerdas, percaya diri, banyak membaca, rajin, ingin tahu
Pertanyaan kelompok pertama:
- Seberapa impresif deskripsi ini terkait kemampuan akademik?
- Persentase deskripsi mahasiswa baru yang menurut Anda lebih impresif?
Pertanyaan ini menuntut evaluasi bukti dibanding norma pribadi. Hasil: peserta menilai kemungkinan mahasiswa berada dalam 15% teratas, tetapi tidak dalam 3% teratas. Ada konsensus budaya yang jelas.
Kelompok kedua diminta:
- Prediksi IPK mahasiswa?
- Persentase mahasiswa baru dengan IPK lebih tinggi?
Perbedaan halus ini sering diabaikan; peserta memperlakukan evaluasi deskripsi sama dengan prediksi hasil masa depan. Ini menunjukkan substitusi: orang diminta prediksi tetapi menggantinya dengan evaluasi bukti, tanpa menyadari pertanyaan yang dijawab berbeda dari yang diminta. Prediksi ini menjadi sistematis bias, sepenuhnya mengabaikan regresi ke rata-rata.
Contoh Militer
Dalam dinas militer di Israel Defense Forces, penulis mengamati seleksi calon perwira melalui wawancara dan tes lapangan. Kriteria sukses: nilai akhir di sekolah perwira. Validitas penilaian awal rendah. Namun ketika diminta menebak nilai akhir calon, hasilnya:
Distribusi A dan B hampir identik dengan distribusi nilai akhir sekolah.
Ini menunjukkan substitusi dan intensity matching: petugas menerjemahkan penilaian mereka ke skala nilai sekolah, gagal membedakan antara evaluasi kinerja sekarang dan prediksi masa depan. Hasilnya, prediksi sepenuhnya non-regresif.
Koreksi Prediksi Intuitif
Kembali ke Julie, pembaca cerdas kita. Cara yang benar untuk memprediksi IPK-nya telah diperkenalkan pada bab sebelumnya. Seperti yang saya lakukan sebelumnya untuk golf pada hari-hari berturut-turut, serta untuk berat badan dan kemampuan bermain piano, saya menulis formula skematis untuk faktor-faktor yang menentukan usia membaca dan nilai kuliah:
usia membaca = faktor bersama + faktor khusus usia membaca = 100%
IPK = faktor bersama + faktor khusus IPK = 100%
Faktor bersama mencakup bakat yang ditentukan secara genetis, sejauh mana keluarga mendukung minat akademis, dan hal-hal lain yang menyebabkan orang yang sama menjadi pembaca cerdas sejak anak-anak dan berhasil secara akademis sebagai orang dewasa muda. Tentu saja, ada banyak faktor yang dapat memengaruhi salah satu hasil tanpa memengaruhi yang lain. Julie bisa saja didorong untuk membaca lebih awal oleh orang tua yang terlalu ambisius, ia mungkin mengalami percintaan yang tidak bahagia sehingga menurunkan nilai kuliahnya, ia bisa saja mengalami kecelakaan ski saat remaja yang meninggalkannya sedikit terganggu, dan seterusnya.
Ingat bahwa korelasi antara dua ukuran—dalam hal ini usia membaca dan IPK—sama dengan proporsi faktor bersama di antara penentunya. Berapa tebakan terbaik Anda tentang proporsi itu? Tebakan saya yang paling optimis sekitar 30%. Dengan asumsi perkiraan ini, kita memiliki semua yang diperlukan untuk menghasilkan prediksi yang tidak bias. Berikut adalah petunjuk untuk mencapainya dalam empat langkah sederhana:
- Mulailah dengan perkiraan IPK rata-rata.
- Tentukan IPK yang sesuai dengan kesan Anda terhadap bukti yang ada.
- Perkirakan korelasi antara bukti Anda dan IPK.
- Jika korelasi adalah 0,30, geser 30% jarak dari rata-rata menuju IPK yang sesuai.
Langkah 1 memberi Anda dasar, IPK yang akan Anda prediksi jika Anda tidak diberi informasi apa pun tentang Julie selain fakta bahwa ia seorang lulusan senior. Tanpa informasi, Anda akan memprediksi nilai rata-rata. (Ini mirip dengan menetapkan probabilitas dasar lulusan administrasi bisnis ketika Anda tidak diberi informasi apa pun tentang Tom W.)
Langkah 2 adalah prediksi intuitif Anda, yang sesuai dengan penilaian Anda terhadap bukti. Langkah 3 memindahkan Anda dari dasar menuju intuisi, tetapi jarak yang dapat Anda tempuh tergantung pada perkiraan korelasi Anda. Pada langkah 4, Anda akan memperoleh prediksi yang dipengaruhi oleh intuisi, namun jauh lebih moderat.
Pendekatan prediksi ini bersifat umum. Anda dapat menerapkannya kapan saja Anda perlu memprediksi variabel kuantitatif, seperti IPK, keuntungan dari investasi, atau pertumbuhan sebuah perusahaan. Pendekatan ini membangun prediksi berdasarkan intuisi Anda, tetapi menyeimbangkannya dengan regresi ke rata-rata. Ketika Anda memiliki alasan yang kuat untuk mempercayai akurasi prediksi intuitif—yaitu korelasi tinggi antara bukti dan prediksi—penyesuaian yang diperlukan akan kecil.
Prediksi intuitif perlu dikoreksi karena tidak bersifat regresif dan karenanya bias. Misalkan saya memprediksi untuk setiap pegolf dalam turnamen bahwa skor hari ke-2 akan sama dengan skor hari ke-1. Prediksi ini tidak memperhitungkan regresi ke rata-rata: pegolf yang tampil baik pada hari pertama rata-rata akan menurun pada hari kedua, dan yang tampil buruk pada hari pertama sebagian besar akan meningkat. Ketika akhirnya dibandingkan dengan hasil aktual, prediksi yang tidak regresif akan terbukti bias. Mereka rata-rata terlalu optimis bagi yang terbaik pada hari pertama dan terlalu pesimis bagi yang memulai dengan buruk. Prediksi ini se-ekstrem bukti yang tersedia.
Demikian pula, jika Anda menggunakan prestasi masa kanak-kanak untuk memprediksi nilai di perguruan tinggi tanpa melakukan regresi ke rata-rata, Anda akan lebih sering kecewa dengan hasil akademis pembaca awal dan terkejut menyenangkan dengan nilai mereka yang belajar membaca relatif lambat. Prediksi intuitif yang dikoreksi menghilangkan bias ini, sehingga prediksi—baik tinggi maupun rendah—sekitar sama kemungkinannya untuk melebih-lebihkan atau meremehkan nilai sebenarnya. Anda tetap melakukan kesalahan meski prediksi tidak bias, tetapi kesalahan tersebut lebih kecil dan tidak memihak pada hasil tinggi atau rendah.
Pembelaan terhadap Prediksi Ekstrem?
Saya mengenalkan Tom W sebelumnya untuk mengilustrasikan prediksi hasil diskrit seperti bidang spesialisasi atau keberhasilan dalam ujian, yang dinyatakan dengan menetapkan probabilitas pada suatu peristiwa tertentu (atau dalam kasus itu, dengan memberi peringkat hasil dari yang paling mungkin hingga yang paling tidak mungkin). Saya juga menjelaskan prosedur yang melawan bias umum dalam prediksi diskrit: pengabaian probabilitas dasar dan ketidakpekaan terhadap kualitas informasi.
Bias yang kita temukan pada prediksi yang dinyatakan dalam skala, seperti IPK atau pendapatan perusahaan, mirip dengan bias yang diamati dalam menilai probabilitas hasil.
Prosedur korektifnya juga mirip:
Keduanya mengandung prediksi dasar, yang akan Anda buat jika Anda tidak mengetahui apa pun tentang kasus tersebut. Dalam kasus kategorikal, ini adalah probabilitas dasar. Dalam kasus numerik, ini adalah hasil rata-rata pada kategori terkait.
Keduanya mengandung prediksi intuitif, yang menyatakan angka yang muncul di benak Anda, baik itu probabilitas atau IPK.
Dalam kedua kasus, Anda bertujuan untuk mendapatkan prediksi yang berada di antara dasar dan respons intuitif Anda.
Dalam kondisi default tanpa bukti yang berguna, Anda tetap pada prediksi dasar. Pada ekstrem lainnya, Anda tetap pada prediksi awal Anda. Ini hanya terjadi jika Anda tetap sepenuhnya percaya pada prediksi awal setelah meninjau secara kritis bukti yang mendukungnya.
Dalam sebagian besar kasus, Anda akan menemukan alasan untuk meragukan bahwa korelasi antara penilaian intuitif dan kebenaran sempurna, sehingga akhirnya Anda akan berada di antara dua kutub tersebut.
Prosedur ini merupakan pendekatan terhadap hasil yang mungkin diperoleh dari analisis statistik yang tepat. Jika berhasil, prosedur ini akan mengarahkan Anda pada prediksi yang tidak bias, penilaian probabilitas yang masuk akal, dan prediksi moderat dari hasil numerik. Kedua prosedur ini dimaksudkan untuk menangani bias yang sama: prediksi intuitif cenderung terlalu percaya diri dan terlalu ekstrem.
Baca Juga: Penemuan artefakUFO dan alien di Guanajuato
Mengoreksi prediksi intuitif adalah tugas Sistem 2. Dibutuhkan upaya signifikan untuk menemukan kategori referensi yang relevan, memperkirakan prediksi dasar, dan menilai kualitas bukti. Upaya ini hanya sepadan jika taruhannya tinggi dan jika Anda sangat ingin menghindari kesalahan. Selain itu, Anda harus memahami bahwa mengoreksi intuisi dapat mempersulit hidup Anda. Salah satu ciri prediksi yang tidak bias adalah bahwa prediksi peristiwa langka atau ekstrem hanya dimungkinkan ketika informasinya sangat baik. Jika prediksi Anda hanya memiliki validitas sedang, Anda tidak akan pernah menebak hasil yang langka atau jauh dari rata-rata.
Jika prediksi Anda tidak bias, Anda tidak akan pernah mengalami kepuasan ketika menebak kasus ekstrem dengan benar. Anda tidak akan bisa berkata, “Ternyata benar!” ketika mahasiswa terbaik Anda di sekolah hukum menjadi hakim Mahkamah Agung, atau ketika start-up yang Anda anggap menjanjikan akhirnya menjadi kesuksesan komersial besar. Mengingat keterbatasan bukti, Anda tidak akan pernah memprediksi bahwa siswa SMA yang luar biasa akan menjadi mahasiswa dengan nilai sempurna di Princeton. Dengan alasan yang sama, seorang pemodal ventura tidak akan diberi tahu bahwa probabilitas keberhasilan start-up pada tahap awalnya “sangat tinggi.”
Keberatan terhadap prinsip moderasi prediksi intuitif harus dipertimbangkan serius, karena ketidakhadiran bias tidak selalu yang terpenting. Preferensi terhadap prediksi tidak bias dibenarkan jika semua kesalahan prediksi diperlakukan sama, tanpa memandang arahnya. Tetapi ada situasi di mana satu jenis kesalahan jauh lebih buruk daripada yang lain. Ketika pemodal ventura mencari “hal besar berikutnya,” risiko melewatkan Google atau Facebook berikutnya jauh lebih penting daripada risiko melakukan investasi kecil pada start-up yang akhirnya gagal. Tujuan pemodal ventura adalah menebak kasus ekstrem dengan benar, meski harus menilai prospek banyak usaha lain terlalu tinggi.
Bagi bankir konservatif yang memberikan pinjaman besar, risiko satu peminjam bangkrut mungkin lebih berat daripada risiko menolak beberapa calon nasabah yang akan memenuhi kewajibannya. Dalam kasus seperti itu, penggunaan bahasa ekstrem (“prospek sangat baik,” “risiko gagal serius”) mungkin memiliki justifikasi tertentu karena memberikan rasa aman, meski informasi yang menjadi dasar penilaian hanya memiliki validitas sedang.
Bagi orang rasional, prediksi yang tidak bias dan moderat seharusnya tidak menjadi masalah. Bagaimanapun, pemodal ventura rasional tahu bahwa bahkan start-up yang paling menjanjikan hanya memiliki peluang sedang untuk berhasil. Ia memandang pekerjaannya sebagai memilih taruhan paling menjanjikan dari taruhan yang tersedia dan tidak merasa perlu menipu diri sendiri tentang prospek start-up yang akan diinvestasikannya. Demikian pula, individu rasional yang memprediksi pendapatan perusahaan tidak akan terpaku pada satu angka—mereka akan mempertimbangkan rentang ketidakpastian di sekitar hasil yang paling mungkin. Orang rasional akan berinvestasi dalam jumlah besar pada usaha yang kemungkinan gagal tinggi jika imbalan keberhasilan cukup besar, tanpa menipu diri sendiri tentang peluang keberhasilan.
Namun, kita tidak semua rasional, dan beberapa dari kita mungkin memerlukan rasa aman dari perkiraan yang bias untuk menghindari kebingungan. Jika Anda memilih menipu diri sendiri dengan menerima prediksi ekstrem, Anda sebaiknya tetap sadar akan kecenderungan tersebut.







Comments (0)