06
Apr
Lampiran A: Penilaian di Bawah Ketidakpastian:
Heuristik dan Bias
Amos Tversky dan Daniel Kahneman
Banyak keputusan didasarkan pada keyakinan mengenai kemungkinan terjadinya peristiwa-peristiwa yang tidak pasti, seperti hasil suatu pemilihan umum, kesalahan atau ketidakbersalahan seorang terdakwa, atau nilai dolar di masa depan. Keyakinan-keyakinan ini biasanya dinyatakan dalam pernyataan seperti “Saya pikir bahwa…,” “kemungkinannya adalah…,” “kecil kemungkinan bahwa…,” dan sebagainya. Kadang-kadang, keyakinan mengenai peristiwa yang tidak pasti dinyatakan dalam bentuk numerik sebagai peluang atau probabilitas subjektif. Apa yang menentukan keyakinan semacam itu? Bagaimana orang menilai probabilitas suatu peristiwa yang tidak pasti atau nilai suatu besaran yang tidak pasti? Artikel ini menunjukkan bahwa orang bergantung pada sejumlah terbatas prinsip heuristik yang menyederhanakan tugas kompleks menilai probabilitas dan memprediksi nilai menjadi operasi penilaian yang lebih sederhana. Secara umum, heuristik ini cukup berguna, tetapi terkadang menimbulkan kesalahan yang serius dan sistematis.
Penilaian subjektif terhadap probabilitas menyerupai penilaian subjektif terhadap besaran fisik seperti jarak atau ukuran. Penilaian-penilaian ini semuanya didasarkan pada data yang memiliki validitas terbatas, yang diproses menurut aturan-aturan heuristik. Sebagai contoh, jarak tampak suatu objek sebagian ditentukan oleh kejernihannya. Semakin tajam objek terlihat, semakin dekat objek tersebut tampak. Aturan ini memiliki validitas tertentu, karena dalam suatu pemandangan yang sama objek yang lebih jauh biasanya terlihat kurang tajam dibandingkan objek yang lebih dekat. Namun, kejernihan juga dipengaruhi oleh faktor lain selain jarak. Akibatnya, objek sering tampak lebih dekat daripada sebenarnya ketika visibilitas sangat baik karena objek tersebut terlihat sangat tajam. Dengan demikian, ketergantungan pada kejernihan sebagai indikator jarak menghasilkan bias yang umum. Bias semacam ini juga ditemukan dalam penilaian intuitif terhadap probabilitas. Artikel ini menggambarkan tiga heuristik yang digunakan untuk menilai probabilitas dan memprediksi nilai. Bias-bias yang dihasilkan oleh heuristik tersebut diuraikan, dan implikasi praktis maupun teoretis dari pengamatan ini dibahas.
Representativitas
Banyak pertanyaan probabilistik yang menjadi perhatian orang termasuk ke dalam salah satu tipe berikut: Berapa probabilitas bahwa objek A termasuk dalam kelas B? Berapa probabilitas bahwa peristiwa A berasal dari proses B? Berapa probabilitas bahwa proses B akan menghasilkan peristiwa A? Dalam menjawab pertanyaan-pertanyaan semacam itu, orang biasanya mengandalkan heuristik representativitas, di mana probabilitas dinilai berdasarkan sejauh mana A merepresentasikan B, yaitu sejauh mana A menyerupai B. Sebagai contoh, ketika A sangat representatif terhadap B, probabilitas bahwa A berasal dari B dinilai tinggi. Sebaliknya, jika A tidak mirip dengan B, probabilitas bahwa A berasal dari B dinilai rendah.
Sebagai ilustrasi penilaian berdasarkan representativitas, pertimbangkan seorang individu yang dideskripsikan oleh mantan tetangganya sebagai berikut:
“Steve sangat pemalu dan tertutup, selalu bersedia membantu, tetapi memiliki sedikit minat terhadap orang lain ataupun dunia nyata. Ia adalah pribadi yang lembut dan rapi, memiliki kebutuhan kuat akan keteraturan dan struktur, serta kegemaran terhadap detail.”
Bagaimana orang menilai probabilitas bahwa Steve bekerja dalam suatu profesi tertentu dari daftar kemungkinan (misalnya, petani, tenaga penjualan, pilot maskapai, pustakawan, atau dokter)? Bagaimana orang mengurutkan profesi-profesi ini dari yang paling mungkin hingga yang paling tidak mungkin? Dalam heuristik representativitas, probabilitas bahwa Steve adalah seorang pustakawan, misalnya, dinilai berdasarkan sejauh mana ia merepresentasikan atau menyerupai stereotip seorang pustakawan. Memang, penelitian dengan masalah semacam ini menunjukkan bahwa orang mengurutkan profesi berdasarkan probabilitas dan berdasarkan kemiripan dengan cara yang persis sama.¹ Pendekatan terhadap penilaian probabilitas ini menghasilkan kesalahan serius, karena kemiripan atau representativitas tidak dipengaruhi oleh beberapa faktor yang seharusnya memengaruhi penilaian probabilitas.
Ketidakpekaan terhadap probabilitas awal dari hasil
Salah satu faktor yang tidak memengaruhi representativitas tetapi seharusnya memiliki pengaruh besar terhadap probabilitas adalah probabilitas awal, atau frekuensi dasar (base rate), dari hasil-hasil yang mungkin. Dalam kasus Steve, misalnya, fakta bahwa jumlah petani jauh lebih banyak daripada pustakawan dalam populasi seharusnya dipertimbangkan dalam setiap perkiraan yang masuk akal mengenai probabilitas bahwa Steve adalah seorang pustakawan daripada seorang petani. Namun, pertimbangan mengenai frekuensi dasar tidak memengaruhi kemiripan Steve dengan stereotip pustakawan atau petani. Oleh karena itu, jika orang menilai probabilitas berdasarkan representativitas, probabilitas awal akan diabaikan.
Hipotesis ini diuji dalam suatu eksperimen di mana probabilitas awal dimanipulasi.² Para partisipan diperlihatkan deskripsi kepribadian singkat dari beberapa individu yang konon diambil secara acak dari kelompok yang terdiri atas 100 profesional—insinyur dan pengacara. Para partisipan diminta menilai, untuk setiap deskripsi, probabilitas bahwa deskripsi tersebut milik seorang insinyur daripada seorang pengacara. Dalam satu kondisi eksperimen, para partisipan diberi tahu bahwa kelompok asal deskripsi terdiri dari 70 insinyur dan 30 pengacara. Dalam kondisi lain, mereka diberi tahu bahwa kelompok tersebut terdiri dari 30 insinyur dan 70 pengacara.
Peluang bahwa suatu deskripsi tertentu milik seorang insinyur daripada seorang pengacara seharusnya lebih tinggi dalam kondisi pertama, di mana insinyur merupakan mayoritas, dibandingkan dalam kondisi kedua, di mana pengacara merupakan mayoritas. Secara khusus, dengan menerapkan aturan Bayes dapat ditunjukkan bahwa rasio peluang ini seharusnya sebesar (.7/.3)², atau 5,44, untuk setiap deskripsi.
Namun, dalam pelanggaran yang tajam terhadap aturan Bayes, para partisipan dalam kedua kondisi tersebut menghasilkan penilaian probabilitas yang pada dasarnya sama. Tampaknya para partisipan menilai kemungkinan bahwa suatu deskripsi tertentu milik seorang insinyur daripada seorang pengacara berdasarkan sejauh mana deskripsi tersebut merepresentasikan dua stereotip tersebut, dengan sedikit atau tanpa memperhatikan probabilitas awal dari kategori-kategori tersebut.
Para partisipan menggunakan probabilitas awal dengan benar ketika mereka tidak memiliki informasi lain. Tanpa adanya sketsa kepribadian, mereka menilai probabilitas bahwa seorang individu yang tidak dikenal adalah seorang insinyur masing-masing sebesar 0,7 dan 0,3 dalam dua kondisi frekuensi dasar tersebut. Namun, probabilitas awal secara efektif diabaikan ketika sebuah deskripsi diperkenalkan, bahkan ketika deskripsi tersebut sama sekali tidak informatif. Respons terhadap deskripsi berikut menggambarkan fenomena ini:
“Dick adalah seorang pria berusia 30 tahun. Ia sudah menikah dan tidak memiliki anak. Ia memiliki kemampuan tinggi dan motivasi tinggi, dan tampaknya akan sangat berhasil dalam bidangnya. Ia disukai oleh rekan-rekan kerjanya.”
Deskripsi ini dimaksudkan untuk tidak memberikan informasi apa pun yang relevan dengan pertanyaan apakah Dick adalah seorang insinyur atau seorang pengacara. Oleh karena itu, probabilitas bahwa Dick adalah seorang insinyur seharusnya sama dengan proporsi insinyur dalam kelompok tersebut, seolah-olah tidak ada deskripsi yang diberikan. Namun, para partisipan menilai probabilitas bahwa Dick adalah seorang insinyur sebesar 0,5, terlepas dari apakah proporsi insinyur dalam kelompok tersebut adalah 0,7 atau 0,3. Jelas bahwa orang merespons secara berbeda ketika tidak diberikan bukti dan ketika diberikan bukti yang tidak bernilai. Ketika tidak ada bukti khusus yang diberikan, probabilitas awal digunakan dengan tepat; tetapi ketika bukti yang tidak bernilai diberikan, probabilitas awal diabaikan.³
Ketidakpekaan terhadap ukuran sampel
Untuk menilai probabilitas memperoleh hasil tertentu dalam suatu sampel yang diambil dari populasi tertentu, orang biasanya menerapkan heuristik representativitas. Artinya, mereka menilai kemungkinan suatu hasil sampel—misalnya bahwa tinggi rata-rata dalam sampel acak yang terdiri dari sepuluh pria adalah 6 kaki—berdasarkan kemiripan hasil tersebut dengan parameter populasi yang bersangkutan (yaitu tinggi rata-rata dalam populasi pria).
Kemiripan suatu statistik sampel dengan parameter populasi tidak bergantung pada ukuran sampel. Oleh karena itu, jika probabilitas dinilai berdasarkan representativitas, maka probabilitas yang diperkirakan untuk suatu statistik sampel akan pada dasarnya tidak bergantung pada ukuran sampel. Memang, ketika para partisipan menilai distribusi tinggi rata-rata untuk sampel dengan berbagai ukuran, mereka menghasilkan distribusi yang identik. Sebagai contoh, probabilitas memperoleh tinggi rata-rata lebih dari 6 kaki diberi nilai yang sama untuk sampel yang terdiri dari 1.000, 100, dan 10 pria.?
Selain itu, para partisipan gagal memahami peran ukuran sampel bahkan ketika hal tersebut ditekankan dalam perumusan masalah. Pertimbangkan pertanyaan berikut:
Sebuah kota tertentu dilayani oleh dua rumah sakit. Di rumah sakit yang lebih besar sekitar 45 bayi lahir setiap hari, sedangkan di rumah sakit yang lebih kecil sekitar 15 bayi lahir setiap hari. Seperti yang Anda ketahui, sekitar 50% dari semua bayi yang lahir adalah laki-laki. Namun, persentase pastinya bervariasi dari hari ke hari—kadang lebih tinggi dari 50%, kadang lebih rendah.
Selama periode satu tahun, masing-masing rumah sakit mencatat hari-hari ketika lebih dari 60% bayi yang lahir adalah laki-laki. Menurut Anda, rumah sakit mana yang mencatat lebih banyak hari seperti itu?
Rumah sakit yang lebih besar (21)
Rumah sakit yang lebih kecil (21)
Kira-kira sama (yakni selisihnya dalam kisaran 5%) (53)
Angka dalam tanda kurung menunjukkan jumlah mahasiswa sarjana yang memilih setiap jawaban.
Sebagian besar subjek menilai probabilitas mendapatkan lebih dari 60% bayi laki-laki sama saja antara rumah sakit kecil dan rumah sakit besar, kemungkinan karena peristiwa ini dijelaskan dengan statistik yang sama dan karenanya dianggap sama representatifnya terhadap populasi umum. Sebaliknya, teori sampling menyatakan bahwa jumlah hari yang diharapkan di mana lebih dari 60% bayi adalah laki-laki jauh lebih besar di rumah sakit kecil dibandingkan rumah sakit besar, karena sampel besar cenderung lebih jarang menyimpang dari 50%. Konsep dasar statistik ini tampaknya tidak termasuk dalam repertoar intuisi orang. Ketidakpekaan serupa terhadap ukuran sampel juga dilaporkan dalam penilaian probabilitas posterior, yaitu probabilitas bahwa sebuah sampel diambil dari satu populasi dibandingkan dari populasi lain. Pertimbangkan contoh berikut:
Bayangkan sebuah guci berisi bola, di mana 2/3 berwarna satu dan 1/3 berwarna lain. Seorang individu mengambil 5 bola dari guci tersebut dan menemukan 4 merah dan 1 putih. Individu lain mengambil 20 bola dan menemukan 12 merah dan 8 putih. Siapakah dari kedua individu tersebut yang seharusnya lebih yakin bahwa guci itu berisi 2/3 bola merah dan 1/3 bola putih, bukan sebaliknya? Berapa peluang yang seharusnya mereka tetapkan?
Dalam masalah ini, odds posterior yang benar adalah 8 banding 1 untuk sampel 4:1 dan 16 banding 1 untuk sampel 12:8, dengan asumsi probabilitas awal sama. Namun, sebagian besar orang merasa sampel pertama memberikan bukti yang jauh lebih kuat untuk hipotesis bahwa guci sebagian besar berwarna merah, karena proporsi bola merah lebih besar pada sampel pertama dibandingkan sampel kedua. Sekali lagi, penilaian intuitif didominasi oleh proporsi sampel dan pada dasarnya tidak terpengaruh oleh ukuran sampel, padahal ukuran sampel memainkan peran krusial dalam menentukan odds posterior yang sesungguhnya. Selain itu, estimasi intuitif terhadap odds posterior jauh lebih moderat dibandingkan nilai yang benar.
Meremehkan pengaruh bukti seperti ini telah diamati berulang kali dalam masalah sejenis dan dikenal dengan istilah “konservatisme.”
Kesalahan konsepsi tentang peluang. Orang mengharapkan bahwa suatu rangkaian peristiwa yang dihasilkan oleh proses acak akan mencerminkan karakteristik esensial dari proses tersebut, meski rangkaiannya pendek. Misalnya, dalam pertimbangan lemparan koin untuk kepala atau ekor, orang menilai rangkaian H-T-H-T-H lebih mungkin terjadi dibandingkan H-H-H-T-T-H, yang tampak tidak acak, dan bahkan lebih mungkin dibandingkan H-H-H-H-T-H, yang tidak mencerminkan keadilan koin. Dengan demikian, orang mengharapkan karakteristik esensial proses tercermin, tidak hanya secara global pada keseluruhan rangkaian, tetapi juga secara lokal pada tiap bagiannya. Namun, rangkaian yang representatif secara lokal secara sistematis menyimpang dari ekspektasi peluang: terdapat terlalu banyak pergantian dan terlalu sedikit rangkaian berturut-turut.
Konsekuensi lain dari keyakinan pada representativitas lokal adalah kesalahan penjudi yang terkenal. Misalnya, setelah mengamati rangkaian panjang merah pada roda roulette, sebagian besar orang keliru percaya bahwa hitam kini harus muncul, kemungkinan karena munculnya hitam akan menghasilkan rangkaian yang lebih representatif daripada munculnya merah tambahan. Peluang sering dipandang sebagai proses yang menyeimbangkan diri sendiri, di mana penyimpangan ke satu arah memicu penyimpangan ke arah sebaliknya untuk memulihkan keseimbangan. Faktanya, penyimpangan tidak “diperbaiki” saat proses acak berlangsung; penyimpangan hanya tereduksi.
Kesalahan konsepsi tentang peluang tidak terbatas pada subjek awam. Sebuah studi tentang intuisi statistik psikolog penelitian berpengalaman mengungkap adanya keyakinan yang bertahan terhadap apa yang dapat disebut “hukum bilangan kecil,” di mana sampel kecil sekalipun dianggap sangat representatif terhadap populasi asalnya. Respons para peneliti ini mencerminkan ekspektasi bahwa hipotesis yang valid tentang populasi akan tercermin melalui hasil signifikan secara statistik pada sampel, tanpa memperhatikan ukurannya. Akibatnya, para peneliti terlalu percaya pada hasil sampel kecil dan sangat melebih-lebihkan kemungkinan hasil tersebut dapat direplikasi. Dalam praktik penelitian, bias ini menyebabkan pemilihan sampel yang tidak memadai dan penafsiran berlebihan terhadap temuan.
Ketidakpekaan terhadap prediktabilitas. Orang kadang diminta membuat prediksi numerik seperti nilai saham di masa depan, permintaan suatu komoditas, atau hasil pertandingan sepak bola. Prediksi semacam ini sering dilakukan berdasarkan representativitas. Misalnya, jika seseorang diberikan deskripsi perusahaan dan diminta memprediksi laba masa depannya, laba sangat tinggi akan tampak paling representatif jika deskripsinya sangat positif; laba sedang akan tampak paling representatif jika deskripsinya biasa-biasa saja. Tingkat kepositifan deskripsi tidak terpengaruh oleh keandalan informasi atau sejauh mana informasi tersebut memungkinkan prediksi akurat. Dengan demikian, jika prediksi dilakukan semata berdasarkan seberapa positif deskripsi, prediksi akan tidak peka terhadap keandalan bukti maupun akurasi yang diharapkan.
Mode penilaian ini melanggar teori statistik normatif, di mana ekstremitas dan rentang prediksi dikendalikan oleh pertimbangan prediktabilitas. Ketika prediktabilitas nol, prediksi yang sama harus dibuat dalam semua kasus. Misalnya, jika deskripsi perusahaan tidak memberi informasi relevan tentang laba, maka nilai yang sama (misalnya rata-rata laba) harus diprediksi untuk semua perusahaan. Jika prediktabilitas sempurna, tentu nilai prediksi akan sesuai dengan nilai aktual, dan rentang prediksi akan sama dengan rentang hasil. Umumnya, semakin tinggi prediktabilitas, semakin luas rentang nilai yang diprediksi. Beberapa studi menunjukkan prediksi intuitif melanggar aturan ini dan subjek hampir tidak mempertimbangkan prediktabilitas.
Dalam salah satu studi tersebut, subjek diberikan beberapa paragraf, masing-masing menggambarkan kinerja seorang guru magang dalam pelajaran praktik tertentu. Beberapa subjek diminta menilai kualitas pelajaran dalam skor persentil relatif terhadap populasi tertentu. Subjek lain diminta memprediksi, juga dalam skor persentil, posisi guru magang lima tahun setelah pelajaran praktik. Penilaian pada kedua kondisi tersebut identik. Artinya, prediksi kriteria yang jauh (kesuksesan guru lima tahun kemudian) identik dengan evaluasi informasi dasar prediksi (kualitas pelajaran praktik). Para subjek tentu menyadari keterbatasan prediktabilitas kompetensi mengajar dari satu pelajaran percobaan lima tahun sebelumnya; meskipun begitu, prediksi mereka se-ekstrem evaluasi mereka.
Ilusi validitas. Seperti yang telah kita lihat, orang sering memprediksi dengan memilih hasil yang paling representatif dari input. Keyakinan mereka terhadap prediksi bergantung terutama pada tingkat representativitas (kecocokan antara hasil yang dipilih dan input), dengan sedikit atau tanpa mempertimbangkan faktor yang membatasi akurasi prediksi. Dengan demikian, orang sangat percaya diri memprediksi seseorang sebagai pustakawan saat diberikan deskripsi kepribadian yang sesuai stereotipe pustakawan, meskipun deskripsi itu minim, tidak dapat diandalkan, atau usang. Keyakinan berlebihan yang muncul dari kesesuaian antara hasil prediksi dan informasi input ini disebut ilusi validitas. Ilusi ini bertahan bahkan ketika penilai sadar akan faktor yang membatasi akurasi prediksinya.
Konsistensi internal pola input menjadi penentu utama keyakinan seseorang terhadap prediksi. Misalnya, orang lebih yakin memprediksi rata-rata nilai akhir mahasiswa dengan catatan tahun pertama seluruhnya B dibandingkan mahasiswa dengan catatan tahun pertama campuran A dan C. Pola konsisten tinggi biasanya muncul saat variabel input sangat redundan atau berkorelasi. Karena itu, orang cenderung sangat percaya pada prediksi berdasarkan variabel input yang redundan. Namun, statistik korelasi menunjukkan bahwa dengan variabel input yang valid, prediksi dengan beberapa input dapat lebih akurat jika independen daripada jika redundan atau berkorelasi. Dengan demikian, redundansi input menurunkan akurasi meski meningkatkan keyakinan, dan orang sering percaya pada prediksi yang kemungkinan besar meleset.
Kesalahan konsepsi regresi. Misalkan sekelompok besar anak diperiksa pada dua versi tes bakat yang setara. Jika sepuluh anak dipilih dari mereka yang terbaik pada satu versi, biasanya hasil mereka pada versi kedua sedikit mengecewakan. Sebaliknya, jika sepuluh anak dipilih dari yang terburuk pada satu versi, rata-rata mereka sedikit lebih baik pada versi lain. Secara lebih umum, jika X dan Y memiliki distribusi sama, individu yang rata-rata skor X-nya menyimpang k dari rata-rata X, rata-rata skor Y mereka biasanya menyimpang kurang dari k dari rata-rata Y. Fenomena ini dikenal sebagai regresi menuju rata-rata, pertama kali didokumentasikan Galton lebih dari 100 tahun lalu.
Dalam kehidupan sehari-hari, regresi menuju rata-rata banyak ditemui, misalnya dalam perbandingan tinggi ayah-anak, kecerdasan suami-istri, atau kinerja individu dalam ujian beruntun. Namun, orang tidak mengembangkan intuisi yang benar tentang fenomena ini. Pertama, mereka tidak mengantisipasi regresi di banyak konteks di mana fenomena itu pasti terjadi. Kedua, saat menyadari regresi, mereka sering menciptakan penjelasan sebab-akibat palsu. Fenomena regresi tetap sulit dipahami karena bertentangan dengan keyakinan bahwa hasil prediksi seharusnya se-ekstrem input.
Kegagalan memahami regresi dapat menimbulkan konsekuensi berbahaya. Misalnya, dalam pelatihan penerbangan, instruktur berpengalaman mencatat bahwa pujian atas pendaratan yang sangat mulus biasanya diikuti pendaratan buruk berikutnya, sementara kritik keras atas pendaratan buruk biasanya diikuti peningkatan. Instruktur menyimpulkan bahwa hadiah verbal merugikan pembelajaran, sementara hukuman verbal bermanfaat—kesimpulan yang salah karena efek regresi menuju rata-rata. Seperti pada pemeriksaan berulang lainnya, perbaikan biasanya mengikuti kinerja buruk, dan penurunan biasanya mengikuti kinerja luar biasa, meski instruktur tidak bereaksi terhadap prestasi pertama. Karena instruktur memuji setelah pendaratan baik dan menegur setelah pendaratan buruk, mereka mencapai kesimpulan keliru yang bisa berbahaya: bahwa hukuman lebih efektif daripada penghargaan.
Dengan demikian, kegagalan memahami efek regresi membuat seseorang melebih-lebihkan efektivitas hukuman dan meremehkan efektivitas penghargaan. Dalam interaksi sosial maupun pelatihan, penghargaan biasanya diberikan saat kinerja baik, dan hukuman saat kinerja buruk. Hanya dengan regresi, perilaku cenderung membaik setelah hukuman dan cenderung menurun setelah penghargaan. Akibatnya, manusia seringkali diberi penghargaan karena menghukum dan dihukum karena memberi penghargaan—kontingensi ini umumnya tidak disadari. Faktanya, peran regresi yang sulit dipahami dalam menentukan konsekuensi nyata dari penghargaan dan hukuman tampaknya luput dari perhatian peneliti di bidang ini.
Ketersediaan (Availability)
Ada situasi di mana orang menilai frekuensi suatu kelas atau probabilitas suatu peristiwa berdasarkan kemudahan mereka dalam mengingat contoh atau kejadian. Misalnya, seseorang dapat menilai risiko serangan jantung di kalangan orang paruh baya dengan mengingat kejadian serupa di antara kenalannya. Demikian pula, seseorang dapat menilai probabilitas kegagalan suatu usaha bisnis dengan membayangkan berbagai kesulitan yang mungkin dihadapinya. Strategi penilaian semacam ini disebut availability.
Availability merupakan petunjuk yang berguna untuk menilai frekuensi atau probabilitas, karena contoh dari kelas besar biasanya lebih mudah dan cepat diingat dibandingkan contoh dari kelas yang lebih jarang. Namun, availability dipengaruhi oleh faktor lain selain frekuensi dan probabilitas. Akibatnya, ketergantungan pada availability menimbulkan bias yang dapat diprediksi, beberapa di antaranya dijelaskan berikut ini.
Bias karena keterjangkauan contoh. Ketika ukuran suatu kelas dinilai berdasarkan ketersediaan contohnya, kelas yang contoh-contohnya mudah diingat akan tampak lebih banyak daripada kelas dengan frekuensi sama yang contoh-contohnya sulit diingat. Dalam demonstrasi sederhana efek ini, subjek mendengar daftar tokoh terkenal dari kedua jenis kelamin, lalu diminta menilai apakah daftar tersebut memuat lebih banyak nama laki-laki daripada perempuan. Daftar berbeda diberikan kepada kelompok subjek yang berbeda. Pada beberapa daftar, tokoh laki-laki relatif lebih terkenal daripada perempuan, dan pada daftar lain sebaliknya. Dalam setiap daftar, subjek secara keliru menilai bahwa kelas (jenis kelamin) yang memiliki tokoh lebih terkenal adalah yang lebih banyak jumlahnya.
Selain familiaritas, ada faktor lain, seperti keterlihatan (salience), yang memengaruhi keterjangkauan contoh. Misalnya, dampak melihat sebuah rumah terbakar terhadap probabilitas subjektif kejadian serupa kemungkinan lebih besar dibandingkan membaca berita kebakaran di koran lokal. Selain itu, kejadian terbaru cenderung lebih mudah diingat daripada kejadian sebelumnya. Adalah pengalaman umum bahwa probabilitas subjektif kecelakaan lalu lintas meningkat sementara ketika seseorang melihat mobil terbalik di pinggir jalan.
Bias karena efektivitas set pencarian. Misalkan seseorang mengambil kata (dengan tiga huruf atau lebih) secara acak dari teks berbahasa Inggris. Apakah lebih mungkin kata itu diawali huruf r atau huruf r berada di posisi ketiga? Orang menyelesaikan masalah ini dengan mengingat kata yang diawali huruf r (misalnya road) dan kata yang memiliki r di posisi ketiga (misalnya car), lalu menilai frekuensi relatif berdasarkan kemudahan mengingat kedua tipe kata tersebut. Karena lebih mudah mencari kata berdasarkan huruf pertama daripada huruf ketiga, sebagian besar orang menilai kata yang diawali konsonan tertentu lebih banyak daripada kata di mana konsonan yang sama muncul di posisi ketiga, bahkan untuk konsonan seperti r atau k yang sebenarnya lebih sering muncul di posisi ketiga daripada pertama.
Tugas yang berbeda memunculkan set pencarian yang berbeda. Misalnya, diminta menilai frekuensi kemunculan kata abstrak (misal, thought, love) dan kata konkret (misal, door, water) dalam bahasa Inggris tertulis. Cara alami untuk menjawab adalah mencari konteks di mana kata tersebut muncul. Tampaknya lebih mudah memikirkan konteks kata abstrak (misal, love dalam cerita cinta) dibandingkan kata konkret (misal, door). Jika frekuensi kata dinilai berdasarkan ketersediaan konteksnya, kata abstrak akan tampak lebih banyak dibandingkan kata konkret. Bias ini telah diamati dalam studi terbaru yang menunjukkan frekuensi kata abstrak yang dinilai jauh lebih tinggi daripada kata konkret, meski frekuensi objektifnya sama. Kata abstrak juga dinilai muncul dalam variasi konteks lebih banyak dibandingkan kata konkret.
Bias karena kemampuan membayangkan. Kadang seseorang harus menilai frekuensi kelas yang contoh-contonya tidak tersimpan dalam ingatan tetapi dapat dihasilkan menurut aturan tertentu. Dalam situasi seperti ini, seseorang biasanya membuat beberapa contoh dan menilai frekuensi atau probabilitas berdasarkan kemudahan membangkitkan contoh tersebut. Namun, kemudahan membangkitkan contoh tidak selalu mencerminkan frekuensi sebenarnya, sehingga mode evaluasi ini rentan terhadap bias.
Misalnya, pertimbangkan 10 orang yang membentuk panitia dengan k anggota, 2 ≤ k ≤ 8. Berapa banyak panitia berbeda yang dapat dibentuk? Jawaban benar diberikan oleh koefisien binomial (10/k), yang mencapai maksimum 252 untuk k = 5. Jelas, jumlah panitia k anggota sama dengan jumlah panitia 10 – k anggota, karena setiap panitia k anggota mendefinisikan satu kelompok unik dari 10 – k anggota non-panitia.
Salah satu cara menjawab tanpa perhitungan adalah dengan membayangkan panitia k anggota dan menilai jumlahnya berdasarkan kemudahan mengingatnya. Panitia kecil, misal 2 anggota, lebih mudah dibayangkan dibanding panitia besar, misal 8 anggota. Skema termudah adalah membagi kelompok menjadi set yang tidak tumpang tindih. Terlihat jelas bahwa mudah membayangkan lima panitia 2 anggota yang tidak tumpang tindih, sedangkan hampir mustahil membayangkan dua panitia 8 anggota yang tidak tumpang tindih. Akibatnya, jika frekuensi dinilai berdasarkan kemampuan membayangkan atau ketersediaan konstruksi, panitia kecil tampak lebih banyak daripada panitia besar, berbeda dengan kurva berbentuk lonceng yang benar. Faktanya, ketika subjek awam diminta memperkirakan jumlah panitia berbeda berdasarkan ukuran, perkiraan mereka menurun seiring ukuran panitia. Misalnya, perkiraan median jumlah panitia 2 anggota adalah 70, sedangkan untuk panitia 8 anggota adalah 20 (jawaban benar: 45 untuk kedua kasus).
Kemampuan membayangkan memainkan peran penting dalam menilai probabilitas situasi nyata. Risiko dalam ekspedisi petualangan, misalnya, dinilai dengan membayangkan kemungkinan kesulitan yang tidak dapat diatasi ekspedisi. Jika banyak kesulitan digambarkan dengan jelas, ekspedisi tampak sangat berbahaya, meski kemudahan membayangkan bencana tidak mencerminkan probabilitas sebenarnya. Sebaliknya, risiko suatu usaha bisa sangat diremehkan jika beberapa bahaya sulit dibayangkan atau tidak terlintas sama sekali.
Korelasi ilusi. Chapman dan Chapman menggambarkan bias menarik dalam penilaian frekuensi dua peristiwa yang terjadi bersamaan. Mereka memberikan informasi tentang beberapa pasien mental hipotetis kepada subjek awam. Data tiap pasien terdiri dari diagnosis klinis dan gambar yang dibuat pasien tersebut. Kemudian, subjek menilai seberapa sering tiap diagnosis (misal, paranoia atau kecurigaan) disertai fitur tertentu dalam gambar (misal, mata aneh). Subjek secara nyata melebih-lebihkan frekuensi kemunculan bersamaan asosiasi alami, seperti kecurigaan dan mata aneh. Efek ini disebut korelasi ilusi. Dalam penilaian yang keliru, subjek “menemukan kembali” banyak pengetahuan klinis umum yang tidak berdasar terkait interpretasi tes menggambar orang. Efek korelasi ilusi sangat tahan terhadap data yang kontradiktif. Ia bertahan meski korelasi antara gejala dan diagnosis sebenarnya negatif, dan mencegah subjek mendeteksi hubungan yang sesungguhnya ada.
Availability memberikan penjelasan alami untuk efek korelasi ilusi. Penilaian frekuensi dua peristiwa yang terjadi bersamaan bisa didasarkan pada kekuatan ikatan asosiasi di antara keduanya. Saat asosiasi kuat, seseorang cenderung menyimpulkan bahwa peristiwa sering terjadi bersamaan. Akibatnya, asosiasi kuat akan dinilai sering terjadi bersamaan. Menurut pandangan ini, korelasi ilusi antara kecurigaan dan gambar mata yang aneh disebabkan oleh fakta bahwa kecurigaan lebih mudah diasosiasikan dengan mata daripada bagian tubuh lainnya.
Pengalaman seumur hidup mengajarkan bahwa, secara umum, contoh dari kelas besar lebih mudah diingat dan lebih cepat dipanggil daripada kelas jarang; kejadian yang mungkin lebih mudah dibayangkan daripada yang tidak mungkin; dan koneksi asosiasi antara peristiwa diperkuat ketika peristiwa sering terjadi bersamaan. Akibatnya, manusia memiliki prosedur (heuristik availability) untuk memperkirakan jumlah kelas, probabilitas suatu peristiwa, atau frekuensi kemunculan bersamaan, berdasarkan kemudahan operasi mental pengambilan, konstruksi, atau asosiasi. Namun, seperti contoh sebelumnya menunjukkan, prosedur estimasi yang berharga ini menghasilkan kesalahan sistematis.
Penyesuaian dan Anchoring (Adjustment and Anchoring)
Dalam banyak situasi, orang membuat perkiraan dengan memulai dari nilai awal yang kemudian disesuaikan untuk menghasilkan jawaban akhir. Nilai awal, atau titik awal, bisa muncul dari formulasi masalah, atau sebagai hasil dari perhitungan parsial. Dalam kedua kasus, penyesuaian biasanya tidak memadai. Artinya, titik awal yang berbeda menghasilkan perkiraan yang berbeda, yang cenderung bias ke arah nilai awal. Fenomena ini disebut anchoring.
Penyesuaian yang tidak memadai. Dalam demonstrasi efek anchoring, subjek diminta memperkirakan berbagai kuantitas yang dinyatakan dalam persentase (misalnya, persentase negara Afrika dalam Perserikatan Bangsa-Bangsa). Untuk setiap kuantitas, sebuah angka antara 0 hingga 100 ditentukan dengan memutar roda keberuntungan di hadapan subjek. Subjek diminta menunjukkan apakah angka tersebut lebih tinggi atau lebih rendah dari nilai sebenarnya, kemudian memperkirakan nilai kuantitas tersebut dengan menyesuaikan naik atau turun dari angka yang diberikan. Kelompok yang berbeda diberi angka awal yang berbeda, dan angka-angka sewenang-wenang ini memiliki efek signifikan terhadap perkiraan. Misalnya, perkiraan median persentase negara Afrika dalam PBB adalah 25 dan 45 untuk kelompok yang menerima titik awal 10 dan 65, masing-masing. Hadiah untuk akurasi tidak mengurangi efek anchoring.
Anchoring terjadi tidak hanya ketika titik awal diberikan kepada subjek, tetapi juga ketika subjek mendasarkan perkiraannya pada hasil perhitungan yang belum lengkap. Sebuah studi tentang perkiraan numerik intuitif mengilustrasikan hal ini. Dua kelompok siswa sekolah menengah diminta memperkirakan, dalam waktu 5 detik, sebuah ekspresi numerik yang ditulis di papan tulis. Satu kelompok memperkirakan hasil perkalian:
8 × 7 × 6 × 5 × 4 × 3 × 2 × 1
Sementara kelompok lain memperkirakan:
1 × 2 × 3 × 4 × 5 × 6 × 7 × 8
Untuk menjawab cepat, orang mungkin melakukan beberapa langkah perhitungan dan memperkirakan hasil perkalian melalui ekstrapolasi atau penyesuaian. Karena penyesuaian biasanya tidak memadai, prosedur ini cenderung menghasilkan perkiraan yang lebih rendah. Selain itu, hasil dari beberapa langkah perkalian pertama (dari kiri ke kanan) lebih besar pada urutan menurun dibanding urutan menaik, sehingga ekspresi pertama akan dinilai lebih besar. Kedua prediksi ini terbukti benar: median perkiraan untuk urutan menaik adalah 512, sedangkan untuk urutan menurun adalah 2.250. Jawaban yang benar adalah 40.320.
Bias dalam penilaian peristiwa konjungtif dan disjungtif. Dalam studi terbaru oleh Bar-Hillel, subjek diberi kesempatan bertaruh pada salah satu dari dua peristiwa. Tiga jenis peristiwa digunakan:
- Peristiwa sederhana, misalnya mengambil bola merah dari kantong yang berisi 50% bola merah dan 50% bola putih.
- Peristiwa konjungtif, misalnya mengambil bola merah tujuh kali berturut-turut, dengan pengembalian, dari kantong yang berisi 90% bola merah dan 10% putih.
- Peristiwa disjungtif, misalnya mengambil bola merah setidaknya sekali dalam tujuh kali percobaan berturut-turut, dengan pengembalian, dari kantong yang berisi 10% bola merah dan 90% putih.
Mayoritas signifikan subjek lebih memilih bertaruh pada peristiwa konjungtif (probabilitas 0,48) daripada peristiwa sederhana (probabilitas 0,50). Subjek juga lebih memilih peristiwa sederhana daripada peristiwa disjungtif (probabilitas 0,52). Dengan demikian, sebagian besar subjek bertaruh pada peristiwa yang kurang mungkin dalam kedua perbandingan. Pola ini menunjukkan temuan umum: orang cenderung menaksir berlebihan probabilitas peristiwa konjungtif dan meremehkan probabilitas peristiwa disjungtif.
Bias ini mudah dijelaskan sebagai efek anchoring. Probabilitas peristiwa elementer (sukses pada satu tahap) memberikan titik awal alami untuk perkiraan probabilitas peristiwa konjungtif maupun disjungtif. Karena penyesuaian dari titik awal biasanya tidak memadai, perkiraan akhir tetap terlalu dekat dengan probabilitas peristiwa elementer. Catatan: probabilitas keseluruhan peristiwa konjungtif lebih rendah daripada probabilitas masing-masing peristiwa elementer, sedangkan probabilitas keseluruhan peristiwa disjungtif lebih tinggi. Akibat anchoring, probabilitas keseluruhan terlalu tinggi pada masalah konjungtif dan terlalu rendah pada masalah disjungtif.
Bias ini penting dalam konteks perencanaan. Penyelesaian sukses suatu proyek, misalnya pengembangan produk baru, biasanya bersifat konjungtif: setiap rangkaian peristiwa harus terjadi agar proyek berhasil. Meskipun masing-masing peristiwa sangat mungkin terjadi, probabilitas keseluruhan keberhasilan bisa rendah jika jumlah peristiwa besar. Kecenderungan umum untuk menaksir berlebihan probabilitas peristiwa konjungtif menyebabkan optimisme berlebihan dalam menilai kemungkinan keberhasilan proyek atau penyelesaian tepat waktu.
Sebaliknya, struktur disjungtif muncul saat menilai risiko. Sistem kompleks, seperti reaktor nuklir atau tubuh manusia, akan gagal jika salah satu komponen esensialnya gagal. Meskipun probabilitas kegagalan tiap komponen kecil, probabilitas kegagalan keseluruhan bisa tinggi jika banyak komponen terlibat. Karena anchoring, orang cenderung meremehkan probabilitas kegagalan sistem kompleks. Dengan demikian, arah bias anchoring kadang bisa diprediksi dari struktur peristiwa:
- Struktur konjungtif (rantai) → menaksir berlebihan
- Struktur disjungtif (corong) → menaksir rendah
Anchoring dalam penilaian distribusi probabilitas subjektif. Dalam analisis keputusan, ahli sering diminta menyatakan keyakinan mereka tentang suatu kuantitas, misalnya nilai rata-rata Dow Jones pada hari tertentu, dalam bentuk distribusi probabilitas. Distribusi ini biasanya dibangun dengan meminta orang memilih nilai kuantitas yang sesuai dengan persentil tertentu dari distribusi probabilitas subjektifnya. Misalnya, hakim diminta memilih nilai X90 sehingga probabilitas subjektifnya bahwa Dow Jones akan lebih tinggi dari X90 adalah 0,90. Artinya, ia bersedia menerima odds 9:1 bahwa Dow Jones tidak akan melebihi X90. Distribusi probabilitas subjektif untuk Dow Jones dapat dibangun dari beberapa penilaian pada persentil berbeda.
Dengan mengumpulkan distribusi probabilitas subjektif dari banyak kuantitas, dimungkinkan menguji kalibrasi eksternal hakim. Seorang hakim dikatakan terkalibrasi jika persis persentase tertentu dari nilai sebenarnya jatuh di bawah nilai yang ia nyatakan. Misalnya, 1% nilai benar seharusnya di bawah X01, dan 1% di atas X99; sehingga 98% nilai benar seharusnya berada dalam interval kepercayaan X01–X99.
Penelitian menunjukkan distribusi probabilitas subjektif sering menunjukkan deviasi sistematis dari kalibrasi. Dalam banyak studi, nilai sebenarnya sekitar 30% dari masalah berada di luar X01 atau X99, menunjukkan interval kepercayaan yang terlalu sempit—subjek terlalu yakin dibandingkan yang seharusnya. Bias ini umum pada subjek awam maupun berpengalaman, dan tidak hilang dengan pengenalan skor kalibrasi eksternal. Efek ini sebagian besar disebabkan oleh anchoring.
Contohnya, dalam memilih X90 untuk Dow Jones, wajar memulai dengan perkiraan terbaik lalu menyesuaikannya naik. Jika penyesuaian—seperti kebanyakan penyesuaian—tidak memadai, X90 tidak cukup ekstrem. Efek anchoring serupa terjadi pada X10, yang biasanya diperoleh dengan menyesuaikan perkiraan terbaik ke bawah. Akibatnya, interval kepercayaan antara X10 dan X90 terlalu sempit, dan distribusi probabilitas yang dinilai terlalu ketat.
Distribusi probabilitas subjektif dapat diperoleh dengan dua prosedur:
- Memilih nilai kuantitas untuk persentil tertentu.
- Menilai probabilitas bahwa nilai sebenarnya melebihi nilai tertentu.
Secara formal, kedua prosedur ekuivalen, namun mereka menggunakan anchor berbeda. Prosedur (1) anchor alami adalah perkiraan terbaik; prosedur (2) anchor bisa berupa nilai yang ditanyakan atau odds 50:50. Prosedur (2) cenderung menghasilkan odds kurang ekstrem dibanding prosedur (1).
Sebagai ilustrasi, sekelompok subjek menilai 24 kuantitas (misal jarak udara dari New Delhi ke Beijing) untuk X10 atau X90. Kelompok lain menerima median penilaian kelompok pertama dan menilai probabilitas nilai tersebut melebihi nilai sebenarnya. Tanpa bias, odds seharusnya 9:1. Namun jika anchor adalah nilai yang ditanyakan atau odds 50:50, odds cenderung lebih moderat, misal 3:1. Penilaian kalibrasi eksternal menunjukkan kelompok pertama terlalu ekstrem, sedangkan kelompok kedua terlalu konservatif. Hal ini menunjukkan derajat kalibrasi tergantung prosedur elicitation.
Diskusi
Artikel ini membahas bias kognitif yang muncul dari ketergantungan pada heuristik penilaian. Bias-bias ini tidak disebabkan oleh efek motivasi, seperti berpikir penuh harapan (wishful thinking) atau distorsi penilaian akibat hadiah dan hukuman. Bahkan, beberapa kesalahan penilaian yang parah yang telah dilaporkan sebelumnya terjadi meskipun subjek didorong untuk akurat dan diberi hadiah untuk jawaban yang benar.
Ketergantungan pada heuristik dan prevalensi bias tidak terbatas pada orang awam. Peneliti berpengalaman juga rentan terhadap bias yang sama—ketika mereka berpikir secara intuitif. Misalnya, kecenderungan untuk memprediksi hasil yang paling mewakili data, dengan memperhatikan probabilitas sebelumnya secara tidak memadai, telah diamati dalam penilaian intuitif individu yang memiliki pelatihan statistik yang luas. Meskipun orang yang mahir statistik menghindari kesalahan dasar seperti gambler’s fallacy, penilaian intuitif mereka tetap rentan terhadap kekeliruan dalam masalah yang lebih rumit dan kurang transparan.
Tidaklah mengejutkan bahwa heuristik yang berguna seperti representativeness dan availability tetap dipertahankan, meskipun kadang menyebabkan kesalahan prediksi atau estimasi. Yang mungkin mengejutkan adalah kegagalan orang untuk menyimpulkan dari pengalaman seumur hidup aturan statistik dasar, seperti regresi menuju rata-rata (regression toward the mean) atau pengaruh ukuran sampel terhadap variabilitas pengambilan sampel. Meskipun setiap orang secara normal terpapar banyak contoh dari mana aturan-aturan ini bisa disimpulkan, sangat sedikit orang yang menemukan prinsip sampling dan regresi secara mandiri.
Prinsip statistik tidak dipelajari dari pengalaman sehari-hari karena instance yang relevan tidak dikodekan dengan tepat. Misalnya, orang tidak menyadari bahwa baris berturut-turut dalam teks berbeda lebih banyak dalam panjang kata rata-rata dibanding halaman berturut-turut, karena mereka tidak memperhatikan panjang kata rata-rata tiap baris atau halaman. Dengan demikian, orang tidak belajar hubungan antara ukuran sampel dan variabilitas pengambilan sampel, meskipun datanya sangat melimpah.
Kurangnya kode yang tepat juga menjelaskan mengapa orang biasanya tidak mendeteksi bias dalam penilaian probabilitas mereka. Seseorang bisa saja belajar apakah penilaiannya terkalkulasi secara eksternal dengan mencatat proporsi peristiwa yang benar-benar terjadi dari semua peristiwa yang ia tetapkan probabilitasnya sama. Namun, secara alami tidak mudah untuk mengelompokkan peristiwa berdasarkan probabilitas yang dinilai. Tanpa pengelompokan seperti itu, mustahil bagi individu untuk menemukan, misalnya, bahwa hanya 50% prediksi dengan probabilitas ≥0,9 yang benar-benar terjadi.
Analisis empiris terhadap bias kognitif memiliki implikasi terhadap peran teoretis dan praktis dari probabilitas yang dinilai. Teori keputusan modern memandang probabilitas subjektif sebagai opini terkuantifikasi dari individu ideal. Probabilitas subjektif suatu peristiwa didefinisikan melalui serangkaian taruhan tentang peristiwa itu yang bersedia diterima individu tersebut. Ukuran probabilitas subjektif yang konsisten internal dapat diperoleh jika pilihan individu memenuhi prinsip tertentu (aksion teori). Probabilitas ini bersifat subjektif karena individu berbeda dapat memiliki probabilitas berbeda untuk peristiwa yang sama. Kontribusi utama pendekatan ini adalah menyediakan interpretasi subjektif probabilitas yang ketat, berlaku untuk peristiwa unik, dan terintegrasi dalam teori keputusan rasional.
Perlu dicatat bahwa, meskipun probabilitas subjektif kadang dapat diturunkan dari preferensi taruhan, biasanya probabilitas tidak dibentuk dengan cara ini. Seseorang bertaruh pada tim A karena percaya tim A lebih mungkin menang; ia tidak menurunkan kepercayaan ini dari preferensi taruhannya. Dengan kata lain, probabilitas subjektif menentukan preferensi taruhan, bukan sebaliknya.
Sifat probabilitas yang subjektif menyebabkan banyak orang percaya bahwa koherensi atau konsistensi internal adalah satu-satunya kriteria valid untuk menilai probabilitas yang dinilai. Dari sudut pandang teori probabilitas subjektif formal, setiap set probabilitas subjektif yang konsisten internal sama baiknya. Namun, kriteria ini tidak sepenuhnya memadai, karena set probabilitas yang konsisten bisa bertentangan dengan keyakinan lain yang dimiliki individu.
Contohnya, seseorang yang probabilitas subjektifnya untuk semua hasil lempar koin mencerminkan gambler’s fallacy (probabilitas tail meningkat setelah banyak head berturut-turut). Penilaiannya bisa konsisten internal, tetapi bertentangan dengan keyakinan umum bahwa koin “tidak memiliki memori.” Agar probabilitas yang dinilai dianggap rasional, konsistensi internal tidak cukup; penilaian harus kompatibel dengan keseluruhan sistem keyakinan individu. Tidak ada prosedur formal sederhana untuk menilai kompatibilitas ini, tetapi penilai rasional akan tetap berusaha mencapainya. Ia akan mencoba membuat penilaian probabilitas kompatibel dengan pengetahuannya tentang materi, hukum probabilitas, serta heuristik dan bias penilaian yang dimiliki.
Ringkasan
Artikel ini menjelaskan tiga heuristik utama yang digunakan dalam penilaian ketidakpastian:
- Representativeness – digunakan saat menilai probabilitas bahwa objek/peristiwa A termasuk kelas/proses B.
- Availability – digunakan saat menilai frekuensi kelas atau kemungkinan suatu perkembangan.
- Adjustment from an anchor – digunakan dalam prediksi numerik ketika nilai relevan tersedia.
Heuristik ini sangat ekonomis dan biasanya efektif, tetapi dapat menyebabkan kesalahan sistematis dan dapat diprediksi. Pemahaman yang lebih baik tentang heuristik ini dan bias yang ditimbulkannya dapat meningkatkan kualitas penilaian dan keputusan dalam situasi ketidakpastian.
January 12, 2019
January 12, 2019
January 12, 2019
January 12, 2019
January 12, 2019
January 12, 2019
Comments (0)