در دانشگاه استیونس نیوجرسی اقتصاد درس میدهم. حوزه تخصصم اقتصاد خرد کاربردی، اقتصاد انرژی و منابع طبیعی، مدیریت ریسک و کنترل بهینه تصادفی است. به علوم انسانی هم علاقهمندم. مسایل توسعه و سیاستگذاری ایران را دنبال میکنم و گاهی چیزهایی مینویسم.
ملاحظهای در مورد سنجش دقت پیشبینیهای انتخاباتی
ملاحظهای در مورد سنجش دقت پیشبینیهای انتخاباتی
نظرسنجیهای رسمی و غیررسمی متعددی در هفتهها و روزهای قبل از انتخابات میزان مشارکت و رایهای دو نامزد پیشرو را تخمین زدند و الان وقت ارزیابی دقت آنها پس از وقوع (Ex-Post) است. در بین نظرسنجیهایی که در اختیار عموم بود، همانند یکی دو دوره پیش ایسپا جزو موفقترینها بود و کل رایها و درصد نامزدها را خیلی نزدیک پیشبینی کرده بود٬ عجیب هم نیست چون این موسسه نمونه بزرگ از داخل کشور میگیرد و انگیزه سیاسی هم ندارد که نتایج را به سمت یک نامزد بایاس نشان دهد.
در این بین یک نکته را در ارزیابی «دقت» پیشبینیها نباید فراموش کرد. فرض کنیم نظرسنجی یا شخصی پیشبینی کرده بود که آقای روحانی ۶۴ درصد رای میآورد و در عمل این رای ۵۷ درصد شد. این پیشبینی قطعا یک امتیاز مثبت بابت پیشبینی «برنده شدن» روحانی میگیرد. ولی به لحاظ «دقت نقطهای» خطایش بزرگتر از چیزی است که به نظر میرسد، چون بازه محتمل برای «کل رایها» و «سهم نامزدها» یک بازه بینهایت نیست. ضمن اینکه توزیع احتمال درصدها یک توزیع یکنواخت نیست. مثلا هیچ کس انتظار ندارد که در یک انتخابات معمول مثل ۱۳۹۶ میزان کل رای در کشور ۲۵ میلیون (زیر حد پایین) یا ۵۰ میلیون (بالای حد بالا) باشد. یا کسی انتظار ندارد که رای آقای روحانی ۷۰٪ یا ۳۵٪ باشد.
برخی از این بازههای محتمل و توزیع احتمالات رایها توسط قوانین شبه-فیزیکی (مثل جمعیت فعال کشور) و برخی دیگر بر اساس تخمین واریانس پایگاه رای جناحهای مختلف از انتخابات قبلی قابل تعیین هستند. حال اگر بخواهیم دقت پیشبینی ۶۴٪ را بسنجیم نباید بگوییم فقط ۷٪ خطا داشته است. از نظر من این نظرسنجی چیزی حدود ۲۵٪ خطا داشته است چون بازه محتمل رای روحانی ۴۰٪ تا ۶۵٪ بود (و تازه احتمال رای بین ۴۸-۶۰ درصد بالاتر بود).
حال اگر دقت نظرسنجی در این حد باشد و ما موسسه/فردی باشیم که در همه انتخابات پیشبینی ارائه میکنیم عجیب نیست که از هر ۴-۵ انتخابات٬ در یکیاش پیشبینی خیلی نزدیک به واقعیت ارائه کرده باشیم. شبیه موضوعی که آماردانها اخیرا به آن p-hacking میگویند و میگوید اگر یک آزمایش را به اندازه کافی تکرار کنیم بلاخره «یک بار» از یک نمونه نتیجه معنیدار خواهیم گرفت، بدون اینکه اصل توزیع احتمال متغیر تصادفی ( که شامل همه آزمایشها است) واقعا در بازه معنیدار باشد.
@hamed_ghoddusi تماس با نویسنده
@hamedghoddusi کانال یک لیوان چای داغ٬ نوشتههای حامد قدوسی