ملاحظه‌ای در مورد سنجش دقت پیش‌بینی‌های انتخاباتی

ملاحظه‌ای در مورد سنجش دقت پیش‌بینی‌های انتخاباتی

نظرسنجی‌های رسمی و غیررسمی متعددی در هفته‌ها و روزهای قبل از انتخابات میزان مشارکت و رای‌های دو نامزد پیش‌رو را تخمین زدند و الان وقت ارزیابی دقت آن‌‌ها پس از وقوع (Ex-Post) است. در بین نظرسنجی‌هایی که در اختیار عموم بود، همانند یکی دو دوره پیش ایسپا جزو موفق‌ترین‌ها بود و کل رای‌ها و درصد نامزدها را خیلی نزدیک پیش‌بینی کرده بود٬ عجیب هم نیست چون این موسسه نمونه بزرگ از داخل کشور می‌گیرد و انگیزه‌ سیاسی هم ندارد که نتایج را به سمت یک نامزد بایاس نشان دهد.

در این بین یک نکته را در ارزیابی «دقت» پیش‌بینی‌ها نباید فراموش کرد. فرض کنیم نظرسنجی یا شخصی پیش‌بینی کرده بود که آقای روحانی ۶۴ درصد رای می‌آورد و در عمل این رای ۵۷ درصد شد. این پیش‌بینی قطعا یک امتیاز مثبت بابت پیش‌بینی «برنده شدن» روحانی می‌گیرد. ولی به لحاظ «دقت نقطه‌ای» خطایش بزرگ‌تر از چیزی است که به نظر می‌رسد، چون بازه محتمل برای «کل رای‌‌ها» و «سهم نامزدها» یک بازه بی‌نهایت نیست. ضمن این‌که توزیع احتمال درصدها یک توزیع یک‌‌نواخت نیست. مثلا هیچ کس انتظار ندارد که در یک انتخابات معمول مثل ۱۳۹۶ میزان کل رای در کشور ۲۵ میلیون (زیر حد پایین) یا ۵۰ میلیون (بالای حد بالا) باشد. یا کسی انتظار ندارد که رای آقای روحانی ۷۰٪ یا ۳۵٪ باشد.

برخی از این بازه‌های محتمل و توزیع احتمالات رای‌ها توسط قوانین شبه‌-فیزیکی (مثل جمعیت فعال کشور) و برخی دیگر بر اساس تخمین واریانس پای‌گاه رای جناح‌های مختلف از انتخابات قبلی قابل تعیین هستند. حال اگر بخواهیم دقت پیش‌بینی ۶۴٪ را بسنجیم نباید بگوییم فقط ۷٪ خطا داشته است. از نظر من این نظرسنجی چیزی حدود ۲۵٪ خطا داشته است چون بازه محتمل رای روحانی ۴۰٪ تا ۶۵٪ بود (و تازه احتمال رای بین ۴۸-۶۰ درصد بالاتر بود).

حال اگر دقت نظرسنجی در این حد باشد و ما موسسه/فردی باشیم که در همه انتخابات پیش‌بینی ارائه می‌کنیم عجیب نیست که از هر ۴-۵ انتخابات٬ در یکی‌اش پیش‌بینی خیلی نزدیک به واقعیت ارائه کرده باشیم. شبیه موضوعی که آماردان‌ها اخیرا به آن p-hacking می‌گویند و می‌گوید اگر یک آزمایش را به اندازه کافی تکرار کنیم بلاخره «یک بار» از یک نمونه نتیجه معنی‌دار خواهیم گرفت، بدون این‌که اصل توزیع احتمال متغیر تصادفی ( که شامل همه آزمایش‌ها است) واقعا در بازه معنی‌دار باشد.

@hamed_ghoddusi تماس با نویسنده
@hamedghoddusi کانال یک لیوان چای داغ٬ نوشته‌های حامد قدوسی