دادهکاوی: دستگرمیای برای پیشبینی انتخابات
یکی از عرصههای نسبتاً تازهی سنجش افکار در سطح جهان، مطالعه و کاوش در دادههای بزرگ (Big Data) است؛ دادههایی که ابعادی حیرتآور دارند و، از این رو، مطالعهی علمیشان میتواند تصویر بسیار دقیقتری از نظرسنجیهایی عرضه کند که صرفنظر از سوگیریهای محتملشان، در بهترین حالت مبتنی بر نمونهگیریاند. کاوش در دادههای بزرگی که هر لحظه بهوسیلهی همهی آدمیان تولید میشوند، بدون آنکه ضرورتاً متأثر از این و یا آن پرسشی باشند که در نظرسنجیها مطرح میشود، و یا از فضای عمومی جامعه تأثیر بپذیرند، میتواند تصویر بسیار دقیقی از آنچه در جامعه میگذرد بهنمایش بگذارد.
بهکارگیری این دادهها در ارزیابی نتیجهی انتخابات چندیست مرسوم شدهاست؛ بهعنوان مثال، تحلیل میزان توجهی که پویش تبلیغاتی ترامپ در انتخابات ریاستجمهوری آمریکا برمیانگیخت، از طریق کاوش در دادههای بزرگی که مثلاً در شبکههای اجتماعی تولید، و یا در موتورهای جستوجو جُسته میشد، برخلاف تمام نظرسنجیهای معتبر و جز آن، بهروشنی نشان میداد ترامپ پیروز انتخابات ریاستجمهوریست و، مثلاً، شرمساری عموم پاسخدهندگان از اینکه بگویند نامزد موردنظرشان شخصی چون دونالد ترامپ است، یکی از عواملی بود که سبب میشد نتایج نظرسنجیها برآورد درستی از دیدگاه عموم مردم بهدست ندهد.
در ایران نیز، میتوان با بررسی میزان جستوجوی کلیدواژههایی مانند اسامی نامزدهای انتخابات در جستوجوگری مانند گوگل، برآورد نسبتاً دقیقتری از نتایج احتمالی انتخابات بهدست داد. پیشفرض این روش آن است که میزان علاقه برای تحصیل اطلاعات دربارهی یک نامزد، نسبت مستقیمی با توجه عمومی بیشتر بهاو دارد، و این توجه بیشتر، میتواند منجر بهرأیدادن بهوی شود. اگرچه باید تأکید کرد که ضرورتاً یک تبیین منحصربهفرد برای گرایشهای عمومی بهیک شخص خاص وجود ندارد؛ با این حال، ملاحظهی روندها و گرایشها حامل اطلاعات مفیدیست.
نکتهی مهم اینجاست که بهنظر میرسد بیشتر این جستوجوها از سوی کسانی انجام میشود که اصطلاحاً هنوز بهتصمیم قطعی نرسیدهاند؛ وگرنه هستهی سخت حامیان هر دو جناح بهتصمیم رسیدهاند، و آنهایی که خصوصاً در جناح موسوم به«چپ» هنوز مردد هستند، اگر بهروحانی رأی ندهند، اصلاً در انتخابات شرکت نخواهندکرد. باید توجه داشت که با توجه بهافزایش ضریب نفوذ اینترنت، خصوصاً در بستر تلفنهای همراه، تعمیم برآوردهای حاصل از کاوش در دادههای بزرگِ مثلاً حاصل از گوگل بهکل جامعه، احتمالاً حاشیهی خطای اندکی دارد؛ اگرچه دقت آن مشابه کشورهای توسعهیافته با ضریب نفوذ بالاتر اینترنت و فزونتربودن آگاهیهای عمومی اینترنتی نیست.
باری، نمودار ذیل، نشاندهندهی میزان جستوجوی نام چهار نامزد رقیب در گوگل، ظرف ۷ روز گذشته است: با این توضیح که رنگهای آبی و قرمز و زرد و سبز، بهترتیب مربوط بهروحانی، رییسی، قالیباف، و جهانگیریاند. چنانکه مشخص است، نقاط عطفی چون مناظرهی سوم، و یا اعلام کنارهگیری قالیباف بهسود رییسی، و یا نظیر این رویداد برای جهانگیری، بهروشنی در این نمودار قابل تشخیصاند؛ اگرچه تکانهی ناشی از کنارهگیری قالیباف بهوضوح شدیدتر از اعلام کنارهگیری جهانگیری بودهاست، که شاید ناشی از غیرمنتظرهبودن کنارهگیری اولیست. یک نکتهی دیگر هم این است که برخلاف تلاش انتحاری قالیباف برای ایراد اتهام بهتیم روحانی-جهانگیری، این قالیباف است که توجهها را در مناظرهی سوم بهخود جلب کردهاست؛ احتمالاً برای آگاهی از اینکه پروندهی ۱۳۸۴ او، که روحانی بهصورتی سربسته اشارتی بِدان داشت، از چهقرار بودهاست (برای مشاهدهی تصویر در ابعاد اصلی، اینجا را ببینید).
نکتهی مهم این است که اگرچه کنارهگیری قالیباف بخشی از نظرها را بهسوی رییسی جلب کردهاست، و میزان گرایش بهاو را طبعاً بهنحو محسوسی افزایش دادهاست، اما گرایش بهروحانی بهصورتی کاملاً مستمر در حال افزایش است. روند افزایش تدریجی آراء روحانی و، همچنین، شیب فوقالعاده مثبت گرایش بهقالیباف در حوالی مناظرهی سوم، که فوراً هم فروکش کردهاست، در روند یکماهه روشنتر است؛ با این توضیح که در روند یکماهه، اثرگذاری کنارهگیری قالیباف و جهانگیری لحاظ نشدهاست (برای مشاهدهی تصویر در ابعاد اصلی، اینجا را ببینید).
از این گذشته، بررسی دقیقتر نمودار ۷ روز گذشته نشان میدهد بخشی از آراء قالیباف، برخلاف میل محافظهکاران، بهسبد رأی روحانی رفتهاست؛ چنانکه شیب نمودار مربوط بهروحانی، پس از این کنارهگیری اندکی افزایش داشتهاست و، البته، با اعلام کنارهگیری جهانگیری نیز، اگرچه گرایش بهروحانی افزایش داشتهاست، اما بهعلت همسانی سبد رأی ایندو، افزایش چندان قابل ملاحظه نبودهاست. بهنقطهی اوج نسبی نمودار جهانگیری در لحظهی اعلام کنارهگیریاش نیز توجه کنید.
بدینترتیب، اگر نظیر این روند در روزهای آتی نیز ادامه داشتهباشد، و اتفاق خاصی نیافتد، بهاحتمال زیاد روحانی برندهی انتخابات خواهدبود؛ با این حال، این ارزیابی قطعی نیست، و کار هنوز خاتمه نیافتهاست. اگر حامیان روحانی در این فرصت باقیمانده بتوانند همین روند افزایش تدریجی را حفظ کنند و، حتا، کاری کنند یک نقطهی بیشینهی دیگر در این نمودار پدید آید، میتوان بهپیروزی روحانی امیدوارتر بود.
پیش بینی درستی بود! احسنت! :)
بررسی "داده های بزرگ" شیوه جالبی هست اما اینکه به سرچ گوگل محدودش کنیم شاید خیلی صحیح نباشه. سرچ زیاد شاید نشون دهنده خیلی چیزها میتونه باشه. مثلا گمنامی کاندیدا ها و تلاش مردم براش شناخت اون فرد