واژه

سوگند به واژه، و آن‌چه واژه می‌سازد

واژه

سوگند به واژه، و آن‌چه واژه می‌سازد

داده‌کاوی: دست‌گرمی‌ای برای پیش‌بینی انتخابات

چهارشنبه, ۲۷ ارديبهشت ۱۳۹۶، ۰۱:۲۷ ب.ظ

یکی از عرصه‌های نسبتاً تازه‌ی سنجش افکار در سطح جهان، مطالعه و کاوش در داده‌های بزرگ (Big Data) است؛ داده‌هایی که ابعادی حیرت‌آور دارند و، از این رو، مطالعه‌ی علمی‌شان می‌تواند تصویر بسیار دقیق‌تری از نظرسنجی‌هایی عرضه کند که صرف‌نظر از سوگیری‌های محتمل‌شان، در بهترین حالت مبتنی بر نمونه‌گیری‌اند. کاوش در داده‌های بزرگی که هر لحظه به‌وسیله‌ی همه‌ی آدمیان تولید می‌شوند، بدون آن‌که ضرورتاً متأثر از این و یا آن پرسشی باشند که در نظرسنجی‌ها مطرح می‌شود، و یا از فضای عمومی جامعه تأثیر بپذیرند، می‌تواند تصویر بسیار دقیقی از آن‌چه در جامعه می‌گذرد به‌نمایش بگذارد.

به‌کارگیری این داده‌ها در ارزیابی نتیجه‌ی انتخابات چندی‌ست مرسوم شده‌است؛ به‌عنوان مثال، تحلیل میزان توجهی که پویش تبلیغاتی ترامپ در انتخابات ریاست‌جمهوری آمریکا برمی‌انگیخت، از طریق کاوش در داده‌های بزرگی که مثلاً در شبکه‌های اجتماعی تولید، و یا در موتورهای جست‌وجو جُسته می‌شد، برخلاف تمام نظرسنجی‌های معتبر و جز آن، به‌روشنی نشان می‌داد ترامپ پیروز انتخابات ریاست‌جمهوری‌ست و، مثلاً، شرم‌ساری عموم پاسخ‌دهندگان از این‌که بگویند نام‌زد موردنظرشان شخصی چون دونالد ترامپ است، یکی از عواملی بود که سبب می‌شد نتایج نظرسنجی‌ها برآورد درستی از دیدگاه عموم مردم به‌دست ندهد.

در ایران نیز، می‌توان با بررسی میزان جست‌وجوی کلیدواژه‌هایی مانند اسامی نام‌زدهای انتخابات در جست‌وجوگری مانند گوگل، برآورد نسبتاً دقیق‌تری از نتایج احتمالی انتخابات به‌دست داد. پیش‌فرض این روش آن است که میزان علاقه برای تحصیل اطلاعات درباره‌ی یک نام‌زد، نسبت مستقیمی با توجه عمومی بیش‌تر به‌او دارد، و این توجه بیش‌تر، می‌تواند منجر به‌رأی‌دادن به‌وی شود. اگرچه باید تأکید کرد که ضرورتاً یک تبیین منحصربه‌فرد برای گرایش‌های عمومی به‌یک شخص خاص وجود ندارد؛ با این حال، ملاحظه‌ی روندها و گرایش‌ها حامل اطلاعات مفیدی‌ست.

نکته‌ی مهم این‌جاست که به‌نظر می‌رسد بیش‌تر این جست‌وجوها از سوی کسانی انجام می‌شود که اصطلاحاً هنوز به‌تصمیم قطعی نرسیده‌اند؛ وگرنه هسته‌ی سخت حامیان هر دو جناح به‌تصمیم رسیده‌اند، و آن‌هایی که خصوصاً در جناح موسوم به«چپ» هنوز مردد هستند، اگر به‌روحانی رأی ندهند، اصلاً در انتخابات شرکت نخواهندکرد. باید توجه داشت که با توجه به‌افزایش ضریب نفوذ اینترنت، خصوصاً در بستر تلفن‌های هم‌راه، تعمیم برآوردهای حاصل از کاوش در داده‌های بزرگِ مثلاً حاصل از گوگل به‌کل جامعه، احتمالاً حاشیه‌ی خطای اندکی دارد؛ اگرچه دقت آن مشابه کشورهای توسعه‌یافته با ضریب نفوذ بالاتر اینترنت و فزون‌تربودن آگاهی‌های عمومی اینترنتی نیست.

باری، نمودار ذیل، نشان‌دهنده‌ی میزان جست‌وجوی نام چهار نام‌زد رقیب در گوگل، ظرف ۷ روز گذشته است: با این توضیح که رنگ‌های آبی و قرمز و زرد و سبز، به‌ترتیب مربوط به‌روحانی، رییسی، قالی‌باف، و جهان‌گیری‌اند. چنان‌که مشخص است، نقاط عطفی چون مناظره‌ی سوم، و یا اعلام کناره‌گیری قالی‌باف به‌سود رییسی، و یا نظیر این روی‌داد برای جهان‌گیری، به‌روشنی در این نمودار قابل تشخیص‌اند؛ اگرچه تکانه‌ی ناشی از کناره‌گیری قالی‌باف به‌وضوح شدیدتر از اعلام کناره‌گیری جهان‌گیری بوده‌است، که شاید ناشی از غیرمنتظره‌بودن کناره‌گیری اولی‌ست. یک نکته‌ی دیگر هم این است که برخلاف تلاش انتحاری قالی‌باف برای ایراد اتهام به‌تیم روحانی-جهان‌گیری، این قالی‌باف است که توجه‌ها را در مناظره‌ی سوم به‌خود جلب کرده‌است؛ احتمالاً برای آگاهی از این‌که پرونده‌ی ۱۳۸۴ او، که روحانی به‌صورتی سربسته اشارتی بِدان داشت، از چه‌قرار بوده‌است (برای مشاهده‌ی تصویر در ابعاد اصلی، این‌جا را ببینید).

روند ۷ روزه

نکته‌ی مهم این است که اگرچه کناره‌گیری قالی‌باف بخشی از نظرها را به‌سوی رییسی جلب کرده‌است، و میزان گرایش به‌او را طبعاً به‌نحو محسوسی افزایش داده‌است، اما گرایش به‌روحانی به‌صورتی کاملاً مستمر در حال افزایش است. روند افزایش تدریجی آراء روحانی و، هم‌چنین، شیب فوق‌العاده مثبت گرایش به‌قالی‌باف در حوالی مناظره‌ی سوم، که فوراً هم فروکش کرده‌است، در روند یک‌ماهه روشن‌تر است؛ با این توضیح که در روند یک‌ماهه، اثرگذاری کناره‌گیری قالی‌باف و جهان‌گیری لحاظ نشده‌است (برای مشاهده‌ی تصویر در ابعاد اصلی، این‌جا را ببینید).

روند یک‌ماهه

از این گذشته، بررسی دقیق‌تر نمودار ۷ روز گذشته نشان می‌دهد بخشی از آراء قالی‌باف، برخلاف میل محافظه‌کاران، به‌سبد رأی روحانی رفته‌است؛ چنان‌که شیب نمودار مربوط به‌روحانی، پس از این کناره‌گیری اندکی افزایش داشته‌است و، البته، با اعلام کناره‌گیری جهان‌گیری نیز، اگرچه گرایش به‌روحانی افزایش داشته‌است، اما به‌علت هم‌سانی سبد رأی این‌دو، افزایش چندان قابل ملاحظه نبوده‌است. به‌نقطه‌ی اوج نسبی نمودار جهان‌گیری در لحظه‌ی اعلام کناره‌گیری‌اش نیز توجه کنید.

بدین‌ترتیب، اگر نظیر این روند در روزهای آتی نیز ادامه داشته‌باشد، و اتفاق خاصی نیافتد، به‌احتمال زیاد روحانی برنده‌ی انتخابات خواهدبود؛ با این حال، این ارزیابی قطعی نیست، و کار هنوز خاتمه نیافته‌است. اگر حامیان روحانی در این فرصت باقی‌مانده بتوانند همین روند افزایش تدریجی را حفظ کنند و، حتا، کاری کنند یک نقطه‌ی بیشینه‌ی دیگر در این نمودار پدید آید، می‌توان به‌پیروزی روحانی امیدوارتر بود.

۹۶/۰۲/۲۷
محمدعلی کاظم‌نظری

نظرات (۱)

براووو!
پیش بینی درستی بود! احسنت! :)

بررسی "داده های بزرگ" شیوه جالبی هست اما اینکه به سرچ گوگل محدودش کنیم شاید خیلی صحیح نباشه. سرچ زیاد شاید نشون دهنده خیلی چیزها میتونه باشه. مثلا گمنامی کاندیدا ها و تلاش مردم براش شناخت اون فرد
پاسخ:
سلامت باشید. :)

البته؛ منتها بررسی این مقوله در ایران نیاز به‌داده‌هایی داره که به‌این راحتی‌ها در دست‌رس نیست ـــ سهل است؛ تلاش برای دست‌یابی به‌آن‌ها می‌تواند موضوعی امنیتی باشد.

تبیین اطلاعاتی که ممکن است از داده‌های بزرگ استخراج کنیم کاری‌ست تخصصی، که واقعاً ادعایی در موردش ندارم؛ تنها تلاش کردم فتح‌بابی در این خصوص کرده‌باشم.

ارسال نظر

ارسال نظر آزاد است، اما اگر قبلا در بیان ثبت نام کرده اید می توانید ابتدا وارد شوید.
شما میتوانید از این تگهای html استفاده کنید:
<b> یا <strong>، <em> یا <i>، <u>، <strike> یا <s>، <sup>، <sub>، <blockquote>، <code>، <pre>، <hr>، <br>، <p>، <a href="" title="">، <span style="">، <div align="">
تجدید کد امنیتی