نگاهی به نظریه بازی، بخش دوم
این نوشته دارای پیشنیاز است
در بخش قبل یاد گرفتیم که زندگی پر از بازیهای استراتژیکه؛ از رانندگی گرفته تا مذاکرات تجاری و رقابتهای سیاسی. تئوری بازی نشون میده که تصمیمهای ما، حتی توی سادهترین موقعیتها، تحت تأثیر رفتار دیگرانه. این نظریه هم در تضادها مثل بازی تطبیق سکه، هم در همکاریها مثل بازی رانندگی (که هر دو بازی در بخش قبلی توضیح داده شد) کاربرد داره. حتی دولتها و شرکتها هم ازش برای طراحی مزایدهها و مدیریت رقابتهای اقتصادی استفاده میکنن. 🎯
حالا در این قسمت، با بازیهایی مثل «بازی چیکن» و «نبرد علایق» درمییابیم که تصمیمگیری در زندگی مثل یه بازی جذاب و پر از ریسک و شگفتی است 🎲🚀و با مثالهای بامزه و داستانهای جالب، راز تعادل نش و هنر معامله رو کشف میکنیم.
ترجیحات آشکارشده
ترجیحات آشکارشده (Revealed Preference)
برای کنار اومدن همزمان با همکاری و تضاد، نیاز داریم انگیزه بازیکنها رو بهتر از این که فقط بگیم «دوست دارن ببرن و از باختن بدشون میآد» توصیف کنیم. به همین خاطر، اقتصاددانها ایدهای به اسم مطلوبیت (Utility) رو ابداع کردن. این مفهوم به بازیکنها اجازه میده که برای هر نتیجه ممکن، یه ارزش عددی اختصاص بدن.
توی دنیای کسبوکار، معمولاً خط قرمز نهایی همون سوده 💵. ولی اقتصاددانها خوب میدونن که آدمها همیشه به دنبال پول بیشتر نیستن؛ اهداف انسانها پیچیدهتر از این حرفهاست. پس نمیشه مطلوبیت رو فقط با پول یکی دونست.
در تئوری بازی، ما سعی نمیکنیم توضیح بدیم چرا آلیس و باب اینجوری رفتار میکنن. به جای این که دنبال یه نظریه توضیحی باشیم، به یه نظریه توصیفی قانع میشیم. این نظریه فقط میگه که اگر آلیس یا باب قبلاً یه کاری رو انجام داده باشن، ولی حالا برنامه داشته باشن که در آینده کاری کاملاً متناقض انجام بدن، این رفتار ناسازگار به حساب میاد.
هدف در تئوری بازی اینه که تصمیماتی که آلیس و باب میگیرن (یا احتمالاً میگیرن) وقتی با کسی تعامل ندارن، مشاهده بشه و از اونجا نتیجه بگیریم که تو یه بازی و در تعامل با همدیگه چطور رفتار خواهند کرد.
با فرضهای نهچندان سختگیرانه، میشه نشون داد که رفتار سازگار همون رفتاریه که هدفش بیشینهسازی ارزش یه چیزیه. که به چیز به طور کلی میگیم مطلوبیت یا سود (Utility).
اگه بخوایم رفتار آلیس رو پیشبینی کنیم، نیاز داریم که بتونیم مطلوبیتش رو روی یه مقیاس اندازهگیری کنیم، درست مثل دماسنجی که دما رو اندازه میگیره. اینجاست که واحد اندازهگیری مطلوبیت به اسم یوتیل (Util) وارد میشه.
فون نویمان برای حل این مشکل یه نظریه رو ارائه داد: اندازهگیری مطلوبیت با بررسی ریسکهایی که آلیس مایله برای به دست آوردن چیزی بپذیره.
پل ساموئلسون «ترجیحات آشکار شده» رو اینجوری تعریف میکنه:
"مطلوبیت (Utility) با میل و خواسته افراد ارتباط دارد و وابسته به آن است. استدلال شده است که امیال را نمیتوان بهطور مستقیم اندازهگیری کرد، بلکه تنها میتوان آنها را بهصورت غیرمستقیم و از طریق پدیدههای بیرونی که ایجاد میکنند، سنجید. در مواردی که اقتصاد عمدتاً با آنها سر و کار دارد، این اندازهگیری از طریق قیمتی که یک فرد مایل به پرداخت آن برای تحقق یا ارضای میل خود است، انجام میشود."
پل ساموئلسون
اگه بخوایم تئوری نویمان و ساموئلسون رو بهتر درک کنیم میتونیم با مثال توضیحش بدیم:
فرض کنین آلیس میخواد یه قرار عاشقانه با باب رو ارزیابی کنه. سوال اینه که چند یوتیل باید به این قرار نسبت بدیم؟
- اول باید یه مقیاس برای مطلوبیت تعیین کنیم. مثل دماسنج سلسیوس، که صفر برای نقطه انجماد و ۱۰۰ برای نقطه جوش آبه، باید بدترین نتیجه ممکن رو ۰ یوتیل و بهترین نتیجه رو ۱۰۰ یوتیل در نظر بگیریم.
- حالا یه سری بلیت بختآزمایی فرضی به آلیس میدیم که فقط دو جایزه دارن:
- بهترین نتیجه (۱۰۰ یوتیل)
- بدترین نتیجه (۰ یوتیل)
- با افزایش احتمال بردن بهترین نتیجه توی این بلیتها، از آلیس میپرسیم آیا حاضره بلیت رو با قرارش با باب عوض کنه یا نه.
- وقتی احتمال برنده شدن بهترین نتیجه به ۷۵٪ رسید و آلیس گفت: «باشه، این بلیت رو میخوام»، طبق نظریه فون نویمان، اون قرار با باب ۷۵ یوتیل ارزش داره.
وقتی بعضی افراد با همین روش مبالغ پولی رو ارزیابی میکنن، ممکنه به هر دلار اضافی همون تعداد یوتیل رو نسبت بدن. به این افراد میگیم خنثی نسبت به ریسک (Risk Neutral) یعنی فرد یا بنگاه اقتصادی نسبت به ریسک بیتفاوته. و فقط به ارزش مورد انتظار (Expected Value) یک سرمایهگذاری یا تصمیم مالی توجه میکنه، بدون اینکه نگران سطح ریسک آن باشه.
اما اونایی که هر دلار اضافی براشون مطلوبیت کمتری نسبت به دلار قبلی داره، به عنوان ریسکگریز (Risk Averse) شناخته میشن. ریسکگریز به فرد یا نهادی گفته میشه که در تصمیمگیریهای مالی و اقتصادی، گزینههایی که ریسک کمتری دارن، ترجیح میده حتی اگه بازدهی مورد انتظار گزینههای پرریسک بیشتر باشد.
حالا باب مامور بیمه شده و به آلیس پیشنهاد میده که عمارت لوکسش تو بورلیهیلز رو در برابر آتشسوزی 🔥 بیمه کنه. آلیس اگه این پیشنهاد رو رد کنه، وارد یه جور بخت آزمایی میشه:
• اگه خونه نسوزه: خونه رو داره و پولی رو که قرار بود بابت بیمه بده، حفظ میکنه.
• اگه خونه بسوزه: فقط همون پول بیمه براش میمونه و خونه از دست میره.
از اون طرف، اگه خونه رو بیمه کنه، ارزش خونهاش رو (منهای هزینهی بیمه) قطعی خواهد داشت و دیگه استرس از دست دادن کامل خونه رو نداره.
حالا، اگه تصمیم باب (برای ارائهی این پیشنهاد) و تصمیم آلیس (برای قبول کردنش) منطقی باشه، یعنی باب فکر میکنه این بختآزمایی برای اون بهتر از یه حالت صفر-صفره، اما آلیس برعکس فکر میکنه و ترجیح میده از ریسک دوری کنه. همین ماجرا نشون میده که:
1. قمار کردن، اگه ریسکها حسابشده باشن، میتونه منطقی باشه.
2. آدمهای منطقی میتونن نگرشهای مختلفی به ریسک داشته باشن. توی صنعت بیمه، شرکتهای بیمه معمولاً خنثی نسبت به ریسک هستن، ولی کسایی که بیمه میخرن معمولاً ریسکگریزن، هرچند میزان این ریسکگریزی متفاوته.
اقتصاددانها میگن ریسکگریزی فقط یه موضوع سلیقهایه، مثل اینکه آلیس بستنی شکلاتی رو به وانیلی ترجیح بده یا نه. ممکنه اون تصمیم بگیره ۱۰۰۰ دلار برای بیمه خونهاش بده، یا شاید هم نده.
اما فیلسوفهایی مثل جان رالز میگن که منطقیه که آدمها ریسکگریز باشن، چون این حرف در راستای ایدههای فلسفیشونه. یه اشتباه رایج اینه که فکر کنیم آدمهای ریسکگریز از خود قمار خوششون نمیاد. ولی طبق نظریه فون نویمان، آدمها باید به خودِ عمل قمار بیتفاوت باشن. مثل یه کشیشی که خونشو بیمه میکنه: قمار نمیکنه چون عشق قمار داره، بلکه فقط وقتی قمار میکنه که فکر کنه شانس به نفعشه.
بیمه یعنی یه معامله بین آدمهایی که به ریسک نگاه متفاوت دارن. یکی (باب) ریسک رو یه فرصت میبینه و یکی (آلیس) دنبال امنیت میگرده.
فیلسوفهایی مثل جان رالز میگن که آدمها ذاتاً ریسکگریز هستن و این دیدگاهشون از فلسفهشون میاد. یعنی چی؟ یعنی منطقیه که آدمها ترجیح بدن از خطر دوری کنن و امنیت داشته باشن.
خیلیها فکر میکنن آدمهای ریسکگریز از قمار بیزارن و هیچوقت واردش نمیشن. ولی فون نویمان میگه:
✅ آدمها نباید از خودِ قمار متنفر باشن یا عاشقش باشن؛ باید نسبت بهش بیتفاوت باشن!
فرض کنین یه کشیش خونهشو بیمه میکنه.
این یعنی اون داره یه جورایی قمار میکنه، چون پول میده که در برابر یه اتفاق نامعلوم (مثل آتشسوزی) محافظت بشه.ولی دلیلش عشق به قمار نیست. اون فقط وقتی وارد این معامله میشه که فکر کنه شانس به نفعشه و امنیت بیشتری داره.
بیمه در اصل یه معامله بین دو جور آدمه:
باب: به ریسک به چشم یه فرصت نگاه میکنه.
آلیس: دنبال امنیت و خیال راحت میگرده.
باب میگه: من حاضرم ریسک رو قبول کنم، چون اگه اتفاقی نیفته، سود میکنم.
آلیس میگه: من حاضرم پول بدم، چون ترجیح میدم مطمئن باشم چیزی رو از دست نمیدم.
مثل اندازهگیری دما، تو انتخاب صفر و واحد، روی مقیاس مطلوبیت برای آلیس هم آزادیم. میتونیم، مثلاً، به بدترین نتیجه ۳۲ یوتیل و به بهترین نتیجه ۲۱۲ یوتیل بدیم. حالا اگه قرار بود یه قرار ملاقات با باب توی مقیاس قدیمی ۷۵ یوتیل ارزش داشته باشه، تو این مقیاس جدید ۱۶۷ یوتیل ارزش پیدا میکرد؛ درست مثل تبدیل دما از سانتیگراد به فارنهایت.
تا حالا تو بازیهای سادهای که دیدیم، آلیس و باب فقط دو نتیجه برای ارزیابی دارن: برنده شدن و بازنده شدن. ما آزادیم که هر عددی برای این نتایج انتخاب کنیم، به شرطی که مطلوبیت بردن همیشه از باختن بیشتر باشه.
برای سادگی، اگه به بردن +۱ یوتیل و به باختن -۱ یوتیل بدیم، به جدول امتیازدهی شکل زیر میرسیم.
توی جدول Matching Pennies در شکل، جمع امتیازهای هر خونه همیشه صفره. توی بازیهایی که صرفاً رقابتی هستن، میتونیم همیشه این کارو کنیم. به این بازیها جمع صفر میگیم.
اما بازیهایی که تو زندگی واقعی بازی میکنیم، به ندرت صرفاً رقابتی یا جمع صفر هستن. مثلاً تو زندگی، اگه باب تو یه معامله سود کنه، ممکنه آلیس هم سود برده باشه. زندگی بیشتر شبیه یه بازی «برد-برد»ه، جایی که هم بردن و هم خوشحالی بقیه، به جای رقابت، ما رو جلو میبره.
بازی چیکن
بازی چیکن (Chicken Game) 🚗💥
یکی از لحظههای ماندگار سینما در فیلم قدیمی Rebel without a Cause هست که توش جیمز دین افسانهای نقش یه نوجوان یاغی و جذاب رو بازی میکنه. بازی چیکن (chicken) دقیقاً از صحنهای تو همین فیلم الهام گرفته شده، جایی که دو پسر با ماشینهاشون به سمت لبه پرتگاه میرن تا ببینن کدومشون زودتر جا میزنه و ترمز میکنه. برتراند راسل، فیلسوف معروف، از این داستان به عنوان استعارهای برای جنگ سرد استفاده کرد.
اما من ترجیح میدم بازی چیکن رو با یه داستان سادهتر توضیح بدم. فرض کنیم آلیس و باب، دو راننده میانسال، تو یه کوچه باریک دارن به هم نزدیک میشن. کوچه اونقدر باریکه که دو تا ماشین نمیتونن بدون اینکه یکی ترمز کنه، از کنار هم رد بشن. حالا استراتژیهای ممکن برای آلیس و باب دو تاست:
- آروم برن (ترمز کنن)
- با سرعت ادامه بدن (جا نزنن)
داستان خیابون باریک، برخلاف داستان پرتگاه، جنبه رقابتی کمتری داره. تو بازی چیکن، علاوه بر رقابت، آلیس و باب یه هدف مشترک هم دارن: پیشگیری از یه فاجعه برای هر دو نفرشون. این ویژگیه که بازی چیکن رو از بازیهای جمع صفر، مثل Matching Pennies، متمایز میکنه.
حالا که حرف از چیکن شد، بریم سراغ یه بازی معروف دیگه:
نبرد علایق
نبرد علایق (Battle of the Sexes) 💑🎭
این بازی از کلیشههایی قدیمیتر از جنبش آزادی زنان الهام گرفته. تصور کن آلیس و باب تازه ازدواج کردن و ماهعسلشون رو تو نیویورک میگذرونن. صبح سر صبحونه، بحثشون میشه که شب برن به:
- مسابقه بوکس (انتخاب باب)
- نمایش باله (انتخاب آلیس)
درسته که علایقشون فرق میکنه، ولی یه نکته مشترک هست: هر دو میخوان با هم باشن. وسط جر و بحث، تو شلوغی نیویورک از هم جدا میشن. حالا هر کدوم باید تنها و مستقل تصمیم بگیرن که شب کجا برن.
داستان نبرد علایق روی جنبههای همکاری آلیس و باب تاکید داره، چون هر دو میخوان شب رو با هم بگذرونن. اما یه چالش رقابتی هم این وسط وجود داره.
جان نش
جان نش برای رفع این مشکل راه حلی ارائه داد. شاید شما هم جان نش رو بهخاطر فیلم ذهن زیبا بشناسید. نش در دوران کارشناسی، پایههای تئوری چانهزنی منطقی رو بنا گذاشت. تو دوران تحصیلات تکمیلی، با ارائه مفهوم تعادل نش، که امروز بهعنوان یکی از ارکان اساسی نظریه بازیها شناخته میشه، انقلابی بهپا کرد.جان نش مسائل بزرگی رو تو ریاضیات محض حل کرد، اونم با روشهایی چنان خلاقانه که بهسرعت جایگاهش رو بهعنوان نابغه ریاضی درجهیک تثبیت کرد. اما بعدش، نش به بیماری اسکیزوفرنی مبتلا شد؛ بیماریای که نهتنها حرفهاش رو نابود کرد، بلکه باعث شد بیش از ۴۰ سال به حاشیه بره و حتی تو محوطه دانشگاه پرینستون، گاهی به چشم تمسخر نگاهش کنن. اما داستان نش اینجا تموم نمیشه. اون بهطور معجزهآسایی از این بیماری بهبود پیدا کرد و تو سال ۱۹۹۴ جایزه نوبل اقتصاد رو برد.
خود نش یه جمله تأملبرانگیز درباره زندگیاش داره:
"اگه اون جنون نبود، شاید منم فقط یکی از اون میلیونها آدمی بودم که بدون هیچ ردپایی روی این سیاره، زندگی میکنن و میمیرن."
جان نش
اما نیازی نیست نابغهای عجیبوغریب باشید تا تعادل نش رو درک کنید. این مفهوم بر اساس این ایده ساده است که بازیکنان منطقی در هر بازی به دنبال حداکثر کردن میانگین پاداش خودشون هستن.
تعادل نش
اگر هر بازیکن استراتژی طرف مقابلش رو بدونه، کار خیلی ساده میشه.
تعادل نش به این معنیه که بازیکنان همزمان بهترین جواب به انتخابهای همدیگه رو میدن.
مثلاً تو بازی چیکن دو تعادل داریم:
- (آهسته، تند)
- (تند، آهسته)
تعادل نش از دو دیدگاه مهمه:
- بازیکنان ایدهآل منطقی (ideally rational players): فرض میکنیم بازیکنان منطقی هستن و با استدلال منطقی به یه راهحل میرسن.
- فرایند تکاملی (evolutionary process): در نظر میگیریم بازیکنان از طریق آزمایش و خطا به یه راهحل میرسن.
قدرت پیشبینی نظریه بازیها از توانایی جابهجایی بین این دو دیدگاه ناشی میشه. حتی وقتی اطلاعاتی درباره فرایند تکاملی نداریم، میتونیم با تحلیل رفتار بازیکنان منطقی، نتیجه نهایی رو پیشبینی کنیم.
دفاع از تعادل نش خودش یه جور استدلال دایرهایه:
- چرا آلیس اینطوری بازی میکنه؟ چون باب اینطوری بازی میکنه.
- چرا باب اینطوری بازی میکنه؟ چون آلیس اینطوری بازی میکنه.
این حلقه به نظر منطقی نیست، اما جایگزینش اینه که وارد یه سلسله بینهایت بشیم:
آلیس فکر میکنه که باب فکر میکنه که آلیس فکر میکنه که باب فکر میکنه… و همینطور ادامه داره.
تعادل نش مثل یه میانبر عمل میکنه و این سری بینهایت رو قطع میکنه.
- اگه بازیکنان شروع کنن به فکر کردن درباره اینکه بقیه بازیکنان چی فکر میکنن، هر استراتژی دیگهای نهایتاً نابود میشه.
- پس اگه باورهای بازیکنان درباره برنامههای همدیگه سازگار باشه، باید توی تعادل باشن.
بهعبارت سادهتر، تعادل نش جاییه که همه بازیکنان باور دارن بقیه منطقی عمل میکنن و این باورها به خودشون برمیگردن.
برداشت تکاملی از تعادل نش
برداشت تکاملی از تعادل نش (Evolutionary interpretation)
اوایل، نظریهپردازان بازیها بهقدری شیفتهی برداشت عقلانی از تعادل نش بودند که برداشت تکاملی تقریباً کاملاً نادیده گرفته شد. حتی ویراستاران مجلهای که نش مقالهاش رو در اون منتشر کرده بود، بخشهایی رو که دربارهی این برداشت نوشته بود حذف کردن و گفتن که «بیاهمیت» هستن!
اما اگه برداشت تکاملی نادرست بود، نظریه بازیها نمیتونست رفتار مردم عادی رو پیشبینی کنه.
برداشت تکاملی تعادل نش رو از زاویهای متفاوت نگاه میکنه:
- در فرآیندهای سادهی سازگاری، مطلوبیتها (payoffs) نشاندهندهی میزان سازگاری یا موفقیت بازیکنان هستن.
- استراتژیهایی که موفقتر باشن، باقی میمونن، و استراتژیهای ناکارآمد حذف میشن.
- این فرآیند فقط وقتی متوقف میشه که به تعادل نش برسیم، چون توی این نقطه همهی استراتژیهای باقیمانده در بهترین شرایط ممکن خودشون قرار دارن.
خلاصه و جمع بندی
مفاهیمی که بعد از خواندن این مطلب باید یادگرفته باشید:
- مطلوبیت: برای درک بهتر ارزش هر تصمیم مقیاسی به نام مطلوبیت یا utility به میان آمد. مطلوبیت با میل و خواسته افراد ارتباط دارد و وابسته به آن است. این اندازهگیری از طریق قیمتی که یک فرد مایل به پرداخت آن برای تحقق یا ارضای میل خود است، انجام میشود.
- بیتفاوت یا خنثی نسبت به ریسک: اگر فرد یا بنگاه اقتصادی نسبت به ریسک بیتفاوت باشند خنثی نسبت به ریسک (Risk Neutral) هستند. و تنها به ارزش مورد انتظار (Expected Value) یک سرمایهگذاری یا تصمیم مالی توجه میکنند. و نگرانی بابت سطح ریسک ندارند
- ریسک گریز: اگر فرد یا بنگاه اقتصادی برای پرداخت هر دلار اضافی مطلوبیت کمتری نسبت به دلار قبلی داشته باشند، به عنوان ریسکگریز (Risk Averse) شناخته میشوند. این افراد در تصمیمگیریهای مالی و اقتصادی، گزینههایی که ریسک کمتری دارند، را حتی اگه بازدهی مورد انتظار گزینههای پرریسک بیشتر باشد، ترجیح میدهند.
- بازی چیکن یا بزدل: بازی چیکن یک مدل معروف در تئوری بازیها است که رقابت و ریسک را نشان میدهد. این بازی معمولاً برای توصیف موقعیتهایی استفاده میشود که دو طرف تصمیمی خطرناک میگیرند، ولی هیچکدام قصد عقبنشینی ندارند تا ترسو یا بزدل (چیکن) خوانده شوند و بازنده به نظر برسند.
- بازی نبرد علایق: نبرد علایق (Battle of the Sexes) یک بازی معروف در نظریه بازیهاست که در آن دو نفر (مثلاً یک زوج) قصد گذران وقت با یک دیگر را دارند اما، هر کدام سلایق متفاوتی دارند. چالش اصلی این است که چطور روی یک برنامه توافق کنند تا همزمان هم از با هم بودن لذت ببرند و هم علاقهی خود را دنبال کنند. این بازی نشون میدهد که همکاری میتواند همراه با رقابت باشد؛ یعنی در عین حال که هر دو یک هدف مشترک دارند (با هم بودن)، سلیقههای متفاوتی دارند.
- تعادل نش: تعادل نش به وضعیتی در بازیهای استراتژیک گفته میشود که در آن هر بازیکن بهترین پاسخ ممکن به استراتژیهای سایرین را انتخاب کرده است. به عبارت سادهتر، وقتی همه بازیکنان تصمیمهای خود را به گونهای اتخاذ کردهاند که هیچکس با تغییر یکجانبه استراتژی خود نمیتواند سود بیشتری کسب کند، به آن تعادل نش گفته میشود.
- تعادل نش میتواند به دو صورت اتفاق بیوفتد:
- با فرض بازیکنان ایدهآل منطقی که تصمیم عقلانی (عقلایی) میگیرند.
- با در نظر گرفتن یک فرایند تکاملی از طریق آزمون و خطا.







