تعادل نش
تعادل نش (به انگلیسی: Nash equilibrium) مفهومی در نظریه بازیها است که کاربرد فراوانی در اقتصاد پیدا کرده و نام آن از جان فوربز نش گرفته شدهاست.
در تئوری بازیها، تعادل نش (به نام جان فوربز نش، که آن را پیشنهاد کرد) راه حلی از نظریه بازی است که شامل دو یا چند بازیکن میشود. در این راه حل فرض بر آگاهی هر بازیکن به راهبرد تعادل بازیکنان دیگر است، بدون وجود هیچ بازیکنی که فقط برای کسب سود خودش با تغییر استراتژی یک جانبه عمل کند. اگر هر بازیکنی استراتژی را انتخاب کنند، هیچ بازیکنی نمیتواند با تغییر استراتژی خود در حالی که نفع بازیکن دیگر را بدون تغییر نگه داشته باشد عمل کند، سپس مجموعه انتخابهای استراتژی فعلی و بهرهمندی مربوطه، تعادل نش را تشکیل میدهد.
به بیان ساده، امی و فیل در تعادل نش است، اگر امی در حال انجام بهترین تصمیمگیری که او میتواند با توجه به تصمیمگیری فیل داشته باشد و همچنین فیل بهترین تصمیمی که میتواند با توجه به تصمیمگیری امی داشته باشد. به همین ترتیب یک گروه از بازیکنان در تعادل نش است. اگر هر یک در حال انجام بهترین تصمیمگیری باشند که آنها میتوانند با توجه به تصمیمات دیگران داشته باشند، با این حال، تعادلی که نش است لزوماً به معنای بهترین بهرهوری کل برای همه بازیکنان مربوطه نمیباشد زیرا در بسیاری از موارد ممکن است تمام بازیکنان بهرهوری خود را بهبود بخشند در صورتی که چگونه بتوانند به توافق بر روی استراتژیهای مختلف از تعادل نش برسند. (به عنوان نمونه، شرکتهای تجاری رقابتی به منظور افزایش سود آنها تشکیل کارتل میدهد).
جنبه مهم تعادل نش این است که سود هر بازیکن نه تنها به استراتژی برگزیده خود بلکه به استراتژی برگزیده دیگر بازیکنان نیز ارتباط دارد.
کاربردها
مفهوم تعادل نش برای تجزیه و تحلیل نتایج اثر متقابل استراتژی چندین تصمیم گیرنده استفاده می شود. به عبارت دیگر، این راهی برای پیشبینی اینکه اگر چند نفر یا چندین مؤسسه که در تصمیم گیریهای همزمان هستند و اگر پیامدهای آن وابسته به تصمیمهای دیگران است چه نتایجی را خواهد داشت. نگرش ساده و ایده اساسی جان نش این است که اگر ما تصمیمهای تصمیم گیرندگان مختلف را به صورت جداگانه تحلیل کنیم در نتیجه نمیتوانیم نتیجه انتخابهای آنان را پیشبینی کنیم. در عوض، ما باید بپرسیم آنچه که هر کدام از بازیکنان انجام میدهد، با در نظر گرفتن تصمیم گیریهای دیگران است.
تعادل نش برای تجزیه و تحلیل شرایط دشمنانه شبیه جنگ و مسابقه تسلیحاتی به کار گرفته شدهاست، همچنین در (معمای زندانی). همچنین نحوه درگیری ممکن است از طریق اثر متقابل تکرار شده تعدیل داده شود(این به جای آن). همچنین این تئوری برای مطالعه آنچه که اندازه افراد با ترجیحات متفاوت میتواند همکاری کنند استفاده شدهاست (Battle of the sexes). و اینکه آیا آنها خطراتی را برای دستیابی به نتایج مشارکتی خواهند گرفت(Stag hunt). این تئوری برای مطالعه تصمیمگیری در مورد استانداردهای فنی گرفته شدهاست، و همچنین رخداد اجرایی بانک و بحرانهای ارزی (بازی هماهنگ). برنامههای کاربردی دیگر شامل جریان ترافیک (Wardrop's principle).، نحوه سازماندهی مزایدهها (تئوری مزایده)، نتیجه اقدامات وارد شده توسط احزاب مختلف در فرایند آموزشی و حتی ضربات پنالتی در فوتبال (سکههای مطابق)
تاریخچه
یک نسخه از مفهوم تعادل نش برای اولین بار توسط آنتونی آگوستین کورنو در نظریه خود در انحصار چند جانبه مورد استفاده قرار گرفت (۱۸۳۸). در تئوری کورنو آمده که بنگاهها برای بیشینه کردن سود خود چگونه میزان محصول بیشتر برای تولید را انتخاب میکنند. با این حال، بهترین محصول برای یک شرکت بستگی به محصولات دیگران دارد. تعادل کورنو هنگامی که هر بنگاه سود هر محصول خود را با توجه به محصولهای شرکتهای دیگر حداکثر میکند رخ میدهد.
مفهوم نوین تئوری بازی از تعادل نش بر حسب استراتژیهای ترکیبی تعریف شدهاست. جایی که بازیکنان یک توزیع احتمال از اقدامات امکانپذیر را انتخاب میکنند. مفهوم استراتژی ترکیبی تعادل نش توسط جان فون نویمان و اسکار مورگسترن در کتاب سال ۱۹۴۴ خود با عنوان نظریه بازیها و رفتار اقتصادی معرفی شدهاست. با این حال، تجزیه و تحلیل آنها برای حالت خاصی از بازی با مجموع صفر محدود بود. آنها نشان دادند که استراتژی ترکیبی تعادل نش برای هر بازی مجموع صفر مجموعه متناهی از اقدامات وجود خواهد داشت. نقش جان فوربز نش در مقاله خود در سال ۱۹۵۱ با عنوان بازیهای غیر مشارکتی به تعریف یک استراتژی مختلط تعادل نش برای هر گونه بازی با یک مجموعه متناهی از اقدامات پرداخت و ثابت کرد که حداقل یک (استراتژی مختلط) تعادل نش باید در چنین بازی وجود داشته باشد.
از آنجایی که توسعه مفهوم تعادل نش را نظریه پردازان تئوری بازی کشف کردهاند در شرایط معینی پیشبینیهای گمراهکنندهای ایجاد میکند؛ بنابراین راه حل بسیاری از مفاهیم مرتبط پیشنهاد شده (همچنین اصلاحات تعادل نش) طراحی شده که برای غلبه بر نقص درک مفهوم نش میباشد. یک موضوع خیلی مهم این است که برخی از تعادلهای نش ممکن است مبتنی بر خطراتی باشد که معتبر نیست؛ بنابراین، در سال ۱۹۶۵ توسط راینهارد سلتن پیشنهاد شده که تعادل کامل با بازی فرعی به عنوان یک بهبود که به تعادل در تهدیدهای غیر معتبر بستگی دارد را حذف کند. ضمیمههای دیگر از مفهوم تعادل نش به این پرداخته که اگر یک بازی تکرار شدهاست یا چه چیزی اتفاقی میافتد اگر یک بازی در نبوداطلاعات کامل بازی شده باشد، با این حال پس از آن اصلاحات و ضمیمهها از مفهوم تعادل نش سهم دیدگاه اصلی مفهوم نش استوار بر همهٔ مفاهیم تعادل تجزیه و تحلیل گزینههایی خواهد شد که هر بازیکن به اعتبار تصمیم سازیهای دیگران میگیرد.
تعاریف
تعریف غیررسمی
به بیان غیر رسمی، به مجموعهای از استراتژیها در صورتی که هیچ بازیکنی توسط راهبردی یک جانبهٔ در حال تغییر خود نمیتواند بهتر عمل کند تعادل نش میگویند. برای مشاهده در مورد این مفهوم، تصور کنید که هر بازیکن بیان کردهاست که استراتژیهای دیگران را میگیرد. فرض کنید که سپس هر بازیکن از خودش میپرسد: دانستن استراتژیهای بازیکنان دیگر، و بحث کردن در رابطه با استراتژیهای بازیکنان دیگر به عنوان زیر بنا تعیین میشوند، آیا با تغییر استراتژی میتوانم بهرهمند بشوم؟ اگر پاسخ هر بازیکن "بله " باشد، پس آن مجموعه استراتژیها تعادل نش نمیباشد. اما اگر هر بازیکن هر تغییری را که ترجیح نمیدهد (یا بیتفاوت است بین تغییر یا نه)، پس مجموعهای از استراتژیهای تعادل نش میباشد. به این ترتیب، هر استراتژی در تعادل نش بهترین پاسخ به تمام استراتژیهای دیگر در آن تعادل است. تعادل نش گاهی اوقات ممکن است غیر عقلایی در دیدگاه سوم شخص ظاهر میشود. دلیل این است که ممکن است که حالتی از تعادل نش که بهینه پارتو نیست رخ دهد. تعادل نش همچنین میتواند عواقب غیر عقلایی در بازیهای پی در پی به خاطر بازیکنان، ممکن است تهدیدی برای یکدیگر با حرکت غیر منطقی داشته باشند. برای مثال در تئوری بازیها تعادل کامل نش با بازی فرعی میتواند معنی دار تر به عنوان ابزار تجزیه و تحلیل باشد.
تعریف رسمی
مجموعه
- یعنی
یک بازی میتواند یا استراتژی محض یا تعادل نش ترکیبی باشد،(در تعریف اخیر استراتژیی محض آن است که به صورت تصادفی با فراوانی ثابت انتخاب شدهاست). نش نشان داد که در صورتی به ما اجازه استراتژی ترکیب شده بدهند، سپس هر بازی با تعداد محدودی از بازیکنان که در آن هر بازیکن میتواند به صورت غیر محدود از میان بسیاری از استراتژیهای کامل که حداقل یک تعادل نش میباشد انتخاب کند. وقتی نابرابری اکید در بالا نگه میدارد برای تمام بازیکنان و تمام استراتژیهای جایگزین امکانپذیر است، سپس تعادل طبقهبندی شده به عنوان یک تعادل دقیق نش میباشد. اگر در عوض، برای برخی از بازیکنان، برابری دقیقی بین x و بعضی از استراتژیهای مجموعه S وجود دارد. سپس تعادل به عنوان یک تعادل طبقهبندی شده ضعیفی از نش میباشد.
نمونهها
بازی هماهنگ
بازیکن ۲، پذیرش استراتژی A | بازیکن ۲، پذیرش استراتژی B | |
---|---|---|
بازیکن ۱، پذیرش استراتژی A | ۴٬۴ | ۱٬۳ |
بازیکن ۱، پذیرش استراتژی B | ۳٬۱ | ۳٬۳ |
مثال بازی هماهنگ نسبت بازیکن ۱ به بازیکن ۲ با هر ترکیبی را نشان میدهد. بازی هماهنگ(متقارن) معمول دو بازیکن یا دو استراتژی بازی است، به عنوان مثال ماتریس بهرهوری در سمت راست نشان داده شدهاست. بازیکنان باید در نتیجه هماهنگ، هر دو استراتژی A را اتخاذ کنند. به عنوان مثال، ۴. اگر هر دو بازیکن استراتژی B را انتخاب کنند هنوز هم در تعادل نش قرار دارند. اگر چه به هر بازیکن کمتر از بهرهوری بهینه تعلق میگیرد، هیچیک از بازیکنان انگیزهای برای تغییر استراتژی به دلیل کاهش در پرداخت فوری ندارند (از ۳ به ۱). نمونهای از بازی هماهنگ تنظیم دو فناوری موجود برای دو شرکت با محصولات سازگار است، و آنها حق انتخاب یک استراتژی برای تبدیل شدن به استاندارد بازار دارند. اگر هر دو شرکت موافق به فناوری انتخاب شده باشند، فروش بالا برای هر دو شرکت انتظار میرود. اگر شرکتها در انجام این فناوری استاندارد را قبول نکنند نتیجه کمی نتیجه فروش میباشد. هر دو روش تعادل نش از بازی . در جاده در حال رانندگی کردن هستید، و دارای انتخاب برای رانندگی در سمت چپ یا به رانندگی در سمت راست جاده باشید همچنین این هم یک بازی هماهنگ است. برای مثال بهرهمندی ۱۰۰ به معنی بدون تصادف و ۰ به معنی تصادف است، این بازی هماهنگ را میتوان با ماتریس پرداخت زیر تعریف کرد:
رانندگی در سمت چپ | رانندگی در سمت راست. | |
---|---|---|
رانندگی در سمت چپ | ۱۰۰٬۱۰۰ | ۰٬۰ |
رانندگی در سمت راست | ۰٬۰ | ۱۰۰٬۱۰۰ |
در این حالت دو استراتژی محض تعادل نش، هنگامی که هر دو به یکی از دو حالت رانندگی در سمت چپ یا در سمت راست را انتخاب کنند وجود دارد، اگر ما اعتراف استراتژیهای مختلط که در آن استراتژی محض تعادل نش است به تصادف انتخاب شده (موضوع برای بعضی احتمالات ثابت)، سپس سه تعادل نش برای موارد مشابه وجود دارد: ما برای هر دو استراتژی محض را به ترتیب در نظر میگیریم که در آن احتمالات (۰٪،۱۰۰٪) برای بازیکن نخست، (۰٪،۱۰۰٪) برای بازیکن دو،(۱۰۰٪و۰٪) برای بازیکن نخست و (۱۰۰٪و۰٪) برای بازیکن دوم. یکی دیگر از احتمالاتی که برای هر بازیکن مشخص میکنیم (۵۰٪و۵۰٪) است.
معمای زندانی
معمای زندانی مشابه ماتریس بهرهوری است که به منظور نشان دادن بازی هماهنگ به کار میرود، اما اکنون در نظر بگیرید که<C> A> D> B. چونکه C>A و D>A، هر بازیکن موقعیت خودش را با تغییر استراتژی از از استراتژی ۱ به ۲ بهبود میبخشد. بدون توجه به آنکه بازیکن دیگر چه تصمیمی میگیرد؛ بنابراین معمای زندانی یک تعادل نش است: هر دو بازیکن استراتژی ۲ (خیانت) را انتخاب میکنند. این مورد جذاب مدت زیادی ساخته شدهاست برای مطالعه این حقیقت که D>A است، (به عنوان مثال، "هر دو خیانت" است در سطح جهانی پایینتر از "هر دو وفاداری باقی میماند "). استراتژی بهینه بهطور کلی ناپایدار است، بلکه در تعادل نیست. مثال ماتریس بهرهوری معمای زندانی
همکاری | عدم | |
---|---|---|
همکاری | ۳٬۳ | ۰٬۵ |
عدم | ۵٬۰ | ۱٬۱ |
تعادل نش در ماتریس پرداخت
یک راه آسان عددی برای شناسایی تعادل نش در ماتریس بهرهمندی وجود دارد. این امر به ویژه کمککننده در بازیهای دو نفره که در آن بازیکنان بیش از دو استراتژی میگیرند میباشد. در این مورد تجزیه و تحلیل رسمی ممکن است بیش از حد طولانی شود. این قانون برای جایی که حالت مختلط است (تصادفی) استراتژیهای مورد علاقه صدق نمیکند. قانون آن به شرح زیر است: اگر شماره اولین بهرهوری، در سلولهای دوتایی، حداکثر ستون ازهر سلول است و اگر عدد دوم حداکثر ازمیان ردیف سلول باشد، سپس آن سلول نشان دهنده تعادل نش است. ما میتوانیم این قاعده برای یک ماتریس ۳ × ۳ به کار بگیریم
انتخاب A | انتخاب B | انتخاب C | |
---|---|---|---|
انتخاب A | ۰٬۰ | ۲۵٬۴۰ | ۵٬۱۰ |
انتخاب B | ۴۰٬۲۵ | ۰٬۰ | ۵٬۱۵ |
انتخاب C | ۱۰٬۵ | ۱۵٬۵ | ۱۰٬۱۰ |
با استفاده از این قانون، ما خیلی سریع (خیلی سریع تر از تجزیه و تحلیل رسمی) میتوانیم ببینیم که سلولهای تعادل نش (B,A)، (A,B) و (C,C) هستند. درواقع، برای سلول (B,A) امتیاز ۴۰ درستون اول و امتیاز ۲۵ برای ردیف دوم حداکثر است. برای سلول (A,B) امتیاز ۲۵ درستون دوم و امتیاز ۴۰ برای ردیف اول حداکثر است. مشابه برای سلول (C,C). برای سلولهای دیگر، یا یکی یا هردوی اعضای دوتایی حداکثر در سطر و ستون مربوطه نیستند.
پایداری
مفهوم پایداری، در تجزیه و تحلیل بسیاری از انواع تعادل مفید است، همچنین میتواند برای تعادل نش استفاده شود. تعادل نش برای بازی استراتژی ترکیبی پایدار است اگر یک تغییر کوچک (بهطور خاص، تغییر بینهایت کوچک) در احتمال وقوع برای یک بازیکن باعث تغییر موقعیت آن به دو حالت میشود:
- بازیکنی که تغییری نکرد هیچ استراتژی بهتری در شرایط مالی جدید ندارد؛
- بازیکنی که تغییر انجام میدهد در حال حاضر با استراتژی به شدت بدتر بازی میکند؛
اگر این موارد هر دو را ملاقات نمود، سپس بازیکن با تغییر کوچک در استراتژی ترکیبی خود فوراً به تعادل نش باز خواهد گشت. تعادل گفته شده با ثبات میباشد. اگر شرط اول برقرار نباشد سپس تعادل ناپایدار است. اگر فقط شرط نخست برقرار باشد سپس احتمالاً تعداد نامحدود از استراتژیهای بهینه برای بازیکنی که تغییر کرده وجود دارد. جان نش نشان داد که وضعیت دوم که در طیف وسیعی از بازی به خوبی تعریف شده نمیتواند به وجود بیاید. در بازی «رانندگی» مثال بالا هر دو تعادل پایدار و ناپایدار وجود دارد. تعادل شامل استراتژیهای ترکیبی با احتمال ۱۰۰ ٪ پایدار میباشند. اگر هر دو بازیکن کمی احتمالات خودشان را تغییر بدهند، و حریف خود هیچ دلیلی برای تغییر استراتژی خود در عوض نداشته باشد. تعادل (۵۰ ٪، ۵۰ ٪) ناپایدار است. اگر هر دو بازیکن احتمالات خود را تغییر بدهند و سپس دیگر بازیکنان بلافاصله یک استراتژی بهتر را از بین (۰ ٪، ۱۰۰ ٪) یا (۱۰۰ ٪، ۰ ٪) میگیرند. پایداری در کاربردهای عملی از تعادل نش بسیار مهم است، زمانی که استراتژی ترکیبی از هر بازیکن کاملاً ناشناخته است، اما باید از توزیع آماری در اقدامات خود در بازی استنتاج کرد. در این حالت تعادل ناپایدارند بسیار بعید است که در عمل به وجود آیند، از آنجا که در هر دقیقه تغییر در سهم هر استراتژی دیده میشود منجر به تغییر در استراتژی و شکست تعادل میشود. تعادل نش تنها بر حسب انحرافات یک جانبه، پایداری را تعریف میکند. در بازیهای مشارکتی ایده قانعکننده کافی نیست. تعادل قوی نش برای انحرافات با هر اتحاد امکانپذیری اجازه میدهد. بعبارت دیگر، تعادل قوی نش هنگامی تعادل نش است که در آن هیچ اتحادی نمیباشد، در نظر گرفتن اقداماتی که خود به عنوان مکمل داده میشود، با همکاری میتوان منافع تمام اعضا را منحرف ساخت. با این حال، مفهوم نش قوی، گاهی خیلی قوی تصور شدهاست که در محیط برای برقراری ارتباط خصوصی نامحدود اجازه میدهد. در حقیقت، تعادل قوی نش میتوان بهینه پارتو باشد. در نتیجه این شرایط، نش قوی تقریباً هرگز وجود ندارد. تعادل نش اصلاح شده معروف به تعادل نش ضد اتحاد (CPNE) هنگامی رخ میدهد که بازیکن نمیتواند بهتر عمل کند حتی اگر به آنها اجازه برقراری ارتباط و ایجاد «خود اجرا درآوردن» توافق برای منحرف شدن را بدهند. هر استراتژی مرتبط با حمایت شده توسط تسلط همهجانبه تکرار شده که بر روی مرز پارتو میباشد (CPNE) است. علاوه بر این، ممکن است برای یک بازی داشتن تعادل نش که انعطاف در برابر ائتلافها کمتر از یک اندازه مشخص شده باشند. (CPNE) مرتبط با تئوری مرکزی است.
پیش آمد
اگر بازی دارای یک تعادل نش منحصربهفرد است و در میان بازیکنان تحت شرایط خاصی انجام میشود، بنابراین مجموعه استراتژی تعادل نش تصویب شده خواهد بود. شرایط کافی برای تضمین اینکه تعادل نش در حال بازی شدن است عبارت اند از:
- بازیکنان تمام قدرت خود برای حداکثر کردن بهرهوری مورد انتظار خود در بازیهای مورد انتظار انجام میدهند؛
- بازیکن بی نقص در اجرای بازی هستند؛
- بازیکنان هوش کافی برای استنتاج راه حل دارند؛
- بازیکنان از استراتژی تعادلی برنامهریزی شده توسط بازیکنهای دیگر با خبرند؛
- بازیکنان بر این باورند که انحراف در استراتژی خود باعث انحراف هر بازیکن دیگر نخواهد شد؛
- شناخت مشترک که همه بازیکنان با این شرایط مواجهاند وجود دارد.
جستارهای وابسته
- نظریهٔ بازیها