تبليغاتX
پیرامون نظریه بازی ها ( GAME THEORY )

پیرامون نظریه بازی ها ( GAME THEORY )

بازي فعاليتي منطقي است در پاسخ به تعاملهاي رقابتي

 

استعفاء ، انصراف و حتي مرگ مي تواند پاياني براي يك بازي باشد. پاياني كه مي تواند گره هاي نا گشوده آن را بگشاید و يا بن بستی بر بیراهه هاي هزار توي بازيها باشد. مانور اين اختتام، يك استراتژي کاملا منطقي است. يك تصميم است كه نمي توان آن را ناديده گرفت و در بيشتر موقعيتهاي تصميم سازي نقطه تعادل NASH را دگرگون مي سازد. ساختار مطلوبيتها را تغيير داده و احتمالات گزينش استراتژي هاي ديگر را متحول مي نمايد. اما بايستي زمان اين مانور مصادف با مرحله استيصال در انتخاب استراتژي نباشد. در زنجيره پياپي تصميم ها ، مرحله اي فرا مي رسد كه انصراف به منزله باخت تلقي مي گردد. بنابراين براي اينكه استراتژي انصراف در يک فرآيند منطقي (CKR) شكل گرفته باشد شرايط زير الزامي است:

1-  قطعا هدف از انصراف بايستي اعلام گردد. اين هدف بايستي در چارچوب معيار هاي بازي و مطلوبيتهاي بازيكنان باشد. مثلا استعفاء از يك سمت مديريتي به بهانه خستگي يا مشكلات خانوادگي نه تنها استراتژي منطقي نبوده و هيچگاه در چارچوب عقلايي از وي انتظار نمي رود. در واقع تغيير در معيار نشان از ناتواني استراتژيست در جلب منافع و مطلوبيت وي دارد.

2-  همواره بايد استراتژي انصراف در سايه يك احتمال ظاهر شود و به عنوان گزينه اي در جدول تصميم ها يادآوري گردد. اعلام انصراف به صورت قطعي ، به عنوان يك استراتژي منطقي در مرزبنديهاي بازي قابل تحليل نيست و بهترين تقابل در برابر اين قطعيت ، اعلام شرايط براي انصراف و مصادره امتيازهاي حريف است. ( همچنان با ذهنيت استعفاء يك مدير موضوع را بررسي مي كنيم.)

3-  چشمداشت ما و حريف از انصراف بايستي مشخص و روشن باشد. اين چشمداشت مي تواند انتظار تغيير در پيامدهاي بازي به شكل تغيير در مطلوبيت هر دو طرف ، يا حذف و اضافه شدن استراتژيها باشد. تغيير در ملاك تصميم سازي ( مينيماكس به ماكسيمين و بالعكس ) و يا در بازيهاي اختلاطي ( با چند نقطه تعادل NASH ) تعيين كننده احتمال انتخابهاي حريف نيز چشمداشت ديگري از استراتژي انصراف است.

بازي زير را در نظر بگيريد ( از كتاب " تصميم گيري گروهي و نظريه بازيها " )

 

B

 

B2

B1

استراتژي

A

1+ , 5*

10+, 4

A1

0 , 3

9 , 9*

A2

(بازي بدون انصراف)

بدون استراتژي انصراف ، بازيكنان با تحليلهاي منطقي ( CKR ) به بهترين جواب كه (A1,B2) دست مي يابند، در صورتيكه براي استراتژيست A انتخاب A1 به منزله چشم پوشي از دو موقعيت بهتر (A1,B1) و (A2,B۱) محتمل است و اين در حالي است كه مطلوبيت نقطه تعادل NASH از موقعيت پست تر فقط به اندازه 1 واحد برتري دارد. اين وضعيت براي B به شكل ديگري است و تامين مطلوبيت وي به ميانگين پيامدهاي ممكن(25. 5) نزديك تر است. بنابراين بايستي براي A به هر ترتيبي شرايط تغيير كند.  . فرض كنيم A مي تواند انصراف دهد و استراتژي A3 به منزله انصراف A از بازي باشد مجددا تركيب جدول را مطابق خواسته هاي مختلفA از انصراف مرتب مي كنيم.

الف) انصراف به دليل سود بالاي B (بازي مجموع صفر نيست) :

 

B

 

B2

B1

استراتژي

A

1 , 5*

10+, 4

A1

0 , 3

9 , 9*

A2

,-3 +5

, -4 9

A3

(بهانه انصراف سود B )

مطلوبيت A درانتخاب استراتژي انصراف مبتني بر حداكثر نتيجه از دست داده B به ازاء هر انتخابش وبراي B ضرر حداقل فرصت از دست رفته خودش خواهد بود. توجه كنيد كه B به ازاء انتخاب احتمالي B1 و انصراف A ، حداقل هزينه فرصت از دست رفته اي معادل (-4) و به ازاء انتخاب B2 معادل (-3) خواهد داشت. تدارك استراتژي B3 يا تغيير در مطلوبيتهاي خويش و يا تعديل در مطلوبيتهاي A شگردهايي است كه B دنبال خواهد كرد تا از انصراف A جلوگيري كند. در اين حالت ديگر نقطه تعادلي وجود نخواهد داشت و در ازاء استراتژي B2 بهترين تصميم انصراف است.

ب) انصراف به دليل زيان بالاي A :

 

B

 

B2

B1

استراتژي

A

1 , 5*

10+, 4

A1

0 , 3

9 , 9*

A2

,-5 9+

,-9 -9

A3

(بهانه انصراف زيان A )

مطلوبيت  Aدر انتخاب استراتژي انصراف ، براي (A3,B1) مبنتي بر بيشترين سودي است كه A در نتيجه انتخاب نشدن B2 از دست داده است ( -9 = 1-10 ) و براي B از دست دادن بيشتر سود ممكن به ازاء انتخاب A3 استنتاج مي گردد و همچنين براي (A3,B2). مجددا نقطه تعادل NASH با استراتژي انصراف از بين رفت. اما مگر مي شود كه A با انصراف از بازي نتيجه مثبتي گرفته باشد؟ آري! بايستي توجه داشت كه ماهيت هر مطلوبيتي ، ذهني است و پرداختها بر اساس الزام يا تعهداتي كه وجود دارد، انجام مي گيرد و هيچ ربطي به ماهيت مطلوبيتها ندارد. لذا جلوگيري از تباه شدن فرصت مي تواند سود تلقي گردد. با اين نگرش نيز باز هم بهترين استراتژي برايA در برابر استراتژي B2 انصراف است. استراتژیستهای انصراف  به آینده چشمداشت دارند و اصلا نا امید نیستند.

+ نوشته شده در  پنجشنبه 26 مرداد1385ساعت 23:54  توسط افشین حقيقي   | 

تصمیم گیری گروهی و نظریه بازیها ( با نگرش در تحقیق در عملیات )  نوشته : دکتر محمد جواد اصغر پور از انتشارات دانشگاه تهران . چاپ اول بهار ۱۳۸۲
+ نوشته شده در  شنبه 14 مرداد1385ساعت 23:27  توسط افشین حقيقي   | 

شایسته تر دیدم که یک ترجمه را از سال گذشته تکرار کنم. که مبحث مقدماتی که به بهترین وجهی می تواند همه را با مباحث این نظریه آشنا کند.

اساسا نظريه بازيها , رياضيات استراتژي است . مقدماتي ترين تئوري در اين زمينه  قضيه مينيماکس است که بيان مي دارد که اگر همه بازيکنان يک بازي  به بهترين شکل بازي کنند ( بهترين استراتژي بهينه) نتيجه پيامدهاي بازي قابل پيش بيني خواهد بود .

هر نوع بازيي از بازي تيک تاک توي تا بازي در بازار سهام مي تواند توسط نظريه بازيها پيش بيني گردد. مسلما تفاوتهايي اساسي در پيش بيني نتايج بازي تيک تاک توي و پيامدهاي بازار سهام وجود دارد . هنگاميکه تيک تاک توي توسط دو بازيکن زيرکانه بازي شود همواره به تساوي مي انجامد. در عين حال همه ما مي توانيم به روشي که حرکتهاي احتمالي خوانده مي شود و  با فرض اينکه مردم با سرمايه به شکل منطقيي بازي مي کنند در بازار سرمايه فعاليت نماييم . البته گرايش به امور صرفا موقتي که باعث اقدامات غير منطقي و غير قابل پيش گويي مي گردد و عليرغم اهتمام فراواني كه در بکارگیری فرمولهاي رياضي با هدف پيش بيني پيامدها صورت مي گيرد ،.مي تواند باعث از دست رفتن سرمايه گردد, بطور مثال حمله تروريستي به مراکز مالي دنيا , تمامي مدلها را تخريب نموده و بازي سرمايه را تا حد سقوط کامل پيش مي برد .  

نظريه بازيها با حرکتهاي منطقي در انواع مختلف بازيها سروکار دارد . تئوريهاي بازار سرمايه براي يک مدرس مبتدي بسيار پيچيده هستند بنابراين ما مقدمتا  بحث را به روي بازيهاي ميزي (شطرنج و تخته نرد و ... ) و بازيهاي خانوادگي( دبرنا و معماهاي خانوادگي و ...)  متمرکز مي کنيم که بيشتر افراد با آنها آشنا هستند . مشخصه هاي مهم بازيها عبارتند از : 

1-    تصادفي و غير تصادفي بودن بازيها ( Non – random vs. random ) : بازيها رندومي شامل تعدادي عناصر تصادفي هستند: تاس, صفحه هاي گردان , توزيع ورق در پاسور, توپهاي پينگ پونگ در ماشين لوتو( قرعه کشي) . بازهاي غير رندومي استراتژي خالص و ناب هستند : چکرز شطرنج - تيک تاک توي , غيره.

2-    آگاهي کامل- بدون آگاهي کامل ( perfect knowledge vs. Non perfect knowledge ) بازيهاي با آگاهي کامل,آنهايي هستند که تمام ترکيب بازي براي همه بازيکنان قابل رويت است : شطرنج, چکرز, مونوپولي, غيره. دربازيهايي بدون آگاهي کامل ظاهر و ترکيب بازي براي همه بازيکنان پوشيده است. همچون بازيهاي ورق , باتل شيپ و استراتژو( بازيهاي استراتژيک) .

3-    يک بازيکن. دو بازيکن.  N بازيکن : بازيهاي تک نفره ( مارپيچ , پازل و غيره) که شامل بازيهاي اشتراکي ( cooperative ) نيزمي باشد بازيهايي هستند که در آنهاهر کسي سعي مي کند پيامد بازي را بدون رقابت ( و مسابقه) به نفع خود به پايان ببرد. بازي A.I ( يا مسابقات تلويزيوني يا شراکت در يک بنگاه اقتصادي در تامين اهداف کلان سازمان ) که مي تواند بيش ازچند هزار بازيکن ( شرکت کننده ) داشته باشد , در حقيقت يک بازي تک بازيکن است زيرا همه اين بازيکنان در يک  تيم بازي مي کنند.  بازيهاي دو بازيکن آنهايي هستند که فقط دو بازيکن (همچون شطرنج, باتل شيپ. غيره )  يا دو تيم (براي مثال مسابقات ورزشي)  و نه بيشتر درگير بازي مي باشند. دربازيهاي N بازيکن دو يا چند نفر درگير هستند همچون مونوپولي, پوکر, لاتاري, يا بازار سرمايه. بايستي توجه داشت که در بازيهاي  N بازيکن , امکان بازي بيش از دو بازيکن نيز وجود دارد حتي اگر اين بازيها با دو نفر انجام گيرد . ( مثل بازي  زو و کليه فعاليتهاي اقتصادي در بازار )

4-    مجموع صفرو مجموع غير صفر( Zero sum vs. Non zero sum ) : در بازيهاي مجموع صفر تمامي ارزش بازي يا همانطور باقي مانده و يا تنزل مي کند. در يک بازي پوکر معمولي بازيکنان بازي را با همان مقدار پولي که ورقها ( يا ژتونها) را مي خرند, شروع مي کنند ,. اگر 6 بازيکن هر کدام با قيمت 50 دلارژتون شروع کنند, در هرمرحله از بازي مجموع موجودي بازيکنان و گلدان برابر 300 دلار خواهد بود. بازيهای انتخاباتی از جمله بازيهای مجموع صفر هستند.

شطرنج , بازي مجموع صفر ديگري است زيرا تعداد مهره هاي شطرنج هرگز نمي تواند افزايش يابد. بازيهاي مجموع غير صفر آنهايي هستند که ارزشهاي بازي مي تواند کاهش يابد و کاهش يافتني هم هستند. درمونوپولي هر زمان هر کسي از خانه شروع (  GO ) گذر کند 200 دلار از پول مونوپولي به بازي اضافه مي شود. اتلو از ديگر بازيهاي خانگي , بازي مجموع غيرصفر ديگري است که در مراحل مختلف بازي مهره هايي به بازي اضافه مي گردد.

بين اقتصاددانها و غير اقتصاددانها بحثهاي زياد در رابطه با ماهيت فعاليتهاي اقتصادي مطرح است از جمله اينکه گروهي اقتصاد را يک بازي مجموع صفر مي دانند. بر اين اساس کل علم اقتصاد از ديدگاه ايشان , توزيع پايدارو مداوم توده ثروت است. بنابراين هماهنگ با هم ، ثروتمند ثروتمند تر شده و فقير فقيرتر مي گردد. حال آنکه بيشترافراد بر اين باورند که اقتصاد يک بازي مجموع غير صفر است . پس هرگاه ثروتي ايجاد گردد, ثروتمند متمول تر شده و فقير هم متمول مي شود. اين موضوع اختلاف اساسي بين تئوري هاي سوسياليستي و تئوريهاي کاپيتاليستي است.

قاعده عمومي بازي عبارت است از :

{ درهر بازي " دو بازيکن" , " مجموع صفر" , " غير تصادفي" , " باآگاهي کامل " يک استراتژي کاملي وجود دارد که حداقل نتیجه مساوی را در يک بازي تضمين مي نمايد .}به طور مثال در هر مذاکره ای هرگاه استراتژی کاملی را از پيش در نظر گرفته باشيد هيچگاه بازنده مطلق نبوده و حداقل نتيجه تساوی را اخذ خواهيد نمود.

اما اين بازيهاي دوبازيکن ,مجموع صفر, غير تصادفي , آگاهي کامل چه بازيهايي هستند؟  چکرز, شطرنج, تيک- تاک- توي , نيم , نقطه ( خط و نقطه) و غيره. ما برخي از اين استراتژيهاي مطلوب ( ايده آل) را مي شناسيم که چه هستند.اما يکي از آنهايي که نمي دانيم شطرنج است . استراتژي آن بسيار پيچيده است بحدي که کوششهاي بسياري در کامپيوتري نمودن اين استراتژيها و خلق يک بازيکن تمام عيار صورت گرفته است همچون  " Deep blue " .( شطرنج باز رايانه اي ساخت اي.بي.ام و حريف کاسپاروف در سالهاي 1996 و 1997) .

يکي ديگراز بازيهايي که با آن آشنايي داريم تيک- تاک توي ( سه به سه قطار- رج) است. ) مثلا...)

X

X

O

O

O

X

X

O

X

هنگاميکه O آغاز مي کند , 9 حرکت ممکن براي او وجود دارد و X نيزمتقابلا 8 حرکت مي تواند انجام دهد که در مجموع  72 گشایش امکان پذير است . ما مي توانيم 880,362 (!9) پيامد ممکن را که براي بازي وجود دارد محاسبه نماييم. البته بااين روش بسيار گزافه گفته ايم زيرا بيشتر بازيها قبل ازاينکه بازيکنان 9 حرکت را کامل کنند به اتمام مي رسند.

هنگاميکه ما درحال حذف بازيها هستيم , درواقع شروع به گزينش حرکتهاي زيرکانه مي کنيم. اگر O شروع کند, قطعا به درستي در مرکز مربع يا يکي از نقاط گوشه , بازي را گشايش خواهد کرد.  بنابراين تنها 5 حرکت قابل پيش بيني جهت شروع بازي وجود خواهد داشت و اگر X نيز زيرکانه بازي کند, آنگاه اگر O يکی ازگوشه ها را برگزيده باشد، با خانه ميانه ( مربع ) مقابله خواهد کرد و در صورتيکه O  ميانه ( مربع ) را انتخاب کرده باشد, با يک گوشه جواب خواهد داد. بنابراين يک بازيکن درنقطه مياني وديگري در يکي از نقاط گوشه بازي را آغاز خواهند کرد و بدين ترتيب حرکتهاي دور گشايش به 8 پيامد ممکن زيرکانه ختم مي شود.

(متاسفانه یک دیاگرام از پیامد های ممکن این بازی را نتوانستم در این جا بگذارم)

هر بازي امکان پذير در واقع انعکاسي از اين 6 پيامد پيش بيني شده است. 6  پيامد غير گزافه وجود دارد , که يا بر حسب تمايل  يا در واکنش به بازي حريف برگزيده شده است, و درمجموع 48 پيامد منطقيي که در بازي تيک تاک توي وجود دارند , شانسهاي امکان پذيري براي هر دو حريف هستند. 

 استراتژي بهينه:

روش تحليل رياضي بازي عبارت است از تهيه جدولي از پيامدهاي ليست شده براي هر استراتژي. جدول يک استراتژي دو بازيکن غير رندوم  ممکن است همچون اين باشد:

 

Player A

Strategy 1

Strategy 2

Strategy 3

etc

Player B

 

Strategy 1

Tie

A wins

B wins

...

Strategy 2

B wins

Tie

A wins

...

Strategy 3

A wins

B wins

Tie

...

etc

...

...

...

...

استراتژي انتخابي بازيکنان مي تواند منجر به نتايجي از بازي , مطابق با جدول فوق گردد. دو استراتژي در جدول مي توان يافت:

مينيماکس: حداقل نتيجه مطلوب( good )  از همه پيامدهاي مثبت.

ماکسيمين: حداقل نتيجه نا مطلوب ( bad ) از همه پيامدهاي مثبت.

قضیه مينيماکس: هرگاه استراتژي مينيماکس يک بازيکن مشابه با يک استراتژي ماکسيمين بازيکن ديگرباشد, آنگاه آن استراتژي, بهترين نتيجه اي است که هر دوبازيکن مي توانند انتظار داشته باشند. ( در مذاکره هاي استخدامي غالبا بازي به يک استراتژي بهينه براي هر دو طرف مي انجامد)  پس اگر احتمال يک نتيجه مساوي وجود داشته باشد, اين نتيجه بهترين پيامد مورد انتظار خواهد بود . اين نتيجه را نقطه زيني مي نامند.

توجه کنيد به مثال دو بچه اي که استدلال مي نمايند که چه کسي آخرين برش کيک را تصاحب نمايد. تصميم گرفته مي شود که يکي از بچه ها کيک را ببرد و ديگري قطعه کيک را براي خوردن انتخاب نمايد. جدول استراتژي مطابق زير مي باشد:  

 

Chooser chooses biggest piece

Chooser chooses smallest piece

Cutter cuts even

Chooser gets a crumb more

Cutter gets a crumb more

Cutter cuts uneven

Chooser gets a big piece

Cutter gets a smal piece

راه حل مينيماکس براي انتخاب کننده تصاحب نيمي از کيک به علاوه يک خرده بيشتر است که اين راه حل ماکسيمين براي برش دهنده نيز مي باشد. تقريبا اين نتيجه مسلمي بود که مي توانست پيش بيني گردد.

برخي از بازيها پيامد با نقطه زيني ندارند , درواقع اين مسئله براي بيشتر بازيها مصداق دارد. يک مثال ساده سنگ - کاغذ - قيچي است .

 

A chooses ROCK

A chooses SCISSORS

A chooses PAPER

B chooses        ROCK