本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 . S5 v- m* K2 T: G9 t
* X6 ^1 W* {7 i" E" [
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);% \; ~. k) q+ @
以下三个定义:
; \9 t0 b5 J4 E! X b7 {( E0 K 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
9 Q+ [% k( E+ ~6 H$ c 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 3 `8 b# i0 a; Q5 H( l# N% j4 ]
所谓的双方优势策略则是指双方利益总和最大的策略。 6 D, [9 ^9 ], o
[编辑本段]严格优势策略举例分析' L6 ]) W/ ]& K. z) D5 o# r5 ^& l
一、经典的囚徒困境 ' N$ ?, D; ~* v- s! W- A- ~
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
7 R+ f8 j, ?* t* O& w0 q 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: x6 S* O6 X8 e* L2 F2 _/ H
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 1 {- D( ^7 a% f3 ?+ R
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 6 F" a/ b3 x; n/ l5 k- w
若二人都互相检举(互相“背叛”),则二人同样判监2年。! F4 R- g2 Y4 Z% j8 j
( `7 K, T" O1 D/ C1 E! J
用表格概述如下:
7 @9 l4 u& x2 B$ ?$ t7 K
$ f8 r; I5 L2 ]0 W& }' O' c 甲沉默(合作) 甲认罪(背叛) 5 {, u+ i! C- J+ n$ m8 v0 r
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
! A- [. T( D# A: a乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ) f$ C9 F2 d: D. n8 l
+ }) m0 M6 |, z" ~8 { 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 1 X9 V1 i, n' J* U* o* t
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 9 b5 s& f8 T+ W; M. c3 G
若对方沉默、背叛会让我获释,所以会选择背叛。
( r. s% N" Q: @; ~5 b8 M 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 5 p. Z4 n$ }& C& l1 ~5 `+ X
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
4 Z8 F0 _; L# c! M 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) X0 E* s, m' z* m" B& ]: i2 \
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。( J( Z- f, r3 z* y
[编辑本段]二、智猪博弈理论! B9 |6 C" ], N) X( Y3 W7 Z
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
, K) Q9 K- {6 d 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 $ t9 [0 D, F& C5 `6 y- D$ S
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
) P! X% l+ Q$ F$ t6 p0 y8 r 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " r% C' \- S2 A
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 o) N) _& I) X, {% h1 b4 ` 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 $ _# V( @' z) t' Y7 j* v) Y/ R5 X
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
$ [! j; M: |2 b; D3 m5 i 8 u1 A! F }( i. ]( |8 g' G3 P
三、关于企业价格策略" e9 A9 X& b3 ?$ P8 ~8 C- y
5 E/ ^5 M! H% I# X% i1 L6 k
# U& F. [* K6 j9 t7 h* |% K, v/ e 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
d" d! r. P( a1 M6 C2 V& Y1 O; v 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: x; T% P5 q6 i3 }5 x7 z' e8 t 以下三个定义:# T! V7 m8 P9 d, f! W* j
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
, o1 |, X4 e: E! \ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( K0 M* q& a' ], L 所谓的双方优势策略则是指双方利益总和最大的策略。 4 |8 Z" ]% L1 W/ T( V {- r
[编辑本段]严格优势策略举例分析) P) v5 O' j9 _- M3 b! i+ R
一、经典的囚徒困境
! I# T) Q7 v. r3 T 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: - u3 H7 [! ~" }% N
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 b/ ]6 I5 z$ a: {4 o6 x 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 + Z; W8 @& a$ } Z4 I
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
' E% L( e( D2 X 若二人都互相检举(互相“背叛”),则二人同样判监2年。6 k0 G2 _. U- {: ~6 t* ~
$ V7 a, ^9 V# D' M
用表格概述如下:
5 U9 R" L3 Q! A4 K/ @$ D$ m
2 R% H! F& t6 {+ w9 l2 ~) y4 ? 甲沉默(合作) 甲认罪(背叛) 7 q5 V9 L" C, R0 }% W
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ; N2 o# A; g9 N& e
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 9 g$ ]( k4 U6 |" j# o
" o2 t; {7 M) i9 k) w3 k6 } 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 : B* ?* k7 U' V! x& `
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 9 l3 z# L, n' T8 r% V B) G
若对方沉默、背叛会让我获释,所以会选择背叛。 - G% p0 {' s8 q( c" a" u
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) y9 @ \. I# C6 j. a- a! y 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ; o# B# a3 }# k
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
$ C- X% @6 Y4 D4 v6 E" f 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
4 h4 a8 p- f5 B0 ^, T3 z; L, _4 w[编辑本段]二、智猪博弈理论
7 R5 ^9 i; k5 O) Y( C 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
; u/ `/ X, G, g& ^, d4 f 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
' d4 k2 U: }2 w8 V/ w 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 : ?) \) i/ j' E) D9 i/ k1 `' _8 Q
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 9 C' `' I8 @4 c
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 h: `% e" Z; R- U T0 ^1 s$ n" I 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
9 F e# I! \ D6 l 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。- k9 [9 f- ~+ L2 Y$ q
5 |2 T; H& M2 N' ` C- N7 q, j三、关于企业价格策略
+ f. R, [7 H0 X6 L7 o
' K2 l3 \/ V( E) Y* [
+ D( }: G7 c, m% c) a5 J 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 ], R) P/ _# G4 Q 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 ^; p& O+ z' ]2 W& G& ~4 I7 C 以下三个定义:4 T4 T3 Z6 C3 S! P5 _
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
3 k) \ M5 M! l 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
: G8 @" E9 \/ m5 b# R! J6 M 所谓的双方优势策略则是指双方利益总和最大的策略。
: [) ?( \5 e9 Y7 i5 e- i[编辑本段]严格优势策略举例分析
* N0 Y. ^: C6 w( y 一、经典的囚徒困境 6 _4 s. m; q% C6 A+ d' {5 M
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
& |6 H: V; j/ V8 E8 T6 P 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
1 X5 [' \3 [7 B+ E% F 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
1 r/ a5 F1 z. g8 q+ C6 t$ } 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! P6 M! j3 c! m# @1 ~! e( ^% p6 x2 ?
若二人都互相检举(互相“背叛”),则二人同样判监2年。
5 ?+ B! U8 \: l5 {- I( p6 g* j
9 M3 B8 X9 a* h4 D$ h用表格概述如下:6 X4 k$ N. C4 J* M" n* O
' B: N9 ?7 o0 p A9 U/ m, e6 c
甲沉默(合作) 甲认罪(背叛) ) i x" j5 z) C
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
9 r% b2 u' Z) N0 X9 G乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
& n3 L, [) Z. l1 K9 o. I; X
7 L A5 z; W( |, b 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! u i3 D6 {5 x, D7 B% n
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
6 {* Q" r7 S! _- p, Q7 k. { 若对方沉默、背叛会让我获释,所以会选择背叛。
) y* w* I/ ~" k 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
; @5 C8 {& {3 D9 l 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 3 l: N2 {2 z Y: D* {- u
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 ?1 h8 z" w9 S 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
# o! V, P& a, y0 v) L" t[编辑本段]二、智猪博弈理论6 O- t* i" m7 O* P. r' m5 x
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
: b3 U% z% U( h" _% d 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
: x$ X, I6 p* F, J 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 9 N6 A$ z2 u* f# ]0 P8 z
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 / L3 m) [# a; J1 D; g$ ^
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 C) H( \0 P1 b% W7 Z
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
2 Z! ]( G) H% J& h) ` 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
' V9 j6 ]7 f+ j ; k& I S$ R! h$ s; E8 t! m0 M ]
三、关于企业价格策略
/ W5 f4 S9 N# g
$ k# |* w; [5 E, Z; o0 Y
) c4 l- ^7 Z2 A3 ~+ K- X 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
. N9 F/ V+ `& y* C9 t6 d 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 c& L! ~; C# c+ G 以下三个定义:
4 Y- E8 p3 r* y& Y: t 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 5 c( `* T! u* L0 n b2 p
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
b3 e4 j$ m: A7 F+ ?* T' _ 所谓的双方优势策略则是指双方利益总和最大的策略。 & W3 ~3 d% _+ D. _0 R w
[编辑本段]严格优势策略举例分析* W( f7 P" N7 ]' I/ t8 @0 Y
一、经典的囚徒困境 6 H/ E3 o4 p$ P/ J3 R8 U* ?
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 9 H2 ], ]/ }0 Z! |
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
6 m1 {0 U+ F: K+ p4 M8 Y 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 - m0 D. N2 P q) f
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
1 q% i9 ]5 Y0 j) I, A7 { 若二人都互相检举(互相“背叛”),则二人同样判监2年。; _* j4 d; d/ `; Q# S
( M& e& \- t# e9 b' Q* M
用表格概述如下:
1 C' X1 U0 I7 b% U U9 |1 C( |# z6 B; V9 B. g
甲沉默(合作) 甲认罪(背叛)
8 e+ K* x* ^' ]$ ]# h' J# ^乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
+ ~% b" \: j! N/ F- E# o4 f乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
/ _ t/ `; V" C+ i% |* L2 G$ ?, j! v2 j
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! { D3 ]( g$ p; \, p+ u% @$ R8 ]
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ; @0 S# C1 b, t$ h c! N X- l4 }
若对方沉默、背叛会让我获释,所以会选择背叛。 ' n- {9 _" ]+ d, \4 Y
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- k4 x$ n. [; p" h/ Z* [. \ } 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 $ k# i( v7 _9 ?
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 2 d! J/ R: X8 r4 G# U# q7 W: e
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 o" {* m3 g% S7 A- G$ W, J1 Z- ^
[编辑本段]二、智猪博弈理论
; O. G' a# f7 U1 [3 u 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 D9 V( [2 {; [1 @( }
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 9 M* c+ A- D; y% K5 D6 d
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ! B/ ^- ~9 n I% c3 G8 f
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 + s7 N8 i. B8 [
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
# ?8 A; H- g$ T2 o# t1 D 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ s7 ^( q$ g) c- r# i1 S) o! D8 _3 o 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。( s1 } q) u6 N4 x
6 [2 o- l. u* x' L# r三、关于企业价格策略
4 i$ s& Z. i/ m
6 N' ]3 O. j0 J2 o2 Q+ |9 W- | } 0 m$ G7 q! i( U
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( w- o% M! S" A( X9 @ 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |