กลยุทธ์ทฤษฎีเกม กลยุทธ์ "บริสุทธิ์"


กลยุทธ์ที่บริสุทธิ์- กำหนด (ไม่รวมการสุ่ม) แผนปฏิบัติการ ในบทที่แล้ว เราพิจารณาเพียงกลยุทธ์ล้วนๆ กลยุทธ์แบบผสมจะกล่าวถึงในหัวข้อ 2.2 แต่สำหรับตอนนี้ เว้นแต่จะระบุไว้เป็นอย่างอื่น โดยกลยุทธ์ เราหมายถึงกลยุทธ์ที่บริสุทธิ์เสมอ

บ่อยครั้งในกระบวนการนำเสนอ เราจะอธิบายแนวคิดของการแก้ปัญหาด้วยตัวอย่างเกม bimatrix ดังนั้นเราจะให้คำจำกัดความที่สอดคล้องกัน

คำจำกัดความ 2.1. จบเกมเป็นเกมที่ชุดผู้เล่นและชุดกลยุทธ์ของผู้เล่นแต่ละคนมีองค์ประกอบจำนวนจำกัด เกมสุดท้ายของคนสองคนเรียกว่า เกมบิเมทริกซ์

นามสกุลมาจากรูปแบบการบันทึกการชนะที่สะดวกสบายในเกมดังกล่าว โดยใช้เมทริกซ์คู่

สำหรับการวิเคราะห์เพิ่มเติม จะสะดวกที่จะแบ่งกลยุทธ์ในโปรไฟล์กลยุทธ์ตามอำเภอใจเป็นกลยุทธ์ของผู้เล่นบางคน และกลยุทธ์ของผู้เล่นอื่นทั้งหมด s_ (. อย่างเป็นทางการ s = (.y, s,) ไม่ได้หมายความว่าเราจะสลับพิกัดของโปรไฟล์กลยุทธ์ แต่เราแนะนำวิธีอื่นในการแสดงเท่านั้น

แนวคิดแรกในการแก้เกมที่เราจะพิจารณาคือความสมดุลในกลยุทธ์ที่โดดเด่น

คำจำกัดความ 2.2 กลยุทธของผู้เล่น /-th ครอบงำอย่างเคร่งครัดกลยุทธ์ของเขา s" if Uj(s jt s .) ,) > h,(s", s ,) สำหรับชุด s ใด ๆ ของกลยุทธ์ของผู้เล่นที่เหลือ ในกรณีนี้ กลยุทธ์ s" จะเรียกว่า ครอบงำอย่างเคร่งครัด

โดยพื้นฐานแล้ว นี่หมายความว่าสำหรับทุกๆ แก้ไขแล้วในชุดกลยุทธของผู้เล่นที่เหลือ ผู้เล่นที่ i เลือกกลยุทธ์รับอย่างเคร่งครัด ชนะที่ใหญ่กว่ากว่าการเลือกกลยุทธิ์" สมมติให้คิดเอาเองว่า ผู้เล่นที่มีเหตุผลไม่ควรเลือกกลยุทธ์ที่ครอบงำอย่างเคร่งครัดสมมติฐานดังกล่าวในเกมที่ง่ายที่สุดอาจเพียงพอที่จะหาวิธีแก้ปัญหาของเกม

คำจำกัดความ 2.3 รายละเอียดกลยุทธ์ s* =(s*, s^,..., s*) เรียกว่า สมดุลใน (อย่างเคร่งครัด) กลยุทธ์ที่โดดเด่นถ้าสำหรับผู้เล่นคนที่ i กลยุทธ์จะครอบงำกลยุทธ์อื่นๆ ของเขาอย่างเคร่งครัด

อาจดูเหมือนว่าแนวคิดการแก้ปัญหานี้สามารถนำไปสู่ข้อสรุปเล็กน้อยเท่านั้น ผู้เล่นแต่ละคนมีหนึ่งในกลยุทธ์ที่จะให้ผลตอบแทนมากกว่าคนอื่นๆ ไม่ว่าคู่ต่อสู้ของเขาจะทำอะไรก็ตาม จากนั้นเขาก็จะใช้กลยุทธ์นี้ในภาวะสมดุล ทุกอย่างค่อนข้างชัดเจน แต่สถานการณ์นี้เป็นเรื่องปกติสำหรับบางทีอาจเป็นสถานการณ์ที่มีชื่อเสียงและสำคัญมากสำหรับการวิเคราะห์สถานการณ์เชิงปฏิบัติจำนวนหนึ่งของเกม "ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ"

ตัวอย่าง 2.1 (ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ) อาชญากรทั้งสองถูกควบคุมตัวในเซลล์ที่ต่างกันและไม่สามารถสื่อสารได้ การสอบสวนมีหลักฐานเพียงพอที่จะตัดสินลงโทษแต่ละคนในข้อหาก่ออาชญากรรมเล็กๆ น้อยๆ เป็นเวลาหนึ่งปี แต่สำหรับอาชญากรรมร้ายแรงที่อาชญากรต้องโทษจำคุก 10 ปี การสอบสวนไม่มีหลักฐานเพียงพอ ตัวแทนของการสอบสวนเสนอข้อตกลงกับอาชญากรแต่ละคน: อาชญากรจะได้รับเงื่อนไขสำหรับ

น้อยกว่าหนึ่งปีถ้าเขาให้การเป็นพยานกับคู่ของเขาซึ่งจะเพียงพอที่จะตั้งข้อหาคนหลังด้วยอาชญากรรมร้ายแรง สมมติว่าอาชญากรกังวลเรื่องจำนวนปีที่พวกเขาจะถูกจำคุกเท่านั้น ในแต่ละปีเพิ่มเติมจะลบด้วยค่าสาธารณูปโภคหนึ่งหน่วย จากนั้นการจ่ายเงินของอาชญากรสามารถแสดงด้วยเมทริกซ์คู่ต่อไปนี้:

ในกรณีที่ไม่มีชื่อผู้เข้าร่วมในเกม เราจะถือว่ากลยุทธ์ที่แตกต่างกันของผู้เข้าร่วมคนแรกนั้นสอดคล้องกับแถวของเมทริกซ์คู่ และกลยุทธ์ของผู้เข้าร่วมคนที่สองสอดคล้องกับคอลัมน์ ถ้าในตัวอย่างของเรา นักโทษคนแรกให้การเป็นพยาน และคนที่สองไม่ให้การเป็นพยาน นักโทษคนแรกจะได้รับการปล่อยตัว และคนที่สองจะได้รับโทษจำคุกสิบปี

สังเกตได้ง่ายว่าไม่ว่าผู้ต้องขังคนอื่นๆ กระทำการอย่างไร กำไรก็ยิ่งมากขึ้น (ระยะเวลาจำคุกสั้นลง) หากให้หลักฐาน (สำหรับผู้เล่นคนแรก พิกัดแรกในแถวแรกของเมทริกซ์คู่จะเคร่งครัด มากกว่าในแถวที่สอง สำหรับผู้เล่นคนที่สอง พิกัดที่สองในเมทริกซ์คู่ของคอลัมน์แรกจะมากกว่าในคอลัมน์ที่สองอย่างเคร่งครัด) จากนั้นดุลยภาพในกลยุทธ์ที่โดดเด่นจะเป็นรายละเอียดของกลยุทธ์ (เป็นพยาน, เป็นพยาน)

มีความสนใจใน ตัวอย่างนี้ที่ผู้เล่นเลือกพฤติกรรมที่เพิ่มผลตอบแทนของพวกเขาจบลงในสถานการณ์ที่ผลตอบแทนของพวกเขาต่ำเมื่อเทียบกับสถานการณ์ที่ตรงกันข้าม - เมื่อทั้งคู่เลือกที่จะเงียบ คำอธิบายอยู่ในการปรากฏตัวของผลกระทบภายนอกที่แข็งแกร่งเช่น อิทธิพลที่แข็งแกร่งของการกระทำของผู้เล่นคนหนึ่งที่มีต่อผลตอบแทนของผู้เล่นอีกคน เป็นผลให้รายละเอียดความสมดุลของกลยุทธ์กลายเป็น Pareto เดียวที่ไม่มีประสิทธิภาพในเกมนี้ โปรดทราบว่าประสิทธิภาพของ Pareto ที่พึงประสงค์จากมุมมองของผู้เข้าร่วมในเกม อาจไม่เป็นที่ต้องการจากมุมมองทางสังคม เช่นในกรณีนี้

สถานการณ์เช่นภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษมักเกิดขึ้นในการวิเคราะห์สถานการณ์ทางเศรษฐกิจ ยกตัวอย่าง การแข่งขันระหว่างสองร้านที่ขายสินค้าชุดเดียวกัน เพื่อความง่าย สมมติว่าร้านค้าสามารถเรียกเก็บเงินได้เพียงสองระดับราคา - สูงหรือต่ำ ผู้บริโภคมักชอบซื้อจากร้านค้าที่มีราคาต่ำกว่า จากนั้นผลตอบแทนของร้านค้าที่มีผลกำไรอาจมีลักษณะดังนี้:


จากมุมมองของดุลยภาพ สถานการณ์ที่นี่คล้ายคลึงกับภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ - ดุลยภาพในกลยุทธ์ที่มีอำนาจเหนือกว่า (ราคาต่ำ ราคาต่ำ) เป็นเพียงโปรไฟล์ที่ไม่มีประสิทธิภาพของ Pareto (และเป็นที่ต้องการจากมุมมองทางสังคมด้วย)

ความนิยมในวงกว้างของภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษที่กล่าวไปแล้วนั้นเป็นเหตุผลว่าทำไม พวกเขาจึงพยายามทดลองเพื่อทดสอบความถูกต้องของการทำนายของทฤษฎีเกมโดยใช้ตัวอย่าง การทดสอบคือสอง คนแปลกหน้าเสนอให้เล่นเกมเพื่อเงินพร้อมรางวัล (เช่น เป็นดอลลาร์) ใกล้เคียงกับที่ระบุไว้สำหรับเกมของสองร้าน ผู้เข้าร่วมแต่ละคนตัดสินใจแยกกัน (มักจะไม่ระบุชื่อ) และไม่ทราบการตัดสินใจของผู้เล่นคนอื่นก่อนจะได้รับรางวัล ปรากฎว่าภายใต้เงื่อนไขดังกล่าว ในการเล่นเกมหลายๆ เกม ผู้เล่นไม่ได้ผลลัพธ์ที่สมดุล โดยถือว่ารางวัลเงินสดประมาณการเงินรางวัลได้ถูกต้อง แน่นอนว่าผลการทดลองเหล่านี้ไม่ได้ติดตามว่าการทำนายของทฤษฎีเกมไม่ถูกต้อง แต่เพียงเท่านั้นเมื่อประเมินผลตอบแทนผู้เล่นคำนึงถึงปัจจัยที่ไม่ใช่ตัวเงิน - การพิจารณาเห็นแก่ประโยชน์ผู้อื่นความเป็นธรรม ฯลฯ หากประมาณการผลตอบแทนของผู้เล่นได้อย่างถูกต้อง ผู้เล่นควรเลือกใช้กลยุทธ์ที่โดดเด่น และเลือกกลยุทธ์นั้น ดังนั้น คุณค่าของการทดลองประเภทนี้จึงไม่ได้อยู่ที่การทดสอบการทำนายตามทฤษฎีเกม แต่เป็นการประเมินบทบาทของแรงจูงใจที่ไม่ใช่วัตถุในการกระทำของบุคคล

น้อยกว่าแนวคิดของการครอบงำที่แข็งแกร่งอย่างมีนัยสำคัญ ทฤษฎีเกมใช้แนวคิดของการครอบงำที่อ่อนแอ

คำจำกัดความ 2.4. กลยุทธ์ของผู้เล่น /-th, ครอบงำอย่างอ่อนแอกลยุทธ์ของเขา s" if ม.(s, s ,) > ม ; (sJ, s ,) สำหรับชุดกลยุทธ์ของผู้เล่นคนอื่น ๆ s_j,ยิ่งไปกว่านั้น สำหรับกลยุทธ์อย่างน้อยหนึ่งชุดของผู้เล่นอื่น ความไม่เท่าเทียมกันนั้นได้รับการพึงพอใจอย่างเคร่งครัด จากนั้นกลยุทธ์ s" เรียกว่า ถูกครอบงำอย่างอ่อนแอ

ในกรณีของความไม่เท่าเทียมกันอย่างไม่เข้มงวด เป็นไปไม่ได้อีกต่อไปที่จะยืนยันว่าผู้เล่นที่มีเหตุผลจะไม่เลือกกลยุทธ์ที่ครอบงำอย่างอ่อนแอ แม้ว่าพฤติกรรมดังกล่าวจะดูสมเหตุสมผลก็ตาม แม้จะไม่ค่อยได้ใช้ คำนิยามของดุลยภาพในกลยุทธ์ที่มีอำนาจเหนือกว่าอย่างอ่อนแอที่คล้ายคลึงกับกรณีของการครอบงำอย่างรุนแรง

คำจำกัดความ 2.5 โปรไฟล์กลยุทธ์ s* = (s*, Sj,..., s*) เรียกว่า สมดุลในกลยุทธ์ที่ครอบงำอย่างอ่อนแอถ้าสำหรับผู้เล่นคนที่ i กลยุทธ์ของเขาก็มีอิทธิพลเหนือกลยุทธ์อื่นๆ ของเขาอย่างอ่อนแอ

ตัวอย่าง 2.2 (ปิดการประมูลราคาที่สอง) การประมูลแบบปิดของราคาที่สองจัดขึ้นระหว่างบุคคลสองคน การประมูลมีการจัดดังนี้ ผู้เข้าร่วมแต่ละคนระบุอัตราที่ไม่เป็นลบ โดยไม่ทราบอัตราของผู้เข้าร่วมคนอื่นๆ (ในซอง) สมาชิกที่ทำ ราคาเสนอสูงสุดจ่ายจำนวนเงินสูงสุดจากการเสนอราคาของผู้เข้าร่วมรายอื่น (เช่น จำนวนที่สอง แต่เป็นมูลค่าของการเสนอราคา) และรับบางรายการ ตัวอย่างเช่น หากราคาเสนอของผู้เล่นเท่ากับ 100 และ 90 ดังนั้นผู้เข้าร่วมที่เสนอราคา 100 ชนะการประมูล เขาจะได้ไอเท็มนั้นมาในราคา 90 ซึ่งเป็นขนาดของการประมูลครั้งที่สอง ให้ผู้เข้าร่วมแต่ละคนมีการประเมินเรื่องที่แสดงเป็นหน่วยเงิน v2> 0 ผู้เข้าร่วมทั้งหมดทราบการประมาณการเหล่านี้ เพื่อความง่ายในการอธิบายเกม ถ้าผู้เข้าร่วมทั้งสองระบุอัตราเดียวกัน วัตถุก็จะไปถึงผู้เข้าร่วมคนแรก

ในเกมนี้ กลยุทธ์ของผู้เล่นคนแรกจะเป็นขนาดของเงินเดิมพันของเขา เนื่องจากอัตราไม่เป็นค่าลบ ชุดของกลยุทธ์ที่เป็นไปได้ทั้งหมด

5, = 0 = u,(o, s 2) > w,(s, s 2) = u, - s 2 v x ครอบงำกลยุทธ์ s,.

เราได้แสดงให้เห็นแล้วว่าสำหรับผู้เล่นคนแรก กลยุทธ์ในการตั้งชื่อคะแนนในฐานะการเดิมพันนั้นมีอิทธิพลเหนือกลยุทธ์อื่นๆ อย่างอ่อน เป็นการง่ายที่จะตรวจสอบว่าข้อความที่คล้ายกันเป็นจริงสำหรับผู้เล่นคนที่สองเช่นกัน ให้สังเกตว่าในการให้เหตุผลของเรา เราไม่เคยใช้ข้อเท็จจริงที่ว่าผู้เล่นทราบการประมาณการของผู้เล่นอื่น ซึ่งหมายความว่าในกรณีของเกมที่มีข้อมูลไม่ครบถ้วนในการประมูลแบบปิดของราคาที่สอง จะทำกำไรได้ไม่น้อย ประมาณการของคุณมากกว่าที่จะเสนอราคาอื่นๆ

อาจดูเหมือนว่าไม่เป็นประโยชน์สำหรับผู้ขายที่จะจัดให้มีการประมูลราคาที่สอง เมื่อเขาสามารถจัดการประมูลราคาแรกและรับมูลค่าไม่ใช่ครั้งที่สอง แต่เป็นการประมูลครั้งแรก อย่างไรก็ตาม มูลค่าของอัตราในกรณีการประมูลราคาแรกในดุลยภาพจะลดลง เราจะพูดถึงผลตอบแทนของการประมูลในบทที่ 5. ในระหว่างนี้ เราสังเกตว่าการประมูลราคาที่สองเป็นที่นิยมอย่างมากและมีการใช้กันอย่างแพร่หลาย ตัวอย่างเช่น โดยบริษัทต่างๆ Googleและ "Yandex" เมื่อขายโฆษณาตามบริบทบนอินเทอร์เน็ต

ความสมดุลในกลยุทธ์ที่โดดเด่นมีอยู่ในเกมกลุ่มเล็กๆ เท่านั้น โดยทั่วไปแล้ว ผู้เล่นไม่มีกลยุทธ์เดียวที่จะครอบงำกลยุทธ์อื่นๆ ทั้งหมด แต่แนวความคิดของการครอบงำช่วยให้ค้นหาวิธีแก้ปัญหาในเกมระดับที่กว้างขึ้น ในการทำเช่นนี้ คุณต้องใช้เหตุผลที่สอดคล้องกันเกี่ยวกับการกระทำของผู้เล่น เราได้ตั้งข้อสังเกตแล้วว่าผู้เล่นที่มีเหตุผลจะไม่เลือกกลยุทธ์ที่ครอบงำอย่างเคร่งครัด แต่นี่หมายความว่าผู้เล่นคนอื่นสามารถวิเคราะห์เกมได้โดยไม่สนใจความเป็นไปได้ที่ฝ่ายตรงข้ามจะเลือกใช้กลยุทธ์ดังกล่าว บางทีการวิเคราะห์บางอย่างอาจเปิดเผยว่าผู้เล่นคนอื่นมีกลยุทธ์ที่ครอบงำซึ่งไม่ได้ครอบงำในเกมดั้งเดิม และอื่นๆ. ให้เราให้คำจำกัดความอย่างเป็นทางการ

กระบวนการ การยกเว้นตามลำดับของกลยุทธ์ที่ครอบงำอย่างมากกำหนดไว้ดังนี้ ให้เราแยกกลยุทธ์ที่ครอบงำอย่างเข้มงวดของผู้เล่นออกจากการพิจารณาเช่น พิจารณาเกมใหม่ที่กลยุทธ์ครอบงำทั้งหมดไม่รวมอยู่ในชุดของกลยุทธ์ที่เป็นไปได้ของผู้เล่น แล้วในนี้ เกมส์ใหม่เรากำจัดกลยุทธ์ที่ครอบงำอย่างเข้มงวดทั้งหมด และอื่นๆ

เป็นไปได้ว่ากระบวนการดังกล่าวจะสิ้นสุดลงเมื่อผู้เล่นมีกลยุทธ์หลายอย่างเหลืออยู่ แต่เป็นไปได้ที่ผู้เล่นแต่ละคนจะมีกลยุทธ์ที่ไม่ยกเว้นเพียงกลยุทธ์เดียว ดังนั้นควรพิจารณาชุดของกลยุทธ์เหล่านี้เป็นวิธีแก้ปัญหาของเกม .

คำจำกัดความ 2.6. หากเป็นผลมาจากการกำจัดกลยุทธ์ที่ครอบงำอย่างรุนแรงตามลำดับ ผู้เล่นแต่ละคนเหลือเพียงกลยุทธ์เดียว โปรไฟล์ของกลยุทธ์เหล่านี้จะถูกเรียก ความสมดุลของการครอบงำ

ในตัวอย่างที่ 1.1 เราได้รับเพียงความสมดุลดังกล่าว ลองพิจารณาอีกตัวอย่างหนึ่ง


โปรไฟล์กลยุทธ์ (N, P) เป็นเพียงความสมดุลของแนชในเกมนี้ แต่โปรดทราบว่าในการเลือก P ผู้เล่นคนที่สองต้องแน่ใจว่าผู้เล่นคนแรกไม่เลือก B แต่ผลตอบแทนของผู้เล่นคนแรกจะเท่ากันหากผู้เล่นคนที่สองเลือก II นอกจากนี้ โดยการเลือก B ผู้เล่นคนแรกอาจไม่กลัวว่าผู้เล่นคนที่สองจะเลือก L บางทีผู้เล่นคนที่สองที่มีเหตุผลจะคิดเกี่ยวกับการเลือกกลยุทธ์ C

คำถามที่สองที่ยังไม่พบคำตอบที่ชัดเจน: ผู้เล่นมาที่สมดุลของแนชได้อย่างไร

สถานการณ์สมมติเชิงทฤษฎีในอุดมคติมีดังนี้ ผู้เล่นสร้างความคาดหวังอย่างอิสระเกี่ยวกับการกระทำของผู้เล่นคนอื่น แล้วเลือกการกระทำที่จะให้ผลตอบแทนสูงสุดตามความคาดหวังที่กำหนด หากในกรณีนี้ ความคาดหวังสอดคล้องกับการกระทำที่ผู้เล่นเลือกจริงๆ เราก็จะได้รับสมดุลของแนช เหตุผลแนวนี้ช่วยให้เราสามารถเรียกสถานการณ์สมดุลของแนชกับ การเติมเต็มความคาดหวังในตนเองแต่ความคาดหวังมาจากไหน? และสมดุลใดของแนช ถ้ามีหลายอย่าง จะถูกเลือกอันเป็นผลมาจากกระบวนการที่อธิบายไว้? ในกรอบของสถานการณ์สมมติที่พิจารณา คำถามเหล่านี้ยังไม่ได้รับคำตอบ

อีกวิธีหนึ่งเกี่ยวข้องกับการฝึกผู้เล่น ผู้เล่นอาจเรียนรู้วิธีเล่นเกมตามทฤษฎี (นึกถึงนักศึกษาเศรษฐศาสตร์) หรือสัมผัสปฏิสัมพันธ์ที่คล้ายคลึงกัน (เช่น พนักงานที่มีประสบการณ์มาที่ ทีมใหม่) ซึ่งช่วยให้พวกเขาสร้างความคาดหวังได้อย่างถูกต้องและเลือกพฤติกรรมที่เหมาะสมที่สุด สถานการณ์นี้ทำให้สามารถอธิบายการก่อตัวของความคาดหวังได้ แต่ประการแรก มันลดขอบเขตของรูปแบบเกมให้เหลือเพียงสถานการณ์มาตรฐาน ศึกษา และพบบ่อยของการโต้ตอบ และประการที่สอง มันสามารถนำไปสู่ความจริงที่ว่าสถานการณ์ของซิงเกิ้ลและซ้ำ ปฏิสัมพันธ์ไม่แตกต่างกัน และอย่างหลังแตกต่างกันอย่างมีนัยสำคัญในแง่ของกลยุทธ์และวิธีการแก้ปัญหาภายในกรอบของทฤษฎีเกม ซึ่งจะกล่าวถึงในรายละเอียดเพิ่มเติมในบทที่ สี่.

สถานการณ์ที่สามคือมีข้อตกลงก่อนหน้านี้ระหว่างผู้เล่นหรือศุลกากรหรือกฎหมายหรือคำแนะนำจากบุคคลที่สามที่ควบคุมการโต้ตอบของผู้เล่น ในกรณีนี้ ข้อตกลงหรือคำแนะนำอาจไม่มีผลผูกพัน แต่ถ้าแนะนำให้เล่นสมดุลของแนช ก็ไม่มีผู้เล่นคนใดที่ต้องการ (คนเดียว) ที่จะเบี่ยงเบนไปจากพฤติกรรมที่กำหนด เป็นที่ชัดเจนว่าสถานการณ์ดังกล่าวไม่สามารถทำได้ในทุกสถานการณ์ นอกจากนี้ กระบวนการในการสร้างข้อตกลงหรือเกี่ยวข้องกับบุคคลที่สามสามารถกลายเป็นส่วนหนึ่งของเกมได้

สุดท้าย คำถามธรรมชาติข้อที่สามที่เกิดขึ้นเมื่อศึกษาแนวคิดของดุลยภาพแนชมีดังต่อไปนี้: มีหลักฐานเชิงประจักษ์ว่าผู้เล่นจริงมักเลือกกลยุทธ์สมดุลหรือไม่ ที่นี่อีกครั้งเป็นเรื่องยากมากที่จะให้คำตอบที่สั้นและชัดเจน ในขณะเดียวกัน ธรรมชาติของปัญหาที่เกิดขึ้นมีความสอดคล้องกับเรื่องของเศรษฐศาสตร์ทดลองมากกว่า ดังนั้นเราจึงจำกัดตัวเองให้อยู่ในคำแนะนำให้หันไปใช้วรรณกรรมเฉพาะทาง เช่น หนังสือที่มีการวิเคราะห์คำถามเกี่ยวกับวิธีการทดลองอย่างดีเยี่ยมและนำเสนอผลลัพธ์จำนวนหนึ่ง

มีเกมที่ไม่สมดุลในกลยุทธ์ที่บริสุทธิ์ (ดูตัวอย่างที่ 3.1) ดังนั้นคำถามจึงเกิดขึ้น: เงื่อนไขใดเพียงพอสำหรับการดำรงอยู่ของดุลยภาพดังกล่าว ให้เรากำหนดและพิสูจน์การยืนยันเกี่ยวกับการดำรงอยู่ของสมดุลของแนชในกลยุทธ์ที่บริสุทธิ์ในเกมที่ไม่มีที่สิ้นสุด

คำชี้แจง 2.3. ถ้าชุดของกลยุทธ์สำหรับผู้เล่นแต่ละคน เซนต์เป็นคอมแพคตานูนไม่ว่างในอวกาศแบบยุคลิดและฟังก์ชันผลตอบแทนของผู้เล่นแต่ละคน และ-ต่อเนื่องใน และกึ่งเว้าใน 5 จากนั้นเกมมีความสมดุลของแนชในกลยุทธ์ที่บริสุทธิ์

การพิสูจน์.จำสูตร ทฤษฎีบทของคาคุไทซึ่งเราจะใช้ในการพิสูจน์ อนุญาต เอ็กซ์-ชุดคอมแพคนูนไม่ว่างใน น , X*เป็นเซตของเซตย่อยของมัน และ/ เป็นการแมปแบบกึ่งต่อเนื่องบนจาก Xใน x*,ว่าแต่ละจุด x อี xเยอะ เอฟ(x)ไม่ว่างเปล่าปิดและนูน จากนั้นการทำแผนที่ / มีจุดคงที่

แนวคิดในการพิสูจน์การยืนยันของเราคือการสร้างแผนที่ที่เป็นไปตามเงื่อนไขของทฤษฎีบทของ Kakutani ในการทำเช่นนี้ เราได้กำหนดการแสดงคำตอบที่ดีที่สุดใหม่เล็กน้อย ในทางเทคนิคแล้ว เราจะถือว่าคำตอบที่ดีที่สุดไม่ได้ขึ้นอยู่กับกลยุทธ์ของผู้เล่นคนอื่นเท่านั้น แต่ยังขึ้นอยู่กับกลยุทธ์ของผู้เล่นด้วย ด้วยการเปลี่ยนกลยุทธของผู้เล่นเองเมื่อ กลยุทธ์คงที่ผู้เล่นที่เหลือคำตอบที่ดีที่สุดแน่นอนจะไม่เปลี่ยนแปลง ตอนนี้เรามาแนะนำสัญกรณ์สำหรับแสดงคำตอบที่ดีที่สุดสำหรับผู้เล่นทุกคนในฐานะผลิตภัณฑ์คาร์ทีเซียน s(s) = s,(s) x s 2 (s) x... x s n (s).การแมปนี้กับแต่ละโปรไฟล์กำหนดชุดของโปรไฟล์ที่ผู้เล่นแต่ละคน วิธีที่ดีที่สุดตอบสนองต่อกลยุทธ์ของผู้เล่นคนอื่น จุดคงที่ของการทำแผนที่ S นั่นคือ ข้อมูลส่วนตัว ดังนั้น s e s(s)>โดยนิยามสมดุลของแนช ให้เราแสดงว่าการทำแผนที่ 5 เป็นไปตามเงื่อนไขของทฤษฎีบทคาคุทานิ การตรวจสอบแต่ละเงื่อนไขจะถือเป็นจุดพิสูจน์ที่แยกจากกัน

  • 1. แสดงว่าเซต โปรไฟล์ทั้งหมด - นูนนูน เนื่องจากภายใต้เงื่อนไขของการยืนยันชุดของกลยุทธ์ของผู้เล่น S แต่ละคนเป็นชุดที่นูนไม่ว่างจากนั้นจึงเป็นผลิตภัณฑ์คาร์ทีเซียน = เซนต์ X S2 X...x ส นเป็นแบบนูนนูน
  • 2. จอแสดงผล มีภาพไม่ว่าง โดยทฤษฎีบทไวเออร์สตราส ฟังก์ชันต่อเนื่อง และ-ไปถึงชุดที่มีขอบเขตปิด 5 ซึ่งเป็นค่าสูงสุด เพราะเหตุนี้, มีภาพไม่ว่าง
  • 3. แสดงภาพ ปิดและนูน เนื่องจากฟังก์ชั่นการจ่ายเงินของผู้เล่นแต่ละคน คุณ tกึ่งเว้าใน s ifจากนั้นโดยคุณสมบัติของฟังก์ชันกึ่งเว้า เซต $ = (ส. | คุณ t (s i9 s .) > k) สำหรับคงที่ .และ kปิดที่ พื้นที่ปิดคำจำกัดความและเป็นนูนถ้าไม่ว่างเปล่า เนื่องจากสิ่งนี้เป็นจริงสำหรับใคร ๆ kแล้วมันก็จริงด้วยว่าชุดที่ 5 = (5/1 คุณ t(s", 5 ,) > maxw.(s., .)}

นูน แต่แล้วผลคูณคาร์ทีเซียน 5(5) = s x (s) X s2(ส) x... x s n CS) ปิดและนูน

4. ให้เราแสดงว่าการทำแผนที่ § กึ่งต่อเนื่องจากด้านบน เราใช้เงื่อนไขความต่อเนื่องของฟังก์ชัน และ,โดย s. เราจะพิสูจน์ด้วยความขัดแย้ง สมมติว่าการแสดงผล § ns เป็นแบบกึ่งต่อเนื่องบน จากนั้นก็มีลำดับของโปรไฟล์กลยุทธ์ s mและ เอส ม ,ที่ไหน เสื้อ -หมายเลของค์ประกอบลำดับ เช่นนั้นสำหรับใดๆ tส"" เ S, s m e s(s""), ลิม s"" = s° อี S,แต่ lim s"" = s° g lim s(s") ซึ่งหมายความว่ามี

ท~* oo t->/และ -? oo

ร็อคที่กลยุทธ์ s f °ไม่ใช่การตอบสนองที่ดีที่สุดสำหรับ s 0 นั่นคือ มีกลยุทธ์ ส"ดังนั้น และ,(s", s 0,) > เรา]ส°;). จากนั้นเราสามารถหา e > 0 ได้ m,(s/, s 0 ,) > m,(s ; °, s 0 ,) + Ze มาจากไหน

เนื่องจาก โดยสมมติ ฟังก์ชัน m ต่อเนื่อง lim s m = s°, ลิม s"” = s°,

*อู้ -*oo

ที่มีขนาดใหญ่พอสมควร ขวา

เมื่อรวมความไม่เท่าเทียมกัน (2.8)-(2.10) เข้าเป็นลูกโซ่เดียว เราจะได้

จากความสัมพันธ์ (2.11) ที่ u,(s", s"") > m,(s/", s"") + s,แต่สิ่งนี้ขัดแย้งกับเงื่อนไข s"" e s(s"") เนื่องจาก s" ให้ผลตอบแทนมากกว่า s/" อย่างเคร่งครัด เพื่อตอบสนองต่อ s"" พวกเขามาถึงความขัดแย้ง ดังนั้น สมมติฐานเดิมของเราที่ s ไม่กึ่งต่อเนื่องบนจึงผิด

เราได้แสดงให้เห็นว่าการทำแผนที่ เป็นไปตามเงื่อนไขทั้งหมดของทฤษฎีบทของ Kakutani และด้วยเหตุนี้จึงมีจุดตายตัว จุดคงที่นี้คือสมดุลของแนช การยืนยัน 2.3 ได้รับการพิสูจน์แล้ว ?

โดยเฉพาะอย่างยิ่ง คำชี้แจง 2.3 รับประกันการมีอยู่ของสมดุลของแนชในตัวอย่างที่ 2.7 แต่ไม่ใช่ในตัวอย่างที่ 2.8 ซึ่งฟังก์ชันการจ่ายเงินของผู้เล่นจะไม่ต่อเนื่อง

“ตัวอย่างจากการทำงาน

5. ทฤษฎีเกมและวิธีแก้ปัญหาทางสถิติ

5.1. เกมเมทริกซ์ผลรวมศูนย์

การสร้างแบบจำลองทางเศรษฐศาสตร์และคณิตศาสตร์ดำเนินการภายใต้เงื่อนไขต่อไปนี้:

ความแน่นอน;

ความไม่แน่นอน

การสร้างแบบจำลอง ภายใต้เงื่อนไขของความแน่นอน สันนิษฐานว่ามีข้อมูลกฎระเบียบเริ่มต้นทั้งหมดที่จำเป็นสำหรับสิ่งนี้ (การสร้างแบบจำลองเมทริกซ์ การวางแผนเครือข่ายและผู้บริหาร)

การสร้างแบบจำลอง มีความเสี่ยง ดำเนินการภายใต้ความไม่แน่นอนแบบสุ่มเมื่อค่าของข้อมูลเริ่มต้นบางส่วนเป็นแบบสุ่มและกฎของการแจกแจงความน่าจะเป็นของตัวแปรสุ่มเหล่านี้เป็นที่รู้จัก (การวิเคราะห์การถดถอยทฤษฎีการจัดคิว)

การสร้างแบบจำลอง ภายใต้เงื่อนไขความไม่แน่นอน สอดคล้องกับการขาดข้อมูลบางอย่างที่จำเป็นสำหรับสิ่งนี้ (ทฤษฎีเกม)

แบบจำลองทางคณิตศาสตร์สำหรับการตัดสินใจที่เหมาะสมในสถานการณ์ความขัดแย้งนั้นสร้างขึ้นภายใต้เงื่อนไขที่ไม่แน่นอน

ในทฤษฎีเกม ใช้แนวคิดพื้นฐานต่อไปนี้:

กลยุทธ์;

ฟังก์ชั่นวิน

เคลื่อนไหว เราจะเรียกตัวเลือกและการดำเนินการโดยผู้เล่นในการดำเนินการอย่างใดอย่างหนึ่งที่กำหนดโดยกฎของเกม

กลยุทธ์ - เป็นเทคโนโลยีในการเลือกแนวทางปฏิบัติสำหรับการเคลื่อนไหวแต่ละครั้ง ขึ้นอยู่กับสถานการณ์

ฟังก์ชั่นชนะ ทำหน้าที่กำหนดจำนวนเงินที่จ่ายให้กับผู้เล่นที่แพ้ให้กับผู้ชนะ

ในเกมเมทริกซ์ ฟังก์ชันการจ่ายเงินจะแสดงเป็น เมทริกซ์การชำระเงิน :

จำนวนเงินที่จ่ายให้กับผู้เล่น I ผู้เลือกการย้าย จากผู้เล่น II ผู้เลือกการย้ายอยู่ที่ไหน

ในเกมคู่นี้ ค่าของฟังก์ชันการจ่ายเงินของผู้เล่นทั้งสองในแต่ละสถานการณ์จะมีขนาดเท่ากันและตรงข้ามกันในเครื่องหมายเช่น และเกมนี้มีชื่อว่า ผลรวมศูนย์ .

กระบวนการของ "การเล่นเกมเมทริกซ์" มีดังต่อไปนี้:

มีการตั้งค่าเมทริกซ์การชำระเงิน

ผู้เล่น I โดยไม่คำนึงถึงผู้เล่น II จะเลือกหนึ่งในแถวของเมทริกซ์นี้ ตัวอย่างเช่น -th;

ผู้เล่น II ไม่ว่าผู้เล่น I จะเลือกคอลัมน์ใดคอลัมน์หนึ่งของเมทริกซ์นี้ ตัวอย่างเช่น - th;

องค์ประกอบของเมทริกซ์กำหนดจำนวนผู้เล่นที่ฉันจะได้รับจากผู้เล่น II แน่นอนว่าถ้า เรากำลังพูดถึงการสูญเสียผู้เล่นตัวจริงของ I.

การเล่นคู่ที่เป็นปฏิปักษ์กับ เมทริกซ์การชำระเงินและจะถูกเรียกว่าเกม

ตัวอย่าง

ลองพิจารณาเกม

กำหนดเมทริกซ์การชำระเงิน:

.

ให้ผู้เล่น I โดยไม่คำนึงถึงผู้เล่น II เลือกแถวที่ 3 ของเมทริกซ์นี้ และผู้เล่น II โดยไม่คำนึงถึงผู้เล่น I เลือกคอลัมน์ที่ 2 ของเมทริกซ์นี้:

จากนั้นผู้เล่น I จะได้รับ 9 หน่วยจากผู้เล่น II

5.2. กลยุทธ์ที่บริสุทธิ์ที่สุดในเกมเมทริกซ์

กลยุทธ์ที่เหมาะสมที่สุด กลยุทธ์ของผู้เล่น I ถูกเรียกว่าว่าเขาไม่ลดผลตอบแทนสำหรับกลยุทธ์ที่เลือกโดยผู้เล่น II และกลยุทธ์ของผู้เล่น II ที่เขาไม่เพิ่มการสูญเสียสำหรับกลยุทธ์ที่เลือกโดยผู้เล่น I

โดยการเลือกแถวที่ i ของเมทริกซ์ผลตอบแทนเป็นการย้าย ผู้เล่น I จะได้รับผลตอบแทนอย่างน้อยตามมูลค่าในกรณีที่เลวร้ายที่สุด เมื่อผู้เล่น II พยายามลดค่านี้ให้เหลือน้อยที่สุด ดังนั้นผู้เล่นฉันจะเลือกแถวที่ - ที่จะให้เขา ชนะสูงสุด:

.

ผู้เล่น II โต้แย้งในลักษณะเดียวกันและสามารถรับประกันการสูญเสียขั้นต่ำได้อย่างแน่นอน:

.

ความไม่เท่าเทียมกันต่อไปนี้เป็นจริงเสมอ:

ค่าที่เรียกว่า ราคาเกมที่ต่ำกว่า .

ค่าที่เรียกว่า ราคาเกมชั้นนำ .

กลยุทธ์ที่เหมาะสมเรียกว่า ทำความสะอาด หากได้รับความเท่าเทียมกันสำหรับพวกเขา:

,

.

ค่าที่เรียกว่า ราคาสุทธิของเกม , ถ้า .

กลยุทธ์และรูปแบบบริสุทธิ์ที่เหมาะสมที่สุด จุดอาน เมทริกซ์การชำระเงิน

สำหรับจุดอาน เป็นไปตามเงื่อนไขต่อไปนี้:

กล่าวคือ องค์ประกอบมีขนาดเล็กที่สุดในแถวและใหญ่ที่สุดในคอลัมน์

ดังนั้น ถ้าเมทริกซ์ผลตอบแทนมี จุดอาน แล้วคุณจะพบ กลยุทธ์บริสุทธิ์ที่ดีที่สุด ผู้เล่น

กลยุทธ์ที่บริสุทธิ์ของผู้เล่นที่ฉันสามารถแสดงได้ด้วยชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ซึ่งตัวเลขทั้งหมดมีค่าเท่ากับศูนย์ ยกเว้นตัวเลขในตำแหน่งที่ - ซึ่งเท่ากับหนึ่ง

กลยุทธ์ที่บริสุทธิ์ของผู้เล่น II สามารถแสดงด้วยชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ซึ่งตัวเลขทั้งหมดมีค่าเท่ากับศูนย์ ยกเว้นตัวเลขในตำแหน่งที่ - ซึ่งเท่ากับหนึ่ง

ตัวอย่าง

.

โดยการเลือกแถวของเมทริกซ์ผลตอบแทนเป็นการย้าย ผู้เล่น ฉันได้รับค่าตอบแทนในกรณีที่เลวร้ายที่สุด ไม่น้อยกว่าค่าในคอลัมน์ที่ทำเครื่องหมาย :

ดังนั้น ผู้เล่นฉันจะเลือกแถวที่ 2 ของเมทริกซ์การจ่ายเงิน ซึ่งให้ผลตอบแทนสูงสุดแก่เขา โดยไม่คำนึงถึงการเคลื่อนไหวของผู้เล่น II ซึ่งจะพยายามลดค่านี้ให้น้อยที่สุด:

ผู้เล่น II โต้แย้งในทำนองเดียวกันและเลือกคอลัมน์ที่ 1 เป็นการย้าย:

ดังนั้น มีจุดอานของเมทริกซ์ผลตอบแทน:

สอดคล้องกับกลยุทธ์ที่ดีที่สุดสำหรับผู้เล่น I และสำหรับผู้เล่น II ซึ่งผู้เล่นที่ฉันไม่ลดผลตอบแทนของเขาสำหรับการเปลี่ยนแปลงกลยุทธ์โดยผู้เล่น II และผู้เล่น II จะไม่เพิ่มการสูญเสียของเขาสำหรับการเปลี่ยนแปลงกลยุทธ์โดยผู้เล่น I

5.3. เหมาะสมที่สุด กลยุทธ์ผสมในเกมเมทริกซ์

หากเมทริกซ์ผลตอบแทนไม่มีจุดอาน ก็ไม่มีเหตุผลสำหรับผู้เล่นที่จะใช้กลยุทธ์เพียงอย่างเดียว กำไรในการใช้งานมากขึ้น "สารผสมความน่าจะเป็น" กลยุทธ์ที่บริสุทธิ์ จากนั้นกำหนดกลยุทธ์แบบผสมแล้วเป็นกลยุทธ์ที่เหมาะสมที่สุด

กลยุทธ์ผสม ผู้เล่นมีลักษณะการแจกแจงความน่าจะเป็น เหตุการณ์สุ่มซึ่งประกอบด้วยการเลือกย้ายโดยผู้เล่นรายนี้

กลยุทธ์ผสมของผู้เล่น I เป็นชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ที่ตรงตามเงื่อนไขสองประการ:

1) สำหรับ นั่นคือ ความน่าจะเป็นของการเลือกแต่ละแถวของเมทริกซ์ผลตอบแทนนั้นไม่เป็นลบ

2) นั่นคือ ตัวเลือกของแต่ละแถวเมทริกซ์ผลตอบแทนในการรวมหมายถึง เต็มกลุ่มเหตุการณ์

กลยุทธ์ผสมของผู้เล่น II คือชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) เป็นไปตามเงื่อนไข:

จำนวนเงินที่ชำระ ให้กับผู้เล่น I ผู้เลือกกลยุทธ์แบบผสม

จากผู้เล่น II ที่เลือกกลยุทธ์แบบผสม

,

เป็นค่าเฉลี่ย

.

เหมาะสมที่สุด เรียกว่ากลยุทธ์ผสม

และ ,

หากเป็นไปตามกลยุทธ์ผสมตามอำเภอใจและเงื่อนไขต่อไปนี้:

กล่าวคือ ภายใต้กลยุทธ์แบบผสมที่เหมาะสม ผลตอบแทนของผู้เล่น I จะมากที่สุด และการสูญเสียผู้เล่น II จะน้อยที่สุด

หากไม่มีจุดอานในเมทริกซ์ผลตอบแทน แล้ว

,

กล่าวคือ มีความแตกต่างในเชิงบวก ( ความแตกต่างที่คงอยู่ )

- ³ 0,

และผู้เล่นจำเป็นต้องมองหาโอกาสเพิ่มเติมเพื่อให้ได้รับส่วนแบ่งที่มากขึ้นของความแตกต่างนี้อย่างมั่นใจ

ตัวอย่าง

พิจารณาเกมที่กำหนดโดยเมทริกซ์ผลตอบแทน:

.

ตรวจสอบว่ามีจุดอานหรือไม่:

, .

ปรากฎว่าไม่มีจุดอานในเมทริกซ์ผลตอบแทนและความแตกต่างที่ไม่ได้กระจายคือ:

.

5.4. ค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุด

สำหรับ 2×2 เกม

การกำหนดกลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเมทริกซ์ผลตอบแทนที่มีมิติจะดำเนินการโดยวิธีการหาจุดที่เหมาะสมที่สุดของฟังก์ชันของตัวแปรสองตัว

ให้ความน่าจะเป็นของผู้เล่นที่ฉันเลือกแถวแรกของเมทริกซ์ผลตอบแทน

เท่ากับ . ความน่าจะเป็นที่จะเลือกแถวที่สองคือ

ให้ความน่าจะเป็นของผู้เล่น II เลือกคอลัมน์แรกเท่ากับ ความน่าจะเป็นที่จะเลือกคอลัมน์ที่สองคือ

จำนวนเงินที่จ่ายให้กับผู้เล่น I โดยผู้เล่น II เท่ากับ:

มูลค่าสูงสุดของผู้เล่นที่ฉันได้รับและการสูญเสียของผู้เล่น II นั้นสอดคล้องกับเงื่อนไข:

;

.

ดังนั้น กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น I และ II ตามลำดับ คือ:

5.5. โซลูชันทางเรขาคณิตของเกม 2×

ด้วยการเพิ่มมิติของเมทริกซ์ผลตอบแทนจาก เป็น เป็น เป็นไปไม่ได้อีกต่อไปที่จะลดคำจำกัดความของกลยุทธ์ผสมที่เหมาะสมที่สุดเพื่อค้นหาฟังก์ชันที่เหมาะสมที่สุดของสองตัวแปร อย่างไรก็ตาม เนื่องจากผู้เล่นคนใดคนหนึ่งมีเพียงสองกลยุทธ์ จึงสามารถใช้โซลูชันทางเรขาคณิตได้

ขั้นตอนหลักในการหาวิธีแก้ปัญหาของเกมมีดังนี้

เราแนะนำระบบพิกัดบนเครื่องบิน ลองใส่ส่วนของเส้นตรงบนแกน จากปลายด้านซ้ายและขวาของส่วนนี้เราวาดเส้นตั้งฉาก


ปลายด้านซ้ายและขวาของส่วนหน่วยสอดคล้องกับสองกลยุทธ์ และ ใช้ได้สำหรับผู้เล่น I ในแนวตั้งฉากที่วาด เราจะเลื่อนการจ่ายเงินของผู้เล่นรายนี้ ตัวอย่างเช่น สำหรับเมทริกซ์ผลตอบแทน


ผลตอบแทนดังกล่าวของผู้เล่น I เมื่อเลือกกลยุทธ์จะเป็น และ และเมื่อเลือกกลยุทธ์ที่พวกเขาจะเป็น และ

ให้เราเชื่อมต่อจุดจ่ายของผู้เล่น I ซึ่งสอดคล้องกับกลยุทธ์ของผู้เล่น II โดยส่วนของเส้นตรง จากนั้นเส้นหักที่เกิดขึ้นซึ่งล้อมรอบแผนภูมิจากด้านล่างจะเป็นตัวกำหนดขอบเขตล่างของผลตอบแทนของผู้เล่น I



ค้นหากลยุทธ์ผสมที่เหมาะสมที่สุดสำหรับผู้เล่น I

,

ซึ่งสอดคล้องกับจุดบนขอบเขตล่างของผลตอบแทนของผู้เล่น I กับพิกัดสูงสุด

ขอให้เราใส่ใจกับความจริงที่ว่าในตัวอย่างที่พิจารณาโดยใช้เพียงสองกลยุทธ์ และ สอดคล้องกับเส้นตรงที่ตัดกันที่จุดที่พบบนขอบเขตล่างของผลตอบแทนของผู้เล่น I ผู้เล่น II สามารถป้องกันไม่ให้ผู้เล่น I มีขนาดใหญ่ขึ้น ผลตอบแทน

ดังนั้นเกมจึงลดลงเป็นเกมและกลยุทธ์ผสมที่ดีที่สุดของผู้เล่น II ในตัวอย่างที่พิจารณาคือ

,

โดยที่ความน่าจะเป็นเท่ากับในเกม :

5.6. แก้เกม×

หากเกมเมทริกซ์ไม่มีวิธีแก้ปัญหาในกลยุทธ์ที่บริสุทธิ์ (เช่น ไม่มีจุดอาน) และเนื่องจากเมทริกซ์ผลตอบแทนมีขนาดใหญ่จึงไม่สามารถแก้ไขได้แบบกราฟิก เพื่อให้ได้วิธีแก้ปัญหา ให้ใช้ วิธีการโปรแกรมเชิงเส้น .

ให้เมทริกซ์ผลตอบแทนของมิติได้รับ:

.

เราต้องหาความน่าจะเป็น โดยผู้เล่นคนใดที่ฉันต้องเลือกการเคลื่อนไหวของเขาเพื่อให้กลยุทธ์แบบผสมนี้รับประกันว่าเขาจะได้รับผลตอบแทนอย่างน้อย โดยไม่คำนึงถึงทางเลือกของการเคลื่อนไหวโดยผู้เล่น II

สำหรับแต่ละการย้ายที่เลือกโดยผู้เล่น II ผลตอบแทนของผู้เล่น I ถูกกำหนดโดยการอ้างอิง:

เราหารอสมการทั้งสองข้างด้วยและแนะนำสัญลักษณ์ใหม่:

ความเท่าเทียมกัน

จะใช้แบบฟอร์ม:

เนื่องจากผู้เล่นที่ฉันต้องการเพิ่มผลตอบแทนสูงสุด การแลกเปลี่ยนซึ่งกันและกันจะต้องถูกย่อให้เล็กสุด จากนั้นปัญหาการเขียนโปรแกรมเชิงเส้นสำหรับผู้เล่น ฉันจะอยู่ในรูปแบบ:

ภายใต้ข้อจำกัด

ปัญหาสำหรับผู้เล่น II นั้นถูกสร้างขึ้นในทำนองเดียวกันเป็นคู่:

ภายใต้ข้อจำกัด

การแก้ปัญหาด้วยวิธีซิมเพล็กซ์เราได้รับ:

,

5.7. คุณสมบัติของการแก้เกมเมทริกซ์

ก่อนแก้ปัญหาการหากลยุทธ์ที่เหมาะสม ควรตรวจสอบสองเงื่อนไข:

เป็นไปได้ไหมที่จะทำให้เมทริกซ์การชำระเงินง่ายขึ้น

เมทริกซ์ผลตอบแทนมีจุดอานหรือไม่

พิจารณาความเป็นไปได้ของการลดความซับซ้อนของเมทริกซ์การชำระเงิน:

เนื่องจากผู้เล่นที่ฉันพยายามที่จะได้รับ ชนะมากที่สุดจากนั้นบรรทัดที่ -th สามารถลบออกจากเมทริกซ์ผลตอบแทนได้ เนื่องจากเขาจะไม่ใช้การย้ายนี้หากความสัมพันธ์ต่อไปนี้เป็นที่พอใจกับบรรทัดที่ -th อื่น:

ในทำนองเดียวกัน มุ่งมั่นเพื่อการสูญเสียน้อยที่สุด ผู้เล่น II จะไม่เลือกคอลัมน์ -th ในเมทริกซ์ผลตอบแทนเป็นการเคลื่อนไหว และคอลัมน์นี้สามารถขีดฆ่าได้หากความสัมพันธ์ต่อไปนี้มีกับคอลัมน์ -th อื่น:

ที่สุด วิธีแก้ปัญหาง่ายๆเกมคือการมีอยู่ในเมทริกซ์ผลตอบแทนแบบง่ายของจุดอานที่ตรงตามเงื่อนไขต่อไปนี้ (ตามคำจำกัดความ):

ตัวอย่าง

รับเมทริกซ์ผลตอบแทน:

.

การลดความซับซ้อนของเมทริกซ์การชำระเงิน:

การปรากฏตัวของจุดอาน:

5.8. เล่นกับธรรมชาติ

ตรงกันข้ามกับปัญหาของทฤษฎีเกมใน ทฤษฎี การตัดสินใจทางสถิติ สถานการณ์ที่ไม่แน่นอนไม่มีความขัดแย้งที่เป็นปฏิปักษ์และขึ้นอยู่กับความเป็นจริงเชิงวัตถุซึ่งเรียกกันทั่วไปว่า "ธรรมชาติ" .

ในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ ผู้เล่น II เป็นชุดของปัจจัยที่ไม่แน่นอนซึ่งส่งผลต่อประสิทธิภาพของการตัดสินใจ

เกมเมทริกซ์ที่มีธรรมชาติแตกต่างจากเกมเมทริกซ์ทั่วไปเฉพาะเมื่อผู้เล่นที่ฉันเลือกกลยุทธ์ที่เหมาะสมที่สุด เป็นไปไม่ได้อีกต่อไปที่จะพึ่งพาความจริงที่ว่าผู้เล่น II จะพยายามลดการสูญเสียของเขาให้เหลือน้อยที่สุด ดังนั้น ควบคู่ไปกับเมทริกซ์ผลตอบแทน เราขอแนะนำ เมทริกซ์ความเสี่ยง :

ค่าความเสี่ยงของผู้เล่น I อยู่ที่ไหนเมื่อใช้การเคลื่อนไหวภายใต้เงื่อนไขเท่ากับส่วนต่าง ระหว่างผลตอบแทนที่ผู้เล่นจะได้รับ ถ้าเขารู้ว่าเงื่อนไขจะถูกสร้างขึ้น กล่าวคือ และผลตอบแทนซึ่งเขาจะได้รับโดยไม่รู้ว่าเมื่อเลือกย้ายแล้วจะมีการกำหนดเงื่อนไข

ดังนั้นเมทริกซ์ผลตอบแทนจึงถูกแปลงเป็นเมทริกซ์ความเสี่ยงโดยเฉพาะ และการแปลงแบบย้อนกลับนั้นคลุมเครือ

ตัวอย่าง

ชนะเมทริกซ์:

.

เมทริกซ์ความเสี่ยง:

เป็นไปได้ สองประโยคปัญหา เกี่ยวกับการเลือกวิธีแก้ปัญหา ในเกมเมทริกซ์กับธรรมชาติ :

กำไรสูงสุด;

การลดความเสี่ยง

ปัญหาการตัดสินใจสามารถกำหนดได้สองเงื่อนไข:

- มีความเสี่ยง เมื่อทราบฟังก์ชันการกระจายความน่าจะเป็นของกลยุทธ์ของธรรมชาติ ตัวอย่างเช่น ตัวแปรสุ่มของการเกิดขึ้นของแต่ละสถานการณ์ทางเศรษฐกิจเฉพาะที่เสนอ

- ภายใต้เงื่อนไขความไม่แน่นอน เมื่อไม่ทราบฟังก์ชันการกระจายความน่าจะเป็นดังกล่าว

5.9. การแก้ปัญหาในทฤษฎีการแก้ปัญหาทางสถิติ

มีความเสี่ยง

เมื่อต้องตัดสินใจภายใต้ความเสี่ยง ผู้เล่นรู้ดีถึงความน่าจะเป็น การเริ่มต้นของสถานะของธรรมชาติ

จากนั้นจึงเป็นการสมควรที่ผู้เล่น I จะเลือกกลยุทธ์ที่ มูลค่าเฉลี่ยของผลตอบแทนตามเส้นคือสูงสุด :

.

เมื่อแก้ปัญหานี้ด้วยเมทริกซ์ความเสี่ยง เราจะได้โซลูชันเดียวกันกับ ความเสี่ยงเฉลี่ยขั้นต่ำ :

.

5.10. การแก้ปัญหาในทฤษฎีการแก้ปัญหาทางสถิติ

ภายใต้เงื่อนไขความไม่แน่นอน

เมื่อทำการตัดสินใจภายใต้ความไม่แน่นอน คุณสามารถใช้สิ่งต่อไปนี้ได้ เกณฑ์ :

เกณฑ์สูงสุดของ Wald;

เกณฑ์ ความเสี่ยงน้อยที่สุดป่าเถื่อน;

เกณฑ์ของการมองโลกในแง่ร้าย - การมองโลกในแง่ดีของ Hurwitz;

หลักการของ Laplace เหตุผลไม่เพียงพอ

พิจารณา เกณฑ์ maximin Wald .

เกมที่มีลักษณะเป็นธรรมชาตินั้นเล่นร่วมกับคู่ต่อสู้ที่ดุดันพอสมควร เช่น วิธีการรับประกันภัยต่อจะดำเนินการจากตำแหน่งที่มองโลกในแง่ร้ายสุดโต่งสำหรับเมทริกซ์ผลตอบแทน:

.

พิจารณา เกณฑ์ความเสี่ยงขั้นต่ำของอำมหิต .

คล้ายกับแนวทางก่อนหน้านี้จากตำแหน่งของการมองโลกในแง่ร้ายที่รุนแรงสำหรับเมทริกซ์ความเสี่ยง:

.

พิจารณา เกณฑ์ของการมองโลกในแง่ร้าย - การมองโลกในแง่ดีของ Hurwitz .

เสนอโอกาสที่จะไม่ถูกชี้นำโดยการมองโลกในแง่ร้ายอย่างสุดขั้วหรือการมองโลกในแง่ดีอย่างสุดขั้ว:

ระดับของการมองโลกในแง่ร้ายอยู่ที่ไหน ;

ใน - การมองโลกในแง่ดีสุดขีด

ใน - การมองโลกในแง่ร้ายสุดขีด

พิจารณา หลักการของ Laplace ของเหตุผลไม่เพียงพอ .

สันนิษฐานว่าสภาวะธรรมชาติทั้งหมดมีความเป็นไปได้เท่าเทียมกัน:

,

.

บทสรุปในส่วนที่ห้า

ผู้เล่นสองคนมีส่วนร่วมในเกมเมทริกซ์ และฟังก์ชันการจ่ายเงิน ซึ่งทำหน้าที่กำหนดจำนวนเงินที่จ่ายจากผู้เล่นที่แพ้ให้กับผู้ชนะ จะแสดงเป็นเมทริกซ์การจ่ายเงิน ตกลงกันว่าผู้เล่นที่ฉันเลือกแถวเมทริกซ์ผลตอบแทนเป็นการย้าย และผู้เล่น II เลือกคอลัมน์ใดคอลัมน์หนึ่ง จากนั้นที่จุดตัดของแถวและคอลัมน์ที่เลือกของเมทริกซ์นี้คือค่าตัวเลขของการชำระเงินให้กับผู้เล่น I จากผู้เล่น II (หากค่านี้เป็นค่าบวก ผู้เล่นที่ฉันชนะจริง ๆ และหากเป็นค่าลบ แสดงว่าผู้เล่น II เป็นหลักชนะ)

หากมีจุดอานในเมทริกซ์ผลตอบแทน ผู้เล่นมีกลยุทธ์ที่ดีที่สุด นั่นคือ เพื่อที่จะชนะ แต่ละคนจะต้องทำซ้ำการเคลื่อนไหวที่เหมาะสมที่สุดของเขา หากไม่มีจุดอาน เพื่อที่จะชนะ แต่ละคนต้องใช้กลยุทธ์ผสมที่เหมาะสม นั่นคือ ใช้ท่าผสมกัน ซึ่งแต่ละท่าจะต้องสร้างด้วยความน่าจะเป็นที่เหมาะสมที่สุด

การค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2×2 ทำได้โดยการคำนวณความน่าจะเป็นที่เหมาะสมที่สุดโดยใช้สูตรที่ทราบ โดยใช้ โซลูชันทางเรขาคณิตเกม 2×n คำจำกัดความของกลยุทธ์แบบผสมที่เหมาะสมที่สุดจะลดลงเพื่อค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2×2 ในการแก้เกม m×n วิธีการเขียนโปรแกรมเชิงเส้นจะใช้เพื่อค้นหากลยุทธ์ผสมที่เหมาะสมที่สุด

เมทริกซ์ผลตอบแทนบางตัวช่วยให้เข้าใจง่าย ซึ่งเป็นผลมาจากการที่มิติของพวกมันลดลงโดยการลบแถวและคอลัมน์ที่สอดคล้องกับการเคลื่อนไหวที่ไม่คาดฝัน

หากผู้เล่น II เป็นชุดของปัจจัยที่ไม่แน่นอนซึ่งขึ้นอยู่กับความเป็นจริงตามวัตถุประสงค์และไม่มีความขัดแย้งที่เป็นปรปักษ์กัน เกมดังกล่าวจะเรียกว่าเกมที่มีธรรมชาติ และปัญหาของทฤษฎีการตัดสินใจทางสถิติจะถูกนำมาใช้ในการแก้ปัญหา จากนั้นพร้อมกับเมทริกซ์การจ่ายผลตอบแทน มีการแนะนำเมทริกซ์ความเสี่ยงและสองสูตรของปัญหาในการเลือกวิธีแก้ปัญหาในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ: เพิ่มกำไรสูงสุดและลดความเสี่ยงให้น้อยที่สุด

การแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติภายใต้เงื่อนไขความเสี่ยงแสดงให้เห็นว่า เป็นการสมควรสำหรับผู้เล่นที่ 1 ให้เลือกกลยุทธ์ที่ค่าเฉลี่ย (ความคาดหวัง) ของผลตอบแทนที่นำมาตามเส้นของเมทริกซ์ผลตอบแทนสูงสุดหรือ ( ซึ่งเหมือนกัน) ค่าเฉลี่ย (ความคาดหวัง) ของความเสี่ยง ที่นำมาโดยเส้นของเมทริกซ์ความเสี่ยงนั้นน้อยที่สุด เมื่อทำการตัดสินใจภายใต้ความไม่แน่นอน เกณฑ์ต่อไปนี้จะถูกใช้: เกณฑ์สูงสุดของ Wald, เกณฑ์ความเสี่ยงขั้นต่ำของ Savage, เกณฑ์การมองโลกในแง่ดีในแง่ร้ายของ Hurwitz, หลักการของ Laplace ที่มีเหตุผลไม่เพียงพอ

คำถามสำหรับการตรวจสอบตนเอง

แนวคิดพื้นฐานของทฤษฎีเกมกำหนดไว้อย่างไร: การเคลื่อนไหว กลยุทธ์ และฟังก์ชันผลตอบแทน

ฟังก์ชันการจ่ายเงินแสดงในเกมเมทริกซ์อย่างไร?

เหตุใดเกมเมทริกซ์จึงเรียกว่าผลรวมเป็นศูนย์

ขั้นตอนการเล่นเกมเมทริกซ์เป็นอย่างไร?

เกมอะไรที่เรียกว่าเกม m×n?

กลยุทธ์เกมเมทริกซ์ที่ดีที่สุดคืออะไร?

อะไรคือกลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ที่เรียกว่า pure?

จุดอานของเมทริกซ์ผลตอบแทนหมายความว่าอย่างไร

อะไรคือกลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ที่เรียกว่ามิกซ์?

กลยุทธ์ผสมของผู้เล่นคืออะไร?

ผลตอบแทนสำหรับผู้เล่น I จากผู้เล่น II ที่เลือกกลยุทธ์แบบผสมคืออะไร?

กลยุทธ์แบบผสมใดที่เรียกว่าเหมาะสมที่สุด

ความแตกต่างที่ไม่ได้กระจายหมายถึงอะไร

วิธีใดที่ใช้ในการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2×2?

กลยุทธ์แบบผสมที่ดีที่สุดพบได้อย่างไรสำหรับเกม 2×n?

วิธีใดที่ใช้ในการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม m×n?

อะไรคือคุณสมบัติของการแก้เกมเมทริกซ์?

การลดความซับซ้อนของเมทริกซ์การชำระเงินหมายถึงอะไรและภายใต้เงื่อนไขใดที่สามารถนำไปใช้ได้

เกมเมทริกซ์ใดแก้ง่ายกว่าเมื่อเมทริกซ์ผลตอบแทนมีหรือไม่มีจุดอาน

ปัญหาใดของทฤษฎีเกมที่เกี่ยวข้องกับปัญหาของทฤษฎีการตัดสินใจทางสถิติ

เมทริกซ์ผลตอบแทนถูกแปลงเป็นเมทริกซ์ความเสี่ยงอย่างไร?

สองสูตรของปัญหาในการเลือกวิธีแก้ปัญหาที่เป็นไปได้ในเกมเมทริกซ์ที่มีธรรมชาติคืออะไร?

สำหรับสองเงื่อนไขใดที่สามารถกำหนดปัญหาในการตัดสินใจในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ?

กลยุทธ์ใดที่เหมาะสมสำหรับผู้เล่นที่ฉันเลือกเมื่อแก้ปัญหาทฤษฎีการตัดสินใจทางสถิติภายใต้ความเสี่ยง?

เกณฑ์การตัดสินใจใดที่สามารถนำมาใช้ในการแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติภายใต้ความไม่แน่นอน?

ตัวอย่างการแก้ปัญหา

1. เมทริกซ์การชำระเงินระบุจำนวนกำไรขององค์กรเมื่อขายได้ ประเภทต่างๆผลิตภัณฑ์ (คอลัมน์) ขึ้นอยู่กับความต้องการที่กำหนดไว้ (แถว) จำเป็นต้องกำหนดกลยุทธ์ที่เหมาะสมที่สุดขององค์กรสำหรับการผลิตผลิตภัณฑ์ประเภทต่างๆ และรายได้สูงสุด (โดยเฉลี่ย) ที่สอดคล้องกันจากการขาย

แสดงถึงเมทริกซ์ที่กำหนดโดยและแนะนำตัวแปร เราจะใช้เมทริกซ์ (เวกเตอร์) ด้วย จากนั้น และ นั่นคือ .

คำนวณเมทริกซ์ผกผัน:

พบค่า:

.

คำนวณความน่าจะเป็น:

รายได้เฉลี่ยจากการขายถูกกำหนด:

.

2. บริษัท "Pharmatsevt" - ผู้ผลิตยาและผลิตภัณฑ์ชีวการแพทย์ในภูมิภาค เป็นที่ทราบกันดีว่าความต้องการยาบางชนิดพุ่งสูงขึ้นใน ช่วงฤดูร้อน(ยาของกลุ่มหัวใจและหลอดเลือด, ยาแก้ปวด) สำหรับคนอื่น ๆ - สำหรับช่วงฤดูใบไม้ร่วงและฤดูใบไม้ผลิ (ป้องกันการติดเชื้อ, ฤทธิ์ต้านฤทธิ์)

ราคาต่อ 1 Conv. หน่วย ผลิตภัณฑ์สำหรับเดือนกันยายนถึงตุลาคมคือ: สำหรับกลุ่มแรก (ยารักษาโรคหัวใจและหลอดเลือดและยาแก้ปวด) - 20 รูเบิล; สำหรับกลุ่มที่สอง (ยาต้านการติดเชื้อ, ยาแก้ไอ) - 15 รูเบิล

จากการสังเกตมากกว่าหลาย ปีที่ผ่านมาบริการด้านการตลาดของบริษัทพบว่าสามารถขายเครื่องทั่วไปได้ 3050 เครื่องในช่วงสองเดือนภายใต้การพิจารณาสภาพอากาศที่อบอุ่น หน่วย สินค้ากลุ่มแรกและ 1100 Conv. หน่วย ผลิตภัณฑ์ของกลุ่มที่สอง ในสภาพอากาศหนาวเย็น - 1525 arb หน่วย ผลิตภัณฑ์ของกลุ่มแรกและ 3690 Conv. หน่วย กลุ่มที่สอง

ในการเชื่อมต่อกับการเปลี่ยนแปลงสภาพอากาศที่เป็นไปได้งานคือการกำหนดกลยุทธ์ของ บริษัท ในการผลิตผลิตภัณฑ์ที่ให้รายได้สูงสุดจากการขายในราคาขาย 40 รูเบิล สำหรับ 1 Conv. หน่วย สินค้ากลุ่มแรกและ 30 น. - กลุ่มที่สอง

วิธีการแก้. บริษัท มีสองกลยุทธ์:

ปีนี้อากาศจะอบอุ่น

อากาศจะเย็น

หาก บริษัท ใช้กลยุทธ์และสภาพอากาศอบอุ่นจริง ๆ (กลยุทธ์ของธรรมชาติ) ผลิตภัณฑ์ที่ผลิต (3050 หน่วยทั่วไปของยากลุ่มแรกและ 1100 หน่วยทั่วไปของกลุ่มที่สอง) จะรับรู้อย่างเต็มที่และรายได้จะ เป็น

3050×(40-20)+1100×(30-15)=77500 ร.

ในสภาพอากาศที่หนาวเย็น (กลยุทธ์ของธรรมชาติ) ยากลุ่มที่สองจะขายเต็มจำนวนและกลุ่มแรกจะขายเฉพาะจำนวน 1525 หน่วยทั่วไปเท่านั้น หน่วย และยาบางชนิดก็ยังขายไม่ออก รายได้จะเป็น

1525×(40-20)+1100×(30-15)-20×()=16500 ร.

ในทำนองเดียวกัน หากรูปแบบใช้กลยุทธ์และอากาศหนาวจริง รายได้ก็จะเป็น

1525×(40-20)+3690×(30-15)=85850 ร.

อากาศร้อนมีรายได้

1525×(40-20)+1100×(30-15)-() ×15=8150 ร.

เมื่อพิจารณาถึงบริษัทและสภาพอากาศในฐานะผู้เล่นสองคน เราจะได้เมทริกซ์ผลตอบแทน

,

ราคาเกมอยู่ในช่วง

จะเห็นได้จาก payoff matrix ว่าภายใต้เงื่อนไขทั้งหมด รายได้ของบริษัทจะอยู่ที่ 16,500 rubles เป็นอย่างน้อย แต่ถ้า สภาพอากาศตรงกับกลยุทธ์ที่เลือก รายได้ของบริษัทสามารถเป็น 77,500 รูเบิล

มาหาวิธีแก้เกมกัน

ให้เราแสดงความน่าจะเป็นของการใช้กลยุทธ์โดยบริษัทเป็น กลยุทธ์ผ่าน และ แก้เกมแบบกราฟิกเราได้รับ ในขณะที่ราคาของเกมอาร์

แผนการผลิตยาที่เหมาะสมที่สุดจะเป็น

ดังนั้นจึงเป็นการสมควรที่บริษัทจะผลิตเครื่องรุ่นธรรมดาจำนวน 2379 เครื่องในช่วงเดือนกันยายนและตุลาคม หน่วย ยากลุ่มแรกและ 2239.6 หน่วยทั่วไป หน่วย ยาเสพติดของกลุ่มที่สองจากนั้นในทุกสภาพอากาศเธอจะได้รับรายได้อย่างน้อย 46,986 รูเบิล

ภายใต้เงื่อนไขของความไม่แน่นอน หากเป็นไปไม่ได้ที่บริษัทจะใช้กลยุทธ์แบบผสม (สัญญากับองค์กรอื่น) เราใช้เกณฑ์ต่อไปนี้เพื่อกำหนดกลยุทธ์ที่เหมาะสมที่สุดของบริษัท:

เกณฑ์ Walde:

เกณฑ์ของ Hurwitz: เพื่อความชัดเจน เรายอมรับ จากนั้นสำหรับกลยุทธ์ของบริษัท

สำหรับกลยุทธ์

ขอแนะนำให้บริษัทใช้กลยุทธ์นี้

เกณฑ์ของ Savage องค์ประกอบสูงสุดในคอลัมน์แรกคือ 77500 ในคอลัมน์ที่สองคือ 85850

องค์ประกอบของเมทริกซ์ความเสี่ยงหาได้จากนิพจน์

,

ที่ไหน , ,

เมทริกซ์ความเสี่ยงมีรูปแบบ

,

ขอแนะนำให้ใช้กลยุทธ์หรือ.

ดังนั้นจึงแนะนำให้บริษัทใช้กลยุทธ์หรือ

โปรดทราบว่าเกณฑ์การพิจารณาแต่ละข้อไม่สามารถถือว่าน่าพอใจอย่างสมบูรณ์สำหรับ ทางเลือกสุดท้ายการตัดสินใจ แต่การวิเคราะห์ร่วมกันทำให้สามารถนำเสนอผลที่ตามมาของการตัดสินใจด้านการจัดการบางอย่างได้ชัดเจนยิ่งขึ้น

ด้วยการแจกแจงความน่าจะเป็นที่ทราบของสภาวะธรรมชาติต่างๆ เกณฑ์การตัดสินใจคือความคาดหวังทางคณิตศาสตร์สูงสุดของผลตอบแทน

ให้ทราบปัญหาที่พิจารณาว่าความน่าจะเป็นของสภาพอากาศที่อบอุ่นและเย็นมีค่าเท่ากับ 0.5 แล้วจึงกำหนดกลยุทธ์ที่เหมาะสมของบริษัทดังนี้

ขอแนะนำให้บริษัทใช้กลยุทธ์หรือ

งานสำหรับงานอิสระ

1. องค์กรสามารถผลิตสินค้าได้ 3 ประเภท (A, B และ C) โดยได้รับผลกำไรตามความต้องการ ในทางกลับกัน อุปสงค์สามารถรับหนึ่งในสี่สถานะ (I, II, III และ IV) ในเมทริกซ์ต่อไปนี้ องค์ประกอบจะแสดงลักษณะผลกำไรที่องค์กรจะได้รับเมื่อปล่อยผลิตภัณฑ์ที่ - และ - สถานะของอุปสงค์:

คำอธิบายของเกม bimatrix. เกมทั้งหมดที่ถือว่าเป็นของคลาส เกมผลรวมศูนย์. อย่างไรก็ตาม สถานการณ์ความขัดแย้งจำนวนหนึ่งที่เกิดขึ้นในระหว่างการดำเนินการมีลักษณะเฉพาะโดยข้อเท็จจริงที่ว่าการได้รับจากฝ่ายหนึ่งไม่เท่ากับการสูญเสียของอีกฝ่ายหนึ่งทุกประการ โมเดลทฤษฎีเกมสถานการณ์ดังกล่าวเป็นเกมที่ไม่ร่วมมือกันโดยมีผลรวมที่ไม่เป็นศูนย์ เกมดังกล่าวเรียกว่า bimatrix เนื่องจากงานของแต่ละเกมดังกล่าวจะลดลงเป็นงานของเมทริกซ์สองตัวและรูปแบบเดียวกัน: .

กระบวนการ เกม bimatrixประกอบด้วยตัวเลือกอิสระของตัวเลขโดยผู้เล่น I และหมายเลขโดยผู้เล่น II หลังจากนั้นผู้เล่นที่ฉันจะได้รับค่าตอบแทน และผู้เล่น II จะได้รับค่าตอบแทน

หมายเลขแถวของเมทริกซ์และจะถูกเรียกว่า กลยุทธ์ที่บริสุทธิ์ของผู้เล่น I และหมายเลขคอลัมน์ของเมทริกซ์เหล่านี้คือ กลยุทธ์ที่บริสุทธิ์ของผู้เล่นครั้งที่สอง จากนั้นรูปแบบคู่จะเป็นสถานการณ์ในกลยุทธ์ที่บริสุทธิ์ เกม bimatrixและตัวเลขและผลตอบแทนของผู้เล่น I และ II ในสถานการณ์ ดังนั้น การแจกแจงความน่าจะเป็นของการใช้กลยุทธ์บริสุทธิ์ของผู้เล่น I คือ และผู้เล่น II - เราจะเรียก กลยุทธ์ผสม. จากนั้นคู่ของแบบฟอร์มแสดงถึงสถานการณ์ เกม bimatrixใน กลยุทธ์ผสมและตัวเลข และ คือผลตอบแทนที่คาดหวังของผู้เล่น I และ II

สถานการณ์สมดุลของเกม bimatrix ในกลยุทธ์แบบผสมเราจะเรียกคู่นั้นว่า:

(8.2)
,

ความคาดหวังทางคณิตศาสตร์ของผลตอบแทนของผู้เล่น I อยู่ที่ไหน

ความคาดหวังทางคณิตศาสตร์ของผลตอบแทนของผู้เล่น II;

ผสมที่เหมาะสมที่สุด กลยุทธ์ผู้เล่นฉัน;

ผสมที่เหมาะสมที่สุด กลยุทธ์ผู้เล่นครั้งที่สอง

งาน

การสร้างและการแก้ปัญหาของเกม bimatrix. สมมุติว่าเรือดำน้ำต่อต้านเรือดำน้ำของประเทศกำลังค้นหาเรือดำน้ำติดขีปนาวุธของรัฐซึ่งกำลังเคลื่อนที่อยู่ในส่วนที่กำหนดไว้อย่างเข้มงวดของพื้นที่ลาดตระเวนการต่อสู้ เรือดำน้ำ ASW ปฏิบัติการในพื้นที่ที่เหลือและค้นหา ASW ให้เรือต่อต้านเรือดำน้ำแต่ละลำเพื่อตรวจจับศัตรูสามารถใช้สถานีพลังน้ำของตนได้ทั้งในโหมดแอคทีฟ เปิดเครื่องเป็นระยะ หรือเฉพาะในโหมดพาสซีฟเท่านั้น ทำการค้นหาอย่างต่อเนื่อง

ทั้งเรือดำน้ำต่อต้านเรือดำน้ำและเรือดำน้ำขีปนาวุธที่ตรวจจับสัญญาณโซนาร์สามารถหลบเลี่ยงศัตรูได้ อย่างไรก็ตาม ความถี่ของการเปิดโซนาร์ทำให้การตรวจจับเป็นไปได้แต่ไม่น่าเชื่อถือ

ในการดังกล่าว สถานการณ์ความขัดแย้งผู้เล่นคนหนึ่งเป็นเรือดำน้ำต่อต้านเรือดำน้ำ และอีกคนหนึ่งเป็นเรือดำน้ำต่อต้านเรือดำน้ำ เห็นได้ชัดว่า เรือดำน้ำมิซไซล์ไม่สามารถเป็นผู้เล่นได้ เนื่องจากมีโหมดการดำเนินการเพียงโหมดเดียวซึ่งก็คือการหลบเลี่ยงและดำเนินการหลบเลี่ยงด้วย การตรวจจับสัญญาณโซนาร์

ลักษณะเด่นของที่นี่คือผู้เล่นแต่ละคนแสวงหาเป้าหมายที่แตกต่างกันแต่ไม่ตรงข้าม แท้จริงแล้ว จุดประสงค์ของเรือดำน้ำ ASW คือการหาตำแหน่งของเรือดำน้ำขีปนาวุธ และจุดประสงค์ของเรือดำน้ำ ASW ก็คือการหาตำแหน่งของ ASW ดังนั้น ในการประเมินความสำเร็จของเป้าหมายโดยผู้เล่นแต่ละคน ขึ้นอยู่กับวิธีการเลือกปฏิบัติ (กลยุทธ์) จำเป็นต้องมีเกณฑ์ประสิทธิภาพสองประการ และตามนั้น สองฟังก์ชันผลตอบแทน จากนั้นโมเดลของสถานการณ์ความขัดแย้งดังกล่าวจะเป็นเกมที่มีขอบเขตจำกัดโดยมีผลรวมที่ไม่เป็นศูนย์ อธิบายโดยเมทริกซ์สองตัวที่มีรูปแบบเดียวกัน และ เรียกว่า บิเมทริกซ์

มาลองกันเถอะ เกณฑ์ประสิทธิภาพเรือดำน้ำต่อต้านเรือดำน้ำ (ผู้เล่น I) ความน่าจะเป็นในการตรวจจับเรือดำน้ำขีปนาวุธและสำหรับ เกณฑ์ประสิทธิภาพเรือดำน้ำต่อต้านเรือดำน้ำ (ผู้เล่น II) - ความน่าจะเป็นในการตรวจจับเรือดำน้ำต่อต้านเรือดำน้ำ . จากนั้นเกม bimatrix จะได้รับโดยเมทริกซ์ (รูปที่ 9.a) และเมทริกซ์ (รูปที่ 9.b)


ข้าว. 9.ก.


ข้าว. 9.ข.

ที่ไหน - ใช้โหมดแอคทีฟ;

การใช้โหมดพาสซีฟ

ในบรรดาเกมที่มีความสำคัญในทางปฏิบัติ เกมที่มีจุดอานนั้นค่อนข้างหายาก โดยทั่วไปมากขึ้นคือกรณีที่ราคาที่ต่ำกว่าและราคาสูงกว่า - เกมต่างกัน เมื่อวิเคราะห์เมทริกซ์ของเกมดังกล่าวแล้ว เราก็ได้ข้อสรุปว่าหากผู้เล่นแต่ละคนได้รับเลือก

หนึ่งเดียว - กลยุทธ์เดียว ดังนั้นโดยอิงจากคู่ต่อสู้ที่มีเหตุผล ทางเลือกนี้ควรถูกกำหนดโดยหลักการ minimax การปฏิบัติตามกลยุทธ์สูงสุดของเรา เรารับประกันว่าตนเองจะได้รับผลตอบแทนเท่ากับราคาที่ต่ำกว่าของเกม a สำหรับพฤติกรรมใดๆ ของคู่ต่อสู้ คำถามธรรมดาเกิดขึ้น: เป็นไปได้ไหมที่จะรับประกันว่าตัวเองจะได้รับผลตอบแทนโดยเฉลี่ยมากกว่า a ถ้าคุณใช้กลยุทธ์ที่ "บริสุทธิ์" เพียงกลยุทธ์เดียว แต่สลับกลยุทธ์หลายๆ อย่างแบบสุ่ม

กลยุทธ์ที่รวมกันดังกล่าวประกอบด้วยการใช้กลยุทธ์บริสุทธิ์หลายอย่างสลับกันตามกฎสุ่มที่มีอัตราส่วนของความถี่ที่แน่นอนเรียกว่ากลยุทธ์แบบผสมในทฤษฎีเกม

เห็นได้ชัดว่า แต่ละกลยุทธ์ล้วนเป็นกรณีพิเศษของกลยุทธ์แบบผสม ซึ่งกลยุทธ์ทั้งหมดยกเว้นกลยุทธ์หนึ่งจะถูกนำไปใช้กับความถี่เป็นศูนย์ และกลยุทธ์นี้ - ด้วยความถี่ 1

ปรากฎว่าไม่เพียงแต่ใช้กลยุทธ์ที่บริสุทธิ์เท่านั้น แต่ยังรวมถึงกลยุทธ์แบบผสมด้วย มันเป็นไปได้ที่จะได้รับวิธีแก้ปัญหาสำหรับแต่ละเกมที่จำกัด นั่นคือคู่ของกลยุทธ์ (โดยทั่วไปผสม) ซึ่งเมื่อผู้เล่นทั้งสองใช้พวกเขา ผลตอบแทนจะเท่ากับ ราคาเกม และเมื่อมีการเบี่ยงเบนด้านเดียวจากกลยุทธ์ที่เหมาะสม ผลตอบแทนสามารถเปลี่ยนไปในทิศทางที่ไม่เอื้ออำนวยต่อผู้เบี่ยงเบนเท่านั้น

ข้อความดังกล่าวเป็นเนื้อหาของทฤษฎีบทหลักที่เรียกว่าทฤษฎีเกม ทฤษฎีบทนี้ได้รับการพิสูจน์ครั้งแรกโดยฟอน นอยมันน์ในปี ค.ศ. 1928 การพิสูจน์ทฤษฎีบทนี้ค่อนข้างซับซ้อน ดังนั้นเราจึงนำเสนอเฉพาะสูตรของมันเท่านั้น

ทุกเกมจำกัดมีทางออกอย่างน้อยหนึ่งทาง (อาจอยู่ในขอบเขตของกลยุทธ์แบบผสม)

ผลตอบแทนที่เกิดจากการตัดสินใจเรียกว่าราคาของเกม จากทฤษฎีบทหลักที่ทุกเกมไฟไนต์มีราคา เห็นได้ชัดว่าราคาของเกม v อยู่ระหว่างราคาที่ต่ำกว่าของเกม a และราคาสูงกว่าของเกม :

อันที่จริง มีผลตอบแทนสูงสุดที่รับประกันได้ว่าเราสามารถรับประกันได้โดยใช้เพียงกลยุทธ์ของเราเองเท่านั้น เนื่องจากกลยุทธ์แบบผสมนั้นรวมถึงกลยุทธ์ที่บริสุทธิ์ทั้งหมดเป็นกรณีพิเศษ ดังนั้น ยอมให้นอกจากกลยุทธ์ที่บริสุทธิ์แล้ว ยังผสมด้วย

กลยุทธ์ ไม่ว่าในกรณีใด เราจะไม่ทำให้ความสามารถของเราแย่ลง เพราะเหตุนี้,

ในทำนองเดียวกัน เมื่อพิจารณาถึงความสามารถของคู่ต่อสู้แล้ว เราแสดงว่า

ดังนั้นความไม่เท่าเทียมกันที่จำเป็น (3.1) จึงตามมา

ให้เราแนะนำสัญลักษณ์พิเศษสำหรับกลยุทธ์แบบผสม ตัวอย่างเช่น หากกลยุทธ์แบบผสมของเราประกอบด้วยการใช้กลยุทธ์ AL กับความถี่ และเราจะแสดงถึงกลยุทธ์นี้

ในทำนองเดียวกัน กลยุทธ์แบบผสมของปฏิปักษ์จะแสดงโดย:

ความถี่ที่กลยุทธ์ผสมอยู่ที่ไหน

สมมติว่าเราพบวิธีแก้ปัญหาของเกมซึ่งประกอบด้วยกลยุทธ์แบบผสมที่ดีที่สุดสองแบบคือ S, S ในกรณีทั่วไป ไม่ใช่กลยุทธ์ทั้งหมดที่มีให้สำหรับผู้เล่นรายใดรายหนึ่งที่รวมอยู่ในกลยุทธ์แบบผสมที่เหมาะสมที่สุดของเขา แต่มีเพียงบางกลยุทธ์เท่านั้น เราจะเรียกกลยุทธ์ที่รวมอยู่ในกลยุทธ์แบบผสมที่ดีที่สุดของผู้เล่นว่ากลยุทธ์ "มีประโยชน์" ของเขา

ปรากฎว่าวิธีแก้ปัญหาของเกมมีคุณสมบัติที่โดดเด่นอีกอย่างหนึ่ง: หากผู้เล่นคนใดคนหนึ่งปฏิบัติตามกลยุทธ์ผสมที่ดีที่สุดของเขา 5 (5) จากนั้นผลตอบแทนจะยังคงไม่เปลี่ยนแปลงและเท่ากับราคาของเกม v ไม่ว่าผู้เล่นคนอื่นจะทำอะไรก็ตาม ถ้าเขา ไม่ได้ไปไกลกว่ากลยุทธ์ที่ "มีประโยชน์" เท่านั้น ตัวอย่างเช่น เขาสามารถใช้กลยุทธ์ที่ "มีประโยชน์" ใดๆ ของเขาใน รูปแบบบริสุทธิ์และยังสามารถผสมในสัดส่วนใดก็ได้

มาพิสูจน์คำกล่าวนี้กัน ให้มีวิธีแก้ปัญหาของเกม เพื่อความเป็นรูปธรรม เราจะถือว่ากลยุทธ์การผสมที่ดีที่สุดประกอบด้วยส่วนผสมของสาม

กลยุทธ์ที่ "มีประโยชน์" ตามลำดับประกอบด้วยกลยุทธ์ที่ "มีประโยชน์" สามอย่างผสมกัน

และระบุว่าถ้าเรายึดกลยุทธ์ S แล้วฝ่ายตรงข้ามก็สามารถใช้กลยุทธ์ในสัดส่วนใด ๆ และผลตอบแทนจะยังคงไม่เปลี่ยนแปลงและจะยังคงเท่ากับราคาของเกม

โดยทั่วไป V * ≠ V * - ไม่มีจุดอาน นอกจากนี้ยังไม่มีวิธีแก้ปัญหาที่ดีที่สุดในกลยุทธ์ที่บริสุทธิ์ อย่างไรก็ตาม หากเราขยายแนวคิดของกลยุทธ์ล้วนๆ โดยการแนะนำแนวคิดของกลยุทธ์แบบผสม เราก็สามารถใช้อัลกอริธึมเพื่อค้นหาวิธีแก้ปัญหาที่เหมาะสมที่สุดสำหรับปัญหาเกมที่ไม่ได้กำหนดไว้อย่างชัดเจน ในสถานการณ์เช่นนี้ ขอเสนอให้ใช้วิธีการทางสถิติ (ความน่าจะเป็น) เพื่อค้นหาวิธีแก้ปัญหาที่เหมาะสมที่สุดสำหรับเกมที่เป็นปฏิปักษ์ สำหรับผู้เล่นแต่ละคน พร้อมกับชุดของกลยุทธ์ที่เป็นไปได้สำหรับเขา มีการแนะนำเวกเตอร์ของความน่าจะเป็น (ความถี่สัมพัทธ์) ที่ไม่รู้จักซึ่งควรใช้กลยุทธ์อย่างใดอย่างหนึ่ง

ให้เราแสดงเวกเตอร์ของความน่าจะเป็น (ความถี่สัมพัทธ์) ของทางเลือกของกลยุทธ์ที่กำหนดของผู้เล่น A ดังนี้:
P = (p 1 , p 2 ,…, p ม.),
โดยที่ p i ≥ 0, p 1 + p 2 +…+ p m = 1 ค่า p i เรียกว่าความน่าจะเป็น (ความถี่สัมพัทธ์) ของการใช้กลยุทธ์ A ผม

ในทำนองเดียวกันสำหรับผู้เล่น B จะมีการแนะนำเวกเตอร์ของความน่าจะเป็นที่ไม่รู้จัก (ความถี่สัมพัทธ์) ซึ่งมีรูปแบบ:
Q = (q 1 , q 2 ,…, q n),
โดยที่ q j ≥ 0, q 1 + q 2 +…+ q n = 1 ปริมาณ q j เรียกว่าความน่าจะเป็น (ความถี่สัมพัทธ์) ของการใช้กลยุทธ์ B j ชุด (รวมกัน) ของกลยุทธ์บริสุทธิ์ A 1 , A 2 , …A m และ B 1, B 2, …B n ร่วมกับเวกเตอร์ความน่าจะเป็นของการเลือกแต่ละรายการถูกเรียก กลยุทธ์ผสม

ทฤษฎีบทหลักในทฤษฎีเกมที่เป็นปรปักษ์กันคือ ทฤษฎีบทของฟอน นอยมันน์: เกมเมทริกซ์ไฟไนต์ทุกเกมมีทางออกที่ดีที่สุดอย่างน้อยหนึ่งวิธี อาจเป็นกลยุทธ์แบบผสมก็ได้.
จากทฤษฎีบทนี้ว่าเกมที่ไม่ได้กำหนดไว้อย่างดีมีวิธีแก้ปัญหาที่ดีที่สุดอย่างน้อยหนึ่งวิธีในกลยุทธ์แบบผสม ในเกมดังกล่าว การแก้ปัญหาจะเป็นคู่ของกลยุทธ์ผสมที่เหมาะสมที่สุด P * และ Q * เช่นนั้นหากผู้เล่นคนใดคนหนึ่งปฏิบัติตามกลยุทธ์ที่เหมาะสมที่สุดของเขา ผู้เล่นคนอื่นจะเบี่ยงเบนไปจากกลยุทธ์ที่ดีที่สุดของเขาไม่ได้
ผลตอบแทนเฉลี่ยของผู้เล่น A ถูกกำหนดโดยความคาดหวังทางคณิตศาสตร์:

หากความน่าจะเป็น (ความถี่สัมพัทธ์) ของการใช้กลยุทธ์แตกต่างจากศูนย์ กลยุทธ์ดังกล่าวจะเรียกว่า คล่องแคล่ว.

กลยุทธ์ P * , Q * เรียกว่า ผสมที่ดีที่สุดกลยุทธ์ถ้า MA (P, Q *) ≤ MA (P * , Q *) ≤ MA (P * , Q) (1)
ในกรณีนี้เรียกว่า MA (P * , Q *) ในราคาเกมและแสดงด้วย V (V * ≤ V ≤ V *) อสมการแรก (1) หมายความว่า การเบี่ยงเบนของผู้เล่น A จากกลยุทธ์ผสมที่ดีที่สุดของเขาโดยมีเงื่อนไขว่าผู้เล่น B ยึดมั่นในกลยุทธ์ผสมที่ดีที่สุดของเขา ส่งผลให้กำไรเฉลี่ยลดลงผู้เล่น A. ความไม่เท่าเทียมกันที่สองหมายความว่า การเบี่ยงเบนของผู้เล่น B จากกลยุทธ์ผสมที่ดีที่สุดของเขาโดยมีเงื่อนไขว่าผู้เล่น A ยึดมั่นในกลยุทธ์ผสมที่ดีที่สุดของเขา นำไปสู่การเพิ่มขึ้นในการสูญเสียเฉลี่ยของผู้เล่นB.

ในกรณีทั่วไป เครื่องคำนวณนี้แก้ปัญหาดังกล่าวได้สำเร็จ

ตัวอย่าง.

4 7 2
7 3 2
2 1 8

1. ตรวจสอบว่าเมทริกซ์ผลตอบแทนมีจุดอานหรือไม่. ถ้าใช่ เราจะเขียนวิธีแก้ปัญหาของเกมด้วยกลยุทธ์ล้วนๆ

เราคิดว่าผู้เล่นที่ฉันเลือกกลยุทธ์ของเขาในลักษณะที่จะเพิ่มผลตอบแทนสูงสุดของเขา และผู้เล่น II เลือกกลยุทธ์ของเขาในลักษณะที่จะลดผลตอบแทนของผู้เล่น I

ผู้เล่น B1 B2 B3 a = นาที (Ai)
A 1 4 7 2 2
A2 7 3 2 2
A 3 2 1 8 1
b = สูงสุด (Bi) 7 7 8

เราพบผลตอบแทนที่รับประกันซึ่งกำหนดโดยราคาที่ต่ำกว่าของเกม a = max(a i) = 2 ซึ่งบ่งบอกถึงกลยุทธ์สูงสุด A 1
ราคาสูงเกม b = นาที (b j) = 7 สิ่งนี้บ่งชี้ว่าไม่มีจุดอาน เนื่องจาก a ≠ b ดังนั้นราคาของเกมจะอยู่ภายใน 2 ≤ y ≤ 7 เราพบวิธีแก้ปัญหาของเกมในกลยุทธ์แบบผสม นี่คือคำอธิบายโดยข้อเท็จจริงที่ว่าผู้เล่นไม่สามารถประกาศกลยุทธ์ที่บริสุทธิ์ของตนต่อคู่ต่อสู้ได้: พวกเขาควรซ่อนการกระทำของตน เกมสามารถแก้ไขได้โดยให้ผู้เล่นเลือกกลยุทธ์ของพวกเขาแบบสุ่ม (ผสมกลยุทธ์ล้วนๆ)

2. ตรวจสอบเมทริกซ์ผลตอบแทนสำหรับแถวที่โดดเด่นและคอลัมน์ที่โดดเด่น.
ไม่มีแถวที่โดดเด่นและคอลัมน์ที่โดดเด่นในเมทริกซ์ผลตอบแทน

3. หาวิธีแก้ปัญหาในเกมด้วยกลยุทธ์แบบผสม.
มาเขียนระบบสมการกัน
สำหรับผู้เล่น I
4p1 +7p2 +2p3 = y
7p1 +3p2 +p3 = y
2p 1 +2p 2 +8p 3 = y
p1 +p2 +p3 = 1

สำหรับผู้เล่น II
4q1 +7q2 +2q3 = y
7q1 +3q2 +2q3 = y
2q1 +q2 +8q3 = y
q 1 + q 2 + q 3 = 1

การแก้ปัญหาระบบเหล่านี้ด้วยวิธีเกาส์ เราพบว่า:

y=4 1/34
p 1 = 29/68 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 1)
p 2 = 4/17 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 2)
p 3 = 23/68 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 3)

กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น I: P = (29 / 68 ; 4 / 17 ; 23 / 68)
q 1 = 6 / 17 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 1)
q 2 = 9/34 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 2)
q 3 = 13/34 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 3)

กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น II: Q = (6 / 17 ; 9 / 34 ; 13 / 34)
ราคาเกม: y = 4 1 / 34

ทางเลือกของบรรณาธิการ
Robert Anson Heinlein เป็นนักเขียนชาวอเมริกัน ร่วมกับ Arthur C. Clarke และ Isaac Asimov เขาเป็นหนึ่งใน "บิ๊กทรี" ของผู้ก่อตั้ง...

การเดินทางทางอากาศ: ชั่วโมงแห่งความเบื่อหน่ายคั่นด้วยช่วงเวลาที่ตื่นตระหนก El Boliska 208 ลิงก์อ้าง 3 นาทีเพื่อสะท้อน...

Ivan Alekseevich Bunin - นักเขียนที่ยิ่งใหญ่ที่สุดในช่วงเปลี่ยนศตวรรษที่ XIX-XX เขาเข้าสู่วงการวรรณกรรมในฐานะกวี สร้างสรรค์บทกวีที่ยอดเยี่ยม...

โทนี่ แบลร์ ซึ่งเข้ารับตำแหน่งเมื่อวันที่ 2 พฤษภาคม 1997 กลายเป็นผู้นำที่อายุน้อยที่สุดของรัฐบาลอังกฤษ ...
ตั้งแต่วันที่ 18 สิงหาคมในบ็อกซ์ออฟฟิศของรัสเซียเรื่อง "Guys with Guns" โศกนาฏกรรมที่มี Jonah Hill และ Miles Teller ในบทบาทนำ หนังเล่าว่า...
Tony Blair เกิดมาเพื่อ Leo และ Hazel Blair และเติบโตใน Durham พ่อของเขาเป็นทนายความที่มีชื่อเสียงซึ่งลงสมัครรับเลือกตั้งในรัฐสภา...
ประวัติศาสตร์รัสเซีย หัวข้อที่ 12 ของสหภาพโซเวียตในยุค 30 ของอุตสาหกรรมในสหภาพโซเวียต การทำให้เป็นอุตสาหกรรมคือการพัฒนาอุตสาหกรรมแบบเร่งรัดของประเทศใน ...
คำนำ "... ดังนั้นในส่วนเหล่านี้ด้วยความช่วยเหลือจากพระเจ้าเราได้รับมากกว่าที่เราแสดงความยินดีกับคุณ" Peter I เขียนด้วยความปิติยินดีที่เซนต์ปีเตอร์สเบิร์กเมื่อวันที่ 30 สิงหาคม ...
หัวข้อที่ 3 เสรีนิยมในรัสเซีย 1. วิวัฒนาการของเสรีนิยมรัสเซีย เสรีนิยมรัสเซียเป็นปรากฏการณ์ดั้งเดิมที่มีพื้นฐานมาจาก ...