คุณอยู่ที่นี่ไหม: สูตร

กลยุทธ์ที่บริสุทธิ์- กำหนด (ไม่รวมการสุ่ม) แผนปฏิบัติการ ในบทที่แล้ว เราพิจารณาเพียงกลยุทธ์ล้วนๆ กลยุทธ์แบบผสมจะกล่าวถึงในหัวข้อ 2.2 แต่สำหรับตอนนี้ เว้นแต่จะระบุไว้เป็นอย่างอื่น โดยกลยุทธ์ เราหมายถึงกลยุทธ์ที่บริสุทธิ์เสมอ

บ่อยครั้งในกระบวนการนำเสนอ เราจะอธิบายแนวคิดของการแก้ปัญหาด้วยตัวอย่างเกม bimatrix ดังนั้นเราจะให้คำจำกัดความที่สอดคล้องกัน

คำจำกัดความ 2.1. จบเกมเป็นเกมที่ชุดผู้เล่นและชุดกลยุทธ์ของผู้เล่นแต่ละคนมีองค์ประกอบจำนวนจำกัด เกมสุดท้ายของคนสองคนเรียกว่า เกมบิเมทริกซ์

นามสกุลมาจากรูปแบบการบันทึกการชนะที่สะดวกสบายในเกมดังกล่าว โดยใช้เมทริกซ์คู่

สำหรับการวิเคราะห์เพิ่มเติม จะสะดวกที่จะแบ่งกลยุทธ์ในโปรไฟล์กลยุทธ์ตามอำเภอใจเป็นกลยุทธ์ของผู้เล่นบางคน และกลยุทธ์ของผู้เล่นอื่นทั้งหมด s_ (. อย่างเป็นทางการ s = (.y, s,) ไม่ได้หมายความว่าเราจะสลับพิกัดของโปรไฟล์กลยุทธ์ แต่เราแนะนำวิธีอื่นในการแสดงเท่านั้น

แนวคิดแรกในการแก้เกมที่เราจะพิจารณาคือความสมดุลในกลยุทธ์ที่โดดเด่น

คำจำกัดความ 2.2 กลยุทธของผู้เล่น /-th ครอบงำอย่างเคร่งครัดกลยุทธ์ของเขา s" if Uj(s jt s .) ,) > h,(s", s ,) สำหรับชุด s ใด ๆ ของกลยุทธ์ของผู้เล่นที่เหลือ ในกรณีนี้ กลยุทธ์ s" จะเรียกว่า ครอบงำอย่างเคร่งครัด

โดยพื้นฐานแล้ว นี่หมายความว่าสำหรับทุกๆ แก้ไขแล้วในชุดกลยุทธของผู้เล่นที่เหลือ ผู้เล่นที่ i เลือกกลยุทธ์รับอย่างเคร่งครัด ชนะที่ใหญ่กว่ากว่าการเลือกกลยุทธิ์" สมมติให้คิดเอาเองว่า ผู้เล่นที่มีเหตุผลไม่ควรเลือกกลยุทธ์ที่ครอบงำอย่างเคร่งครัดสมมติฐานดังกล่าวในเกมที่ง่ายที่สุดอาจเพียงพอที่จะหาวิธีแก้ปัญหาของเกม

คำจำกัดความ 2.3 รายละเอียดกลยุทธ์ s* =(s*, s^,..., s*) เรียกว่า สมดุลใน (อย่างเคร่งครัด) กลยุทธ์ที่โดดเด่นถ้าสำหรับผู้เล่นคนที่ i กลยุทธ์จะครอบงำกลยุทธ์อื่นๆ ของเขาอย่างเคร่งครัด

อาจดูเหมือนว่าแนวคิดการแก้ปัญหานี้สามารถนำไปสู่ข้อสรุปเล็กน้อยเท่านั้น ผู้เล่นแต่ละคนมีหนึ่งในกลยุทธ์ที่จะให้ผลตอบแทนมากกว่าคนอื่นๆ ไม่ว่าคู่ต่อสู้ของเขาจะทำอะไรก็ตาม จากนั้นเขาก็จะใช้กลยุทธ์นี้ในภาวะสมดุล ทุกอย่างค่อนข้างชัดเจน แต่สถานการณ์นี้เป็นเรื่องปกติสำหรับบางทีอาจเป็นสถานการณ์ที่มีชื่อเสียงและสำคัญมากสำหรับการวิเคราะห์สถานการณ์เชิงปฏิบัติจำนวนหนึ่งของเกม "ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ"

ตัวอย่าง 2.1 (ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ) อาชญากรทั้งสองถูกควบคุมตัวในเซลล์ที่ต่างกันและไม่สามารถสื่อสารได้ การสอบสวนมีหลักฐานเพียงพอที่จะตัดสินลงโทษแต่ละคนในข้อหาก่ออาชญากรรมเล็กๆ น้อยๆ เป็นเวลาหนึ่งปี แต่สำหรับอาชญากรรมร้ายแรงที่อาชญากรต้องโทษจำคุก 10 ปี การสอบสวนไม่มีหลักฐานเพียงพอ ตัวแทนของการสอบสวนเสนอข้อตกลงกับอาชญากรแต่ละคน: อาชญากรจะได้รับเงื่อนไขสำหรับ

น้อยกว่าหนึ่งปีถ้าเขาให้การเป็นพยานกับคู่ของเขาซึ่งจะเพียงพอที่จะตั้งข้อหาคนหลังด้วยอาชญากรรมร้ายแรง สมมติว่าอาชญากรกังวลเรื่องจำนวนปีที่พวกเขาจะถูกจำคุกเท่านั้น ในแต่ละปีเพิ่มเติมจะลบด้วยค่าสาธารณูปโภคหนึ่งหน่วย จากนั้นการจ่ายเงินของอาชญากรสามารถแสดงด้วยเมทริกซ์คู่ต่อไปนี้:

ในกรณีที่ไม่มีชื่อผู้เข้าร่วมในเกม เราจะถือว่ากลยุทธ์ที่แตกต่างกันของผู้เข้าร่วมคนแรกนั้นสอดคล้องกับแถวของเมทริกซ์คู่ และกลยุทธ์ของผู้เข้าร่วมคนที่สองสอดคล้องกับคอลัมน์ ถ้าในตัวอย่างของเรา นักโทษคนแรกให้การเป็นพยาน และคนที่สองไม่ให้การเป็นพยาน นักโทษคนแรกจะได้รับการปล่อยตัว และคนที่สองจะได้รับโทษจำคุกสิบปี

สังเกตได้ง่ายว่าไม่ว่าผู้ต้องขังคนอื่นๆ กระทำการอย่างไร กำไรก็ยิ่งมากขึ้น (ระยะเวลาจำคุกสั้นลง) หากให้หลักฐาน (สำหรับผู้เล่นคนแรก พิกัดแรกในแถวแรกของเมทริกซ์คู่จะเคร่งครัด มากกว่าในแถวที่สอง สำหรับผู้เล่นคนที่สอง พิกัดที่สองในเมทริกซ์คู่ของคอลัมน์แรกจะมากกว่าในคอลัมน์ที่สองอย่างเคร่งครัด) จากนั้นดุลยภาพในกลยุทธ์ที่โดดเด่นจะเป็นรายละเอียดของกลยุทธ์ (เป็นพยาน, เป็นพยาน)

มีความสนใจใน ตัวอย่างนี้ที่ผู้เล่นเลือกพฤติกรรมที่เพิ่มผลตอบแทนของพวกเขาจบลงในสถานการณ์ที่ผลตอบแทนของพวกเขาต่ำเมื่อเทียบกับสถานการณ์ที่ตรงกันข้าม - เมื่อทั้งคู่เลือกที่จะเงียบ คำอธิบายอยู่ในการปรากฏตัวของผลกระทบภายนอกที่แข็งแกร่งเช่น อิทธิพลที่แข็งแกร่งของการกระทำของผู้เล่นคนหนึ่งที่มีต่อผลตอบแทนของผู้เล่นอีกคน เป็นผลให้รายละเอียดความสมดุลของกลยุทธ์กลายเป็น Pareto เดียวที่ไม่มีประสิทธิภาพในเกมนี้ โปรดทราบว่าประสิทธิภาพของ Pareto ที่พึงประสงค์จากมุมมองของผู้เข้าร่วมในเกม อาจไม่เป็นที่ต้องการจากมุมมองทางสังคม เช่นในกรณีนี้

สถานการณ์เช่นภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษมักเกิดขึ้นในการวิเคราะห์สถานการณ์ทางเศรษฐกิจ ยกตัวอย่าง การแข่งขันระหว่างสองร้านที่ขายสินค้าชุดเดียวกัน เพื่อความง่าย สมมติว่าร้านค้าสามารถเรียกเก็บเงินได้เพียงสองระดับราคา - สูงหรือต่ำ ผู้บริโภคมักชอบซื้อจากร้านค้าที่มีราคาต่ำกว่า จากนั้นผลตอบแทนของร้านค้าที่มีผลกำไรอาจมีลักษณะดังนี้:

จากมุมมองของดุลยภาพ สถานการณ์ที่นี่คล้ายคลึงกับภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ - ดุลยภาพในกลยุทธ์ที่มีอำนาจเหนือกว่า (ราคาต่ำ ราคาต่ำ) เป็นเพียงโปรไฟล์ที่ไม่มีประสิทธิภาพของ Pareto (และเป็นที่ต้องการจากมุมมองทางสังคมด้วย)

ความนิยมในวงกว้างของภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษที่กล่าวไปแล้วนั้นเป็นเหตุผลว่าทำไม พวกเขาจึงพยายามทดลองเพื่อทดสอบความถูกต้องของการทำนายของทฤษฎีเกมโดยใช้ตัวอย่าง การทดสอบคือสอง คนแปลกหน้าเสนอให้เล่นเกมเพื่อเงินพร้อมรางวัล (เช่น เป็นดอลลาร์) ใกล้เคียงกับที่ระบุไว้สำหรับเกมของสองร้าน ผู้เข้าร่วมแต่ละคนตัดสินใจแยกกัน (มักจะไม่ระบุชื่อ) และไม่ทราบการตัดสินใจของผู้เล่นคนอื่นก่อนจะได้รับรางวัล ปรากฎว่าภายใต้เงื่อนไขดังกล่าว ในการเล่นเกมหลายๆ เกม ผู้เล่นไม่ได้ผลลัพธ์ที่สมดุล โดยถือว่ารางวัลเงินสดประมาณการเงินรางวัลได้ถูกต้อง แน่นอนว่าผลการทดลองเหล่านี้ไม่ได้ติดตามว่าการทำนายของทฤษฎีเกมไม่ถูกต้อง แต่เพียงเท่านั้นเมื่อประเมินผลตอบแทนผู้เล่นคำนึงถึงปัจจัยที่ไม่ใช่ตัวเงิน - การพิจารณาเห็นแก่ประโยชน์ผู้อื่นความเป็นธรรม ฯลฯ หากประมาณการผลตอบแทนของผู้เล่นได้อย่างถูกต้อง ผู้เล่นควรเลือกใช้กลยุทธ์ที่โดดเด่น และเลือกกลยุทธ์นั้น ดังนั้น คุณค่าของการทดลองประเภทนี้จึงไม่ได้อยู่ที่การทดสอบการทำนายตามทฤษฎีเกม แต่เป็นการประเมินบทบาทของแรงจูงใจที่ไม่ใช่วัตถุในการกระทำของบุคคล

น้อยกว่าแนวคิดของการครอบงำที่แข็งแกร่งอย่างมีนัยสำคัญ ทฤษฎีเกมใช้แนวคิดของการครอบงำที่อ่อนแอ

คำจำกัดความ 2.4. กลยุทธ์ของผู้เล่น /-th, ครอบงำอย่างอ่อนแอกลยุทธ์ของเขา s" if ม.(s, s ,) > ม ; (sJ, s ,) สำหรับชุดกลยุทธ์ของผู้เล่นคนอื่น ๆ s_j,ยิ่งไปกว่านั้น สำหรับกลยุทธ์อย่างน้อยหนึ่งชุดของผู้เล่นอื่น ความไม่เท่าเทียมกันนั้นได้รับการพึงพอใจอย่างเคร่งครัด จากนั้นกลยุทธ์ s" เรียกว่า ถูกครอบงำอย่างอ่อนแอ

ในกรณีของความไม่เท่าเทียมกันอย่างไม่เข้มงวด เป็นไปไม่ได้อีกต่อไปที่จะยืนยันว่าผู้เล่นที่มีเหตุผลจะไม่เลือกกลยุทธ์ที่ครอบงำอย่างอ่อนแอ แม้ว่าพฤติกรรมดังกล่าวจะดูสมเหตุสมผลก็ตาม แม้จะไม่ค่อยได้ใช้ คำนิยามของดุลยภาพในกลยุทธ์ที่มีอำนาจเหนือกว่าอย่างอ่อนแอที่คล้ายคลึงกับกรณีของการครอบงำอย่างรุนแรง

คำจำกัดความ 2.5 โปรไฟล์กลยุทธ์ s* = (s*, Sj,..., s*) เรียกว่า สมดุลในกลยุทธ์ที่ครอบงำอย่างอ่อนแอถ้าสำหรับผู้เล่นคนที่ i กลยุทธ์ของเขาก็มีอิทธิพลเหนือกลยุทธ์อื่นๆ ของเขาอย่างอ่อนแอ

ตัวอย่าง 2.2 (ปิดการประมูลราคาที่สอง) การประมูลแบบปิดของราคาที่สองจัดขึ้นระหว่างบุคคลสองคน การประมูลมีการจัดดังนี้ ผู้เข้าร่วมแต่ละคนระบุอัตราที่ไม่เป็นลบ โดยไม่ทราบอัตราของผู้เข้าร่วมคนอื่นๆ (ในซอง) สมาชิกที่ทำ ราคาเสนอสูงสุดจ่ายจำนวนเงินสูงสุดจากการเสนอราคาของผู้เข้าร่วมรายอื่น (เช่น จำนวนที่สอง แต่เป็นมูลค่าของการเสนอราคา) และรับบางรายการ ตัวอย่างเช่น หากราคาเสนอของผู้เล่นเท่ากับ 100 และ 90 ดังนั้นผู้เข้าร่วมที่เสนอราคา 100 ชนะการประมูล เขาจะได้ไอเท็มนั้นมาในราคา 90 ซึ่งเป็นขนาดของการประมูลครั้งที่สอง ให้ผู้เข้าร่วมแต่ละคนมีการประเมินเรื่องที่แสดงเป็นหน่วยเงิน v2> 0 ผู้เข้าร่วมทั้งหมดทราบการประมาณการเหล่านี้ เพื่อความง่ายในการอธิบายเกม ถ้าผู้เข้าร่วมทั้งสองระบุอัตราเดียวกัน วัตถุก็จะไปถึงผู้เข้าร่วมคนแรก

ในเกมนี้ กลยุทธ์ของผู้เล่นคนแรกจะเป็นขนาดของเงินเดิมพันของเขา เนื่องจากอัตราไม่เป็นค่าลบ ชุดของกลยุทธ์ที่เป็นไปได้ทั้งหมด

5, = 0 = u,(o, s 2) > w,(s, s 2) = u, - s 2 v x ครอบงำกลยุทธ์ s,.

เราได้แสดงให้เห็นแล้วว่าสำหรับผู้เล่นคนแรก กลยุทธ์ในการตั้งชื่อคะแนนในฐานะการเดิมพันนั้นมีอิทธิพลเหนือกลยุทธ์อื่นๆ อย่างอ่อน เป็นการง่ายที่จะตรวจสอบว่าข้อความที่คล้ายกันเป็นจริงสำหรับผู้เล่นคนที่สองเช่นกัน ให้สังเกตว่าในการให้เหตุผลของเรา เราไม่เคยใช้ข้อเท็จจริงที่ว่าผู้เล่นทราบการประมาณการของผู้เล่นอื่น ซึ่งหมายความว่าในกรณีของเกมที่มีข้อมูลไม่ครบถ้วนในการประมูลแบบปิดของราคาที่สอง จะทำกำไรได้ไม่น้อย ประมาณการของคุณมากกว่าที่จะเสนอราคาอื่นๆ

อาจดูเหมือนว่าไม่เป็นประโยชน์สำหรับผู้ขายที่จะจัดให้มีการประมูลราคาที่สอง เมื่อเขาสามารถจัดการประมูลราคาแรกและรับมูลค่าไม่ใช่ครั้งที่สอง แต่เป็นการประมูลครั้งแรก อย่างไรก็ตาม มูลค่าของอัตราในกรณีการประมูลราคาแรกในดุลยภาพจะลดลง เราจะพูดถึงผลตอบแทนของการประมูลในบทที่ 5. ในระหว่างนี้ เราสังเกตว่าการประมูลราคาที่สองเป็นที่นิยมอย่างมากและมีการใช้กันอย่างแพร่หลาย ตัวอย่างเช่น โดยบริษัทต่างๆ Googleและ "Yandex" เมื่อขายโฆษณาตามบริบทบนอินเทอร์เน็ต

ความสมดุลในกลยุทธ์ที่โดดเด่นมีอยู่ในเกมกลุ่มเล็กๆ เท่านั้น โดยทั่วไปแล้ว ผู้เล่นไม่มีกลยุทธ์เดียวที่จะครอบงำกลยุทธ์อื่นๆ ทั้งหมด แต่แนวความคิดของการครอบงำช่วยให้ค้นหาวิธีแก้ปัญหาในเกมระดับที่กว้างขึ้น ในการทำเช่นนี้ คุณต้องใช้เหตุผลที่สอดคล้องกันเกี่ยวกับการกระทำของผู้เล่น เราได้ตั้งข้อสังเกตแล้วว่าผู้เล่นที่มีเหตุผลจะไม่เลือกกลยุทธ์ที่ครอบงำอย่างเคร่งครัด แต่นี่หมายความว่าผู้เล่นคนอื่นสามารถวิเคราะห์เกมได้โดยไม่สนใจความเป็นไปได้ที่ฝ่ายตรงข้ามจะเลือกใช้กลยุทธ์ดังกล่าว บางทีการวิเคราะห์บางอย่างอาจเปิดเผยว่าผู้เล่นคนอื่นมีกลยุทธ์ที่ครอบงำซึ่งไม่ได้ครอบงำในเกมดั้งเดิม และอื่นๆ. ให้เราให้คำจำกัดความอย่างเป็นทางการ

กระบวนการ การยกเว้นตามลำดับของกลยุทธ์ที่ครอบงำอย่างมากกำหนดไว้ดังนี้ ให้เราแยกกลยุทธ์ที่ครอบงำอย่างเข้มงวดของผู้เล่นออกจากการพิจารณาเช่น พิจารณาเกมใหม่ที่กลยุทธ์ครอบงำทั้งหมดไม่รวมอยู่ในชุดของกลยุทธ์ที่เป็นไปได้ของผู้เล่น แล้วในนี้ เกมส์ใหม่เรากำจัดกลยุทธ์ที่ครอบงำอย่างเข้มงวดทั้งหมด และอื่นๆ

เป็นไปได้ว่ากระบวนการดังกล่าวจะสิ้นสุดลงเมื่อผู้เล่นมีกลยุทธ์หลายอย่างเหลืออยู่ แต่เป็นไปได้ที่ผู้เล่นแต่ละคนจะมีกลยุทธ์ที่ไม่ยกเว้นเพียงกลยุทธ์เดียว ดังนั้นควรพิจารณาชุดของกลยุทธ์เหล่านี้เป็นวิธีแก้ปัญหาของเกม .

คำจำกัดความ 2.6. หากเป็นผลมาจากการกำจัดกลยุทธ์ที่ครอบงำอย่างรุนแรงตามลำดับ ผู้เล่นแต่ละคนเหลือเพียงกลยุทธ์เดียว โปรไฟล์ของกลยุทธ์เหล่านี้จะถูกเรียก ความสมดุลของการครอบงำ

ในตัวอย่างที่ 1.1 เราได้รับเพียงความสมดุลดังกล่าว ลองพิจารณาอีกตัวอย่างหนึ่ง

โปรไฟล์กลยุทธ์ (N, P) เป็นเพียงความสมดุลของแนชในเกมนี้ แต่โปรดทราบว่าในการเลือก P ผู้เล่นคนที่สองต้องแน่ใจว่าผู้เล่นคนแรกไม่เลือก B แต่ผลตอบแทนของผู้เล่นคนแรกจะเท่ากันหากผู้เล่นคนที่สองเลือก II นอกจากนี้ โดยการเลือก B ผู้เล่นคนแรกอาจไม่กลัวว่าผู้เล่นคนที่สองจะเลือก L บางทีผู้เล่นคนที่สองที่มีเหตุผลจะคิดเกี่ยวกับการเลือกกลยุทธ์ C

คำถามที่สองที่ยังไม่พบคำตอบที่ชัดเจน: ผู้เล่นมาที่สมดุลของแนชได้อย่างไร

สถานการณ์สมมติเชิงทฤษฎีในอุดมคติมีดังนี้ ผู้เล่นสร้างความคาดหวังอย่างอิสระเกี่ยวกับการกระทำของผู้เล่นคนอื่น แล้วเลือกการกระทำที่จะให้ผลตอบแทนสูงสุดตามความคาดหวังที่กำหนด หากในกรณีนี้ ความคาดหวังสอดคล้องกับการกระทำที่ผู้เล่นเลือกจริงๆ เราก็จะได้รับสมดุลของแนช เหตุผลแนวนี้ช่วยให้เราสามารถเรียกสถานการณ์สมดุลของแนชกับ การเติมเต็มความคาดหวังในตนเองแต่ความคาดหวังมาจากไหน? และสมดุลใดของแนช ถ้ามีหลายอย่าง จะถูกเลือกอันเป็นผลมาจากกระบวนการที่อธิบายไว้? ในกรอบของสถานการณ์สมมติที่พิจารณา คำถามเหล่านี้ยังไม่ได้รับคำตอบ

อีกวิธีหนึ่งเกี่ยวข้องกับการฝึกผู้เล่น ผู้เล่นอาจเรียนรู้วิธีเล่นเกมตามทฤษฎี (นึกถึงนักศึกษาเศรษฐศาสตร์) หรือสัมผัสปฏิสัมพันธ์ที่คล้ายคลึงกัน (เช่น พนักงานที่มีประสบการณ์มาที่ ทีมใหม่) ซึ่งช่วยให้พวกเขาสร้างความคาดหวังได้อย่างถูกต้องและเลือกพฤติกรรมที่เหมาะสมที่สุด สถานการณ์นี้ทำให้สามารถอธิบายการก่อตัวของความคาดหวังได้ แต่ประการแรก มันลดขอบเขตของรูปแบบเกมให้เหลือเพียงสถานการณ์มาตรฐาน ศึกษา และพบบ่อยของการโต้ตอบ และประการที่สอง มันสามารถนำไปสู่ความจริงที่ว่าสถานการณ์ของซิงเกิ้ลและซ้ำ ปฏิสัมพันธ์ไม่แตกต่างกัน และอย่างหลังแตกต่างกันอย่างมีนัยสำคัญในแง่ของกลยุทธ์และวิธีการแก้ปัญหาภายในกรอบของทฤษฎีเกม ซึ่งจะกล่าวถึงในรายละเอียดเพิ่มเติมในบทที่ สี่.

สถานการณ์ที่สามคือมีข้อตกลงก่อนหน้านี้ระหว่างผู้เล่นหรือศุลกากรหรือกฎหมายหรือคำแนะนำจากบุคคลที่สามที่ควบคุมการโต้ตอบของผู้เล่น ในกรณีนี้ ข้อตกลงหรือคำแนะนำอาจไม่มีผลผูกพัน แต่ถ้าแนะนำให้เล่นสมดุลของแนช ก็ไม่มีผู้เล่นคนใดที่ต้องการ (คนเดียว) ที่จะเบี่ยงเบนไปจากพฤติกรรมที่กำหนด เป็นที่ชัดเจนว่าสถานการณ์ดังกล่าวไม่สามารถทำได้ในทุกสถานการณ์ นอกจากนี้ กระบวนการในการสร้างข้อตกลงหรือเกี่ยวข้องกับบุคคลที่สามสามารถกลายเป็นส่วนหนึ่งของเกมได้

สุดท้าย คำถามธรรมชาติข้อที่สามที่เกิดขึ้นเมื่อศึกษาแนวคิดของดุลยภาพแนชมีดังต่อไปนี้: มีหลักฐานเชิงประจักษ์ว่าผู้เล่นจริงมักเลือกกลยุทธ์สมดุลหรือไม่ ที่นี่อีกครั้งเป็นเรื่องยากมากที่จะให้คำตอบที่สั้นและชัดเจน ในขณะเดียวกัน ธรรมชาติของปัญหาที่เกิดขึ้นมีความสอดคล้องกับเรื่องของเศรษฐศาสตร์ทดลองมากกว่า ดังนั้นเราจึงจำกัดตัวเองให้อยู่ในคำแนะนำให้หันไปใช้วรรณกรรมเฉพาะทาง เช่น หนังสือที่มีการวิเคราะห์คำถามเกี่ยวกับวิธีการทดลองอย่างดีเยี่ยมและนำเสนอผลลัพธ์จำนวนหนึ่ง

มีเกมที่ไม่สมดุลในกลยุทธ์ที่บริสุทธิ์ (ดูตัวอย่างที่ 3.1) ดังนั้นคำถามจึงเกิดขึ้น: เงื่อนไขใดเพียงพอสำหรับการดำรงอยู่ของดุลยภาพดังกล่าว ให้เรากำหนดและพิสูจน์การยืนยันเกี่ยวกับการดำรงอยู่ของสมดุลของแนชในกลยุทธ์ที่บริสุทธิ์ในเกมที่ไม่มีที่สิ้นสุด

คำชี้แจง 2.3. ถ้าชุดของกลยุทธ์สำหรับผู้เล่นแต่ละคน เซนต์เป็นคอมแพคตานูนไม่ว่างในอวกาศแบบยุคลิดและฟังก์ชันผลตอบแทนของผู้เล่นแต่ละคน และ-ต่อเนื่องใน สและกึ่งเว้าใน 5 จากนั้นเกมมีความสมดุลของแนชในกลยุทธ์ที่บริสุทธิ์

การพิสูจน์.จำสูตร ทฤษฎีบทของคาคุไทซึ่งเราจะใช้ในการพิสูจน์ อนุญาต เอ็กซ์-ชุดคอมแพคนูนไม่ว่างใน น , X*เป็นเซตของเซตย่อยของมัน และ/ เป็นการแมปแบบกึ่งต่อเนื่องบนจาก Xใน x*,ว่าแต่ละจุด x อี xเยอะ เอฟ(x)ไม่ว่างเปล่าปิดและนูน จากนั้นการทำแผนที่ / มีจุดคงที่

แนวคิดในการพิสูจน์การยืนยันของเราคือการสร้างแผนที่ที่เป็นไปตามเงื่อนไขของทฤษฎีบทของ Kakutani ในการทำเช่นนี้ เราได้กำหนดการแสดงคำตอบที่ดีที่สุดใหม่เล็กน้อย ในทางเทคนิคแล้ว เราจะถือว่าคำตอบที่ดีที่สุดไม่ได้ขึ้นอยู่กับกลยุทธ์ของผู้เล่นคนอื่นเท่านั้น แต่ยังขึ้นอยู่กับกลยุทธ์ของผู้เล่นด้วย ด้วยการเปลี่ยนกลยุทธของผู้เล่นเองเมื่อ กลยุทธ์คงที่ผู้เล่นที่เหลือคำตอบที่ดีที่สุดแน่นอนจะไม่เปลี่ยนแปลง ตอนนี้เรามาแนะนำสัญกรณ์สำหรับแสดงคำตอบที่ดีที่สุดสำหรับผู้เล่นทุกคนในฐานะผลิตภัณฑ์คาร์ทีเซียน s(s) = s,(s) x s 2 (s) x... x s n (s).การแมปนี้กับแต่ละโปรไฟล์กำหนดชุดของโปรไฟล์ที่ผู้เล่นแต่ละคน วิธีที่ดีที่สุดตอบสนองต่อกลยุทธ์ของผู้เล่นคนอื่น จุดคงที่ของการทำแผนที่ S นั่นคือ ข้อมูลส่วนตัว สดังนั้น s e s(s)>โดยนิยามสมดุลของแนช ให้เราแสดงว่าการทำแผนที่ 5 เป็นไปตามเงื่อนไขของทฤษฎีบทคาคุทานิ การตรวจสอบแต่ละเงื่อนไขจะถือเป็นจุดพิสูจน์ที่แยกจากกัน

1. แสดงว่าเซต สโปรไฟล์ทั้งหมด - นูนนูน เนื่องจากภายใต้เงื่อนไขของการยืนยันชุดของกลยุทธ์ของผู้เล่น S แต่ละคนเป็นชุดที่นูนไม่ว่างจากนั้นจึงเป็นผลิตภัณฑ์คาร์ทีเซียน ส = เซนต์ X S2 X...x ส นเป็นแบบนูนนูน
2. จอแสดงผล สมีภาพไม่ว่าง โดยทฤษฎีบทไวเออร์สตราส ฟังก์ชันต่อเนื่อง และ-ไปถึงชุดที่มีขอบเขตปิด 5 ซึ่งเป็นค่าสูงสุด เพราะเหตุนี้, สมีภาพไม่ว่าง
3. แสดงภาพ สปิดและนูน เนื่องจากฟังก์ชั่นการจ่ายเงินของผู้เล่นแต่ละคน คุณ tกึ่งเว้าใน s ifจากนั้นโดยคุณสมบัติของฟังก์ชันกึ่งเว้า เซต $ = (ส. | คุณ t (s i9 s .) > k) สำหรับคงที่ ส .และ kปิดที่ พื้นที่ปิดคำจำกัดความและเป็นนูนถ้าไม่ว่างเปล่า เนื่องจากสิ่งนี้เป็นจริงสำหรับใคร ๆ kแล้วมันก็จริงด้วยว่าชุดที่ 5 = (5/1 คุณ t(s", 5 ,) > maxw.(s., ส .)}

นูน แต่แล้วผลคูณคาร์ทีเซียน 5(5) = s x (s) X s2(ส) x... x s n CS) ปิดและนูน

4. ให้เราแสดงว่าการทำแผนที่ § กึ่งต่อเนื่องจากด้านบน เราใช้เงื่อนไขความต่อเนื่องของฟังก์ชัน และ,โดย s. เราจะพิสูจน์ด้วยความขัดแย้ง สมมติว่าการแสดงผล § ns เป็นแบบกึ่งต่อเนื่องบน จากนั้นก็มีลำดับของโปรไฟล์กลยุทธ์ s mและ เอส ม ,ที่ไหน เสื้อ -หมายเลของค์ประกอบลำดับ เช่นนั้นสำหรับใดๆ tส"" เ S, s m e s(s""), ลิม s"" = s° อี S,แต่ lim s"" = s° g lim s(s") ซึ่งหมายความว่ามี

ท~* oo t->/และ -? oo

ร็อคที่กลยุทธ์ s f °ไม่ใช่การตอบสนองที่ดีที่สุดสำหรับ s 0 นั่นคือ มีกลยุทธ์ ส"ดังนั้น และ,(s", s 0,) > เรา]ส°;). จากนั้นเราสามารถหา e > 0 ได้ m,(s/, s 0 ,) > m,(s ; °, s 0 ,) + Ze มาจากไหน

เนื่องจาก โดยสมมติ ฟังก์ชัน m ต่อเนื่อง lim s m = s°, ลิม s"” = s°,

ม*อู้ ม-*oo

ที่มีขนาดใหญ่พอสมควร มขวา

เมื่อรวมความไม่เท่าเทียมกัน (2.8)-(2.10) เข้าเป็นลูกโซ่เดียว เราจะได้

จากความสัมพันธ์ (2.11) ที่ u,(s", s"") > m,(s/", s"") + s,แต่สิ่งนี้ขัดแย้งกับเงื่อนไข s"" e s(s"") เนื่องจาก s" ให้ผลตอบแทนมากกว่า s/" อย่างเคร่งครัด เพื่อตอบสนองต่อ s"" พวกเขามาถึงความขัดแย้ง ดังนั้น สมมติฐานเดิมของเราที่ s ไม่กึ่งต่อเนื่องบนจึงผิด

เราได้แสดงให้เห็นว่าการทำแผนที่ สเป็นไปตามเงื่อนไขทั้งหมดของทฤษฎีบทของ Kakutani และด้วยเหตุนี้จึงมีจุดตายตัว จุดคงที่นี้คือสมดุลของแนช การยืนยัน 2.3 ได้รับการพิสูจน์แล้ว ?

โดยเฉพาะอย่างยิ่ง คำชี้แจง 2.3 รับประกันการมีอยู่ของสมดุลของแนชในตัวอย่างที่ 2.7 แต่ไม่ใช่ในตัวอย่างที่ 2.8 ซึ่งฟังก์ชันการจ่ายเงินของผู้เล่นจะไม่ต่อเนื่อง

“ตัวอย่างจากการทำงาน

5. ทฤษฎีเกมและวิธีแก้ปัญหาทางสถิติ

5.1. เกมเมทริกซ์ผลรวมศูนย์

การสร้างแบบจำลองทางเศรษฐศาสตร์และคณิตศาสตร์ดำเนินการภายใต้เงื่อนไขต่อไปนี้:

ความแน่นอน;

ความไม่แน่นอน

การสร้างแบบจำลอง ภายใต้เงื่อนไขของความแน่นอน สันนิษฐานว่ามีข้อมูลกฎระเบียบเริ่มต้นทั้งหมดที่จำเป็นสำหรับสิ่งนี้ (การสร้างแบบจำลองเมทริกซ์ การวางแผนเครือข่ายและผู้บริหาร)

การสร้างแบบจำลอง มีความเสี่ยง ดำเนินการภายใต้ความไม่แน่นอนแบบสุ่มเมื่อค่าของข้อมูลเริ่มต้นบางส่วนเป็นแบบสุ่มและกฎของการแจกแจงความน่าจะเป็นของตัวแปรสุ่มเหล่านี้เป็นที่รู้จัก (การวิเคราะห์การถดถอยทฤษฎีการจัดคิว)

การสร้างแบบจำลอง ภายใต้เงื่อนไขความไม่แน่นอน สอดคล้องกับการขาดข้อมูลบางอย่างที่จำเป็นสำหรับสิ่งนี้ (ทฤษฎีเกม)

แบบจำลองทางคณิตศาสตร์สำหรับการตัดสินใจที่เหมาะสมในสถานการณ์ความขัดแย้งนั้นสร้างขึ้นภายใต้เงื่อนไขที่ไม่แน่นอน

ในทฤษฎีเกม ใช้แนวคิดพื้นฐานต่อไปนี้:

กลยุทธ์;

ฟังก์ชั่นวิน

เคลื่อนไหว เราจะเรียกตัวเลือกและการดำเนินการโดยผู้เล่นในการดำเนินการอย่างใดอย่างหนึ่งที่กำหนดโดยกฎของเกม

กลยุทธ์ - เป็นเทคโนโลยีในการเลือกแนวทางปฏิบัติสำหรับการเคลื่อนไหวแต่ละครั้ง ขึ้นอยู่กับสถานการณ์

ฟังก์ชั่นชนะ ทำหน้าที่กำหนดจำนวนเงินที่จ่ายให้กับผู้เล่นที่แพ้ให้กับผู้ชนะ

ในเกมเมทริกซ์ ฟังก์ชันการจ่ายเงินจะแสดงเป็น เมทริกซ์การชำระเงิน :

จำนวนเงินที่จ่ายให้กับผู้เล่น I ผู้เลือกการย้าย จากผู้เล่น II ผู้เลือกการย้ายอยู่ที่ไหน

ในเกมคู่นี้ ค่าของฟังก์ชันการจ่ายเงินของผู้เล่นทั้งสองในแต่ละสถานการณ์จะมีขนาดเท่ากันและตรงข้ามกันในเครื่องหมายเช่น และเกมนี้มีชื่อว่า ผลรวมศูนย์ .

กระบวนการของ "การเล่นเกมเมทริกซ์" มีดังต่อไปนี้:

มีการตั้งค่าเมทริกซ์การชำระเงิน

ผู้เล่น I โดยไม่คำนึงถึงผู้เล่น II จะเลือกหนึ่งในแถวของเมทริกซ์นี้ ตัวอย่างเช่น -th;

ผู้เล่น II ไม่ว่าผู้เล่น I จะเลือกคอลัมน์ใดคอลัมน์หนึ่งของเมทริกซ์นี้ ตัวอย่างเช่น - th;

องค์ประกอบของเมทริกซ์กำหนดจำนวนผู้เล่นที่ฉันจะได้รับจากผู้เล่น II แน่นอนว่าถ้า เรากำลังพูดถึงการสูญเสียผู้เล่นตัวจริงของ I.

การเล่นคู่ที่เป็นปฏิปักษ์กับ เมทริกซ์การชำระเงินและจะถูกเรียกว่าเกม

ตัวอย่าง

ลองพิจารณาเกม

กำหนดเมทริกซ์การชำระเงิน:

ให้ผู้เล่น I โดยไม่คำนึงถึงผู้เล่น II เลือกแถวที่ 3 ของเมทริกซ์นี้ และผู้เล่น II โดยไม่คำนึงถึงผู้เล่น I เลือกคอลัมน์ที่ 2 ของเมทริกซ์นี้:

จากนั้นผู้เล่น I จะได้รับ 9 หน่วยจากผู้เล่น II

5.2. กลยุทธ์ที่บริสุทธิ์ที่สุดในเกมเมทริกซ์

กลยุทธ์ที่เหมาะสมที่สุด กลยุทธ์ของผู้เล่น I ถูกเรียกว่าว่าเขาไม่ลดผลตอบแทนสำหรับกลยุทธ์ที่เลือกโดยผู้เล่น II และกลยุทธ์ของผู้เล่น II ที่เขาไม่เพิ่มการสูญเสียสำหรับกลยุทธ์ที่เลือกโดยผู้เล่น I

โดยการเลือกแถวที่ i ของเมทริกซ์ผลตอบแทนเป็นการย้าย ผู้เล่น I จะได้รับผลตอบแทนอย่างน้อยตามมูลค่าในกรณีที่เลวร้ายที่สุด เมื่อผู้เล่น II พยายามลดค่านี้ให้เหลือน้อยที่สุด ดังนั้นผู้เล่นฉันจะเลือกแถวที่ - ที่จะให้เขา ชนะสูงสุด:

ผู้เล่น II โต้แย้งในลักษณะเดียวกันและสามารถรับประกันการสูญเสียขั้นต่ำได้อย่างแน่นอน:

ความไม่เท่าเทียมกันต่อไปนี้เป็นจริงเสมอ:

ค่าที่เรียกว่า ราคาเกมที่ต่ำกว่า .

ค่าที่เรียกว่า ราคาเกมชั้นนำ .

กลยุทธ์ที่เหมาะสมเรียกว่า ทำความสะอาด หากได้รับความเท่าเทียมกันสำหรับพวกเขา:

ค่าที่เรียกว่า ราคาสุทธิของเกม , ถ้า .

กลยุทธ์และรูปแบบบริสุทธิ์ที่เหมาะสมที่สุด จุดอาน เมทริกซ์การชำระเงิน

สำหรับจุดอาน เป็นไปตามเงื่อนไขต่อไปนี้:

กล่าวคือ องค์ประกอบมีขนาดเล็กที่สุดในแถวและใหญ่ที่สุดในคอลัมน์

ดังนั้น ถ้าเมทริกซ์ผลตอบแทนมี จุดอาน แล้วคุณจะพบ กลยุทธ์บริสุทธิ์ที่ดีที่สุด ผู้เล่น

กลยุทธ์ที่บริสุทธิ์ของผู้เล่นที่ฉันสามารถแสดงได้ด้วยชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ซึ่งตัวเลขทั้งหมดมีค่าเท่ากับศูนย์ ยกเว้นตัวเลขในตำแหน่งที่ - ซึ่งเท่ากับหนึ่ง

กลยุทธ์ที่บริสุทธิ์ของผู้เล่น II สามารถแสดงด้วยชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ซึ่งตัวเลขทั้งหมดมีค่าเท่ากับศูนย์ ยกเว้นตัวเลขในตำแหน่งที่ - ซึ่งเท่ากับหนึ่ง

ตัวอย่าง

โดยการเลือกแถวของเมทริกซ์ผลตอบแทนเป็นการย้าย ผู้เล่น ฉันได้รับค่าตอบแทนในกรณีที่เลวร้ายที่สุด ไม่น้อยกว่าค่าในคอลัมน์ที่ทำเครื่องหมาย :

ดังนั้น ผู้เล่นฉันจะเลือกแถวที่ 2 ของเมทริกซ์การจ่ายเงิน ซึ่งให้ผลตอบแทนสูงสุดแก่เขา โดยไม่คำนึงถึงการเคลื่อนไหวของผู้เล่น II ซึ่งจะพยายามลดค่านี้ให้น้อยที่สุด:

ผู้เล่น II โต้แย้งในทำนองเดียวกันและเลือกคอลัมน์ที่ 1 เป็นการย้าย:

ดังนั้น มีจุดอานของเมทริกซ์ผลตอบแทน:

สอดคล้องกับกลยุทธ์ที่ดีที่สุดสำหรับผู้เล่น I และสำหรับผู้เล่น II ซึ่งผู้เล่นที่ฉันไม่ลดผลตอบแทนของเขาสำหรับการเปลี่ยนแปลงกลยุทธ์โดยผู้เล่น II และผู้เล่น II จะไม่เพิ่มการสูญเสียของเขาสำหรับการเปลี่ยนแปลงกลยุทธ์โดยผู้เล่น I

5.3. เหมาะสมที่สุด กลยุทธ์ผสมในเกมเมทริกซ์

หากเมทริกซ์ผลตอบแทนไม่มีจุดอาน ก็ไม่มีเหตุผลสำหรับผู้เล่นที่จะใช้กลยุทธ์เพียงอย่างเดียว กำไรในการใช้งานมากขึ้น "สารผสมความน่าจะเป็น" กลยุทธ์ที่บริสุทธิ์ จากนั้นกำหนดกลยุทธ์แบบผสมแล้วเป็นกลยุทธ์ที่เหมาะสมที่สุด

กลยุทธ์ผสม ผู้เล่นมีลักษณะการแจกแจงความน่าจะเป็น เหตุการณ์สุ่มซึ่งประกอบด้วยการเลือกย้ายโดยผู้เล่นรายนี้

กลยุทธ์ผสมของผู้เล่น I เป็นชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ที่ตรงตามเงื่อนไขสองประการ:

1) สำหรับ นั่นคือ ความน่าจะเป็นของการเลือกแต่ละแถวของเมทริกซ์ผลตอบแทนนั้นไม่เป็นลบ

2) นั่นคือ ตัวเลือกของแต่ละแถวเมทริกซ์ผลตอบแทนในการรวมหมายถึง เต็มกลุ่มเหตุการณ์

กลยุทธ์ผสมของผู้เล่น II คือชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) เป็นไปตามเงื่อนไข:

จำนวนเงินที่ชำระ ให้กับผู้เล่น I ผู้เลือกกลยุทธ์แบบผสม

จากผู้เล่น II ที่เลือกกลยุทธ์แบบผสม

เป็นค่าเฉลี่ย

เหมาะสมที่สุด เรียกว่ากลยุทธ์ผสม

และ ,

หากเป็นไปตามกลยุทธ์ผสมตามอำเภอใจและเงื่อนไขต่อไปนี้:

กล่าวคือ ภายใต้กลยุทธ์แบบผสมที่เหมาะสม ผลตอบแทนของผู้เล่น I จะมากที่สุด และการสูญเสียผู้เล่น II จะน้อยที่สุด

หากไม่มีจุดอานในเมทริกซ์ผลตอบแทน แล้ว

กล่าวคือ มีความแตกต่างในเชิงบวก ( ความแตกต่างที่คงอยู่ )

- ³ 0,

และผู้เล่นจำเป็นต้องมองหาโอกาสเพิ่มเติมเพื่อให้ได้รับส่วนแบ่งที่มากขึ้นของความแตกต่างนี้อย่างมั่นใจ

ตัวอย่าง

พิจารณาเกมที่กำหนดโดยเมทริกซ์ผลตอบแทน:

ตรวจสอบว่ามีจุดอานหรือไม่:

, .

ปรากฎว่าไม่มีจุดอานในเมทริกซ์ผลตอบแทนและความแตกต่างที่ไม่ได้กระจายคือ:

5.4. ค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุด

สำหรับ 2×2 เกม

การกำหนดกลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเมทริกซ์ผลตอบแทนที่มีมิติจะดำเนินการโดยวิธีการหาจุดที่เหมาะสมที่สุดของฟังก์ชันของตัวแปรสองตัว

ให้ความน่าจะเป็นของผู้เล่นที่ฉันเลือกแถวแรกของเมทริกซ์ผลตอบแทน

เท่ากับ . ความน่าจะเป็นที่จะเลือกแถวที่สองคือ

ให้ความน่าจะเป็นของผู้เล่น II เลือกคอลัมน์แรกเท่ากับ ความน่าจะเป็นที่จะเลือกคอลัมน์ที่สองคือ

จำนวนเงินที่จ่ายให้กับผู้เล่น I โดยผู้เล่น II เท่ากับ:

มูลค่าสูงสุดของผู้เล่นที่ฉันได้รับและการสูญเสียของผู้เล่น II นั้นสอดคล้องกับเงื่อนไข:

;

ดังนั้น กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น I และ II ตามลำดับ คือ:

5.5. โซลูชันทางเรขาคณิตของเกม 2×น

ด้วยการเพิ่มมิติของเมทริกซ์ผลตอบแทนจาก เป็น เป็น เป็นไปไม่ได้อีกต่อไปที่จะลดคำจำกัดความของกลยุทธ์ผสมที่เหมาะสมที่สุดเพื่อค้นหาฟังก์ชันที่เหมาะสมที่สุดของสองตัวแปร อย่างไรก็ตาม เนื่องจากผู้เล่นคนใดคนหนึ่งมีเพียงสองกลยุทธ์ จึงสามารถใช้โซลูชันทางเรขาคณิตได้

ขั้นตอนหลักในการหาวิธีแก้ปัญหาของเกมมีดังนี้

เราแนะนำระบบพิกัดบนเครื่องบิน ลองใส่ส่วนของเส้นตรงบนแกน จากปลายด้านซ้ายและขวาของส่วนนี้เราวาดเส้นตั้งฉาก

ปลายด้านซ้ายและขวาของส่วนหน่วยสอดคล้องกับสองกลยุทธ์ และ ใช้ได้สำหรับผู้เล่น I ในแนวตั้งฉากที่วาด เราจะเลื่อนการจ่ายเงินของผู้เล่นรายนี้ ตัวอย่างเช่น สำหรับเมทริกซ์ผลตอบแทน

ผลตอบแทนดังกล่าวของผู้เล่น I เมื่อเลือกกลยุทธ์จะเป็น และ และเมื่อเลือกกลยุทธ์ที่พวกเขาจะเป็น และ

ให้เราเชื่อมต่อจุดจ่ายของผู้เล่น I ซึ่งสอดคล้องกับกลยุทธ์ของผู้เล่น II โดยส่วนของเส้นตรง จากนั้นเส้นหักที่เกิดขึ้นซึ่งล้อมรอบแผนภูมิจากด้านล่างจะเป็นตัวกำหนดขอบเขตล่างของผลตอบแทนของผู้เล่น I

ค้นหากลยุทธ์ผสมที่เหมาะสมที่สุดสำหรับผู้เล่น I

ซึ่งสอดคล้องกับจุดบนขอบเขตล่างของผลตอบแทนของผู้เล่น I กับพิกัดสูงสุด

ขอให้เราใส่ใจกับความจริงที่ว่าในตัวอย่างที่พิจารณาโดยใช้เพียงสองกลยุทธ์ และ สอดคล้องกับเส้นตรงที่ตัดกันที่จุดที่พบบนขอบเขตล่างของผลตอบแทนของผู้เล่น I ผู้เล่น II สามารถป้องกันไม่ให้ผู้เล่น I มีขนาดใหญ่ขึ้น ผลตอบแทน

ดังนั้นเกมจึงลดลงเป็นเกมและกลยุทธ์ผสมที่ดีที่สุดของผู้เล่น II ในตัวอย่างที่พิจารณาคือ

โดยที่ความน่าจะเป็นเท่ากับในเกม :

5.6. แก้เกมม× น

หากเกมเมทริกซ์ไม่มีวิธีแก้ปัญหาในกลยุทธ์ที่บริสุทธิ์ (เช่น ไม่มีจุดอาน) และเนื่องจากเมทริกซ์ผลตอบแทนมีขนาดใหญ่จึงไม่สามารถแก้ไขได้แบบกราฟิก เพื่อให้ได้วิธีแก้ปัญหา ให้ใช้ วิธีการโปรแกรมเชิงเส้น .

ให้เมทริกซ์ผลตอบแทนของมิติได้รับ:

เราต้องหาความน่าจะเป็น โดยผู้เล่นคนใดที่ฉันต้องเลือกการเคลื่อนไหวของเขาเพื่อให้กลยุทธ์แบบผสมนี้รับประกันว่าเขาจะได้รับผลตอบแทนอย่างน้อย โดยไม่คำนึงถึงทางเลือกของการเคลื่อนไหวโดยผู้เล่น II

สำหรับแต่ละการย้ายที่เลือกโดยผู้เล่น II ผลตอบแทนของผู้เล่น I ถูกกำหนดโดยการอ้างอิง:

เราหารอสมการทั้งสองข้างด้วยและแนะนำสัญลักษณ์ใหม่:

ความเท่าเทียมกัน

จะใช้แบบฟอร์ม:

เนื่องจากผู้เล่นที่ฉันต้องการเพิ่มผลตอบแทนสูงสุด การแลกเปลี่ยนซึ่งกันและกันจะต้องถูกย่อให้เล็กสุด จากนั้นปัญหาการเขียนโปรแกรมเชิงเส้นสำหรับผู้เล่น ฉันจะอยู่ในรูปแบบ:

ภายใต้ข้อจำกัด

ปัญหาสำหรับผู้เล่น II นั้นถูกสร้างขึ้นในทำนองเดียวกันเป็นคู่:

ภายใต้ข้อจำกัด

การแก้ปัญหาด้วยวิธีซิมเพล็กซ์เราได้รับ:

5.7. คุณสมบัติของการแก้เกมเมทริกซ์

ก่อนแก้ปัญหาการหากลยุทธ์ที่เหมาะสม ควรตรวจสอบสองเงื่อนไข:

เป็นไปได้ไหมที่จะทำให้เมทริกซ์การชำระเงินง่ายขึ้น

เมทริกซ์ผลตอบแทนมีจุดอานหรือไม่

พิจารณาความเป็นไปได้ของการลดความซับซ้อนของเมทริกซ์การชำระเงิน:

เนื่องจากผู้เล่นที่ฉันพยายามที่จะได้รับ ชนะมากที่สุดจากนั้นบรรทัดที่ -th สามารถลบออกจากเมทริกซ์ผลตอบแทนได้ เนื่องจากเขาจะไม่ใช้การย้ายนี้หากความสัมพันธ์ต่อไปนี้เป็นที่พอใจกับบรรทัดที่ -th อื่น:

ในทำนองเดียวกัน มุ่งมั่นเพื่อการสูญเสียน้อยที่สุด ผู้เล่น II จะไม่เลือกคอลัมน์ -th ในเมทริกซ์ผลตอบแทนเป็นการเคลื่อนไหว และคอลัมน์นี้สามารถขีดฆ่าได้หากความสัมพันธ์ต่อไปนี้มีกับคอลัมน์ -th อื่น:

ที่สุด วิธีแก้ปัญหาง่ายๆเกมคือการมีอยู่ในเมทริกซ์ผลตอบแทนแบบง่ายของจุดอานที่ตรงตามเงื่อนไขต่อไปนี้ (ตามคำจำกัดความ):

ตัวอย่าง

รับเมทริกซ์ผลตอบแทน:

การลดความซับซ้อนของเมทริกซ์การชำระเงิน:

การปรากฏตัวของจุดอาน:

5.8. เล่นกับธรรมชาติ

ตรงกันข้ามกับปัญหาของทฤษฎีเกมใน ทฤษฎี การตัดสินใจทางสถิติ สถานการณ์ที่ไม่แน่นอนไม่มีความขัดแย้งที่เป็นปฏิปักษ์และขึ้นอยู่กับความเป็นจริงเชิงวัตถุซึ่งเรียกกันทั่วไปว่า "ธรรมชาติ" .

ในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ ผู้เล่น II เป็นชุดของปัจจัยที่ไม่แน่นอนซึ่งส่งผลต่อประสิทธิภาพของการตัดสินใจ

เกมเมทริกซ์ที่มีธรรมชาติแตกต่างจากเกมเมทริกซ์ทั่วไปเฉพาะเมื่อผู้เล่นที่ฉันเลือกกลยุทธ์ที่เหมาะสมที่สุด เป็นไปไม่ได้อีกต่อไปที่จะพึ่งพาความจริงที่ว่าผู้เล่น II จะพยายามลดการสูญเสียของเขาให้เหลือน้อยที่สุด ดังนั้น ควบคู่ไปกับเมทริกซ์ผลตอบแทน เราขอแนะนำ เมทริกซ์ความเสี่ยง :

ค่าความเสี่ยงของผู้เล่น I อยู่ที่ไหนเมื่อใช้การเคลื่อนไหวภายใต้เงื่อนไขเท่ากับส่วนต่าง ระหว่างผลตอบแทนที่ผู้เล่นจะได้รับ ถ้าเขารู้ว่าเงื่อนไขจะถูกสร้างขึ้น กล่าวคือ และผลตอบแทนซึ่งเขาจะได้รับโดยไม่รู้ว่าเมื่อเลือกย้ายแล้วจะมีการกำหนดเงื่อนไข

ดังนั้นเมทริกซ์ผลตอบแทนจึงถูกแปลงเป็นเมทริกซ์ความเสี่ยงโดยเฉพาะ และการแปลงแบบย้อนกลับนั้นคลุมเครือ

ตัวอย่าง

ชนะเมทริกซ์:

เมทริกซ์ความเสี่ยง:

เป็นไปได้ สองประโยคปัญหา เกี่ยวกับการเลือกวิธีแก้ปัญหา ในเกมเมทริกซ์กับธรรมชาติ :

กำไรสูงสุด;

การลดความเสี่ยง

ปัญหาการตัดสินใจสามารถกำหนดได้สองเงื่อนไข:

- มีความเสี่ยง เมื่อทราบฟังก์ชันการกระจายความน่าจะเป็นของกลยุทธ์ของธรรมชาติ ตัวอย่างเช่น ตัวแปรสุ่มของการเกิดขึ้นของแต่ละสถานการณ์ทางเศรษฐกิจเฉพาะที่เสนอ

- ภายใต้เงื่อนไขความไม่แน่นอน เมื่อไม่ทราบฟังก์ชันการกระจายความน่าจะเป็นดังกล่าว

5.9. การแก้ปัญหาในทฤษฎีการแก้ปัญหาทางสถิติ

มีความเสี่ยง

เมื่อต้องตัดสินใจภายใต้ความเสี่ยง ผู้เล่นรู้ดีถึงความน่าจะเป็น การเริ่มต้นของสถานะของธรรมชาติ

จากนั้นจึงเป็นการสมควรที่ผู้เล่น I จะเลือกกลยุทธ์ที่ มูลค่าเฉลี่ยของผลตอบแทนตามเส้นคือสูงสุด :

เมื่อแก้ปัญหานี้ด้วยเมทริกซ์ความเสี่ยง เราจะได้โซลูชันเดียวกันกับ ความเสี่ยงเฉลี่ยขั้นต่ำ :

5.10. การแก้ปัญหาในทฤษฎีการแก้ปัญหาทางสถิติ

ภายใต้เงื่อนไขความไม่แน่นอน

เมื่อทำการตัดสินใจภายใต้ความไม่แน่นอน คุณสามารถใช้สิ่งต่อไปนี้ได้ เกณฑ์ :

เกณฑ์สูงสุดของ Wald;

เกณฑ์ ความเสี่ยงน้อยที่สุดป่าเถื่อน;

เกณฑ์ของการมองโลกในแง่ร้าย - การมองโลกในแง่ดีของ Hurwitz;

หลักการของ Laplace เหตุผลไม่เพียงพอ

พิจารณา เกณฑ์ maximin Wald .

เกมที่มีลักษณะเป็นธรรมชาตินั้นเล่นร่วมกับคู่ต่อสู้ที่ดุดันพอสมควร เช่น วิธีการรับประกันภัยต่อจะดำเนินการจากตำแหน่งที่มองโลกในแง่ร้ายสุดโต่งสำหรับเมทริกซ์ผลตอบแทน:

พิจารณา เกณฑ์ความเสี่ยงขั้นต่ำของอำมหิต .

คล้ายกับแนวทางก่อนหน้านี้จากตำแหน่งของการมองโลกในแง่ร้ายที่รุนแรงสำหรับเมทริกซ์ความเสี่ยง:

พิจารณา เกณฑ์ของการมองโลกในแง่ร้าย - การมองโลกในแง่ดีของ Hurwitz .

เสนอโอกาสที่จะไม่ถูกชี้นำโดยการมองโลกในแง่ร้ายอย่างสุดขั้วหรือการมองโลกในแง่ดีอย่างสุดขั้ว:

ระดับของการมองโลกในแง่ร้ายอยู่ที่ไหน ;

ใน - การมองโลกในแง่ดีสุดขีด

ใน - การมองโลกในแง่ร้ายสุดขีด

พิจารณา หลักการของ Laplace ของเหตุผลไม่เพียงพอ .

สันนิษฐานว่าสภาวะธรรมชาติทั้งหมดมีความเป็นไปได้เท่าเทียมกัน:

บทสรุปในส่วนที่ห้า

ผู้เล่นสองคนมีส่วนร่วมในเกมเมทริกซ์ และฟังก์ชันการจ่ายเงิน ซึ่งทำหน้าที่กำหนดจำนวนเงินที่จ่ายจากผู้เล่นที่แพ้ให้กับผู้ชนะ จะแสดงเป็นเมทริกซ์การจ่ายเงิน ตกลงกันว่าผู้เล่นที่ฉันเลือกแถวเมทริกซ์ผลตอบแทนเป็นการย้าย และผู้เล่น II เลือกคอลัมน์ใดคอลัมน์หนึ่ง จากนั้นที่จุดตัดของแถวและคอลัมน์ที่เลือกของเมทริกซ์นี้คือค่าตัวเลขของการชำระเงินให้กับผู้เล่น I จากผู้เล่น II (หากค่านี้เป็นค่าบวก ผู้เล่นที่ฉันชนะจริง ๆ และหากเป็นค่าลบ แสดงว่าผู้เล่น II เป็นหลักชนะ)

หากมีจุดอานในเมทริกซ์ผลตอบแทน ผู้เล่นมีกลยุทธ์ที่ดีที่สุด นั่นคือ เพื่อที่จะชนะ แต่ละคนจะต้องทำซ้ำการเคลื่อนไหวที่เหมาะสมที่สุดของเขา หากไม่มีจุดอาน เพื่อที่จะชนะ แต่ละคนต้องใช้กลยุทธ์ผสมที่เหมาะสม นั่นคือ ใช้ท่าผสมกัน ซึ่งแต่ละท่าจะต้องสร้างด้วยความน่าจะเป็นที่เหมาะสมที่สุด

การค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2×2 ทำได้โดยการคำนวณความน่าจะเป็นที่เหมาะสมที่สุดโดยใช้สูตรที่ทราบ โดยใช้ โซลูชันทางเรขาคณิตเกม 2×n คำจำกัดความของกลยุทธ์แบบผสมที่เหมาะสมที่สุดจะลดลงเพื่อค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2×2 ในการแก้เกม m×n วิธีการเขียนโปรแกรมเชิงเส้นจะใช้เพื่อค้นหากลยุทธ์ผสมที่เหมาะสมที่สุด

เมทริกซ์ผลตอบแทนบางตัวช่วยให้เข้าใจง่าย ซึ่งเป็นผลมาจากการที่มิติของพวกมันลดลงโดยการลบแถวและคอลัมน์ที่สอดคล้องกับการเคลื่อนไหวที่ไม่คาดฝัน

หากผู้เล่น II เป็นชุดของปัจจัยที่ไม่แน่นอนซึ่งขึ้นอยู่กับความเป็นจริงตามวัตถุประสงค์และไม่มีความขัดแย้งที่เป็นปรปักษ์กัน เกมดังกล่าวจะเรียกว่าเกมที่มีธรรมชาติ และปัญหาของทฤษฎีการตัดสินใจทางสถิติจะถูกนำมาใช้ในการแก้ปัญหา จากนั้นพร้อมกับเมทริกซ์การจ่ายผลตอบแทน มีการแนะนำเมทริกซ์ความเสี่ยงและสองสูตรของปัญหาในการเลือกวิธีแก้ปัญหาในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ: เพิ่มกำไรสูงสุดและลดความเสี่ยงให้น้อยที่สุด

การแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติภายใต้เงื่อนไขความเสี่ยงแสดงให้เห็นว่า เป็นการสมควรสำหรับผู้เล่นที่ 1 ให้เลือกกลยุทธ์ที่ค่าเฉลี่ย (ความคาดหวัง) ของผลตอบแทนที่นำมาตามเส้นของเมทริกซ์ผลตอบแทนสูงสุดหรือ ( ซึ่งเหมือนกัน) ค่าเฉลี่ย (ความคาดหวัง) ของความเสี่ยง ที่นำมาโดยเส้นของเมทริกซ์ความเสี่ยงนั้นน้อยที่สุด เมื่อทำการตัดสินใจภายใต้ความไม่แน่นอน เกณฑ์ต่อไปนี้จะถูกใช้: เกณฑ์สูงสุดของ Wald, เกณฑ์ความเสี่ยงขั้นต่ำของ Savage, เกณฑ์การมองโลกในแง่ดีในแง่ร้ายของ Hurwitz, หลักการของ Laplace ที่มีเหตุผลไม่เพียงพอ

คำถามสำหรับการตรวจสอบตนเอง

แนวคิดพื้นฐานของทฤษฎีเกมกำหนดไว้อย่างไร: การเคลื่อนไหว กลยุทธ์ และฟังก์ชันผลตอบแทน

ฟังก์ชันการจ่ายเงินแสดงในเกมเมทริกซ์อย่างไร?

เหตุใดเกมเมทริกซ์จึงเรียกว่าผลรวมเป็นศูนย์

ขั้นตอนการเล่นเกมเมทริกซ์เป็นอย่างไร?

เกมอะไรที่เรียกว่าเกม m×n?

กลยุทธ์เกมเมทริกซ์ที่ดีที่สุดคืออะไร?

อะไรคือกลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ที่เรียกว่า pure?

จุดอานของเมทริกซ์ผลตอบแทนหมายความว่าอย่างไร

อะไรคือกลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ที่เรียกว่ามิกซ์?

กลยุทธ์ผสมของผู้เล่นคืออะไร?

ผลตอบแทนสำหรับผู้เล่น I จากผู้เล่น II ที่เลือกกลยุทธ์แบบผสมคืออะไร?

กลยุทธ์แบบผสมใดที่เรียกว่าเหมาะสมที่สุด

ความแตกต่างที่ไม่ได้กระจายหมายถึงอะไร

วิธีใดที่ใช้ในการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2×2?

กลยุทธ์แบบผสมที่ดีที่สุดพบได้อย่างไรสำหรับเกม 2×n?

วิธีใดที่ใช้ในการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม m×n?

อะไรคือคุณสมบัติของการแก้เกมเมทริกซ์?

การลดความซับซ้อนของเมทริกซ์การชำระเงินหมายถึงอะไรและภายใต้เงื่อนไขใดที่สามารถนำไปใช้ได้

เกมเมทริกซ์ใดแก้ง่ายกว่าเมื่อเมทริกซ์ผลตอบแทนมีหรือไม่มีจุดอาน

ปัญหาใดของทฤษฎีเกมที่เกี่ยวข้องกับปัญหาของทฤษฎีการตัดสินใจทางสถิติ

เมทริกซ์ผลตอบแทนถูกแปลงเป็นเมทริกซ์ความเสี่ยงอย่างไร?

สองสูตรของปัญหาในการเลือกวิธีแก้ปัญหาที่เป็นไปได้ในเกมเมทริกซ์ที่มีธรรมชาติคืออะไร?

สำหรับสองเงื่อนไขใดที่สามารถกำหนดปัญหาในการตัดสินใจในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ?

กลยุทธ์ใดที่เหมาะสมสำหรับผู้เล่นที่ฉันเลือกเมื่อแก้ปัญหาทฤษฎีการตัดสินใจทางสถิติภายใต้ความเสี่ยง?

เกณฑ์การตัดสินใจใดที่สามารถนำมาใช้ในการแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติภายใต้ความไม่แน่นอน?

ตัวอย่างการแก้ปัญหา

1. เมทริกซ์การชำระเงินระบุจำนวนกำไรขององค์กรเมื่อขายได้ ประเภทต่างๆผลิตภัณฑ์ (คอลัมน์) ขึ้นอยู่กับความต้องการที่กำหนดไว้ (แถว) จำเป็นต้องกำหนดกลยุทธ์ที่เหมาะสมที่สุดขององค์กรสำหรับการผลิตผลิตภัณฑ์ประเภทต่างๆ และรายได้สูงสุด (โดยเฉลี่ย) ที่สอดคล้องกันจากการขาย

แสดงถึงเมทริกซ์ที่กำหนดโดยและแนะนำตัวแปร เราจะใช้เมทริกซ์ (เวกเตอร์) ด้วย จากนั้น และ นั่นคือ .

คำนวณเมทริกซ์ผกผัน:

พบค่า:

คำนวณความน่าจะเป็น:

รายได้เฉลี่ยจากการขายถูกกำหนด:

2. บริษัท "Pharmatsevt" - ผู้ผลิตยาและผลิตภัณฑ์ชีวการแพทย์ในภูมิภาค เป็นที่ทราบกันดีว่าความต้องการยาบางชนิดพุ่งสูงขึ้นใน ช่วงฤดูร้อน(ยาของกลุ่มหัวใจและหลอดเลือด, ยาแก้ปวด) สำหรับคนอื่น ๆ - สำหรับช่วงฤดูใบไม้ร่วงและฤดูใบไม้ผลิ (ป้องกันการติดเชื้อ, ฤทธิ์ต้านฤทธิ์)

ราคาต่อ 1 Conv. หน่วย ผลิตภัณฑ์สำหรับเดือนกันยายนถึงตุลาคมคือ: สำหรับกลุ่มแรก (ยารักษาโรคหัวใจและหลอดเลือดและยาแก้ปวด) - 20 รูเบิล; สำหรับกลุ่มที่สอง (ยาต้านการติดเชื้อ, ยาแก้ไอ) - 15 รูเบิล

จากการสังเกตมากกว่าหลาย ปีที่ผ่านมาบริการด้านการตลาดของบริษัทพบว่าสามารถขายเครื่องทั่วไปได้ 3050 เครื่องในช่วงสองเดือนภายใต้การพิจารณาสภาพอากาศที่อบอุ่น หน่วย สินค้ากลุ่มแรกและ 1100 Conv. หน่วย ผลิตภัณฑ์ของกลุ่มที่สอง ในสภาพอากาศหนาวเย็น - 1525 arb หน่วย ผลิตภัณฑ์ของกลุ่มแรกและ 3690 Conv. หน่วย กลุ่มที่สอง

ในการเชื่อมต่อกับการเปลี่ยนแปลงสภาพอากาศที่เป็นไปได้งานคือการกำหนดกลยุทธ์ของ บริษัท ในการผลิตผลิตภัณฑ์ที่ให้รายได้สูงสุดจากการขายในราคาขาย 40 รูเบิล สำหรับ 1 Conv. หน่วย สินค้ากลุ่มแรกและ 30 น. - กลุ่มที่สอง

วิธีการแก้. บริษัท มีสองกลยุทธ์:

ปีนี้อากาศจะอบอุ่น

อากาศจะเย็น

หาก บริษัท ใช้กลยุทธ์และสภาพอากาศอบอุ่นจริง ๆ (กลยุทธ์ของธรรมชาติ) ผลิตภัณฑ์ที่ผลิต (3050 หน่วยทั่วไปของยากลุ่มแรกและ 1100 หน่วยทั่วไปของกลุ่มที่สอง) จะรับรู้อย่างเต็มที่และรายได้จะ เป็น

3050×(40-20)+1100×(30-15)=77500 ร.

ในสภาพอากาศที่หนาวเย็น (กลยุทธ์ของธรรมชาติ) ยากลุ่มที่สองจะขายเต็มจำนวนและกลุ่มแรกจะขายเฉพาะจำนวน 1525 หน่วยทั่วไปเท่านั้น หน่วย และยาบางชนิดก็ยังขายไม่ออก รายได้จะเป็น

1525×(40-20)+1100×(30-15)-20×()=16500 ร.

ในทำนองเดียวกัน หากรูปแบบใช้กลยุทธ์และอากาศหนาวจริง รายได้ก็จะเป็น

1525×(40-20)+3690×(30-15)=85850 ร.

อากาศร้อนมีรายได้

1525×(40-20)+1100×(30-15)-() ×15=8150 ร.

เมื่อพิจารณาถึงบริษัทและสภาพอากาศในฐานะผู้เล่นสองคน เราจะได้เมทริกซ์ผลตอบแทน

ราคาเกมอยู่ในช่วง

จะเห็นได้จาก payoff matrix ว่าภายใต้เงื่อนไขทั้งหมด รายได้ของบริษัทจะอยู่ที่ 16,500 rubles เป็นอย่างน้อย แต่ถ้า สภาพอากาศตรงกับกลยุทธ์ที่เลือก รายได้ของบริษัทสามารถเป็น 77,500 รูเบิล

มาหาวิธีแก้เกมกัน

ให้เราแสดงความน่าจะเป็นของการใช้กลยุทธ์โดยบริษัทเป็น กลยุทธ์ผ่าน และ แก้เกมแบบกราฟิกเราได้รับ ในขณะที่ราคาของเกมอาร์

แผนการผลิตยาที่เหมาะสมที่สุดจะเป็น

ดังนั้นจึงเป็นการสมควรที่บริษัทจะผลิตเครื่องรุ่นธรรมดาจำนวน 2379 เครื่องในช่วงเดือนกันยายนและตุลาคม หน่วย ยากลุ่มแรกและ 2239.6 หน่วยทั่วไป หน่วย ยาเสพติดของกลุ่มที่สองจากนั้นในทุกสภาพอากาศเธอจะได้รับรายได้อย่างน้อย 46,986 รูเบิล

ภายใต้เงื่อนไขของความไม่แน่นอน หากเป็นไปไม่ได้ที่บริษัทจะใช้กลยุทธ์แบบผสม (สัญญากับองค์กรอื่น) เราใช้เกณฑ์ต่อไปนี้เพื่อกำหนดกลยุทธ์ที่เหมาะสมที่สุดของบริษัท:

เกณฑ์ Walde:

เกณฑ์ของ Hurwitz: เพื่อความชัดเจน เรายอมรับ จากนั้นสำหรับกลยุทธ์ของบริษัท

สำหรับกลยุทธ์

ขอแนะนำให้บริษัทใช้กลยุทธ์นี้

เกณฑ์ของ Savage องค์ประกอบสูงสุดในคอลัมน์แรกคือ 77500 ในคอลัมน์ที่สองคือ 85850

องค์ประกอบของเมทริกซ์ความเสี่ยงหาได้จากนิพจน์

ที่ไหน , ,

เมทริกซ์ความเสี่ยงมีรูปแบบ

ขอแนะนำให้ใช้กลยุทธ์หรือ.

ดังนั้นจึงแนะนำให้บริษัทใช้กลยุทธ์หรือ

โปรดทราบว่าเกณฑ์การพิจารณาแต่ละข้อไม่สามารถถือว่าน่าพอใจอย่างสมบูรณ์สำหรับ ทางเลือกสุดท้ายการตัดสินใจ แต่การวิเคราะห์ร่วมกันทำให้สามารถนำเสนอผลที่ตามมาของการตัดสินใจด้านการจัดการบางอย่างได้ชัดเจนยิ่งขึ้น

ด้วยการแจกแจงความน่าจะเป็นที่ทราบของสภาวะธรรมชาติต่างๆ เกณฑ์การตัดสินใจคือความคาดหวังทางคณิตศาสตร์สูงสุดของผลตอบแทน

ให้ทราบปัญหาที่พิจารณาว่าความน่าจะเป็นของสภาพอากาศที่อบอุ่นและเย็นมีค่าเท่ากับ 0.5 แล้วจึงกำหนดกลยุทธ์ที่เหมาะสมของบริษัทดังนี้

ขอแนะนำให้บริษัทใช้กลยุทธ์หรือ

งานสำหรับงานอิสระ

1. องค์กรสามารถผลิตสินค้าได้ 3 ประเภท (A, B และ C) โดยได้รับผลกำไรตามความต้องการ ในทางกลับกัน อุปสงค์สามารถรับหนึ่งในสี่สถานะ (I, II, III และ IV) ในเมทริกซ์ต่อไปนี้ องค์ประกอบจะแสดงลักษณะผลกำไรที่องค์กรจะได้รับเมื่อปล่อยผลิตภัณฑ์ที่ - และ - สถานะของอุปสงค์:

คำอธิบายของเกม bimatrix. เกมทั้งหมดที่ถือว่าเป็นของคลาส เกมผลรวมศูนย์. อย่างไรก็ตาม สถานการณ์ความขัดแย้งจำนวนหนึ่งที่เกิดขึ้นในระหว่างการดำเนินการมีลักษณะเฉพาะโดยข้อเท็จจริงที่ว่าการได้รับจากฝ่ายหนึ่งไม่เท่ากับการสูญเสียของอีกฝ่ายหนึ่งทุกประการ โมเดลทฤษฎีเกมสถานการณ์ดังกล่าวเป็นเกมที่ไม่ร่วมมือกันโดยมีผลรวมที่ไม่เป็นศูนย์ เกมดังกล่าวเรียกว่า bimatrix เนื่องจากงานของแต่ละเกมดังกล่าวจะลดลงเป็นงานของเมทริกซ์สองตัวและรูปแบบเดียวกัน: .

กระบวนการ เกม bimatrixประกอบด้วยตัวเลือกอิสระของตัวเลขโดยผู้เล่น I และหมายเลขโดยผู้เล่น II หลังจากนั้นผู้เล่นที่ฉันจะได้รับค่าตอบแทน และผู้เล่น II จะได้รับค่าตอบแทน

หมายเลขแถวของเมทริกซ์และจะถูกเรียกว่า กลยุทธ์ที่บริสุทธิ์ของผู้เล่น I และหมายเลขคอลัมน์ของเมทริกซ์เหล่านี้คือ กลยุทธ์ที่บริสุทธิ์ของผู้เล่นครั้งที่สอง จากนั้นรูปแบบคู่จะเป็นสถานการณ์ในกลยุทธ์ที่บริสุทธิ์ เกม bimatrixและตัวเลขและผลตอบแทนของผู้เล่น I และ II ในสถานการณ์ ดังนั้น การแจกแจงความน่าจะเป็นของการใช้กลยุทธ์บริสุทธิ์ของผู้เล่น I คือ และผู้เล่น II - เราจะเรียก กลยุทธ์ผสม. จากนั้นคู่ของแบบฟอร์มแสดงถึงสถานการณ์ เกม bimatrixใน กลยุทธ์ผสมและตัวเลข และ คือผลตอบแทนที่คาดหวังของผู้เล่น I และ II

สถานการณ์สมดุลของเกม bimatrix ในกลยุทธ์แบบผสมเราจะเรียกคู่นั้นว่า:

(8.2)

ความคาดหวังทางคณิตศาสตร์ของผลตอบแทนของผู้เล่น I อยู่ที่ไหน

ความคาดหวังทางคณิตศาสตร์ของผลตอบแทนของผู้เล่น II;

ผสมที่เหมาะสมที่สุด กลยุทธ์ผู้เล่นฉัน;

ผสมที่เหมาะสมที่สุด กลยุทธ์ผู้เล่นครั้งที่สอง

งาน

การสร้างและการแก้ปัญหาของเกม bimatrix. สมมุติว่าเรือดำน้ำต่อต้านเรือดำน้ำของประเทศกำลังค้นหาเรือดำน้ำติดขีปนาวุธของรัฐซึ่งกำลังเคลื่อนที่อยู่ในส่วนที่กำหนดไว้อย่างเข้มงวดของพื้นที่ลาดตระเวนการต่อสู้ เรือดำน้ำ ASW ปฏิบัติการในพื้นที่ที่เหลือและค้นหา ASW ให้เรือต่อต้านเรือดำน้ำแต่ละลำเพื่อตรวจจับศัตรูสามารถใช้สถานีพลังน้ำของตนได้ทั้งในโหมดแอคทีฟ เปิดเครื่องเป็นระยะ หรือเฉพาะในโหมดพาสซีฟเท่านั้น ทำการค้นหาอย่างต่อเนื่อง

ทั้งเรือดำน้ำต่อต้านเรือดำน้ำและเรือดำน้ำขีปนาวุธที่ตรวจจับสัญญาณโซนาร์สามารถหลบเลี่ยงศัตรูได้ อย่างไรก็ตาม ความถี่ของการเปิดโซนาร์ทำให้การตรวจจับเป็นไปได้แต่ไม่น่าเชื่อถือ

ในการดังกล่าว สถานการณ์ความขัดแย้งผู้เล่นคนหนึ่งเป็นเรือดำน้ำต่อต้านเรือดำน้ำ และอีกคนหนึ่งเป็นเรือดำน้ำต่อต้านเรือดำน้ำ เห็นได้ชัดว่า เรือดำน้ำมิซไซล์ไม่สามารถเป็นผู้เล่นได้ เนื่องจากมีโหมดการดำเนินการเพียงโหมดเดียวซึ่งก็คือการหลบเลี่ยงและดำเนินการหลบเลี่ยงด้วย การตรวจจับสัญญาณโซนาร์

ลักษณะเด่นของที่นี่คือผู้เล่นแต่ละคนแสวงหาเป้าหมายที่แตกต่างกันแต่ไม่ตรงข้าม แท้จริงแล้ว จุดประสงค์ของเรือดำน้ำ ASW คือการหาตำแหน่งของเรือดำน้ำขีปนาวุธ และจุดประสงค์ของเรือดำน้ำ ASW ก็คือการหาตำแหน่งของ ASW ดังนั้น ในการประเมินความสำเร็จของเป้าหมายโดยผู้เล่นแต่ละคน ขึ้นอยู่กับวิธีการเลือกปฏิบัติ (กลยุทธ์) จำเป็นต้องมีเกณฑ์ประสิทธิภาพสองประการ และตามนั้น สองฟังก์ชันผลตอบแทน จากนั้นโมเดลของสถานการณ์ความขัดแย้งดังกล่าวจะเป็นเกมที่มีขอบเขตจำกัดโดยมีผลรวมที่ไม่เป็นศูนย์ อธิบายโดยเมทริกซ์สองตัวที่มีรูปแบบเดียวกัน และ เรียกว่า บิเมทริกซ์

มาลองกันเถอะ เกณฑ์ประสิทธิภาพเรือดำน้ำต่อต้านเรือดำน้ำ (ผู้เล่น I) ความน่าจะเป็นในการตรวจจับเรือดำน้ำขีปนาวุธและสำหรับ เกณฑ์ประสิทธิภาพเรือดำน้ำต่อต้านเรือดำน้ำ (ผู้เล่น II) - ความน่าจะเป็นในการตรวจจับเรือดำน้ำต่อต้านเรือดำน้ำ . จากนั้นเกม bimatrix จะได้รับโดยเมทริกซ์ (รูปที่ 9.a) และเมทริกซ์ (รูปที่ 9.b)

ข้าว. 9.ก.

ข้าว. 9.ข.

ที่ไหน - ใช้โหมดแอคทีฟ;

การใช้โหมดพาสซีฟ

ในบรรดาเกมที่มีความสำคัญในทางปฏิบัติ เกมที่มีจุดอานนั้นค่อนข้างหายาก โดยทั่วไปมากขึ้นคือกรณีที่ราคาที่ต่ำกว่าและราคาสูงกว่า - เกมต่างกัน เมื่อวิเคราะห์เมทริกซ์ของเกมดังกล่าวแล้ว เราก็ได้ข้อสรุปว่าหากผู้เล่นแต่ละคนได้รับเลือก

หนึ่งเดียว - กลยุทธ์เดียว ดังนั้นโดยอิงจากคู่ต่อสู้ที่มีเหตุผล ทางเลือกนี้ควรถูกกำหนดโดยหลักการ minimax การปฏิบัติตามกลยุทธ์สูงสุดของเรา เรารับประกันว่าตนเองจะได้รับผลตอบแทนเท่ากับราคาที่ต่ำกว่าของเกม a สำหรับพฤติกรรมใดๆ ของคู่ต่อสู้ คำถามธรรมดาเกิดขึ้น: เป็นไปได้ไหมที่จะรับประกันว่าตัวเองจะได้รับผลตอบแทนโดยเฉลี่ยมากกว่า a ถ้าคุณใช้กลยุทธ์ที่ "บริสุทธิ์" เพียงกลยุทธ์เดียว แต่สลับกลยุทธ์หลายๆ อย่างแบบสุ่ม

กลยุทธ์ที่รวมกันดังกล่าวประกอบด้วยการใช้กลยุทธ์บริสุทธิ์หลายอย่างสลับกันตามกฎสุ่มที่มีอัตราส่วนของความถี่ที่แน่นอนเรียกว่ากลยุทธ์แบบผสมในทฤษฎีเกม

เห็นได้ชัดว่า แต่ละกลยุทธ์ล้วนเป็นกรณีพิเศษของกลยุทธ์แบบผสม ซึ่งกลยุทธ์ทั้งหมดยกเว้นกลยุทธ์หนึ่งจะถูกนำไปใช้กับความถี่เป็นศูนย์ และกลยุทธ์นี้ - ด้วยความถี่ 1

ปรากฎว่าไม่เพียงแต่ใช้กลยุทธ์ที่บริสุทธิ์เท่านั้น แต่ยังรวมถึงกลยุทธ์แบบผสมด้วย มันเป็นไปได้ที่จะได้รับวิธีแก้ปัญหาสำหรับแต่ละเกมที่จำกัด นั่นคือคู่ของกลยุทธ์ (โดยทั่วไปผสม) ซึ่งเมื่อผู้เล่นทั้งสองใช้พวกเขา ผลตอบแทนจะเท่ากับ ราคาเกม และเมื่อมีการเบี่ยงเบนด้านเดียวจากกลยุทธ์ที่เหมาะสม ผลตอบแทนสามารถเปลี่ยนไปในทิศทางที่ไม่เอื้ออำนวยต่อผู้เบี่ยงเบนเท่านั้น

ข้อความดังกล่าวเป็นเนื้อหาของทฤษฎีบทหลักที่เรียกว่าทฤษฎีเกม ทฤษฎีบทนี้ได้รับการพิสูจน์ครั้งแรกโดยฟอน นอยมันน์ในปี ค.ศ. 1928 การพิสูจน์ทฤษฎีบทนี้ค่อนข้างซับซ้อน ดังนั้นเราจึงนำเสนอเฉพาะสูตรของมันเท่านั้น

ทุกเกมจำกัดมีทางออกอย่างน้อยหนึ่งทาง (อาจอยู่ในขอบเขตของกลยุทธ์แบบผสม)

ผลตอบแทนที่เกิดจากการตัดสินใจเรียกว่าราคาของเกม จากทฤษฎีบทหลักที่ทุกเกมไฟไนต์มีราคา เห็นได้ชัดว่าราคาของเกม v อยู่ระหว่างราคาที่ต่ำกว่าของเกม a และราคาสูงกว่าของเกม :

อันที่จริง มีผลตอบแทนสูงสุดที่รับประกันได้ว่าเราสามารถรับประกันได้โดยใช้เพียงกลยุทธ์ของเราเองเท่านั้น เนื่องจากกลยุทธ์แบบผสมนั้นรวมถึงกลยุทธ์ที่บริสุทธิ์ทั้งหมดเป็นกรณีพิเศษ ดังนั้น ยอมให้นอกจากกลยุทธ์ที่บริสุทธิ์แล้ว ยังผสมด้วย

กลยุทธ์ ไม่ว่าในกรณีใด เราจะไม่ทำให้ความสามารถของเราแย่ลง เพราะเหตุนี้,

ในทำนองเดียวกัน เมื่อพิจารณาถึงความสามารถของคู่ต่อสู้แล้ว เราแสดงว่า

ดังนั้นความไม่เท่าเทียมกันที่จำเป็น (3.1) จึงตามมา

ให้เราแนะนำสัญลักษณ์พิเศษสำหรับกลยุทธ์แบบผสม ตัวอย่างเช่น หากกลยุทธ์แบบผสมของเราประกอบด้วยการใช้กลยุทธ์ AL กับความถี่ และเราจะแสดงถึงกลยุทธ์นี้

ในทำนองเดียวกัน กลยุทธ์แบบผสมของปฏิปักษ์จะแสดงโดย:

ความถี่ที่กลยุทธ์ผสมอยู่ที่ไหน

สมมติว่าเราพบวิธีแก้ปัญหาของเกมซึ่งประกอบด้วยกลยุทธ์แบบผสมที่ดีที่สุดสองแบบคือ S, S ในกรณีทั่วไป ไม่ใช่กลยุทธ์ทั้งหมดที่มีให้สำหรับผู้เล่นรายใดรายหนึ่งที่รวมอยู่ในกลยุทธ์แบบผสมที่เหมาะสมที่สุดของเขา แต่มีเพียงบางกลยุทธ์เท่านั้น เราจะเรียกกลยุทธ์ที่รวมอยู่ในกลยุทธ์แบบผสมที่ดีที่สุดของผู้เล่นว่ากลยุทธ์ "มีประโยชน์" ของเขา

ปรากฎว่าวิธีแก้ปัญหาของเกมมีคุณสมบัติที่โดดเด่นอีกอย่างหนึ่ง: หากผู้เล่นคนใดคนหนึ่งปฏิบัติตามกลยุทธ์ผสมที่ดีที่สุดของเขา 5 (5) จากนั้นผลตอบแทนจะยังคงไม่เปลี่ยนแปลงและเท่ากับราคาของเกม v ไม่ว่าผู้เล่นคนอื่นจะทำอะไรก็ตาม ถ้าเขา ไม่ได้ไปไกลกว่ากลยุทธ์ที่ "มีประโยชน์" เท่านั้น ตัวอย่างเช่น เขาสามารถใช้กลยุทธ์ที่ "มีประโยชน์" ใดๆ ของเขาใน รูปแบบบริสุทธิ์และยังสามารถผสมในสัดส่วนใดก็ได้

มาพิสูจน์คำกล่าวนี้กัน ให้มีวิธีแก้ปัญหาของเกม เพื่อความเป็นรูปธรรม เราจะถือว่ากลยุทธ์การผสมที่ดีที่สุดประกอบด้วยส่วนผสมของสาม

กลยุทธ์ที่ "มีประโยชน์" ตามลำดับประกอบด้วยกลยุทธ์ที่ "มีประโยชน์" สามอย่างผสมกัน

และระบุว่าถ้าเรายึดกลยุทธ์ S แล้วฝ่ายตรงข้ามก็สามารถใช้กลยุทธ์ในสัดส่วนใด ๆ และผลตอบแทนจะยังคงไม่เปลี่ยนแปลงและจะยังคงเท่ากับราคาของเกม

โดยทั่วไป V * ≠ V * - ไม่มีจุดอาน นอกจากนี้ยังไม่มีวิธีแก้ปัญหาที่ดีที่สุดในกลยุทธ์ที่บริสุทธิ์ อย่างไรก็ตาม หากเราขยายแนวคิดของกลยุทธ์ล้วนๆ โดยการแนะนำแนวคิดของกลยุทธ์แบบผสม เราก็สามารถใช้อัลกอริธึมเพื่อค้นหาวิธีแก้ปัญหาที่เหมาะสมที่สุดสำหรับปัญหาเกมที่ไม่ได้กำหนดไว้อย่างชัดเจน ในสถานการณ์เช่นนี้ ขอเสนอให้ใช้วิธีการทางสถิติ (ความน่าจะเป็น) เพื่อค้นหาวิธีแก้ปัญหาที่เหมาะสมที่สุดสำหรับเกมที่เป็นปฏิปักษ์ สำหรับผู้เล่นแต่ละคน พร้อมกับชุดของกลยุทธ์ที่เป็นไปได้สำหรับเขา มีการแนะนำเวกเตอร์ของความน่าจะเป็น (ความถี่สัมพัทธ์) ที่ไม่รู้จักซึ่งควรใช้กลยุทธ์อย่างใดอย่างหนึ่ง

ให้เราแสดงเวกเตอร์ของความน่าจะเป็น (ความถี่สัมพัทธ์) ของทางเลือกของกลยุทธ์ที่กำหนดของผู้เล่น A ดังนี้:
P = (p 1 , p 2 ,…, p ม.),
โดยที่ p i ≥ 0, p 1 + p 2 +…+ p m = 1 ค่า p i เรียกว่าความน่าจะเป็น (ความถี่สัมพัทธ์) ของการใช้กลยุทธ์ A ผม

ในทำนองเดียวกันสำหรับผู้เล่น B จะมีการแนะนำเวกเตอร์ของความน่าจะเป็นที่ไม่รู้จัก (ความถี่สัมพัทธ์) ซึ่งมีรูปแบบ:
Q = (q 1 , q 2 ,…, q n),
โดยที่ q j ≥ 0, q 1 + q 2 +…+ q n = 1 ปริมาณ q j เรียกว่าความน่าจะเป็น (ความถี่สัมพัทธ์) ของการใช้กลยุทธ์ B j ชุด (รวมกัน) ของกลยุทธ์บริสุทธิ์ A 1 , A 2 , …A m และ B 1, B 2, …B n ร่วมกับเวกเตอร์ความน่าจะเป็นของการเลือกแต่ละรายการถูกเรียก กลยุทธ์ผสม

ทฤษฎีบทหลักในทฤษฎีเกมที่เป็นปรปักษ์กันคือ ทฤษฎีบทของฟอน นอยมันน์: เกมเมทริกซ์ไฟไนต์ทุกเกมมีทางออกที่ดีที่สุดอย่างน้อยหนึ่งวิธี อาจเป็นกลยุทธ์แบบผสมก็ได้.
จากทฤษฎีบทนี้ว่าเกมที่ไม่ได้กำหนดไว้อย่างดีมีวิธีแก้ปัญหาที่ดีที่สุดอย่างน้อยหนึ่งวิธีในกลยุทธ์แบบผสม ในเกมดังกล่าว การแก้ปัญหาจะเป็นคู่ของกลยุทธ์ผสมที่เหมาะสมที่สุด P * และ Q * เช่นนั้นหากผู้เล่นคนใดคนหนึ่งปฏิบัติตามกลยุทธ์ที่เหมาะสมที่สุดของเขา ผู้เล่นคนอื่นจะเบี่ยงเบนไปจากกลยุทธ์ที่ดีที่สุดของเขาไม่ได้
ผลตอบแทนเฉลี่ยของผู้เล่น A ถูกกำหนดโดยความคาดหวังทางคณิตศาสตร์:

หากความน่าจะเป็น (ความถี่สัมพัทธ์) ของการใช้กลยุทธ์แตกต่างจากศูนย์ กลยุทธ์ดังกล่าวจะเรียกว่า คล่องแคล่ว.

กลยุทธ์ P * , Q * เรียกว่า ผสมที่ดีที่สุดกลยุทธ์ถ้า MA (P, Q *) ≤ MA (P * , Q *) ≤ MA (P * , Q) (1)
ในกรณีนี้เรียกว่า MA (P * , Q *) ในราคาเกมและแสดงด้วย V (V * ≤ V ≤ V *) อสมการแรก (1) หมายความว่า การเบี่ยงเบนของผู้เล่น A จากกลยุทธ์ผสมที่ดีที่สุดของเขาโดยมีเงื่อนไขว่าผู้เล่น B ยึดมั่นในกลยุทธ์ผสมที่ดีที่สุดของเขา ส่งผลให้กำไรเฉลี่ยลดลงผู้เล่น A. ความไม่เท่าเทียมกันที่สองหมายความว่า การเบี่ยงเบนของผู้เล่น B จากกลยุทธ์ผสมที่ดีที่สุดของเขาโดยมีเงื่อนไขว่าผู้เล่น A ยึดมั่นในกลยุทธ์ผสมที่ดีที่สุดของเขา นำไปสู่การเพิ่มขึ้นในการสูญเสียเฉลี่ยของผู้เล่นB.

ในกรณีทั่วไป เครื่องคำนวณนี้แก้ปัญหาดังกล่าวได้สำเร็จ

ตัวอย่าง.

4	7	2
7	3	2
2	1	8

1. ตรวจสอบว่าเมทริกซ์ผลตอบแทนมีจุดอานหรือไม่. ถ้าใช่ เราจะเขียนวิธีแก้ปัญหาของเกมด้วยกลยุทธ์ล้วนๆ

เราคิดว่าผู้เล่นที่ฉันเลือกกลยุทธ์ของเขาในลักษณะที่จะเพิ่มผลตอบแทนสูงสุดของเขา และผู้เล่น II เลือกกลยุทธ์ของเขาในลักษณะที่จะลดผลตอบแทนของผู้เล่น I

ผู้เล่น	B1	B2	B3	a = นาที (Ai)
A 1	4	7	2	2
A2	7	3	2	2
A 3	2	1	8	1
b = สูงสุด (Bi)	7	7	8

เราพบผลตอบแทนที่รับประกันซึ่งกำหนดโดยราคาที่ต่ำกว่าของเกม a = max(a i) = 2 ซึ่งบ่งบอกถึงกลยุทธ์สูงสุด A 1
ราคาสูงเกม b = นาที (b j) = 7 สิ่งนี้บ่งชี้ว่าไม่มีจุดอาน เนื่องจาก a ≠ b ดังนั้นราคาของเกมจะอยู่ภายใน 2 ≤ y ≤ 7 เราพบวิธีแก้ปัญหาของเกมในกลยุทธ์แบบผสม นี่คือคำอธิบายโดยข้อเท็จจริงที่ว่าผู้เล่นไม่สามารถประกาศกลยุทธ์ที่บริสุทธิ์ของตนต่อคู่ต่อสู้ได้: พวกเขาควรซ่อนการกระทำของตน เกมสามารถแก้ไขได้โดยให้ผู้เล่นเลือกกลยุทธ์ของพวกเขาแบบสุ่ม (ผสมกลยุทธ์ล้วนๆ)

2. ตรวจสอบเมทริกซ์ผลตอบแทนสำหรับแถวที่โดดเด่นและคอลัมน์ที่โดดเด่น.
ไม่มีแถวที่โดดเด่นและคอลัมน์ที่โดดเด่นในเมทริกซ์ผลตอบแทน

3. หาวิธีแก้ปัญหาในเกมด้วยกลยุทธ์แบบผสม.
มาเขียนระบบสมการกัน
สำหรับผู้เล่น I
4p1 +7p2 +2p3 = y
7p1 +3p2 +p3 = y
2p 1 +2p 2 +8p 3 = y
p1 +p2 +p3 = 1

สำหรับผู้เล่น II
4q1 +7q2 +2q3 = y
7q1 +3q2 +2q3 = y
2q1 +q2 +8q3 = y
q 1 + q 2 + q 3 = 1

การแก้ปัญหาระบบเหล่านี้ด้วยวิธีเกาส์ เราพบว่า:

y=4 1/34
p 1 = 29/68 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 1)
p 2 = 4/17 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 2)
p 3 = 23/68 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 3)

กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น I: P = (29 / 68 ; 4 / 17 ; 23 / 68)
q 1 = 6 / 17 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 1)
q 2 = 9/34 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 2)
q 3 = 13/34 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 3)

กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น II: Q = (6 / 17 ; 9 / 34 ; 13 / 34)
ราคาเกม: y = 4 1 / 34

ทางเลือกของบรรณาธิการ

ไก่ไฮไลน์ที่ไม่โอ้อวดและให้ผลผลิตสูง ปีสุดท้ายและความตาย

Robert Anson Heinlein เป็นนักเขียนชาวอเมริกัน ร่วมกับ Arthur C. Clarke และ Isaac Asimov เขาเป็นหนึ่งใน "บิ๊กทรี" ของผู้ก่อตั้ง...

คำคมในหัวข้อ “สนามบิน

การเดินทางทางอากาศ: ชั่วโมงแห่งความเบื่อหน่ายคั่นด้วยช่วงเวลาที่ตื่นตระหนก El Boliska 208 ลิงก์อ้าง 3 นาทีเพื่อสะท้อน...

แรงจูงใจหลักของเนื้อเพลง

Ivan Alekseevich Bunin - นักเขียนที่ยิ่งใหญ่ที่สุดในช่วงเปลี่ยนศตวรรษที่ XIX-XX เขาเข้าสู่วงการวรรณกรรมในฐานะกวี สร้างสรรค์บทกวีที่ยอดเยี่ยม...

Tony Blair: ชีวประวัติและข้อเท็จจริงที่น่าสนใจ

โทนี่ แบลร์ ซึ่งเข้ารับตำแหน่งเมื่อวันที่ 2 พฤษภาคม 1997 กลายเป็นผู้นำที่อายุน้อยที่สุดของรัฐบาลอังกฤษ ...

บูธเป็นผู้ค้าอาวุธที่ใหญ่ที่สุดในโลก?

ตั้งแต่วันที่ 18 สิงหาคมในบ็อกซ์ออฟฟิศของรัสเซียเรื่อง "Guys with Guns" โศกนาฏกรรมที่มี Jonah Hill และ Miles Teller ในบทบาทนำ หนังเล่าว่า...

โทนี่ แบลร์ นายกรัฐมนตรี

Tony Blair เกิดมาเพื่อ Leo และ Hazel Blair และเติบโตใน Durham พ่อของเขาเป็นทนายความที่มีชื่อเสียงซึ่งลงสมัครรับเลือกตั้งในรัฐสภา...

ผลที่ตามมาของการพัฒนาอุตสาหกรรม

ประวัติศาสตร์รัสเซีย หัวข้อที่ 12 ของสหภาพโซเวียตในยุค 30 ของอุตสาหกรรมในสหภาพโซเวียต การทำให้เป็นอุตสาหกรรมคือการพัฒนาอุตสาหกรรมแบบเร่งรัดของประเทศใน ...

แคมเปญแคสเปียนของ Peter I: เป้าหมายคืออะไร & nbsp

คำนำ "... ดังนั้นในส่วนเหล่านี้ด้วยความช่วยเหลือจากพระเจ้าเราได้รับมากกว่าที่เราแสดงความยินดีกับคุณ" Peter I เขียนด้วยความปิติยินดีที่เซนต์ปีเตอร์สเบิร์กเมื่อวันที่ 30 สิงหาคม ...

ประวัติความเป็นมาของการพัฒนาเสรีนิยม

หัวข้อที่ 3 เสรีนิยมในรัสเซีย 1. วิวัฒนาการของเสรีนิยมรัสเซีย เสรีนิยมรัสเซียเป็นปรากฏการณ์ดั้งเดิมที่มีพื้นฐานมาจาก ...

ใหม่

เป็นที่นิยม

กลยุทธ์ทฤษฎีเกม กลยุทธ์ "บริสุทธิ์"

บทสรุปในส่วนที่ห้า

คำถามสำหรับการตรวจสอบตนเอง

งานสำหรับงานอิสระ

งาน