กลยุทธ์ทฤษฎีเกม กลยุทธ์ "บริสุทธิ์"
กลยุทธ์ที่บริสุทธิ์- กำหนด (ไม่รวมการสุ่ม) แผนปฏิบัติการ ในบทที่แล้ว เราพิจารณาเพียงกลยุทธ์ล้วนๆ กลยุทธ์แบบผสมจะกล่าวถึงในหัวข้อ 2.2 แต่สำหรับตอนนี้ เว้นแต่จะระบุไว้เป็นอย่างอื่น โดยกลยุทธ์ เราหมายถึงกลยุทธ์ที่บริสุทธิ์เสมอ
บ่อยครั้งในกระบวนการนำเสนอ เราจะอธิบายแนวคิดของการแก้ปัญหาด้วยตัวอย่างเกม bimatrix ดังนั้นเราจะให้คำจำกัดความที่สอดคล้องกัน
คำจำกัดความ 2.1. จบเกมเป็นเกมที่ชุดผู้เล่นและชุดกลยุทธ์ของผู้เล่นแต่ละคนมีองค์ประกอบจำนวนจำกัด เกมสุดท้ายของคนสองคนเรียกว่า เกมบิเมทริกซ์
นามสกุลมาจากรูปแบบการบันทึกการชนะที่สะดวกสบายในเกมดังกล่าว โดยใช้เมทริกซ์คู่
สำหรับการวิเคราะห์เพิ่มเติม จะสะดวกที่จะแบ่งกลยุทธ์ในโปรไฟล์กลยุทธ์ตามอำเภอใจเป็นกลยุทธ์ของผู้เล่นบางคน และกลยุทธ์ของผู้เล่นอื่นทั้งหมด s_ (. อย่างเป็นทางการ s = (.y, s,) ไม่ได้หมายความว่าเราจะสลับพิกัดของโปรไฟล์กลยุทธ์ แต่เราแนะนำวิธีอื่นในการแสดงเท่านั้น
แนวคิดแรกในการแก้เกมที่เราจะพิจารณาคือความสมดุลในกลยุทธ์ที่โดดเด่น
คำจำกัดความ 2.2 กลยุทธของผู้เล่น /-th ครอบงำอย่างเคร่งครัดกลยุทธ์ของเขา s" if Uj(s jt s .) ,) > h,(s", s ,) สำหรับชุด s ใด ๆ ของกลยุทธ์ของผู้เล่นที่เหลือ ในกรณีนี้ กลยุทธ์ s" จะเรียกว่า ครอบงำอย่างเคร่งครัด
โดยพื้นฐานแล้ว นี่หมายความว่าสำหรับทุกๆ แก้ไขแล้วในชุดกลยุทธของผู้เล่นที่เหลือ ผู้เล่นที่ i เลือกกลยุทธ์รับอย่างเคร่งครัด ชนะที่ใหญ่กว่ากว่าการเลือกกลยุทธิ์" สมมติให้คิดเอาเองว่า ผู้เล่นที่มีเหตุผลไม่ควรเลือกกลยุทธ์ที่ครอบงำอย่างเคร่งครัดสมมติฐานดังกล่าวในเกมที่ง่ายที่สุดอาจเพียงพอที่จะหาวิธีแก้ปัญหาของเกม
คำจำกัดความ 2.3 รายละเอียดกลยุทธ์ s* =(s*, s^,..., s*) เรียกว่า สมดุลใน (อย่างเคร่งครัด) กลยุทธ์ที่โดดเด่นถ้าสำหรับผู้เล่นคนที่ i กลยุทธ์จะครอบงำกลยุทธ์อื่นๆ ของเขาอย่างเคร่งครัด
อาจดูเหมือนว่าแนวคิดการแก้ปัญหานี้สามารถนำไปสู่ข้อสรุปเล็กน้อยเท่านั้น ผู้เล่นแต่ละคนมีหนึ่งในกลยุทธ์ที่จะให้ผลตอบแทนมากกว่าคนอื่นๆ ไม่ว่าคู่ต่อสู้ของเขาจะทำอะไรก็ตาม จากนั้นเขาก็จะใช้กลยุทธ์นี้ในภาวะสมดุล ทุกอย่างค่อนข้างชัดเจน แต่สถานการณ์นี้เป็นเรื่องปกติสำหรับบางทีอาจเป็นสถานการณ์ที่มีชื่อเสียงและสำคัญมากสำหรับการวิเคราะห์สถานการณ์เชิงปฏิบัติจำนวนหนึ่งของเกม "ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ"
ตัวอย่าง 2.1 (ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ) อาชญากรทั้งสองถูกควบคุมตัวในเซลล์ที่ต่างกันและไม่สามารถสื่อสารได้ การสอบสวนมีหลักฐานเพียงพอที่จะตัดสินลงโทษแต่ละคนในข้อหาก่ออาชญากรรมเล็กๆ น้อยๆ เป็นเวลาหนึ่งปี แต่สำหรับอาชญากรรมร้ายแรงที่อาชญากรต้องโทษจำคุก 10 ปี การสอบสวนไม่มีหลักฐานเพียงพอ ตัวแทนของการสอบสวนเสนอข้อตกลงกับอาชญากรแต่ละคน: อาชญากรจะได้รับเงื่อนไขสำหรับ
น้อยกว่าหนึ่งปีถ้าเขาให้การเป็นพยานกับคู่ของเขาซึ่งจะเพียงพอที่จะตั้งข้อหาคนหลังด้วยอาชญากรรมร้ายแรง สมมติว่าอาชญากรกังวลเรื่องจำนวนปีที่พวกเขาจะถูกจำคุกเท่านั้น ในแต่ละปีเพิ่มเติมจะลบด้วยค่าสาธารณูปโภคหนึ่งหน่วย จากนั้นการจ่ายเงินของอาชญากรสามารถแสดงด้วยเมทริกซ์คู่ต่อไปนี้:
ในกรณีที่ไม่มีชื่อผู้เข้าร่วมในเกม เราจะถือว่ากลยุทธ์ที่แตกต่างกันของผู้เข้าร่วมคนแรกนั้นสอดคล้องกับแถวของเมทริกซ์คู่ และกลยุทธ์ของผู้เข้าร่วมคนที่สองสอดคล้องกับคอลัมน์ ถ้าในตัวอย่างของเรา นักโทษคนแรกให้การเป็นพยาน และคนที่สองไม่ให้การเป็นพยาน นักโทษคนแรกจะได้รับการปล่อยตัว และคนที่สองจะได้รับโทษจำคุกสิบปี
สังเกตได้ง่ายว่าไม่ว่าผู้ต้องขังคนอื่นๆ กระทำการอย่างไร กำไรก็ยิ่งมากขึ้น (ระยะเวลาจำคุกสั้นลง) หากให้หลักฐาน (สำหรับผู้เล่นคนแรก พิกัดแรกในแถวแรกของเมทริกซ์คู่จะเคร่งครัด มากกว่าในแถวที่สอง สำหรับผู้เล่นคนที่สอง พิกัดที่สองในเมทริกซ์คู่ของคอลัมน์แรกจะมากกว่าในคอลัมน์ที่สองอย่างเคร่งครัด) จากนั้นดุลยภาพในกลยุทธ์ที่โดดเด่นจะเป็นรายละเอียดของกลยุทธ์ (เป็นพยาน, เป็นพยาน)
มีความสนใจใน ตัวอย่างนี้ที่ผู้เล่นเลือกพฤติกรรมที่เพิ่มผลตอบแทนของพวกเขาจบลงในสถานการณ์ที่ผลตอบแทนของพวกเขาต่ำเมื่อเทียบกับสถานการณ์ที่ตรงกันข้าม - เมื่อทั้งคู่เลือกที่จะเงียบ คำอธิบายอยู่ในการปรากฏตัวของผลกระทบภายนอกที่แข็งแกร่งเช่น อิทธิพลที่แข็งแกร่งของการกระทำของผู้เล่นคนหนึ่งที่มีต่อผลตอบแทนของผู้เล่นอีกคน เป็นผลให้รายละเอียดความสมดุลของกลยุทธ์กลายเป็น Pareto เดียวที่ไม่มีประสิทธิภาพในเกมนี้ โปรดทราบว่าประสิทธิภาพของ Pareto ที่พึงประสงค์จากมุมมองของผู้เข้าร่วมในเกม อาจไม่เป็นที่ต้องการจากมุมมองทางสังคม เช่นในกรณีนี้
สถานการณ์เช่นภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษมักเกิดขึ้นในการวิเคราะห์สถานการณ์ทางเศรษฐกิจ ยกตัวอย่าง การแข่งขันระหว่างสองร้านที่ขายสินค้าชุดเดียวกัน เพื่อความง่าย สมมติว่าร้านค้าสามารถเรียกเก็บเงินได้เพียงสองระดับราคา - สูงหรือต่ำ ผู้บริโภคมักชอบซื้อจากร้านค้าที่มีราคาต่ำกว่า จากนั้นผลตอบแทนของร้านค้าที่มีผลกำไรอาจมีลักษณะดังนี้:
![](https://i0.wp.com/studme.org/htm/img/33/2573/6.png)
จากมุมมองของดุลยภาพ สถานการณ์ที่นี่คล้ายคลึงกับภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ - ดุลยภาพในกลยุทธ์ที่มีอำนาจเหนือกว่า (ราคาต่ำ ราคาต่ำ) เป็นเพียงโปรไฟล์ที่ไม่มีประสิทธิภาพของ Pareto (และเป็นที่ต้องการจากมุมมองทางสังคมด้วย)
ความนิยมในวงกว้างของภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษที่กล่าวไปแล้วนั้นเป็นเหตุผลว่าทำไม พวกเขาจึงพยายามทดลองเพื่อทดสอบความถูกต้องของการทำนายของทฤษฎีเกมโดยใช้ตัวอย่าง การทดสอบคือสอง คนแปลกหน้าเสนอให้เล่นเกมเพื่อเงินพร้อมรางวัล (เช่น เป็นดอลลาร์) ใกล้เคียงกับที่ระบุไว้สำหรับเกมของสองร้าน ผู้เข้าร่วมแต่ละคนตัดสินใจแยกกัน (มักจะไม่ระบุชื่อ) และไม่ทราบการตัดสินใจของผู้เล่นคนอื่นก่อนจะได้รับรางวัล ปรากฎว่าภายใต้เงื่อนไขดังกล่าว ในการเล่นเกมหลายๆ เกม ผู้เล่นไม่ได้ผลลัพธ์ที่สมดุล โดยถือว่ารางวัลเงินสดประมาณการเงินรางวัลได้ถูกต้อง แน่นอนว่าผลการทดลองเหล่านี้ไม่ได้ติดตามว่าการทำนายของทฤษฎีเกมไม่ถูกต้อง แต่เพียงเท่านั้นเมื่อประเมินผลตอบแทนผู้เล่นคำนึงถึงปัจจัยที่ไม่ใช่ตัวเงิน - การพิจารณาเห็นแก่ประโยชน์ผู้อื่นความเป็นธรรม ฯลฯ หากประมาณการผลตอบแทนของผู้เล่นได้อย่างถูกต้อง ผู้เล่นควรเลือกใช้กลยุทธ์ที่โดดเด่น และเลือกกลยุทธ์นั้น ดังนั้น คุณค่าของการทดลองประเภทนี้จึงไม่ได้อยู่ที่การทดสอบการทำนายตามทฤษฎีเกม แต่เป็นการประเมินบทบาทของแรงจูงใจที่ไม่ใช่วัตถุในการกระทำของบุคคล
น้อยกว่าแนวคิดของการครอบงำที่แข็งแกร่งอย่างมีนัยสำคัญ ทฤษฎีเกมใช้แนวคิดของการครอบงำที่อ่อนแอ
คำจำกัดความ 2.4. กลยุทธ์ของผู้เล่น /-th, ครอบงำอย่างอ่อนแอกลยุทธ์ของเขา s" if ม.(s, s ,) > ม ; (sJ, s ,) สำหรับชุดกลยุทธ์ของผู้เล่นคนอื่น ๆ s_j,ยิ่งไปกว่านั้น สำหรับกลยุทธ์อย่างน้อยหนึ่งชุดของผู้เล่นอื่น ความไม่เท่าเทียมกันนั้นได้รับการพึงพอใจอย่างเคร่งครัด จากนั้นกลยุทธ์ s" เรียกว่า ถูกครอบงำอย่างอ่อนแอ
ในกรณีของความไม่เท่าเทียมกันอย่างไม่เข้มงวด เป็นไปไม่ได้อีกต่อไปที่จะยืนยันว่าผู้เล่นที่มีเหตุผลจะไม่เลือกกลยุทธ์ที่ครอบงำอย่างอ่อนแอ แม้ว่าพฤติกรรมดังกล่าวจะดูสมเหตุสมผลก็ตาม แม้จะไม่ค่อยได้ใช้ คำนิยามของดุลยภาพในกลยุทธ์ที่มีอำนาจเหนือกว่าอย่างอ่อนแอที่คล้ายคลึงกับกรณีของการครอบงำอย่างรุนแรง
คำจำกัดความ 2.5 โปรไฟล์กลยุทธ์ s* = (s*, Sj,..., s*) เรียกว่า สมดุลในกลยุทธ์ที่ครอบงำอย่างอ่อนแอถ้าสำหรับผู้เล่นคนที่ i กลยุทธ์ของเขาก็มีอิทธิพลเหนือกลยุทธ์อื่นๆ ของเขาอย่างอ่อนแอ
ตัวอย่าง 2.2 (ปิดการประมูลราคาที่สอง) การประมูลแบบปิดของราคาที่สองจัดขึ้นระหว่างบุคคลสองคน การประมูลมีการจัดดังนี้ ผู้เข้าร่วมแต่ละคนระบุอัตราที่ไม่เป็นลบ โดยไม่ทราบอัตราของผู้เข้าร่วมคนอื่นๆ (ในซอง) สมาชิกที่ทำ ราคาเสนอสูงสุดจ่ายจำนวนเงินสูงสุดจากการเสนอราคาของผู้เข้าร่วมรายอื่น (เช่น จำนวนที่สอง แต่เป็นมูลค่าของการเสนอราคา) และรับบางรายการ ตัวอย่างเช่น หากราคาเสนอของผู้เล่นเท่ากับ 100 และ 90 ดังนั้นผู้เข้าร่วมที่เสนอราคา 100 ชนะการประมูล เขาจะได้ไอเท็มนั้นมาในราคา 90 ซึ่งเป็นขนาดของการประมูลครั้งที่สอง ให้ผู้เข้าร่วมแต่ละคนมีการประเมินเรื่องที่แสดงเป็นหน่วยเงิน v2> 0 ผู้เข้าร่วมทั้งหมดทราบการประมาณการเหล่านี้ เพื่อความง่ายในการอธิบายเกม ถ้าผู้เข้าร่วมทั้งสองระบุอัตราเดียวกัน วัตถุก็จะไปถึงผู้เข้าร่วมคนแรก
ในเกมนี้ กลยุทธ์ของผู้เล่นคนแรกจะเป็นขนาดของเงินเดิมพันของเขา เนื่องจากอัตราไม่เป็นค่าลบ ชุดของกลยุทธ์ที่เป็นไปได้ทั้งหมด
5, = 0 = u,(o, s 2) > w,(s, s 2) = u, - s 2 v x ครอบงำกลยุทธ์ s,.
เราได้แสดงให้เห็นแล้วว่าสำหรับผู้เล่นคนแรก กลยุทธ์ในการตั้งชื่อคะแนนในฐานะการเดิมพันนั้นมีอิทธิพลเหนือกลยุทธ์อื่นๆ อย่างอ่อน เป็นการง่ายที่จะตรวจสอบว่าข้อความที่คล้ายกันเป็นจริงสำหรับผู้เล่นคนที่สองเช่นกัน ให้สังเกตว่าในการให้เหตุผลของเรา เราไม่เคยใช้ข้อเท็จจริงที่ว่าผู้เล่นทราบการประมาณการของผู้เล่นอื่น ซึ่งหมายความว่าในกรณีของเกมที่มีข้อมูลไม่ครบถ้วนในการประมูลแบบปิดของราคาที่สอง จะทำกำไรได้ไม่น้อย ประมาณการของคุณมากกว่าที่จะเสนอราคาอื่นๆ
อาจดูเหมือนว่าไม่เป็นประโยชน์สำหรับผู้ขายที่จะจัดให้มีการประมูลราคาที่สอง เมื่อเขาสามารถจัดการประมูลราคาแรกและรับมูลค่าไม่ใช่ครั้งที่สอง แต่เป็นการประมูลครั้งแรก อย่างไรก็ตาม มูลค่าของอัตราในกรณีการประมูลราคาแรกในดุลยภาพจะลดลง เราจะพูดถึงผลตอบแทนของการประมูลในบทที่ 5. ในระหว่างนี้ เราสังเกตว่าการประมูลราคาที่สองเป็นที่นิยมอย่างมากและมีการใช้กันอย่างแพร่หลาย ตัวอย่างเช่น โดยบริษัทต่างๆ Googleและ "Yandex" เมื่อขายโฆษณาตามบริบทบนอินเทอร์เน็ต
ความสมดุลในกลยุทธ์ที่โดดเด่นมีอยู่ในเกมกลุ่มเล็กๆ เท่านั้น โดยทั่วไปแล้ว ผู้เล่นไม่มีกลยุทธ์เดียวที่จะครอบงำกลยุทธ์อื่นๆ ทั้งหมด แต่แนวความคิดของการครอบงำช่วยให้ค้นหาวิธีแก้ปัญหาในเกมระดับที่กว้างขึ้น ในการทำเช่นนี้ คุณต้องใช้เหตุผลที่สอดคล้องกันเกี่ยวกับการกระทำของผู้เล่น เราได้ตั้งข้อสังเกตแล้วว่าผู้เล่นที่มีเหตุผลจะไม่เลือกกลยุทธ์ที่ครอบงำอย่างเคร่งครัด แต่นี่หมายความว่าผู้เล่นคนอื่นสามารถวิเคราะห์เกมได้โดยไม่สนใจความเป็นไปได้ที่ฝ่ายตรงข้ามจะเลือกใช้กลยุทธ์ดังกล่าว บางทีการวิเคราะห์บางอย่างอาจเปิดเผยว่าผู้เล่นคนอื่นมีกลยุทธ์ที่ครอบงำซึ่งไม่ได้ครอบงำในเกมดั้งเดิม และอื่นๆ. ให้เราให้คำจำกัดความอย่างเป็นทางการ
กระบวนการ การยกเว้นตามลำดับของกลยุทธ์ที่ครอบงำอย่างมากกำหนดไว้ดังนี้ ให้เราแยกกลยุทธ์ที่ครอบงำอย่างเข้มงวดของผู้เล่นออกจากการพิจารณาเช่น พิจารณาเกมใหม่ที่กลยุทธ์ครอบงำทั้งหมดไม่รวมอยู่ในชุดของกลยุทธ์ที่เป็นไปได้ของผู้เล่น แล้วในนี้ เกมส์ใหม่เรากำจัดกลยุทธ์ที่ครอบงำอย่างเข้มงวดทั้งหมด และอื่นๆ
เป็นไปได้ว่ากระบวนการดังกล่าวจะสิ้นสุดลงเมื่อผู้เล่นมีกลยุทธ์หลายอย่างเหลืออยู่ แต่เป็นไปได้ที่ผู้เล่นแต่ละคนจะมีกลยุทธ์ที่ไม่ยกเว้นเพียงกลยุทธ์เดียว ดังนั้นควรพิจารณาชุดของกลยุทธ์เหล่านี้เป็นวิธีแก้ปัญหาของเกม .
คำจำกัดความ 2.6. หากเป็นผลมาจากการกำจัดกลยุทธ์ที่ครอบงำอย่างรุนแรงตามลำดับ ผู้เล่นแต่ละคนเหลือเพียงกลยุทธ์เดียว โปรไฟล์ของกลยุทธ์เหล่านี้จะถูกเรียก ความสมดุลของการครอบงำ
ในตัวอย่างที่ 1.1 เราได้รับเพียงความสมดุลดังกล่าว ลองพิจารณาอีกตัวอย่างหนึ่ง
![](https://i1.wp.com/studme.org/htm/img/33/2573/40.png)
โปรไฟล์กลยุทธ์ (N, P) เป็นเพียงความสมดุลของแนชในเกมนี้ แต่โปรดทราบว่าในการเลือก P ผู้เล่นคนที่สองต้องแน่ใจว่าผู้เล่นคนแรกไม่เลือก B แต่ผลตอบแทนของผู้เล่นคนแรกจะเท่ากันหากผู้เล่นคนที่สองเลือก II นอกจากนี้ โดยการเลือก B ผู้เล่นคนแรกอาจไม่กลัวว่าผู้เล่นคนที่สองจะเลือก L บางทีผู้เล่นคนที่สองที่มีเหตุผลจะคิดเกี่ยวกับการเลือกกลยุทธ์ C
คำถามที่สองที่ยังไม่พบคำตอบที่ชัดเจน: ผู้เล่นมาที่สมดุลของแนชได้อย่างไร
สถานการณ์สมมติเชิงทฤษฎีในอุดมคติมีดังนี้ ผู้เล่นสร้างความคาดหวังอย่างอิสระเกี่ยวกับการกระทำของผู้เล่นคนอื่น แล้วเลือกการกระทำที่จะให้ผลตอบแทนสูงสุดตามความคาดหวังที่กำหนด หากในกรณีนี้ ความคาดหวังสอดคล้องกับการกระทำที่ผู้เล่นเลือกจริงๆ เราก็จะได้รับสมดุลของแนช เหตุผลแนวนี้ช่วยให้เราสามารถเรียกสถานการณ์สมดุลของแนชกับ การเติมเต็มความคาดหวังในตนเองแต่ความคาดหวังมาจากไหน? และสมดุลใดของแนช ถ้ามีหลายอย่าง จะถูกเลือกอันเป็นผลมาจากกระบวนการที่อธิบายไว้? ในกรอบของสถานการณ์สมมติที่พิจารณา คำถามเหล่านี้ยังไม่ได้รับคำตอบ
อีกวิธีหนึ่งเกี่ยวข้องกับการฝึกผู้เล่น ผู้เล่นอาจเรียนรู้วิธีเล่นเกมตามทฤษฎี (นึกถึงนักศึกษาเศรษฐศาสตร์) หรือสัมผัสปฏิสัมพันธ์ที่คล้ายคลึงกัน (เช่น พนักงานที่มีประสบการณ์มาที่ ทีมใหม่) ซึ่งช่วยให้พวกเขาสร้างความคาดหวังได้อย่างถูกต้องและเลือกพฤติกรรมที่เหมาะสมที่สุด สถานการณ์นี้ทำให้สามารถอธิบายการก่อตัวของความคาดหวังได้ แต่ประการแรก มันลดขอบเขตของรูปแบบเกมให้เหลือเพียงสถานการณ์มาตรฐาน ศึกษา และพบบ่อยของการโต้ตอบ และประการที่สอง มันสามารถนำไปสู่ความจริงที่ว่าสถานการณ์ของซิงเกิ้ลและซ้ำ ปฏิสัมพันธ์ไม่แตกต่างกัน และอย่างหลังแตกต่างกันอย่างมีนัยสำคัญในแง่ของกลยุทธ์และวิธีการแก้ปัญหาภายในกรอบของทฤษฎีเกม ซึ่งจะกล่าวถึงในรายละเอียดเพิ่มเติมในบทที่ สี่.
สถานการณ์ที่สามคือมีข้อตกลงก่อนหน้านี้ระหว่างผู้เล่นหรือศุลกากรหรือกฎหมายหรือคำแนะนำจากบุคคลที่สามที่ควบคุมการโต้ตอบของผู้เล่น ในกรณีนี้ ข้อตกลงหรือคำแนะนำอาจไม่มีผลผูกพัน แต่ถ้าแนะนำให้เล่นสมดุลของแนช ก็ไม่มีผู้เล่นคนใดที่ต้องการ (คนเดียว) ที่จะเบี่ยงเบนไปจากพฤติกรรมที่กำหนด เป็นที่ชัดเจนว่าสถานการณ์ดังกล่าวไม่สามารถทำได้ในทุกสถานการณ์ นอกจากนี้ กระบวนการในการสร้างข้อตกลงหรือเกี่ยวข้องกับบุคคลที่สามสามารถกลายเป็นส่วนหนึ่งของเกมได้
สุดท้าย คำถามธรรมชาติข้อที่สามที่เกิดขึ้นเมื่อศึกษาแนวคิดของดุลยภาพแนชมีดังต่อไปนี้: มีหลักฐานเชิงประจักษ์ว่าผู้เล่นจริงมักเลือกกลยุทธ์สมดุลหรือไม่ ที่นี่อีกครั้งเป็นเรื่องยากมากที่จะให้คำตอบที่สั้นและชัดเจน ในขณะเดียวกัน ธรรมชาติของปัญหาที่เกิดขึ้นมีความสอดคล้องกับเรื่องของเศรษฐศาสตร์ทดลองมากกว่า ดังนั้นเราจึงจำกัดตัวเองให้อยู่ในคำแนะนำให้หันไปใช้วรรณกรรมเฉพาะทาง เช่น หนังสือที่มีการวิเคราะห์คำถามเกี่ยวกับวิธีการทดลองอย่างดีเยี่ยมและนำเสนอผลลัพธ์จำนวนหนึ่ง
มีเกมที่ไม่สมดุลในกลยุทธ์ที่บริสุทธิ์ (ดูตัวอย่างที่ 3.1) ดังนั้นคำถามจึงเกิดขึ้น: เงื่อนไขใดเพียงพอสำหรับการดำรงอยู่ของดุลยภาพดังกล่าว ให้เรากำหนดและพิสูจน์การยืนยันเกี่ยวกับการดำรงอยู่ของสมดุลของแนชในกลยุทธ์ที่บริสุทธิ์ในเกมที่ไม่มีที่สิ้นสุด
คำชี้แจง 2.3. ถ้าชุดของกลยุทธ์สำหรับผู้เล่นแต่ละคน เซนต์เป็นคอมแพคตานูนไม่ว่างในอวกาศแบบยุคลิดและฟังก์ชันผลตอบแทนของผู้เล่นแต่ละคน และ-ต่อเนื่องใน สและกึ่งเว้าใน 5 จากนั้นเกมมีความสมดุลของแนชในกลยุทธ์ที่บริสุทธิ์
การพิสูจน์.จำสูตร ทฤษฎีบทของคาคุไทซึ่งเราจะใช้ในการพิสูจน์ อนุญาต เอ็กซ์-ชุดคอมแพคนูนไม่ว่างใน น , X*เป็นเซตของเซตย่อยของมัน และ/ เป็นการแมปแบบกึ่งต่อเนื่องบนจาก Xใน x*,ว่าแต่ละจุด x อี xเยอะ เอฟ(x)ไม่ว่างเปล่าปิดและนูน จากนั้นการทำแผนที่ / มีจุดคงที่
แนวคิดในการพิสูจน์การยืนยันของเราคือการสร้างแผนที่ที่เป็นไปตามเงื่อนไขของทฤษฎีบทของ Kakutani ในการทำเช่นนี้ เราได้กำหนดการแสดงคำตอบที่ดีที่สุดใหม่เล็กน้อย ในทางเทคนิคแล้ว เราจะถือว่าคำตอบที่ดีที่สุดไม่ได้ขึ้นอยู่กับกลยุทธ์ของผู้เล่นคนอื่นเท่านั้น แต่ยังขึ้นอยู่กับกลยุทธ์ของผู้เล่นด้วย ด้วยการเปลี่ยนกลยุทธของผู้เล่นเองเมื่อ กลยุทธ์คงที่ผู้เล่นที่เหลือคำตอบที่ดีที่สุดแน่นอนจะไม่เปลี่ยนแปลง ตอนนี้เรามาแนะนำสัญกรณ์สำหรับแสดงคำตอบที่ดีที่สุดสำหรับผู้เล่นทุกคนในฐานะผลิตภัณฑ์คาร์ทีเซียน s(s) = s,(s) x s 2 (s) x... x s n (s).การแมปนี้กับแต่ละโปรไฟล์กำหนดชุดของโปรไฟล์ที่ผู้เล่นแต่ละคน วิธีที่ดีที่สุดตอบสนองต่อกลยุทธ์ของผู้เล่นคนอื่น จุดคงที่ของการทำแผนที่ S นั่นคือ ข้อมูลส่วนตัว สดังนั้น s e s(s)>โดยนิยามสมดุลของแนช ให้เราแสดงว่าการทำแผนที่ 5 เป็นไปตามเงื่อนไขของทฤษฎีบทคาคุทานิ การตรวจสอบแต่ละเงื่อนไขจะถือเป็นจุดพิสูจน์ที่แยกจากกัน
- 1. แสดงว่าเซต สโปรไฟล์ทั้งหมด - นูนนูน เนื่องจากภายใต้เงื่อนไขของการยืนยันชุดของกลยุทธ์ของผู้เล่น S แต่ละคนเป็นชุดที่นูนไม่ว่างจากนั้นจึงเป็นผลิตภัณฑ์คาร์ทีเซียน ส = เซนต์ X S2 X...x ส นเป็นแบบนูนนูน
- 2. จอแสดงผล สมีภาพไม่ว่าง โดยทฤษฎีบทไวเออร์สตราส ฟังก์ชันต่อเนื่อง และ-ไปถึงชุดที่มีขอบเขตปิด 5 ซึ่งเป็นค่าสูงสุด เพราะเหตุนี้, สมีภาพไม่ว่าง
- 3. แสดงภาพ สปิดและนูน เนื่องจากฟังก์ชั่นการจ่ายเงินของผู้เล่นแต่ละคน คุณ tกึ่งเว้าใน s ifจากนั้นโดยคุณสมบัติของฟังก์ชันกึ่งเว้า เซต $ = (ส. | คุณ t (s i9 s .) > k) สำหรับคงที่ ส .และ kปิดที่ พื้นที่ปิดคำจำกัดความและเป็นนูนถ้าไม่ว่างเปล่า เนื่องจากสิ่งนี้เป็นจริงสำหรับใคร ๆ kแล้วมันก็จริงด้วยว่าชุดที่ 5 = (5/1 คุณ t(s", 5 ,) > maxw.(s., ส .)}
นูน แต่แล้วผลคูณคาร์ทีเซียน 5(5) = s x (s) X s2(ส) x... x s n CS) ปิดและนูน
4. ให้เราแสดงว่าการทำแผนที่ § กึ่งต่อเนื่องจากด้านบน เราใช้เงื่อนไขความต่อเนื่องของฟังก์ชัน และ,โดย s. เราจะพิสูจน์ด้วยความขัดแย้ง สมมติว่าการแสดงผล § ns เป็นแบบกึ่งต่อเนื่องบน จากนั้นก็มีลำดับของโปรไฟล์กลยุทธ์ s mและ เอส ม ,ที่ไหน เสื้อ -หมายเลของค์ประกอบลำดับ เช่นนั้นสำหรับใดๆ tส"" เ S, s m e s(s""), ลิม s"" = s° อี S,แต่ lim s"" = s° g lim s(s") ซึ่งหมายความว่ามี
ท~* oo t->/และ -? oo
ร็อคที่กลยุทธ์ s f °ไม่ใช่การตอบสนองที่ดีที่สุดสำหรับ s 0 นั่นคือ มีกลยุทธ์ ส"ดังนั้น และ,(s", s 0,) > เรา]ส°;). จากนั้นเราสามารถหา e > 0 ได้ m,(s/, s 0 ,) > m,(s ; °, s 0 ,) + Ze มาจากไหน
เนื่องจาก โดยสมมติ ฟังก์ชัน m ต่อเนื่อง lim s m = s°, ลิม s"” = s°,
ม*อู้ ม-*oo
ที่มีขนาดใหญ่พอสมควร มขวา
เมื่อรวมความไม่เท่าเทียมกัน (2.8)-(2.10) เข้าเป็นลูกโซ่เดียว เราจะได้
จากความสัมพันธ์ (2.11) ที่ u,(s", s"") > m,(s/", s"") + s,แต่สิ่งนี้ขัดแย้งกับเงื่อนไข s"" e s(s"") เนื่องจาก s" ให้ผลตอบแทนมากกว่า s/" อย่างเคร่งครัด เพื่อตอบสนองต่อ s"" พวกเขามาถึงความขัดแย้ง ดังนั้น สมมติฐานเดิมของเราที่ s ไม่กึ่งต่อเนื่องบนจึงผิด
เราได้แสดงให้เห็นว่าการทำแผนที่ สเป็นไปตามเงื่อนไขทั้งหมดของทฤษฎีบทของ Kakutani และด้วยเหตุนี้จึงมีจุดตายตัว จุดคงที่นี้คือสมดุลของแนช การยืนยัน 2.3 ได้รับการพิสูจน์แล้ว ?
โดยเฉพาะอย่างยิ่ง คำชี้แจง 2.3 รับประกันการมีอยู่ของสมดุลของแนชในตัวอย่างที่ 2.7 แต่ไม่ใช่ในตัวอย่างที่ 2.8 ซึ่งฟังก์ชันการจ่ายเงินของผู้เล่นจะไม่ต่อเนื่อง
“ตัวอย่างจากการทำงาน
5. ทฤษฎีเกมและวิธีแก้ปัญหาทางสถิติ
5.1. เกมเมทริกซ์ผลรวมศูนย์
การสร้างแบบจำลองทางเศรษฐศาสตร์และคณิตศาสตร์ดำเนินการภายใต้เงื่อนไขต่อไปนี้:
ความแน่นอน;
ความไม่แน่นอน
การสร้างแบบจำลอง ภายใต้เงื่อนไขของความแน่นอน สันนิษฐานว่ามีข้อมูลกฎระเบียบเริ่มต้นทั้งหมดที่จำเป็นสำหรับสิ่งนี้ (การสร้างแบบจำลองเมทริกซ์ การวางแผนเครือข่ายและผู้บริหาร)
การสร้างแบบจำลอง มีความเสี่ยง ดำเนินการภายใต้ความไม่แน่นอนแบบสุ่มเมื่อค่าของข้อมูลเริ่มต้นบางส่วนเป็นแบบสุ่มและกฎของการแจกแจงความน่าจะเป็นของตัวแปรสุ่มเหล่านี้เป็นที่รู้จัก (การวิเคราะห์การถดถอยทฤษฎีการจัดคิว)
การสร้างแบบจำลอง ภายใต้เงื่อนไขความไม่แน่นอน สอดคล้องกับการขาดข้อมูลบางอย่างที่จำเป็นสำหรับสิ่งนี้ (ทฤษฎีเกม)
แบบจำลองทางคณิตศาสตร์สำหรับการตัดสินใจที่เหมาะสมในสถานการณ์ความขัดแย้งนั้นสร้างขึ้นภายใต้เงื่อนไขที่ไม่แน่นอน
ในทฤษฎีเกม ใช้แนวคิดพื้นฐานต่อไปนี้:
กลยุทธ์;
ฟังก์ชั่นวิน
เคลื่อนไหว เราจะเรียกตัวเลือกและการดำเนินการโดยผู้เล่นในการดำเนินการอย่างใดอย่างหนึ่งที่กำหนดโดยกฎของเกม
กลยุทธ์ - เป็นเทคโนโลยีในการเลือกแนวทางปฏิบัติสำหรับการเคลื่อนไหวแต่ละครั้ง ขึ้นอยู่กับสถานการณ์
ฟังก์ชั่นชนะ ทำหน้าที่กำหนดจำนวนเงินที่จ่ายให้กับผู้เล่นที่แพ้ให้กับผู้ชนะ
ในเกมเมทริกซ์ ฟังก์ชันการจ่ายเงินจะแสดงเป็น เมทริกซ์การชำระเงิน :
จำนวนเงินที่จ่ายให้กับผู้เล่น I ผู้เลือกการย้าย จากผู้เล่น II ผู้เลือกการย้ายอยู่ที่ไหน
ในเกมคู่นี้ ค่าของฟังก์ชันการจ่ายเงินของผู้เล่นทั้งสองในแต่ละสถานการณ์จะมีขนาดเท่ากันและตรงข้ามกันในเครื่องหมายเช่น และเกมนี้มีชื่อว่า ผลรวมศูนย์
.
กระบวนการของ "การเล่นเกมเมทริกซ์" มีดังต่อไปนี้:
มีการตั้งค่าเมทริกซ์การชำระเงิน
ผู้เล่น I โดยไม่คำนึงถึงผู้เล่น II จะเลือกหนึ่งในแถวของเมทริกซ์นี้ ตัวอย่างเช่น -th;
ผู้เล่น II ไม่ว่าผู้เล่น I จะเลือกคอลัมน์ใดคอลัมน์หนึ่งของเมทริกซ์นี้ ตัวอย่างเช่น - th;
องค์ประกอบของเมทริกซ์กำหนดจำนวนผู้เล่นที่ฉันจะได้รับจากผู้เล่น II แน่นอนว่าถ้า เรากำลังพูดถึงการสูญเสียผู้เล่นตัวจริงของ I.
การเล่นคู่ที่เป็นปฏิปักษ์กับ เมทริกซ์การชำระเงินและจะถูกเรียกว่าเกม
ตัวอย่าง
ลองพิจารณาเกม
กำหนดเมทริกซ์การชำระเงิน:
.
ให้ผู้เล่น I โดยไม่คำนึงถึงผู้เล่น II เลือกแถวที่ 3 ของเมทริกซ์นี้ และผู้เล่น II โดยไม่คำนึงถึงผู้เล่น I เลือกคอลัมน์ที่ 2 ของเมทริกซ์นี้:
จากนั้นผู้เล่น I จะได้รับ 9 หน่วยจากผู้เล่น II
5.2. กลยุทธ์ที่บริสุทธิ์ที่สุดในเกมเมทริกซ์
กลยุทธ์ที่เหมาะสมที่สุด กลยุทธ์ของผู้เล่น I ถูกเรียกว่าว่าเขาไม่ลดผลตอบแทนสำหรับกลยุทธ์ที่เลือกโดยผู้เล่น II และกลยุทธ์ของผู้เล่น II ที่เขาไม่เพิ่มการสูญเสียสำหรับกลยุทธ์ที่เลือกโดยผู้เล่น I
โดยการเลือกแถวที่ i ของเมทริกซ์ผลตอบแทนเป็นการย้าย ผู้เล่น I จะได้รับผลตอบแทนอย่างน้อยตามมูลค่าในกรณีที่เลวร้ายที่สุด เมื่อผู้เล่น II พยายามลดค่านี้ให้เหลือน้อยที่สุด ดังนั้นผู้เล่นฉันจะเลือกแถวที่ - ที่จะให้เขา ชนะสูงสุด:
.
ผู้เล่น II โต้แย้งในลักษณะเดียวกันและสามารถรับประกันการสูญเสียขั้นต่ำได้อย่างแน่นอน:
.
ความไม่เท่าเทียมกันต่อไปนี้เป็นจริงเสมอ:
ค่าที่เรียกว่า ราคาเกมที่ต่ำกว่า .
ค่าที่เรียกว่า ราคาเกมชั้นนำ .
กลยุทธ์ที่เหมาะสมเรียกว่า ทำความสะอาด หากได้รับความเท่าเทียมกันสำหรับพวกเขา:
,
.
ค่าที่เรียกว่า ราคาสุทธิของเกม , ถ้า .
กลยุทธ์และรูปแบบบริสุทธิ์ที่เหมาะสมที่สุด จุดอาน เมทริกซ์การชำระเงิน
สำหรับจุดอาน เป็นไปตามเงื่อนไขต่อไปนี้:
กล่าวคือ องค์ประกอบมีขนาดเล็กที่สุดในแถวและใหญ่ที่สุดในคอลัมน์
ดังนั้น ถ้าเมทริกซ์ผลตอบแทนมี จุดอาน แล้วคุณจะพบ กลยุทธ์บริสุทธิ์ที่ดีที่สุด ผู้เล่น
กลยุทธ์ที่บริสุทธิ์ของผู้เล่นที่ฉันสามารถแสดงได้ด้วยชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ซึ่งตัวเลขทั้งหมดมีค่าเท่ากับศูนย์ ยกเว้นตัวเลขในตำแหน่งที่ - ซึ่งเท่ากับหนึ่ง
กลยุทธ์ที่บริสุทธิ์ของผู้เล่น II สามารถแสดงด้วยชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ซึ่งตัวเลขทั้งหมดมีค่าเท่ากับศูนย์ ยกเว้นตัวเลขในตำแหน่งที่ - ซึ่งเท่ากับหนึ่ง
ตัวอย่าง
.
โดยการเลือกแถวของเมทริกซ์ผลตอบแทนเป็นการย้าย ผู้เล่น ฉันได้รับค่าตอบแทนในกรณีที่เลวร้ายที่สุด ไม่น้อยกว่าค่าในคอลัมน์ที่ทำเครื่องหมาย :
ดังนั้น ผู้เล่นฉันจะเลือกแถวที่ 2 ของเมทริกซ์การจ่ายเงิน ซึ่งให้ผลตอบแทนสูงสุดแก่เขา โดยไม่คำนึงถึงการเคลื่อนไหวของผู้เล่น II ซึ่งจะพยายามลดค่านี้ให้น้อยที่สุด:
ผู้เล่น II โต้แย้งในทำนองเดียวกันและเลือกคอลัมน์ที่ 1 เป็นการย้าย:
ดังนั้น มีจุดอานของเมทริกซ์ผลตอบแทน:
สอดคล้องกับกลยุทธ์ที่ดีที่สุดสำหรับผู้เล่น I และสำหรับผู้เล่น II ซึ่งผู้เล่นที่ฉันไม่ลดผลตอบแทนของเขาสำหรับการเปลี่ยนแปลงกลยุทธ์โดยผู้เล่น II และผู้เล่น II จะไม่เพิ่มการสูญเสียของเขาสำหรับการเปลี่ยนแปลงกลยุทธ์โดยผู้เล่น I
5.3. เหมาะสมที่สุด กลยุทธ์ผสมในเกมเมทริกซ์
หากเมทริกซ์ผลตอบแทนไม่มีจุดอาน ก็ไม่มีเหตุผลสำหรับผู้เล่นที่จะใช้กลยุทธ์เพียงอย่างเดียว กำไรในการใช้งานมากขึ้น "สารผสมความน่าจะเป็น" กลยุทธ์ที่บริสุทธิ์ จากนั้นกำหนดกลยุทธ์แบบผสมแล้วเป็นกลยุทธ์ที่เหมาะสมที่สุด
กลยุทธ์ผสม ผู้เล่นมีลักษณะการแจกแจงความน่าจะเป็น เหตุการณ์สุ่มซึ่งประกอบด้วยการเลือกย้ายโดยผู้เล่นรายนี้
กลยุทธ์ผสมของผู้เล่น I เป็นชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) ที่ตรงตามเงื่อนไขสองประการ:
1) สำหรับ นั่นคือ ความน่าจะเป็นของการเลือกแต่ละแถวของเมทริกซ์ผลตอบแทนนั้นไม่เป็นลบ
2) นั่นคือ ตัวเลือกของแต่ละแถวเมทริกซ์ผลตอบแทนในการรวมหมายถึง เต็มกลุ่มเหตุการณ์
กลยุทธ์ผสมของผู้เล่น II คือชุดตัวเลขที่เรียงลำดับ (เวกเตอร์) เป็นไปตามเงื่อนไข:
จำนวนเงินที่ชำระ ให้กับผู้เล่น I ผู้เลือกกลยุทธ์แบบผสม
จากผู้เล่น II ที่เลือกกลยุทธ์แบบผสม
,
เป็นค่าเฉลี่ย
.
เหมาะสมที่สุด เรียกว่ากลยุทธ์ผสม
และ
,
หากเป็นไปตามกลยุทธ์ผสมตามอำเภอใจและเงื่อนไขต่อไปนี้:
กล่าวคือ ภายใต้กลยุทธ์แบบผสมที่เหมาะสม ผลตอบแทนของผู้เล่น I จะมากที่สุด และการสูญเสียผู้เล่น II จะน้อยที่สุด
หากไม่มีจุดอานในเมทริกซ์ผลตอบแทน แล้ว
,
กล่าวคือ มีความแตกต่างในเชิงบวก ( ความแตกต่างที่คงอยู่ )
- ³ 0,
และผู้เล่นจำเป็นต้องมองหาโอกาสเพิ่มเติมเพื่อให้ได้รับส่วนแบ่งที่มากขึ้นของความแตกต่างนี้อย่างมั่นใจ
ตัวอย่าง
พิจารณาเกมที่กำหนดโดยเมทริกซ์ผลตอบแทน:
.
ตรวจสอบว่ามีจุดอานหรือไม่:
,
.
ปรากฎว่าไม่มีจุดอานในเมทริกซ์ผลตอบแทนและความแตกต่างที่ไม่ได้กระจายคือ:
.
5.4. ค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุด
สำหรับ 2×2 เกม
การกำหนดกลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเมทริกซ์ผลตอบแทนที่มีมิติจะดำเนินการโดยวิธีการหาจุดที่เหมาะสมที่สุดของฟังก์ชันของตัวแปรสองตัว
ให้ความน่าจะเป็นของผู้เล่นที่ฉันเลือกแถวแรกของเมทริกซ์ผลตอบแทน
เท่ากับ . ความน่าจะเป็นที่จะเลือกแถวที่สองคือ
ให้ความน่าจะเป็นของผู้เล่น II เลือกคอลัมน์แรกเท่ากับ ความน่าจะเป็นที่จะเลือกคอลัมน์ที่สองคือ
จำนวนเงินที่จ่ายให้กับผู้เล่น I โดยผู้เล่น II เท่ากับ:
มูลค่าสูงสุดของผู้เล่นที่ฉันได้รับและการสูญเสียของผู้เล่น II นั้นสอดคล้องกับเงื่อนไข:
;
.
ดังนั้น กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น I และ II ตามลำดับ คือ:
5.5. โซลูชันทางเรขาคณิตของเกม 2×น
ด้วยการเพิ่มมิติของเมทริกซ์ผลตอบแทนจาก เป็น เป็น เป็นไปไม่ได้อีกต่อไปที่จะลดคำจำกัดความของกลยุทธ์ผสมที่เหมาะสมที่สุดเพื่อค้นหาฟังก์ชันที่เหมาะสมที่สุดของสองตัวแปร อย่างไรก็ตาม เนื่องจากผู้เล่นคนใดคนหนึ่งมีเพียงสองกลยุทธ์ จึงสามารถใช้โซลูชันทางเรขาคณิตได้
ขั้นตอนหลักในการหาวิธีแก้ปัญหาของเกมมีดังนี้
เราแนะนำระบบพิกัดบนเครื่องบิน ลองใส่ส่วนของเส้นตรงบนแกน จากปลายด้านซ้ายและขวาของส่วนนี้เราวาดเส้นตั้งฉาก
ปลายด้านซ้ายและขวาของส่วนหน่วยสอดคล้องกับสองกลยุทธ์ และ ใช้ได้สำหรับผู้เล่น I ในแนวตั้งฉากที่วาด เราจะเลื่อนการจ่ายเงินของผู้เล่นรายนี้ ตัวอย่างเช่น สำหรับเมทริกซ์ผลตอบแทน
ผลตอบแทนดังกล่าวของผู้เล่น I เมื่อเลือกกลยุทธ์จะเป็น และ และเมื่อเลือกกลยุทธ์ที่พวกเขาจะเป็น และ
ให้เราเชื่อมต่อจุดจ่ายของผู้เล่น I ซึ่งสอดคล้องกับกลยุทธ์ของผู้เล่น II โดยส่วนของเส้นตรง จากนั้นเส้นหักที่เกิดขึ้นซึ่งล้อมรอบแผนภูมิจากด้านล่างจะเป็นตัวกำหนดขอบเขตล่างของผลตอบแทนของผู้เล่น I
ค้นหากลยุทธ์ผสมที่เหมาะสมที่สุดสำหรับผู้เล่น I
,
ซึ่งสอดคล้องกับจุดบนขอบเขตล่างของผลตอบแทนของผู้เล่น I กับพิกัดสูงสุด
ขอให้เราใส่ใจกับความจริงที่ว่าในตัวอย่างที่พิจารณาโดยใช้เพียงสองกลยุทธ์ และ สอดคล้องกับเส้นตรงที่ตัดกันที่จุดที่พบบนขอบเขตล่างของผลตอบแทนของผู้เล่น I ผู้เล่น II สามารถป้องกันไม่ให้ผู้เล่น I มีขนาดใหญ่ขึ้น ผลตอบแทน
ดังนั้นเกมจึงลดลงเป็นเกมและกลยุทธ์ผสมที่ดีที่สุดของผู้เล่น II ในตัวอย่างที่พิจารณาคือ
,
โดยที่ความน่าจะเป็นเท่ากับในเกม :
5.6. แก้เกมม× น
หากเกมเมทริกซ์ไม่มีวิธีแก้ปัญหาในกลยุทธ์ที่บริสุทธิ์ (เช่น ไม่มีจุดอาน) และเนื่องจากเมทริกซ์ผลตอบแทนมีขนาดใหญ่จึงไม่สามารถแก้ไขได้แบบกราฟิก เพื่อให้ได้วิธีแก้ปัญหา ให้ใช้ วิธีการโปรแกรมเชิงเส้น .
ให้เมทริกซ์ผลตอบแทนของมิติได้รับ:
.
เราต้องหาความน่าจะเป็น โดยผู้เล่นคนใดที่ฉันต้องเลือกการเคลื่อนไหวของเขาเพื่อให้กลยุทธ์แบบผสมนี้รับประกันว่าเขาจะได้รับผลตอบแทนอย่างน้อย โดยไม่คำนึงถึงทางเลือกของการเคลื่อนไหวโดยผู้เล่น II
สำหรับแต่ละการย้ายที่เลือกโดยผู้เล่น II ผลตอบแทนของผู้เล่น I ถูกกำหนดโดยการอ้างอิง:
เราหารอสมการทั้งสองข้างด้วยและแนะนำสัญลักษณ์ใหม่:
ความเท่าเทียมกัน
จะใช้แบบฟอร์ม:
เนื่องจากผู้เล่นที่ฉันต้องการเพิ่มผลตอบแทนสูงสุด การแลกเปลี่ยนซึ่งกันและกันจะต้องถูกย่อให้เล็กสุด จากนั้นปัญหาการเขียนโปรแกรมเชิงเส้นสำหรับผู้เล่น ฉันจะอยู่ในรูปแบบ:
ภายใต้ข้อจำกัด
ปัญหาสำหรับผู้เล่น II นั้นถูกสร้างขึ้นในทำนองเดียวกันเป็นคู่:
ภายใต้ข้อจำกัด
การแก้ปัญหาด้วยวิธีซิมเพล็กซ์เราได้รับ:
,
5.7. คุณสมบัติของการแก้เกมเมทริกซ์
ก่อนแก้ปัญหาการหากลยุทธ์ที่เหมาะสม ควรตรวจสอบสองเงื่อนไข:
เป็นไปได้ไหมที่จะทำให้เมทริกซ์การชำระเงินง่ายขึ้น
เมทริกซ์ผลตอบแทนมีจุดอานหรือไม่
พิจารณาความเป็นไปได้ของการลดความซับซ้อนของเมทริกซ์การชำระเงิน:
เนื่องจากผู้เล่นที่ฉันพยายามที่จะได้รับ ชนะมากที่สุดจากนั้นบรรทัดที่ -th สามารถลบออกจากเมทริกซ์ผลตอบแทนได้ เนื่องจากเขาจะไม่ใช้การย้ายนี้หากความสัมพันธ์ต่อไปนี้เป็นที่พอใจกับบรรทัดที่ -th อื่น:
ในทำนองเดียวกัน มุ่งมั่นเพื่อการสูญเสียน้อยที่สุด ผู้เล่น II จะไม่เลือกคอลัมน์ -th ในเมทริกซ์ผลตอบแทนเป็นการเคลื่อนไหว และคอลัมน์นี้สามารถขีดฆ่าได้หากความสัมพันธ์ต่อไปนี้มีกับคอลัมน์ -th อื่น:
ที่สุด วิธีแก้ปัญหาง่ายๆเกมคือการมีอยู่ในเมทริกซ์ผลตอบแทนแบบง่ายของจุดอานที่ตรงตามเงื่อนไขต่อไปนี้ (ตามคำจำกัดความ):
ตัวอย่าง
รับเมทริกซ์ผลตอบแทน:
.
การลดความซับซ้อนของเมทริกซ์การชำระเงิน:
การปรากฏตัวของจุดอาน:
5.8. เล่นกับธรรมชาติ
ตรงกันข้ามกับปัญหาของทฤษฎีเกมใน ทฤษฎี การตัดสินใจทางสถิติ สถานการณ์ที่ไม่แน่นอนไม่มีความขัดแย้งที่เป็นปฏิปักษ์และขึ้นอยู่กับความเป็นจริงเชิงวัตถุซึ่งเรียกกันทั่วไปว่า "ธรรมชาติ" .
ในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ ผู้เล่น II เป็นชุดของปัจจัยที่ไม่แน่นอนซึ่งส่งผลต่อประสิทธิภาพของการตัดสินใจ
เกมเมทริกซ์ที่มีธรรมชาติแตกต่างจากเกมเมทริกซ์ทั่วไปเฉพาะเมื่อผู้เล่นที่ฉันเลือกกลยุทธ์ที่เหมาะสมที่สุด เป็นไปไม่ได้อีกต่อไปที่จะพึ่งพาความจริงที่ว่าผู้เล่น II จะพยายามลดการสูญเสียของเขาให้เหลือน้อยที่สุด ดังนั้น ควบคู่ไปกับเมทริกซ์ผลตอบแทน เราขอแนะนำ เมทริกซ์ความเสี่ยง :
ค่าความเสี่ยงของผู้เล่น I อยู่ที่ไหนเมื่อใช้การเคลื่อนไหวภายใต้เงื่อนไขเท่ากับส่วนต่าง ระหว่างผลตอบแทนที่ผู้เล่นจะได้รับ ถ้าเขารู้ว่าเงื่อนไขจะถูกสร้างขึ้น กล่าวคือ
และผลตอบแทนซึ่งเขาจะได้รับโดยไม่รู้ว่าเมื่อเลือกย้ายแล้วจะมีการกำหนดเงื่อนไข
ดังนั้นเมทริกซ์ผลตอบแทนจึงถูกแปลงเป็นเมทริกซ์ความเสี่ยงโดยเฉพาะ และการแปลงแบบย้อนกลับนั้นคลุมเครือ
ตัวอย่าง
ชนะเมทริกซ์:
.
เมทริกซ์ความเสี่ยง:
เป็นไปได้ สองประโยคปัญหา เกี่ยวกับการเลือกวิธีแก้ปัญหา ในเกมเมทริกซ์กับธรรมชาติ :
กำไรสูงสุด;
การลดความเสี่ยง
ปัญหาการตัดสินใจสามารถกำหนดได้สองเงื่อนไข:
- มีความเสี่ยง เมื่อทราบฟังก์ชันการกระจายความน่าจะเป็นของกลยุทธ์ของธรรมชาติ ตัวอย่างเช่น ตัวแปรสุ่มของการเกิดขึ้นของแต่ละสถานการณ์ทางเศรษฐกิจเฉพาะที่เสนอ
- ภายใต้เงื่อนไขความไม่แน่นอน เมื่อไม่ทราบฟังก์ชันการกระจายความน่าจะเป็นดังกล่าว
5.9. การแก้ปัญหาในทฤษฎีการแก้ปัญหาทางสถิติ
มีความเสี่ยง
เมื่อต้องตัดสินใจภายใต้ความเสี่ยง ผู้เล่นรู้ดีถึงความน่าจะเป็น การเริ่มต้นของสถานะของธรรมชาติ
จากนั้นจึงเป็นการสมควรที่ผู้เล่น I จะเลือกกลยุทธ์ที่ มูลค่าเฉลี่ยของผลตอบแทนตามเส้นคือสูงสุด :
.
เมื่อแก้ปัญหานี้ด้วยเมทริกซ์ความเสี่ยง เราจะได้โซลูชันเดียวกันกับ ความเสี่ยงเฉลี่ยขั้นต่ำ :
.
5.10. การแก้ปัญหาในทฤษฎีการแก้ปัญหาทางสถิติ
ภายใต้เงื่อนไขความไม่แน่นอน
เมื่อทำการตัดสินใจภายใต้ความไม่แน่นอน คุณสามารถใช้สิ่งต่อไปนี้ได้ เกณฑ์ :
เกณฑ์สูงสุดของ Wald;
เกณฑ์ ความเสี่ยงน้อยที่สุดป่าเถื่อน;
เกณฑ์ของการมองโลกในแง่ร้าย - การมองโลกในแง่ดีของ Hurwitz;
หลักการของ Laplace เหตุผลไม่เพียงพอ
พิจารณา เกณฑ์ maximin Wald .
เกมที่มีลักษณะเป็นธรรมชาตินั้นเล่นร่วมกับคู่ต่อสู้ที่ดุดันพอสมควร เช่น วิธีการรับประกันภัยต่อจะดำเนินการจากตำแหน่งที่มองโลกในแง่ร้ายสุดโต่งสำหรับเมทริกซ์ผลตอบแทน:
.
พิจารณา เกณฑ์ความเสี่ยงขั้นต่ำของอำมหิต .
คล้ายกับแนวทางก่อนหน้านี้จากตำแหน่งของการมองโลกในแง่ร้ายที่รุนแรงสำหรับเมทริกซ์ความเสี่ยง:
.
พิจารณา เกณฑ์ของการมองโลกในแง่ร้าย - การมองโลกในแง่ดีของ Hurwitz .
เสนอโอกาสที่จะไม่ถูกชี้นำโดยการมองโลกในแง่ร้ายอย่างสุดขั้วหรือการมองโลกในแง่ดีอย่างสุดขั้ว:
ระดับของการมองโลกในแง่ร้ายอยู่ที่ไหน ;
ใน - การมองโลกในแง่ดีสุดขีด
ใน - การมองโลกในแง่ร้ายสุดขีด
พิจารณา หลักการของ Laplace ของเหตุผลไม่เพียงพอ .
สันนิษฐานว่าสภาวะธรรมชาติทั้งหมดมีความเป็นไปได้เท่าเทียมกัน:
,
.
บทสรุปในส่วนที่ห้า
ผู้เล่นสองคนมีส่วนร่วมในเกมเมทริกซ์ และฟังก์ชันการจ่ายเงิน ซึ่งทำหน้าที่กำหนดจำนวนเงินที่จ่ายจากผู้เล่นที่แพ้ให้กับผู้ชนะ จะแสดงเป็นเมทริกซ์การจ่ายเงิน ตกลงกันว่าผู้เล่นที่ฉันเลือกแถวเมทริกซ์ผลตอบแทนเป็นการย้าย และผู้เล่น II เลือกคอลัมน์ใดคอลัมน์หนึ่ง จากนั้นที่จุดตัดของแถวและคอลัมน์ที่เลือกของเมทริกซ์นี้คือค่าตัวเลขของการชำระเงินให้กับผู้เล่น I จากผู้เล่น II (หากค่านี้เป็นค่าบวก ผู้เล่นที่ฉันชนะจริง ๆ และหากเป็นค่าลบ แสดงว่าผู้เล่น II เป็นหลักชนะ)
หากมีจุดอานในเมทริกซ์ผลตอบแทน ผู้เล่นมีกลยุทธ์ที่ดีที่สุด นั่นคือ เพื่อที่จะชนะ แต่ละคนจะต้องทำซ้ำการเคลื่อนไหวที่เหมาะสมที่สุดของเขา หากไม่มีจุดอาน เพื่อที่จะชนะ แต่ละคนต้องใช้กลยุทธ์ผสมที่เหมาะสม นั่นคือ ใช้ท่าผสมกัน ซึ่งแต่ละท่าจะต้องสร้างด้วยความน่าจะเป็นที่เหมาะสมที่สุด
การค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2×2 ทำได้โดยการคำนวณความน่าจะเป็นที่เหมาะสมที่สุดโดยใช้สูตรที่ทราบ โดยใช้ โซลูชันทางเรขาคณิตเกม 2×n คำจำกัดความของกลยุทธ์แบบผสมที่เหมาะสมที่สุดจะลดลงเพื่อค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2×2 ในการแก้เกม m×n วิธีการเขียนโปรแกรมเชิงเส้นจะใช้เพื่อค้นหากลยุทธ์ผสมที่เหมาะสมที่สุด
เมทริกซ์ผลตอบแทนบางตัวช่วยให้เข้าใจง่าย ซึ่งเป็นผลมาจากการที่มิติของพวกมันลดลงโดยการลบแถวและคอลัมน์ที่สอดคล้องกับการเคลื่อนไหวที่ไม่คาดฝัน
หากผู้เล่น II เป็นชุดของปัจจัยที่ไม่แน่นอนซึ่งขึ้นอยู่กับความเป็นจริงตามวัตถุประสงค์และไม่มีความขัดแย้งที่เป็นปรปักษ์กัน เกมดังกล่าวจะเรียกว่าเกมที่มีธรรมชาติ และปัญหาของทฤษฎีการตัดสินใจทางสถิติจะถูกนำมาใช้ในการแก้ปัญหา จากนั้นพร้อมกับเมทริกซ์การจ่ายผลตอบแทน มีการแนะนำเมทริกซ์ความเสี่ยงและสองสูตรของปัญหาในการเลือกวิธีแก้ปัญหาในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ: เพิ่มกำไรสูงสุดและลดความเสี่ยงให้น้อยที่สุด
การแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติภายใต้เงื่อนไขความเสี่ยงแสดงให้เห็นว่า เป็นการสมควรสำหรับผู้เล่นที่ 1 ให้เลือกกลยุทธ์ที่ค่าเฉลี่ย (ความคาดหวัง) ของผลตอบแทนที่นำมาตามเส้นของเมทริกซ์ผลตอบแทนสูงสุดหรือ ( ซึ่งเหมือนกัน) ค่าเฉลี่ย (ความคาดหวัง) ของความเสี่ยง ที่นำมาโดยเส้นของเมทริกซ์ความเสี่ยงนั้นน้อยที่สุด เมื่อทำการตัดสินใจภายใต้ความไม่แน่นอน เกณฑ์ต่อไปนี้จะถูกใช้: เกณฑ์สูงสุดของ Wald, เกณฑ์ความเสี่ยงขั้นต่ำของ Savage, เกณฑ์การมองโลกในแง่ดีในแง่ร้ายของ Hurwitz, หลักการของ Laplace ที่มีเหตุผลไม่เพียงพอ
คำถามสำหรับการตรวจสอบตนเอง
แนวคิดพื้นฐานของทฤษฎีเกมกำหนดไว้อย่างไร: การเคลื่อนไหว กลยุทธ์ และฟังก์ชันผลตอบแทน
ฟังก์ชันการจ่ายเงินแสดงในเกมเมทริกซ์อย่างไร?
เหตุใดเกมเมทริกซ์จึงเรียกว่าผลรวมเป็นศูนย์
ขั้นตอนการเล่นเกมเมทริกซ์เป็นอย่างไร?
เกมอะไรที่เรียกว่าเกม m×n?
กลยุทธ์เกมเมทริกซ์ที่ดีที่สุดคืออะไร?
อะไรคือกลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ที่เรียกว่า pure?
จุดอานของเมทริกซ์ผลตอบแทนหมายความว่าอย่างไร
อะไรคือกลยุทธ์ที่เหมาะสมที่สุดสำหรับเกมเมทริกซ์ที่เรียกว่ามิกซ์?
กลยุทธ์ผสมของผู้เล่นคืออะไร?
ผลตอบแทนสำหรับผู้เล่น I จากผู้เล่น II ที่เลือกกลยุทธ์แบบผสมคืออะไร?
กลยุทธ์แบบผสมใดที่เรียกว่าเหมาะสมที่สุด
ความแตกต่างที่ไม่ได้กระจายหมายถึงอะไร
วิธีใดที่ใช้ในการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม 2×2?
กลยุทธ์แบบผสมที่ดีที่สุดพบได้อย่างไรสำหรับเกม 2×n?
วิธีใดที่ใช้ในการค้นหากลยุทธ์แบบผสมที่เหมาะสมที่สุดสำหรับเกม m×n?
อะไรคือคุณสมบัติของการแก้เกมเมทริกซ์?
การลดความซับซ้อนของเมทริกซ์การชำระเงินหมายถึงอะไรและภายใต้เงื่อนไขใดที่สามารถนำไปใช้ได้
เกมเมทริกซ์ใดแก้ง่ายกว่าเมื่อเมทริกซ์ผลตอบแทนมีหรือไม่มีจุดอาน
ปัญหาใดของทฤษฎีเกมที่เกี่ยวข้องกับปัญหาของทฤษฎีการตัดสินใจทางสถิติ
เมทริกซ์ผลตอบแทนถูกแปลงเป็นเมทริกซ์ความเสี่ยงอย่างไร?
สองสูตรของปัญหาในการเลือกวิธีแก้ปัญหาที่เป็นไปได้ในเกมเมทริกซ์ที่มีธรรมชาติคืออะไร?
สำหรับสองเงื่อนไขใดที่สามารถกำหนดปัญหาในการตัดสินใจในเกมเมทริกซ์ที่มีลักษณะเป็นธรรมชาติ?
กลยุทธ์ใดที่เหมาะสมสำหรับผู้เล่นที่ฉันเลือกเมื่อแก้ปัญหาทฤษฎีการตัดสินใจทางสถิติภายใต้ความเสี่ยง?
เกณฑ์การตัดสินใจใดที่สามารถนำมาใช้ในการแก้ปัญหาของทฤษฎีการตัดสินใจทางสถิติภายใต้ความไม่แน่นอน?
ตัวอย่างการแก้ปัญหา
1. เมทริกซ์การชำระเงินระบุจำนวนกำไรขององค์กรเมื่อขายได้ ประเภทต่างๆผลิตภัณฑ์ (คอลัมน์) ขึ้นอยู่กับความต้องการที่กำหนดไว้ (แถว) จำเป็นต้องกำหนดกลยุทธ์ที่เหมาะสมที่สุดขององค์กรสำหรับการผลิตผลิตภัณฑ์ประเภทต่างๆ และรายได้สูงสุด (โดยเฉลี่ย) ที่สอดคล้องกันจากการขาย
แสดงถึงเมทริกซ์ที่กำหนดโดยและแนะนำตัวแปร เราจะใช้เมทริกซ์ (เวกเตอร์) ด้วย จากนั้น และ นั่นคือ .
คำนวณเมทริกซ์ผกผัน:
พบค่า:
.
คำนวณความน่าจะเป็น:
รายได้เฉลี่ยจากการขายถูกกำหนด:
.
2. บริษัท "Pharmatsevt" - ผู้ผลิตยาและผลิตภัณฑ์ชีวการแพทย์ในภูมิภาค เป็นที่ทราบกันดีว่าความต้องการยาบางชนิดพุ่งสูงขึ้นใน ช่วงฤดูร้อน(ยาของกลุ่มหัวใจและหลอดเลือด, ยาแก้ปวด) สำหรับคนอื่น ๆ - สำหรับช่วงฤดูใบไม้ร่วงและฤดูใบไม้ผลิ (ป้องกันการติดเชื้อ, ฤทธิ์ต้านฤทธิ์)
ราคาต่อ 1 Conv. หน่วย ผลิตภัณฑ์สำหรับเดือนกันยายนถึงตุลาคมคือ: สำหรับกลุ่มแรก (ยารักษาโรคหัวใจและหลอดเลือดและยาแก้ปวด) - 20 รูเบิล; สำหรับกลุ่มที่สอง (ยาต้านการติดเชื้อ, ยาแก้ไอ) - 15 รูเบิล
จากการสังเกตมากกว่าหลาย ปีที่ผ่านมาบริการด้านการตลาดของบริษัทพบว่าสามารถขายเครื่องทั่วไปได้ 3050 เครื่องในช่วงสองเดือนภายใต้การพิจารณาสภาพอากาศที่อบอุ่น หน่วย สินค้ากลุ่มแรกและ 1100 Conv. หน่วย ผลิตภัณฑ์ของกลุ่มที่สอง ในสภาพอากาศหนาวเย็น - 1525 arb หน่วย ผลิตภัณฑ์ของกลุ่มแรกและ 3690 Conv. หน่วย กลุ่มที่สอง
ในการเชื่อมต่อกับการเปลี่ยนแปลงสภาพอากาศที่เป็นไปได้งานคือการกำหนดกลยุทธ์ของ บริษัท ในการผลิตผลิตภัณฑ์ที่ให้รายได้สูงสุดจากการขายในราคาขาย 40 รูเบิล สำหรับ 1 Conv. หน่วย สินค้ากลุ่มแรกและ 30 น. - กลุ่มที่สอง
วิธีการแก้. บริษัท มีสองกลยุทธ์:
ปีนี้อากาศจะอบอุ่น
อากาศจะเย็น
หาก บริษัท ใช้กลยุทธ์และสภาพอากาศอบอุ่นจริง ๆ (กลยุทธ์ของธรรมชาติ) ผลิตภัณฑ์ที่ผลิต (3050 หน่วยทั่วไปของยากลุ่มแรกและ 1100 หน่วยทั่วไปของกลุ่มที่สอง) จะรับรู้อย่างเต็มที่และรายได้จะ เป็น
3050×(40-20)+1100×(30-15)=77500 ร.
ในสภาพอากาศที่หนาวเย็น (กลยุทธ์ของธรรมชาติ) ยากลุ่มที่สองจะขายเต็มจำนวนและกลุ่มแรกจะขายเฉพาะจำนวน 1525 หน่วยทั่วไปเท่านั้น หน่วย และยาบางชนิดก็ยังขายไม่ออก รายได้จะเป็น
1525×(40-20)+1100×(30-15)-20×()=16500 ร.
ในทำนองเดียวกัน หากรูปแบบใช้กลยุทธ์และอากาศหนาวจริง รายได้ก็จะเป็น
1525×(40-20)+3690×(30-15)=85850 ร.
อากาศร้อนมีรายได้
1525×(40-20)+1100×(30-15)-() ×15=8150 ร.
เมื่อพิจารณาถึงบริษัทและสภาพอากาศในฐานะผู้เล่นสองคน เราจะได้เมทริกซ์ผลตอบแทน
,
ราคาเกมอยู่ในช่วง
จะเห็นได้จาก payoff matrix ว่าภายใต้เงื่อนไขทั้งหมด รายได้ของบริษัทจะอยู่ที่ 16,500 rubles เป็นอย่างน้อย แต่ถ้า สภาพอากาศตรงกับกลยุทธ์ที่เลือก รายได้ของบริษัทสามารถเป็น 77,500 รูเบิล
มาหาวิธีแก้เกมกัน
ให้เราแสดงความน่าจะเป็นของการใช้กลยุทธ์โดยบริษัทเป็น กลยุทธ์ผ่าน และ แก้เกมแบบกราฟิกเราได้รับ ในขณะที่ราคาของเกมอาร์
แผนการผลิตยาที่เหมาะสมที่สุดจะเป็น
ดังนั้นจึงเป็นการสมควรที่บริษัทจะผลิตเครื่องรุ่นธรรมดาจำนวน 2379 เครื่องในช่วงเดือนกันยายนและตุลาคม หน่วย ยากลุ่มแรกและ 2239.6 หน่วยทั่วไป หน่วย ยาเสพติดของกลุ่มที่สองจากนั้นในทุกสภาพอากาศเธอจะได้รับรายได้อย่างน้อย 46,986 รูเบิล
ภายใต้เงื่อนไขของความไม่แน่นอน หากเป็นไปไม่ได้ที่บริษัทจะใช้กลยุทธ์แบบผสม (สัญญากับองค์กรอื่น) เราใช้เกณฑ์ต่อไปนี้เพื่อกำหนดกลยุทธ์ที่เหมาะสมที่สุดของบริษัท:
เกณฑ์ Walde:
เกณฑ์ของ Hurwitz: เพื่อความชัดเจน เรายอมรับ จากนั้นสำหรับกลยุทธ์ของบริษัท
สำหรับกลยุทธ์
ขอแนะนำให้บริษัทใช้กลยุทธ์นี้
เกณฑ์ของ Savage องค์ประกอบสูงสุดในคอลัมน์แรกคือ 77500 ในคอลัมน์ที่สองคือ 85850
องค์ประกอบของเมทริกซ์ความเสี่ยงหาได้จากนิพจน์
,
ที่ไหน , ,
เมทริกซ์ความเสี่ยงมีรูปแบบ
,
ขอแนะนำให้ใช้กลยุทธ์หรือ.
ดังนั้นจึงแนะนำให้บริษัทใช้กลยุทธ์หรือ
โปรดทราบว่าเกณฑ์การพิจารณาแต่ละข้อไม่สามารถถือว่าน่าพอใจอย่างสมบูรณ์สำหรับ ทางเลือกสุดท้ายการตัดสินใจ แต่การวิเคราะห์ร่วมกันทำให้สามารถนำเสนอผลที่ตามมาของการตัดสินใจด้านการจัดการบางอย่างได้ชัดเจนยิ่งขึ้น
ด้วยการแจกแจงความน่าจะเป็นที่ทราบของสภาวะธรรมชาติต่างๆ เกณฑ์การตัดสินใจคือความคาดหวังทางคณิตศาสตร์สูงสุดของผลตอบแทน
ให้ทราบปัญหาที่พิจารณาว่าความน่าจะเป็นของสภาพอากาศที่อบอุ่นและเย็นมีค่าเท่ากับ 0.5 แล้วจึงกำหนดกลยุทธ์ที่เหมาะสมของบริษัทดังนี้
ขอแนะนำให้บริษัทใช้กลยุทธ์หรือ
งานสำหรับงานอิสระ
1. องค์กรสามารถผลิตสินค้าได้ 3 ประเภท (A, B และ C) โดยได้รับผลกำไรตามความต้องการ ในทางกลับกัน อุปสงค์สามารถรับหนึ่งในสี่สถานะ (I, II, III และ IV) ในเมทริกซ์ต่อไปนี้ องค์ประกอบจะแสดงลักษณะผลกำไรที่องค์กรจะได้รับเมื่อปล่อยผลิตภัณฑ์ที่ - และ - สถานะของอุปสงค์:
คำอธิบายของเกม bimatrix. เกมทั้งหมดที่ถือว่าเป็นของคลาส เกมผลรวมศูนย์. อย่างไรก็ตาม สถานการณ์ความขัดแย้งจำนวนหนึ่งที่เกิดขึ้นในระหว่างการดำเนินการมีลักษณะเฉพาะโดยข้อเท็จจริงที่ว่าการได้รับจากฝ่ายหนึ่งไม่เท่ากับการสูญเสียของอีกฝ่ายหนึ่งทุกประการ โมเดลทฤษฎีเกมสถานการณ์ดังกล่าวเป็นเกมที่ไม่ร่วมมือกันโดยมีผลรวมที่ไม่เป็นศูนย์ เกมดังกล่าวเรียกว่า bimatrix เนื่องจากงานของแต่ละเกมดังกล่าวจะลดลงเป็นงานของเมทริกซ์สองตัวและรูปแบบเดียวกัน: .
กระบวนการ เกม bimatrixประกอบด้วยตัวเลือกอิสระของตัวเลขโดยผู้เล่น I และหมายเลขโดยผู้เล่น II หลังจากนั้นผู้เล่นที่ฉันจะได้รับค่าตอบแทน และผู้เล่น II จะได้รับค่าตอบแทน
หมายเลขแถวของเมทริกซ์และจะถูกเรียกว่า กลยุทธ์ที่บริสุทธิ์ของผู้เล่น I และหมายเลขคอลัมน์ของเมทริกซ์เหล่านี้คือ กลยุทธ์ที่บริสุทธิ์ของผู้เล่นครั้งที่สอง จากนั้นรูปแบบคู่จะเป็นสถานการณ์ในกลยุทธ์ที่บริสุทธิ์ เกม bimatrixและตัวเลขและผลตอบแทนของผู้เล่น I และ II ในสถานการณ์ ดังนั้น การแจกแจงความน่าจะเป็นของการใช้กลยุทธ์บริสุทธิ์ของผู้เล่น I คือ และผู้เล่น II -
เราจะเรียก กลยุทธ์ผสม. จากนั้นคู่ของแบบฟอร์มแสดงถึงสถานการณ์ เกม bimatrixใน กลยุทธ์ผสมและตัวเลข
และ
คือผลตอบแทนที่คาดหวังของผู้เล่น I และ II
สถานการณ์สมดุลของเกม bimatrix ในกลยุทธ์แบบผสมเราจะเรียกคู่นั้นว่า:
![]() |
(8.2) |
ความคาดหวังทางคณิตศาสตร์ของผลตอบแทนของผู้เล่น I อยู่ที่ไหน
ความคาดหวังทางคณิตศาสตร์ของผลตอบแทนของผู้เล่น II;
ผสมที่เหมาะสมที่สุด กลยุทธ์ผู้เล่นฉัน;
ผสมที่เหมาะสมที่สุด กลยุทธ์ผู้เล่นครั้งที่สอง
งาน
การสร้างและการแก้ปัญหาของเกม bimatrix. สมมุติว่าเรือดำน้ำต่อต้านเรือดำน้ำของประเทศกำลังค้นหาเรือดำน้ำติดขีปนาวุธของรัฐซึ่งกำลังเคลื่อนที่อยู่ในส่วนที่กำหนดไว้อย่างเข้มงวดของพื้นที่ลาดตระเวนการต่อสู้ เรือดำน้ำ ASW ปฏิบัติการในพื้นที่ที่เหลือและค้นหา ASW ให้เรือต่อต้านเรือดำน้ำแต่ละลำเพื่อตรวจจับศัตรูสามารถใช้สถานีพลังน้ำของตนได้ทั้งในโหมดแอคทีฟ เปิดเครื่องเป็นระยะ หรือเฉพาะในโหมดพาสซีฟเท่านั้น ทำการค้นหาอย่างต่อเนื่อง
ทั้งเรือดำน้ำต่อต้านเรือดำน้ำและเรือดำน้ำขีปนาวุธที่ตรวจจับสัญญาณโซนาร์สามารถหลบเลี่ยงศัตรูได้ อย่างไรก็ตาม ความถี่ของการเปิดโซนาร์ทำให้การตรวจจับเป็นไปได้แต่ไม่น่าเชื่อถือ
ในการดังกล่าว สถานการณ์ความขัดแย้งผู้เล่นคนหนึ่งเป็นเรือดำน้ำต่อต้านเรือดำน้ำ และอีกคนหนึ่งเป็นเรือดำน้ำต่อต้านเรือดำน้ำ เห็นได้ชัดว่า เรือดำน้ำมิซไซล์ไม่สามารถเป็นผู้เล่นได้ เนื่องจากมีโหมดการดำเนินการเพียงโหมดเดียวซึ่งก็คือการหลบเลี่ยงและดำเนินการหลบเลี่ยงด้วย การตรวจจับสัญญาณโซนาร์
ลักษณะเด่นของที่นี่คือผู้เล่นแต่ละคนแสวงหาเป้าหมายที่แตกต่างกันแต่ไม่ตรงข้าม แท้จริงแล้ว จุดประสงค์ของเรือดำน้ำ ASW คือการหาตำแหน่งของเรือดำน้ำขีปนาวุธ และจุดประสงค์ของเรือดำน้ำ ASW ก็คือการหาตำแหน่งของ ASW ดังนั้น ในการประเมินความสำเร็จของเป้าหมายโดยผู้เล่นแต่ละคน ขึ้นอยู่กับวิธีการเลือกปฏิบัติ (กลยุทธ์) จำเป็นต้องมีเกณฑ์ประสิทธิภาพสองประการ และตามนั้น สองฟังก์ชันผลตอบแทน จากนั้นโมเดลของสถานการณ์ความขัดแย้งดังกล่าวจะเป็นเกมที่มีขอบเขตจำกัดโดยมีผลรวมที่ไม่เป็นศูนย์ อธิบายโดยเมทริกซ์สองตัวที่มีรูปแบบเดียวกัน และ
เรียกว่า บิเมทริกซ์
มาลองกันเถอะ เกณฑ์ประสิทธิภาพเรือดำน้ำต่อต้านเรือดำน้ำ (ผู้เล่น I) ความน่าจะเป็นในการตรวจจับเรือดำน้ำขีปนาวุธและสำหรับ เกณฑ์ประสิทธิภาพเรือดำน้ำต่อต้านเรือดำน้ำ (ผู้เล่น II) - ความน่าจะเป็นในการตรวจจับเรือดำน้ำต่อต้านเรือดำน้ำ . จากนั้นเกม bimatrix จะได้รับโดยเมทริกซ์ (รูปที่ 9.a) และเมทริกซ์ (รูปที่ 9.b)
ข้าว. 9.ก.
ข้าว. 9.ข.
ที่ไหน - ใช้โหมดแอคทีฟ;
การใช้โหมดพาสซีฟ
ในบรรดาเกมที่มีความสำคัญในทางปฏิบัติ เกมที่มีจุดอานนั้นค่อนข้างหายาก โดยทั่วไปมากขึ้นคือกรณีที่ราคาที่ต่ำกว่าและราคาสูงกว่า - เกมต่างกัน เมื่อวิเคราะห์เมทริกซ์ของเกมดังกล่าวแล้ว เราก็ได้ข้อสรุปว่าหากผู้เล่นแต่ละคนได้รับเลือก
หนึ่งเดียว - กลยุทธ์เดียว ดังนั้นโดยอิงจากคู่ต่อสู้ที่มีเหตุผล ทางเลือกนี้ควรถูกกำหนดโดยหลักการ minimax การปฏิบัติตามกลยุทธ์สูงสุดของเรา เรารับประกันว่าตนเองจะได้รับผลตอบแทนเท่ากับราคาที่ต่ำกว่าของเกม a สำหรับพฤติกรรมใดๆ ของคู่ต่อสู้ คำถามธรรมดาเกิดขึ้น: เป็นไปได้ไหมที่จะรับประกันว่าตัวเองจะได้รับผลตอบแทนโดยเฉลี่ยมากกว่า a ถ้าคุณใช้กลยุทธ์ที่ "บริสุทธิ์" เพียงกลยุทธ์เดียว แต่สลับกลยุทธ์หลายๆ อย่างแบบสุ่ม
กลยุทธ์ที่รวมกันดังกล่าวประกอบด้วยการใช้กลยุทธ์บริสุทธิ์หลายอย่างสลับกันตามกฎสุ่มที่มีอัตราส่วนของความถี่ที่แน่นอนเรียกว่ากลยุทธ์แบบผสมในทฤษฎีเกม
เห็นได้ชัดว่า แต่ละกลยุทธ์ล้วนเป็นกรณีพิเศษของกลยุทธ์แบบผสม ซึ่งกลยุทธ์ทั้งหมดยกเว้นกลยุทธ์หนึ่งจะถูกนำไปใช้กับความถี่เป็นศูนย์ และกลยุทธ์นี้ - ด้วยความถี่ 1
ปรากฎว่าไม่เพียงแต่ใช้กลยุทธ์ที่บริสุทธิ์เท่านั้น แต่ยังรวมถึงกลยุทธ์แบบผสมด้วย มันเป็นไปได้ที่จะได้รับวิธีแก้ปัญหาสำหรับแต่ละเกมที่จำกัด นั่นคือคู่ของกลยุทธ์ (โดยทั่วไปผสม) ซึ่งเมื่อผู้เล่นทั้งสองใช้พวกเขา ผลตอบแทนจะเท่ากับ ราคาเกม และเมื่อมีการเบี่ยงเบนด้านเดียวจากกลยุทธ์ที่เหมาะสม ผลตอบแทนสามารถเปลี่ยนไปในทิศทางที่ไม่เอื้ออำนวยต่อผู้เบี่ยงเบนเท่านั้น
ข้อความดังกล่าวเป็นเนื้อหาของทฤษฎีบทหลักที่เรียกว่าทฤษฎีเกม ทฤษฎีบทนี้ได้รับการพิสูจน์ครั้งแรกโดยฟอน นอยมันน์ในปี ค.ศ. 1928 การพิสูจน์ทฤษฎีบทนี้ค่อนข้างซับซ้อน ดังนั้นเราจึงนำเสนอเฉพาะสูตรของมันเท่านั้น
ทุกเกมจำกัดมีทางออกอย่างน้อยหนึ่งทาง (อาจอยู่ในขอบเขตของกลยุทธ์แบบผสม)
ผลตอบแทนที่เกิดจากการตัดสินใจเรียกว่าราคาของเกม จากทฤษฎีบทหลักที่ทุกเกมไฟไนต์มีราคา เห็นได้ชัดว่าราคาของเกม v อยู่ระหว่างราคาที่ต่ำกว่าของเกม a และราคาสูงกว่าของเกม :
อันที่จริง มีผลตอบแทนสูงสุดที่รับประกันได้ว่าเราสามารถรับประกันได้โดยใช้เพียงกลยุทธ์ของเราเองเท่านั้น เนื่องจากกลยุทธ์แบบผสมนั้นรวมถึงกลยุทธ์ที่บริสุทธิ์ทั้งหมดเป็นกรณีพิเศษ ดังนั้น ยอมให้นอกจากกลยุทธ์ที่บริสุทธิ์แล้ว ยังผสมด้วย
กลยุทธ์ ไม่ว่าในกรณีใด เราจะไม่ทำให้ความสามารถของเราแย่ลง เพราะเหตุนี้,
ในทำนองเดียวกัน เมื่อพิจารณาถึงความสามารถของคู่ต่อสู้แล้ว เราแสดงว่า
ดังนั้นความไม่เท่าเทียมกันที่จำเป็น (3.1) จึงตามมา
ให้เราแนะนำสัญลักษณ์พิเศษสำหรับกลยุทธ์แบบผสม ตัวอย่างเช่น หากกลยุทธ์แบบผสมของเราประกอบด้วยการใช้กลยุทธ์ AL กับความถี่ และเราจะแสดงถึงกลยุทธ์นี้
ในทำนองเดียวกัน กลยุทธ์แบบผสมของปฏิปักษ์จะแสดงโดย:
ความถี่ที่กลยุทธ์ผสมอยู่ที่ไหน
สมมติว่าเราพบวิธีแก้ปัญหาของเกมซึ่งประกอบด้วยกลยุทธ์แบบผสมที่ดีที่สุดสองแบบคือ S, S ในกรณีทั่วไป ไม่ใช่กลยุทธ์ทั้งหมดที่มีให้สำหรับผู้เล่นรายใดรายหนึ่งที่รวมอยู่ในกลยุทธ์แบบผสมที่เหมาะสมที่สุดของเขา แต่มีเพียงบางกลยุทธ์เท่านั้น เราจะเรียกกลยุทธ์ที่รวมอยู่ในกลยุทธ์แบบผสมที่ดีที่สุดของผู้เล่นว่ากลยุทธ์ "มีประโยชน์" ของเขา
ปรากฎว่าวิธีแก้ปัญหาของเกมมีคุณสมบัติที่โดดเด่นอีกอย่างหนึ่ง: หากผู้เล่นคนใดคนหนึ่งปฏิบัติตามกลยุทธ์ผสมที่ดีที่สุดของเขา 5 (5) จากนั้นผลตอบแทนจะยังคงไม่เปลี่ยนแปลงและเท่ากับราคาของเกม v ไม่ว่าผู้เล่นคนอื่นจะทำอะไรก็ตาม ถ้าเขา ไม่ได้ไปไกลกว่ากลยุทธ์ที่ "มีประโยชน์" เท่านั้น ตัวอย่างเช่น เขาสามารถใช้กลยุทธ์ที่ "มีประโยชน์" ใดๆ ของเขาใน รูปแบบบริสุทธิ์และยังสามารถผสมในสัดส่วนใดก็ได้
มาพิสูจน์คำกล่าวนี้กัน ให้มีวิธีแก้ปัญหาของเกม เพื่อความเป็นรูปธรรม เราจะถือว่ากลยุทธ์การผสมที่ดีที่สุดประกอบด้วยส่วนผสมของสาม
กลยุทธ์ที่ "มีประโยชน์" ตามลำดับประกอบด้วยกลยุทธ์ที่ "มีประโยชน์" สามอย่างผสมกัน
และระบุว่าถ้าเรายึดกลยุทธ์ S แล้วฝ่ายตรงข้ามก็สามารถใช้กลยุทธ์ในสัดส่วนใด ๆ และผลตอบแทนจะยังคงไม่เปลี่ยนแปลงและจะยังคงเท่ากับราคาของเกม
โดยทั่วไป V * ≠ V * - ไม่มีจุดอาน นอกจากนี้ยังไม่มีวิธีแก้ปัญหาที่ดีที่สุดในกลยุทธ์ที่บริสุทธิ์ อย่างไรก็ตาม หากเราขยายแนวคิดของกลยุทธ์ล้วนๆ โดยการแนะนำแนวคิดของกลยุทธ์แบบผสม เราก็สามารถใช้อัลกอริธึมเพื่อค้นหาวิธีแก้ปัญหาที่เหมาะสมที่สุดสำหรับปัญหาเกมที่ไม่ได้กำหนดไว้อย่างชัดเจน ในสถานการณ์เช่นนี้ ขอเสนอให้ใช้วิธีการทางสถิติ (ความน่าจะเป็น) เพื่อค้นหาวิธีแก้ปัญหาที่เหมาะสมที่สุดสำหรับเกมที่เป็นปฏิปักษ์ สำหรับผู้เล่นแต่ละคน พร้อมกับชุดของกลยุทธ์ที่เป็นไปได้สำหรับเขา มีการแนะนำเวกเตอร์ของความน่าจะเป็น (ความถี่สัมพัทธ์) ที่ไม่รู้จักซึ่งควรใช้กลยุทธ์อย่างใดอย่างหนึ่ง
ให้เราแสดงเวกเตอร์ของความน่าจะเป็น (ความถี่สัมพัทธ์) ของทางเลือกของกลยุทธ์ที่กำหนดของผู้เล่น A ดังนี้:
P = (p 1 , p 2 ,…, p ม.),
โดยที่ p i ≥ 0, p 1 + p 2 +…+ p m = 1 ค่า p i เรียกว่าความน่าจะเป็น (ความถี่สัมพัทธ์) ของการใช้กลยุทธ์ A ผม
ในทำนองเดียวกันสำหรับผู้เล่น B จะมีการแนะนำเวกเตอร์ของความน่าจะเป็นที่ไม่รู้จัก (ความถี่สัมพัทธ์) ซึ่งมีรูปแบบ:
Q = (q 1 , q 2 ,…, q n),
โดยที่ q j ≥ 0, q 1 + q 2 +…+ q n = 1 ปริมาณ q j เรียกว่าความน่าจะเป็น (ความถี่สัมพัทธ์) ของการใช้กลยุทธ์ B j ชุด (รวมกัน) ของกลยุทธ์บริสุทธิ์ A 1 , A 2 , …A m และ B 1, B 2, …B n ร่วมกับเวกเตอร์ความน่าจะเป็นของการเลือกแต่ละรายการถูกเรียก กลยุทธ์ผสม
ทฤษฎีบทหลักในทฤษฎีเกมที่เป็นปรปักษ์กันคือ ทฤษฎีบทของฟอน นอยมันน์: เกมเมทริกซ์ไฟไนต์ทุกเกมมีทางออกที่ดีที่สุดอย่างน้อยหนึ่งวิธี อาจเป็นกลยุทธ์แบบผสมก็ได้.
จากทฤษฎีบทนี้ว่าเกมที่ไม่ได้กำหนดไว้อย่างดีมีวิธีแก้ปัญหาที่ดีที่สุดอย่างน้อยหนึ่งวิธีในกลยุทธ์แบบผสม ในเกมดังกล่าว การแก้ปัญหาจะเป็นคู่ของกลยุทธ์ผสมที่เหมาะสมที่สุด P * และ Q * เช่นนั้นหากผู้เล่นคนใดคนหนึ่งปฏิบัติตามกลยุทธ์ที่เหมาะสมที่สุดของเขา ผู้เล่นคนอื่นจะเบี่ยงเบนไปจากกลยุทธ์ที่ดีที่สุดของเขาไม่ได้
ผลตอบแทนเฉลี่ยของผู้เล่น A ถูกกำหนดโดยความคาดหวังทางคณิตศาสตร์:
หากความน่าจะเป็น (ความถี่สัมพัทธ์) ของการใช้กลยุทธ์แตกต่างจากศูนย์ กลยุทธ์ดังกล่าวจะเรียกว่า คล่องแคล่ว.
กลยุทธ์ P * , Q * เรียกว่า ผสมที่ดีที่สุดกลยุทธ์ถ้า MA (P, Q *) ≤ MA (P * , Q *) ≤ MA (P * , Q) (1)
ในกรณีนี้เรียกว่า MA (P * , Q *) ในราคาเกมและแสดงด้วย V (V * ≤ V ≤ V *) อสมการแรก (1) หมายความว่า การเบี่ยงเบนของผู้เล่น A จากกลยุทธ์ผสมที่ดีที่สุดของเขาโดยมีเงื่อนไขว่าผู้เล่น B ยึดมั่นในกลยุทธ์ผสมที่ดีที่สุดของเขา ส่งผลให้กำไรเฉลี่ยลดลงผู้เล่น A. ความไม่เท่าเทียมกันที่สองหมายความว่า การเบี่ยงเบนของผู้เล่น B จากกลยุทธ์ผสมที่ดีที่สุดของเขาโดยมีเงื่อนไขว่าผู้เล่น A ยึดมั่นในกลยุทธ์ผสมที่ดีที่สุดของเขา นำไปสู่การเพิ่มขึ้นในการสูญเสียเฉลี่ยของผู้เล่นB.
ในกรณีทั่วไป เครื่องคำนวณนี้แก้ปัญหาดังกล่าวได้สำเร็จ
ตัวอย่าง.
4 | 7 | 2 |
7 | 3 | 2 |
2 | 1 | 8 |
1. ตรวจสอบว่าเมทริกซ์ผลตอบแทนมีจุดอานหรือไม่. ถ้าใช่ เราจะเขียนวิธีแก้ปัญหาของเกมด้วยกลยุทธ์ล้วนๆ
เราคิดว่าผู้เล่นที่ฉันเลือกกลยุทธ์ของเขาในลักษณะที่จะเพิ่มผลตอบแทนสูงสุดของเขา และผู้เล่น II เลือกกลยุทธ์ของเขาในลักษณะที่จะลดผลตอบแทนของผู้เล่น I
ผู้เล่น | B1 | B2 | B3 | a = นาที (Ai) |
A 1 | 4 | 7 | 2 | 2 |
A2 | 7 | 3 | 2 | 2 |
A 3 | 2 | 1 | 8 | 1 |
b = สูงสุด (Bi) | 7 | 7 | 8 |
เราพบผลตอบแทนที่รับประกันซึ่งกำหนดโดยราคาที่ต่ำกว่าของเกม a = max(a i) = 2 ซึ่งบ่งบอกถึงกลยุทธ์สูงสุด A 1
ราคาสูงเกม b = นาที (b j) = 7 สิ่งนี้บ่งชี้ว่าไม่มีจุดอาน เนื่องจาก a ≠ b ดังนั้นราคาของเกมจะอยู่ภายใน 2 ≤ y ≤ 7 เราพบวิธีแก้ปัญหาของเกมในกลยุทธ์แบบผสม นี่คือคำอธิบายโดยข้อเท็จจริงที่ว่าผู้เล่นไม่สามารถประกาศกลยุทธ์ที่บริสุทธิ์ของตนต่อคู่ต่อสู้ได้: พวกเขาควรซ่อนการกระทำของตน เกมสามารถแก้ไขได้โดยให้ผู้เล่นเลือกกลยุทธ์ของพวกเขาแบบสุ่ม (ผสมกลยุทธ์ล้วนๆ)
2. ตรวจสอบเมทริกซ์ผลตอบแทนสำหรับแถวที่โดดเด่นและคอลัมน์ที่โดดเด่น.
ไม่มีแถวที่โดดเด่นและคอลัมน์ที่โดดเด่นในเมทริกซ์ผลตอบแทน
3. หาวิธีแก้ปัญหาในเกมด้วยกลยุทธ์แบบผสม.
มาเขียนระบบสมการกัน
สำหรับผู้เล่น I
4p1 +7p2 +2p3 = y
7p1 +3p2 +p3 = y
2p 1 +2p 2 +8p 3 = y
p1 +p2 +p3 = 1
สำหรับผู้เล่น II
4q1 +7q2 +2q3 = y
7q1 +3q2 +2q3 = y
2q1 +q2 +8q3 = y
q 1 + q 2 + q 3 = 1
การแก้ปัญหาระบบเหล่านี้ด้วยวิธีเกาส์ เราพบว่า:
y=4 1/34
p 1 = 29/68 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 1)
p 2 = 4/17 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 2)
p 3 = 23/68 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 3)
กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น I: P = (29 / 68 ; 4 / 17 ; 23 / 68)
q 1 = 6 / 17 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 1)
q 2 = 9/34 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 2)
q 3 = 13/34 (ความน่าจะเป็นของการใช้กลยุทธ์ที่ 3)
กลยุทธ์ผสมที่ดีที่สุดของผู้เล่น II: Q = (6 / 17 ; 9 / 34 ; 13 / 34)
ราคาเกม: y = 4 1 / 34
- บุคคลสามารถทำอะไรได้บ้าง?
- เหตุผลในการเริ่มต้นและความพ่ายแพ้ของสงครามรัสเซีย - ญี่ปุ่น: สั้น ๆ
- ขบวนการพรรคพวก - "กระบองแห่งสงครามประชาชน" พรรคพวก Smolensk ในสงครามปี 1812
- ปัญหาเงินคืออะไร?
- บทคัดย่อ: ปีเตอร์มหาราช พระองค์ทรงยิ่งใหญ่จริงๆ
- ต้มซุปไก่นานแค่ไหน?
- มะเขือเทศสีเขียวยัดไส้สำหรับฤดูหนาว - ของว่างแสนอร่อย
- มะเขือเทศสำหรับฤดูหนาวยัดไส้ด้วยกระเทียมและสมุนไพร
- Grissini - พิสูจน์สูตรขนมปังแท่งอิตาลี
- Raf coffee: ประวัติความเป็นมาของการสร้างสรรค์และทางเลือกในการเตรียมเครื่องดื่มกาแฟ
- อาหารว่างจานด่วน
- เคล็ดลับการทำอาหารที่มีประโยชน์สำหรับแม่บ้าน
- มายองเนสมังสวิรัติที่บ้าน
- พายแอปเปิ้ล - สูตรอาหารด่วน
- เคล็ดลับการทำขนมตาตาร์จักจก
- ปรับปรุงช่วงและเพิ่มคุณค่าทางโภชนาการของผลิตภัณฑ์ขนมปังและเบเกอรี่
- คุณสมบัติและสูตรสำหรับใส่หอมหัวใหญ่และแยม
- ที่บ้านปลาอะไรเค็มได้: ทางเลือกและเคล็ดลับในการทำอาหาร เกลือปลาขาว
- ยันต์คืออะไร ประเภทของยันต์ หมายถึง
- เทคโนโลยีการเผาไม้