1253 - Συνεχή παίγνια και Λύσεις Stackelberg
Ν. Λυγερός
Μια ειδική κατηγορία της θεωρίας παιγνίων αποτελείται από τα συνεχή παίγνια. Όπως δεν ανήκουν στα διακριτά συστήματα μπορούμε να εφαρμόσουμε τον διαφορικό λογισμό ειδικά όταν γνωρίζουμε τις συναρτήσεις κέρδους των παικτών.
Κλασικά ορίζουμε x τις στρατηγικές του παίκτη Ι και y τις στρατηγικές του παίκτη ΙΙ. Τότε αν οι παίκτες παίζουν ορθολογικά, οι συνθήκες ισορροπίας οδηγούν στις εξής αναγκαίες συνθήκες για ένα ζεύγος στρατηγικών x*, y* που αποτελείται από τις βέλτιστες στρατηγικές των παικτών.
ΚΙ (x*, y*) μέγιστο ως προς x με y* σταθερό Þ ¶ΚΙ / ¶x = 0 ½ (x*, y*)
ΚΙΙ (x*, y*) μέγιστο ως προς y με x* σταθερό Þ ¶ΚΙΙ / ¶y = 0 ½ (x*, y*)
Αν οι δύο εξισώσεις δεν επαρκούν, τότε προσθέτουμε συνθήκες μεγαλύτερης τάξης.
Το ενδιαφέρον αυτής της προσέγγισης είναι ότι μπορεί και να ερμηνευτεί ως επίπτωση μίας διπλής αντίδρασης. Ο παίκτης Ι, γνωρίζοντας ότι ο παίκτης ΙΙ θα παίξει y , αντιδρά παίζοντας Λύση (¶ΚΙ / ¶x = 0) και ο παίκτης ΙΙ, γνωρίζοντας ότι ο παίκτης Ι θα παίξει x , αντιδρά παίζοντας Λύση (¶ΚΙΙ / ¶y = 0). Όμως στην τελική φάση, το αποτέλεσμα είναι εντελώς συμμετρικό και οι εκτιμήσεις είναι ανεξάρτητες.
Μια άλλη περίπτωση προκαλείται από το ασυμμετρικό στοιχείο του χρόνου. Δηλαδή μπορούμε πια να διαχωρίσουμε τους παίκτες χρονικά. Ο παίκτης ΙΙ γνωρίζει την κίνηση του παίκτη Ι. Τότε η γενική προσέγγιση αλλάζει και μετατρέπεται σε ανάλυση του Stackelberg . Αυτήν τη φορά η ανάλυση γίνεται αναστροφικά. Με άλλα λόγια ο παίκτης Ι ξέρει ότι ο παίκτης ΙΙ γνωρίζει την κίνησή του και ότι θα παίξει Λύση ( ¶ΚΙΙ / ¶y = 0), συνεπώς εξετάζει το κέρδος του ΚΙ διαφορετικά ενσωματώνοντας την πληροφορία της αντίδρασης του παίκτη ΙΙ. Έχει λοιπόν όχι πια ΚΙ ( x, y) αλλά ΚΙ ( x, y αντίδραση) άρα επιλέγει Λύση (¶ΚΙ ( x, y αντίδραση) / ¶x = 0).
Μέσα σε αυτήν τη διαδικασία ονομάζουμε ηγέτη τον πρώτο παίκτη και υποτελή τον δεύτερο παίκτη. Η ύπαρξη αυτού του ζευγαριού δεν είναι τεχνητή εφόσον με την επέμβαση του χρόνου αλλάζει και η θέση της ισορροπίας. Η λύση του Stackelberg είναι διαφορετική από τη συμμετρική ισορροπία που προέρχεται από τη μη πρόσβαση στην πληροφορία. Μέσω της μεθοδολογίας αυτής μπορούμε δίχως δυσκολία να ερμηνέψουμε τον χρόνο ως μέσο πληροφόρησης και μάλιστα πλήρους πληροφόρησης στη συγκεκριμένη περίπτωση. Δημιουργεί με αυτόν τον τρόπο ένα πλαίσιο ενδιάμεσο σε σχέση με τα παίγνια συνεργασίας και τα παίγνια μη συνεργασίας. Συνεπώς μπορούμε με την προσέγγιση του Stackelberg να εξετάσουμε και να ερμηνέψουμε διαπραγματευτικές περιπτώσεις όπου ο χρόνος μέσω της διάταξης των επεμβάσεων είναι σημαντικός.