AlphaZero, το μέλλον είναι εδώ – Οι μηχανές αυτοδιδάσκονται

Υποστήκαμε το πρώτο σοκ το 1997, όταν ο ισχυρότερος σκακιστής του αιώνα, ο Γκάρι Κασπάροβ, ηττήθηκε στη Νέα Υόρκη από τον υπερυπολογιστή Deep Blue. Η δυσκολία να συνειδητοποιήσουμε το γεγονός οδηγούσε σε εκδοχές και υποψίες σκοπιμοτήτων και χρηματισμού. Έκτοτε, οι νίκες των μηχανών σε συναντήσεις με διάσημους γκραν μετρ έδωσαν την αποστομωτική απάντηση. Την αναστάτωση ήρθε να διασκεδάσει φλεγματικός Άγγλος γκραν μετρ, λέγοντας ότι και ένα γκρέιντερ σηκώνει περισσότερο από τον παγκόσμιο πρωταθλητή άρσης βαρών.

Στα 20 χρόνια που ακολούθησαν, οι μηχανές εξελίχθηκαν ραγδαία. Το καμάρι του σκακιστικού προγραμματισμού, το Stockfish, έφθασε να υπολογίζει εβδομήντα εκατομμύρια κινήσεις ανά δευτερόλεπτο. Φάνταζε άτρωτο!

Ο ιθύνων νους Ντ. Χασάμπης

O Γκάρι Κασπάροφ συνομιλεί με τον Δημήτρη Χασάβη, ιδρυτή της εταιρίας DeepMind

Το 2014 η Google αποκτά έναντι 450 εκατομμυρίων ευρώ το πρωτοποριακό βρετανικό εργαστήριο τεχνητής νοημοσύνης DeepMind. Συνιδρυτής και ιθύνων νους ο Ελληνοκύπριος Ντέμης Χασάμπης, ο, κατά τον Γκάρντιαν, «υπερήρωας της τεχνητής νοημοσύνης».

Ο Χασάμπης, γεννημένος το 1976 στο Λονδίνο από Ελληνοκύπριο πατέρα (καταγόμενο από την Αμμόχωστο) και μητέρα από τη Σιγκαπούρη, διακρίνεται από μικρός σε σκακιστικούς αγώνες. Με το πρώτο χρηματικό έπαθλο αγοράζει ένα κομπιούτερ και εκείνο που τον μαγεύει είναι το ότι μπορεί να το προγραμματίζει!

Το 1997, πτυχιούχος του Κέιμπριτζ, εργάζεται σε δημιουργικό στούντιο ηλεκτρονικών παιχνιδιών. Το 2010 ιδρύει την DeepMind. Το πρόγραμμά του, το AlphaGo, κερδίζει τον παγκόσμιο πρωταθλητή στο γκο, στο κινεζικό επιτραπέζιο παιχνίδι των 3.000 ετών!

Δεν ξαφνιάζει τόσο το αποτέλεσμα όσο το γεγονός ότι το AlphaGo μαθαίνει μόνο του, με τον ίδιο τρόπο που το κάνει ο ανθρώπινος εγκέφαλος.

Πριν από λίγες ημέρες, το δημιούργημα του σκακιστή Ντέμη Χασάμπη, το AlphaZero, αντιμετωπίζει σε ματς 100 παρτίδων το Stockfish 8. Το αποτέλεσμα είναι πέρα από κάθε πρόβλεψη: 28-0 και 72 ισοπαλίες υπέρ του AlphaZero. Είναι χαρακτηριστικό ότι οι 25 νίκες σημειώθηκαν με τα λευκά!

Το AlphaZero υπολογίζει ογδόντα χιλιάδες κινήσεις το δευτερόλεπτο (δηλαδή είναι 900 φορές πιο αργό από το Stockfish!), αλλά έτρεχε σε κατά 4 φορές ισχυρότερο hardware.

Όπως γράφει ο Φίλιππος Κοεράντ, «το εντυπωσιακό είναι πως η μηχανή αυτή (AlphaZero) ‘δεν ήξερε σκάκι’ τέσσερις ώρες πριν αρχίσει η αναμέτρηση (ενώ το Stockfish ‘χτίζεται’ ασταμάτητα επί πολλά χρόνια, με αφοσίωση ζωής, από πλήθος προγραμματιστών). Ο νέος επισκέπτης δεν πατάει σε κλασικό προγραμματισμό με αλγορίθμους, με σχετικές εκτιμήσεις δυναμικότητας κομματιών στις θέσεις, με δυναμικές εκτιμήσεις για τις πιονοδομές, με βιβλία ανοιγμάτων, με πίνακες φινάλε κ.λπ., αλλά στην τεχνητή νοημοσύνη. Το AlphaZero ‘έμαθε σκάκι’ από την αρχή και με την αυτοδιδαχή, σε λιγότερη ώρα από όση καταναλώνει κανείς για να δει τον Άρχοντα των Δαχτυλιδιών, κέρδισε με σαρωτική διαφορά στο σκορ και χωρίς ήττα την κορυφαία κλασικού προγραμματισμού μηχανή του κόσμου». Συμπεραίνει πως «μάλλον ο προγραμματισμός των σκακιστικών μηχανών θα αποτελέσει ρομαντικό παρελθόν και το σύντομο μέλλον, το πολύ σύντομο μέλλον, ανήκει στην τεχνητή νοημοσύνη» και καταλήγει: «Ζώντας το παρόν δεν υπάρχει ανθρώπινη δυνατότητα να συλλάβει κανείς πότε μιλάμε για εξέλιξη και πότε για τομή. Και πόση ιστορία πίσω από τη σκηνή έχει η τομή πριν εμφανιστεί στο κοινό».

Ο Παναγιώτης Κονιδάρης αναφέρει σε σχόλιό του: «Μου μοιάζει συγκλονιστικό. Όχι ‘καλό’ ή ‘κακό’. Συγκλονιστικό! Κάτι μου ψιθυρίζει ότι γύρισε μια ιστορική σελίδα καθώς κοιμόμασταν. Όχι για το σκάκι βέβαια, αστεία πράματα. Αυτό δεν ήταν παρά ο πειραματικός θάλαμος ή ένα μικρό μέσο επίδειξης. Όμως μια Α.Ι. που μπορεί να αυτοδιδάσκεται και να αυτοβελτιώνεται, είναι κάτι ταυτόχρονα θαυμάσιο και τρομακτικό».

Ας δούμε πώς παίζει το νέο δημιούργημα σε μία εκπληκτική παρτίδα:

AlphaZero – Stockfish 8 :

1.δ4 ε6 2.ε4 δ5 3.Iγ3 Iζ6 4.ε5 Iζδ7 5.ζ4 γ5 6.Iζ3 γxδ4 7.Iβ5 Aβ4+ 8.Aδ2 Aγ5 9.β4 Aε7 10.Iβxδ4 Iγ6 11.γ3 α5 12.β5 Ixδ4 13.γxδ4 Iβ6 14.α4 Iγ4 15.Aδ3 Ixδ2 16.Pxδ2 Aδ7 17.Pε3 β6 18.η4 θ5 19.Bη1 θxη4 20.Bxη4 Aζ8 21.θ4 Bε7 22.Πθγ1 η6 23.Πγ2 Pδ8 24.Παγ1 Bε8 25.Πγ7 Πγ8 26.Πxγ8+ Axγ8 27.Πγ6 Aβ7 28.Πγ2 Pδ7 29.Iη5 Aε7

30.Axη6!! Axη5 [30…ζxη6 31. Qxε6+] 31.Bxη5 ζxη6? 32.ζ5!! Πη8 33.Bθ6 Bζ7 34.ζ6 Pδ8 35.Pδ2 Pδ7 36.Πγ1 Pδ8 37.Bε3 Bζ8 38.Bγ3 Bβ4 39.Bxβ4 αxβ4 40.Πη1 β3 41.Pγ3 Aγ8 42.Pxβ3 Aδ7 43.Pβ4 Aε8 44.Πα1 Pγ7 45.α5 Aδ7 46.αxβ6+ Pxβ6 47.Πα6+ Pβ7 48.Pγ5 Πδ8 49.Πα2 Πγ8+ 50.Pδ6 Aε8 51.Pε7 η5 52.θxη5 1-0

_______________________

Πηγή: Deepmind Paper , AlphaZero vs. Stockfish 10 παρτίδες ,avgi.gr , chessbase.com

by Αντικλείδι , https://antikleidi.com

AlphaZero, το μέλλον είναι εδώ – Οι μηχανές αυτοδιδάσκονται

Share this:

Σχετικά Άρθρα

Δημήτρης Ψαθάς – Λευκό όραμα

Πατούντ: «ταιριαστό-κατάλληλο-δίκαιο...

1 σχόλιοΣχολιάστε