Σε ένα σερί προκλήσεων κλήθηκαν να ανταποκριθούν τα μοντέλα Τεχνητής Νοημοσύνης της ΟpenAI και της Google και ιδού το αποτέλεσμα.
Η OpenAI και η Google παρουσίασαν πρόσφατα τα πιο ισχυρά τους μοντέλα: το GPT-5 και το Gemini 2.5 Pro.
Και τα δύο διαθέτουν προηγμένες δυνατότητες λογικής, δημιουργίας κειμένου, κώδικα και πολυτροπικών λειτουργιών, επισημαίνει ο τεχνολογικός ιστότοπος Τom'sGuide.
Για να διαπιστωθεί ποιο μοντέλο ΑΙ αποδίδει καλύτερα, δοκιμάστηκαν σε 10 προκλήσεις που κάλυπταν από δημιουργική γραφή μέχρι ρεαλιστικό προγραμματισμό εβδομαδιαίου φαγητού με συγκεκριμένους περιορισμούς.
10 προκλήσεις για τα μοντέλα Τεχνητής Νοημοσύνης
1. Λογική αλυσίδας σκέψης
Σε σενάριο διοργάνωσης πάρτι για κάποιον που μισεί τις εκπλήξεις, το GPT-5 πρότεινε έξυπνη προσέγγιση που απέφυγε κάθε στρεσογόνο στοιχείο. Το Gemini φάνηκε πιο πατροναριστικό. Νικητής: GPT-5.
2. Δημιουργική γραφή
Το GPT-5 έστησε σε πέντε γραμμές ένα ολοκληρωμένο δυστοπικό σκηνικό με δυνατό τέλος, ενώ το Gemini έδωσε ασαφή και υπερβολικά περιγραφική εισαγωγή. Νικητής: GPT-5.
3. Κωδικοποίηση
Το GPT-5 παρήγαγε πλήρη HTML/CSS σε ένα αρχείο, με σαφείς εξηγήσεις για αρχάριους. Το Gemini βασίστηκε σε Tailwind CSS, δυσκολεύοντας τη χρήση. Νικητής: GPT-5.
4. Περίληψη
Στην περίληψη του Atomic Habits σε τρεις μορφές (X post, ομιλία, παραμύθι), το GPT-5 προσαρμόστηκε άψογα σε κάθε ύφος, ενώ το Gemini έμεινε πιο άκαμπτο. Νικητής: GPT-5.
5. Μνήμη και εξατομίκευση
Ζητήθηκε ημερήσιο πρόγραμμα για συγγραφέα με ΔΕΠΥ και αγάπη για sci-fi. Το GPT-5 παρέδωσε στοχευμένες, εφαρμόσιμες συμβουλές. Το Gemini έδωσε περίπλοκη απάντηση. Νικητής: GPT-5.
6. Πρακτική χρησιμότητα
Με 100 δολάρια για οικογένεια 5 ατόμων, χωρίς γαλακτοκομικά και γλουτένη και χωρίς διάθεση για μαγείρεμα, το GPT-5 έδωσε πλήρες μενού χωρίς μαγείρεμα. Το Gemini παρέβλεψε τον περιορισμό. Νικητής: GPT-5.
7. Επεξήγηση για ανθρώπους 5, 15 και 50 ετών
Το GPT-5 εξήγησε την κβαντική διεμπλοκή με απλές και ευφάνταστες αναλογίες για κάθε ηλικία. Το Gemini ήταν τεχνικά ακριβές αλλά όχι αρκετά προσαρμοσμένο. Νικητής: GPT-5.
8. Δεξιότητες debate
Στην αντιπαράθεση «ανανάς στην πίτσα», το GPT-5 χρησιμοποίησε ζωντανές μεταφορές και χιούμορ. Το Gemini έμεινε πιο ακαδημαϊκό. Νικητής: GPT-5.
9. Πολυτροπικότητα
Το GPT-5 παρήγαγε άμεσα δύο ρεαλιστικές εικόνες δωματίου πριν και μετά την τακτοποίηση. Το Gemini δημιούργησε μόνο μία εικόνα και χρειάστηκε νέα πρόκληση για να ολοκληρώσει. Νικητής: GPT-5.
10. Χιούμορ
Σε αστεία και «ατάκες» για την AI, το GPT-5 έδειξε σταθερά πνευματώδες και σχετικό ύφος. Το Gemini ήταν άνισο και πιο τεχνικό. Νικητής: GPT-5.
Η δοκιμή έδειξε ότι το Gemini 2.5 Pro είναι δυνατό στην τεχνική ακρίβεια και την αξιοποίηση του οικοσυστήματος της Google. Όμως το GPT-5 υπερέχει στην κατανόηση του ύφους, στη δημιουργικότητα και στην ικανότητα να προσαρμόζεται απόλυτα στις ανάγκες του χρήστη, σύμφωνα με το δημοσίευμα.