Créativité Computationnelle

Le système que nous développons intègre un ensemble limité de fonctions pédagogiques, ce qui restreint ses performances globales. Les développements futurs pourraient introduire des formes plus variées d’interactions en classe, inspirées par les pratiques éducatives existantes, et intégrer des technologies supplémentaires pour enrichir l’expérience pédagogique.

MMLU-Pro est un nouveau benchmark d’évaluation des modèles de langage , conçu pour mesurer leurs compétences en compréhension, raisonnement et résolution de problèmes dans des contextes complexes. Il s’agit d’une version améliorée du benchmark MMLU (Massive Multitask Language Understanding) , largement utilisé pour évaluer les performances des grands modèles de langage.