Nous utilisons des cookies pour améliorer votre expérience sur notre site. En utilisant notre site, vous consentez à l&#39utilisation de cookies.

image post
Tech · innovation

OpenAI lance Operator, son agent IA capable d'exécuter des tâches sur le web

OpenAI a récemment introduit Operator, un agent IA conçu pour exécuter des tâches web de manière autonome, marquant une étape significative dans l'évolution des assistants numériques.

Operator, l'agent IA d'OpenAI, est désormais en phase de prévisualisation de recherche et est actuellement disponible pour les abonnés Pro aux États-Unis. Cet agent utilise un modèle appelé Computer-Using Agent (CUA) qui combine la vision par ordinateur et l'apprentissage par renforcement pour naviguer et interagir avec le web comme le ferait un humain. Comme le montre très bien Shubham Sharma dans sa vidéo ci-dessus.

Les tâches que peut accomplir Operator incluent remplir des formulaires, faire des réservations dans un restaurant, et même planifier des vacances. L'agent a été conçu pour maintenir l'utilisateur au contrôle, s'arrêtant lorsqu'il rencontre des obstacles comme les CAPTCHA ou les champs de saisie de mot de passe, et demandant une intervention humaine. Malgré ses capacités, Operator est encore limité dans la gestion de tâches complexes et ne peut pas encore gérer des transactions financières ou interagir avec des interfaces web non standard.

Bon départ, mais encore quelques progrès à faire

Pour peaufiner Operator, OpenAI a collaboré avec plusieurs entreprises, dont DoorDash et Uber, afin d'adapter l'agent aux besoins réels des utilisateurs. Ces partenariats visent à simplifier l'accès aux services en ligne et à améliorer l'efficacité des tâches quotidiennes via l'automatisation. OpenAI a également mis en place des garde-fous robustes pour assurer la sécurité et la conformité de l'agent, incluant la formation de CUA pour refuser les demandes toxiques ou illégales et bloquer l'accès à des sites sensibles.

En termes de performance, Operator a surpassé les modèles concurrents dans des benchmarks spécifiques, bien qu'il reste encore derrière les performances humaines. OpenAI continue de recueillir des retours d'utilisateurs pour améliorer les capacités de l'agent. À terme, l'entreprise prévoit d'étendre l'accès à Operator à d'autres abonnements payants et d'intégrer ses fonctionnalités directement dans ChatGPT, tout en s'assurant de sa sécurité et de sa facilité d'utilisation à grande échelle.

Sources

Partagez cet article