Robert Vesoul (Illuin Technology) : « Avec Sharlie, on réinvente l’expérience de marque pour la génération Z »

À l’occasion du lancement par Orange France de Sharlie, assistant vocal IA dédié à Sosh, et de MAIA, outil d’assistance pour les conseillers commerciaux, Robert Vesoul, CEO d’Illuin Technology, revient pour Paroles d’élus sur le rôle de sa scale-up dans ce projet. Entre orchestration de modèles, architecture multi-agents et enjeux de souveraineté technologique, il dessine les contours d’une relation client profondément réinventée par l’intelligence artificielle.
Paroles d’élus : Pouvez-vous nous présenter Illuin Technology et votre rôle dans le projet Sharlie ?
Robert Vesoul : Je suis CEO d’Illuin Technology, une scale-up dans le domaine de l’IA. Nous proposons une plateforme conversationnelle qui s’appelle Illuin Dialogue, que nous avons implémentée dans le cadre du projet Sharlie. Cette plateforme orchestre les différents modèles d’IA et permet de concevoir des agents spécialisés pour répondre aux questions des clients. Dans le cas de Sharlie, ces agents interrogent notamment le modèle speech-to-speech d’OpenAI.
Paroles d’élus : D’où vient Illuin Technology, et quelle est votre culture d’entreprise ?
Robert Vesoul : Nous sommes aujourd’hui environ 150 ingénieurs. Nous sommes nés dans le berceau de l’université Paris-Saclay, avec une culture très tech et des profils très pointus dans le domaine de l’IA. Très vite, nous avons constaté que pour mettre à l’échelle de grands projets d’IA, il fallait des composants d’orchestration permettant aux grandes entreprises de choisir leurs modèles en fonction des évolutions technologiques. Concrètement, si demain Mistral ou Nvidia propose un modèle deux fois plus performant et trois fois moins cher, Orange doit pouvoir en tirer parti sans repartir de zéro. C’est précisément ce que notre approche d’orchestration rend possible.
Paroles d’élus : Pourquoi la marque Sosh était-elle particulièrement adaptée à ce type d’innovation ?
Robert Vesoul : La marque Sosh s’adresse à un public jeune, avide de nouvelles expériences. Il y avait donc un vrai défi pour Sosh : proposer une expérience différenciante, qui modernise la façon d’interagir. On observe d’ailleurs que les jeunes générations se sont réconciliées avec la voix : avec leur mobile, elles parlent naturellement, elles interagissent. Ainsi, il y avait une volonté initiale forte de créer une expérience suffisamment différenciante pour que la marque Sosh soit aussi reconnue sur son volet expérience client. La génération Z est totalement native aux outils génératifs, elle les utilise au quotidien. Elle va donc se trouver face à une expérience de marque d’une qualité inédite.
Paroles d’élus : Comment fonctionne concrètement l’architecture multi-agents que vous avez mise en place ?
Robert Vesoul : C’est un peu comme quand vous entrez dans une boutique : un agent d’accueil vous reçoit, puis vous oriente vers un technicien ou un conseiller spécialisé selon votre besoin. Dans notre système multi-agents, c’est la même logique. L’agent d’accueil, peu gourmand en ressources, réalise simplement du dispatching. Ensuite, un agent spécialisé — par exemple en facturation — prend le relais. Il est connecté au système d’information, capable d’analyser votre facture et de tenir une conversation avancée. Si vous souhaitez ensuite souscrire à une nouvelle option, il passe la main à un autre agent. Ainsi, on fait varier le niveau d’intelligence, et donc les coûts énergétiques, en fonction de la complexité réelle de chaque étape.
Paroles d’élus : Sharlie traite directement la voix sans passer par le texte. Qu’est-ce que cela change concrètement ?
Robert Vesoul : C’est là une rupture fondamentale. Habituellement, un agent vocal transcrit d’abord la voix en texte, puis retranscrit la réponse en parole. Nous, nous ne sommes pas du tout dans ce paradigme. Nous travaillons directement avec des bouts d’audio en entrée et en sortie. Dès lors, le modèle a accès non seulement au contenu des mots, mais aussi à tout ce qui relève du registre émotionnel et de l’intonation. Si un client est en colère, le modèle le perçoit directement et s’adapte. À l’inverse, si quelqu’un appelle avec enthousiasme pour une offre de roaming, la tonalité de la réponse sera différente. Ces modèles sont conçus pour désescalader les tensions et remettre de la rationalité dans la conversation.
Paroles d’élus : Comment garantissez-vous que l’IA reste dans les clous des règles de gestion d’Orange, notamment face à des clients insistants ?
Robert Vesoul : C’est une question essentielle. Dans le paramétrage et le design de la solution, on intègre des garde-fous précis. Par exemple, Sharlie ne peut pas accorder une remise à un client simplement parce qu’il se montre mécontent ou insistant. L’IA peut tout au plus signaler qu’elle demande l’autorisation de rembourser, exactement comme un conseiller humain au téléphone. Par ailleurs, nous avons déployé un autre produit d’ILLUIN qui s’appelle Nolize : c’est la tour de contrôle permanente de toutes les conversations. Toutes les interactions sont analysées, les dysfonctionnements potentiels sont détectés afin d’améliorer continuellement le système. C’est absolument essentiel dans le monitoring de la relation client.





