AI & ML Engineering

The Intrinsic Limitations of Large Language Models: Understanding Hallucinations and Their Impact on Data Workflows

A propos du talk

Les modèles de langage large (LLMs) ont révolutionné le traitement du langage naturel et ouvert de nouvelles perspectives dans les applications de données. Cependant, ils ne sont pas sans limitations.

Cette présentation explorera les principales contraintes des LLMs, en se concentrant sur le phénomène des hallucinations—des cas où les modèles génèrent des informations incorrectes ou absurdes. Contrairement à la perception commune, ces hallucinations ne sont pas de simples bugs, mais une caractéristique inhérente à la manière dont les LLMs sont conçus et entraînés : en d'autres termes, les hallucinations ne disparaîtront jamais des LLMs, même dans 10 ans. De plus, les hallucinations sont, par conception des LLMs, très convaincantes et parfois difficiles à détecter ! Nous explorerons les raisons sous-jacentes de ces limitations, enracinées dans la nature probabiliste et auto-régressive des LLMs.

Comprendre pourquoi les hallucinations se produisent est crucial pour reconnaître qu'elles ne peuvent pas être complètement éliminées. Elles doivent plutôt être gérées efficacement, notamment lors de l'intégration des LLMs dans les pipelines de données. La présentation abordera les implications concrètes des limitations des LLMs pour les Data engineers, les Data analysts et les utilisateurs business.

Nous examinerons des scénarios où les hallucinations peuvent conduire à une mauvaise interprétation des données, à une analyse défectueuse et à des décisions business erronées.

En outre, des stratégies pratiques pour atténuer l'impact de ces limitations seront discutées, y compris le model fine-tuning, l'intégration d'approches human-in-the-loop, et l'utilisation de technologies complémentaires pour améliorer la fiabilité.

Devenez sponsor

bronze partner

2 invitations
Votre logo sur notre site, page Linkedin et les vidéos en replay
Likes et partages de vos propres posts

silver partner

4 invitations
Votre logo sur notre site, page Linkedin et les vidéos en replay
Short Youtube sous-forme de remerciement
Likes et partages de vos propres posts

gold partner

6 Invitations
Votre logo sur notre site, page Linkedin et les vidéos en replay
Short Youtube sous-forme de remerciement
Temps de parole sur la scène principale (5mn) ou table ronde (45mn) dans un de nos espaces dédiés (30 participants environ)
Liste des partcipants (conformité RGPD)
sponsoring