From Monolith to Mesh: How to Model Data in the Age of Data Products and AI Agents
A propos du talk
Les produits de données visent à rendre les données facilement accessibles et réutilisables par leurs consommateurs. Pour cette raison, la modélisation des données n'est pas un simple détail d'implémentation, mais un aspect central de la conception produit. Alors que le schema-on-read a déprioritisé la modélisation ces dernières années, l'essor des architectures centrées sur les produits de données et les Agents IA la remet au premier plan. Les techniques établies comme la modélisation dimensionnelle, le data vault, et le unified star schema offrent des fondations utiles, mais la plupart ont été construites pour des systèmes centralisés. Dans cette présentation, nous explorerons comment adapter ces techniques aux architectures distribuées et modulaires pour créer des produits de données prêts pour l'IA qui sont faciles à utiliser, réutiliser et composer. Cette présentation vise à être une synthèse du Chapitre 10 du livre "Managing Data as a Product", qui est dédié à la modélisation des données dans des environnements distribués. Nous couvrirons la modélisation physique distribuée, la modélisation dimensionnelle centralisée et distribuée, la modélisation data vault, la modélisation unified star schema, et la gestion du cycle de vie du modèle physique.