Vous êtes actuellement dans WEB-NTIC > Etudes Les Etudes concernent des articles sur les logiciels ou des concepts d’informatique tels que le décisionnel. Mise en ligne: vendredi 21 mars 2003, par km Nouvelle approche du decisionnelL’informatique décisionnelle est relancée de plus belle aujourd’hui avec l’apparition d’un nouveau concept : le Datawarehouse ou " entrepôt de données ". L’infocentre d’hier devient Datawarehouse aujourd’hui. Que se cache-t-il derrière ce changement de terminologie ? Avant tout, comme souvent, la bataille marketing fait rage à l’heure actuelle et tous les acteurs majeurs cherchent à se positionner sur ce nouveau marché car les enjeux sont importants. Le décisionnel trouve là une seconde jeunesse ou plutôt, sort de l’enfance. La difficulté pour l’utilisateur final est de comprendre les concepts, l’intérêt et ce qui se cache derrière ce brouillage marketing. Eclaircissons d’abord le concept : " Datawarehouse ", littéralement " entrepôt de données ", terme dont on attribue la paternité à W.H. Inmon, auteur de plusieurs ouvrages sur le sujet et aujourd’hui leader charismatique de Prism Solutions. Le Datawarehousing se caractérise par une approche méthodologique spécifique de l’informatique décisionnelle et surtout par un postulat de base issu d’un constat simple : les données de l’informatique de production ne se prêtent pas à une exploitation optimale dans un cadre décisionnel. C’est à dire que non seulement il est indispensable de séparer les deux mondes mais surtout, et ce qui est nouveau, il faut repenser les schémas de données en vue d’une exploitation dans un cadre d’aide à la décision. De surcroît, cette vision doit être globale, propre à l’entreprise toute entière. En fait, la problématique cachée derrière cela est l’unification des différents gisements de données de l’entreprise en un entrepôt de données global organisé pour l’aide à la décision.
Une conséquence directe, le Datawarehousing est un processus : il faut le percevoir comme mouvant et en perpétuelle évolution. " Il faut s’attendre à ce que votre Datawarehouse double de volume toutes les nuits ! " déclare Rob Armstrong, d’AT&T GIS en charge du projet Walmart. Sous cet angle, on peut finalement voir le Datawarehouse comme une architecture décisionnelle capable à la fois de gérer l’hétérogénéité et le changement et dont l’enjeu final est de " Transformer les données en informations " directement exploitables par les utilisateurs du métier concerné. L’enjeu : l’émergence d’un nouveau marché Le battage médiatique dans la presse spécialisée traduit un constat clair : ce marché intéresse tout le monde et la complexité inhérente à la mise en place d’un tel projet conduit forcément à des alliances et des accords de partenariat. Chacun annonce d’ailleurs à l’heure actuelle sa stratégie propre autour du Datawarehouse. Constructeurs, éditeurs de base de données ou d’outils et intégrateurs collaborent donc et essayent de se positionner sur ce nouveau créneau. Pour exemple, on peut citer les offres des éditeurs SGBD au centre du débat avec Oracle Warehouse, Sybase Warehouse Works, ou la stratégie Datawarehouse d’Informix. Justification marketing Ceux qui comme nous croient fermement à l’efficacité des solutions client-serveurs ne peuvent que voir d’un bon oeil l’arrivée d’un concept tel que le Datawarehousing. En effet, l’approche Datawarehouse peut être vue comme un nouveau vecteur de promotion des architectures client-serveur fondées sur les systèmes ouverts. Typiquement, la plate-forme privilégiée pour l’hébergement de la base décisionnelle fédératrice (i.e. l’entrepôt de données) est une machine parallèle dotée d’un SGBD relationnel sous Unix. De plus, les outils d’analyses des données ou d’administration du Datawarehouse fonctionnent quasiment tous en mode client-serveur. Cette approche réconcilie en quelque sorte les mondes mainframe et systèmes ouverts puisque il n’y a pas de notion de rupture dans la méthodologie proposée : les systèmes de production restent inchangés et on ne leur enlève pas d’importance, on ajoute simplement un composant décisionnel dans le système d’informations de l’entreprise. Finalement, une nouvelle voie pour le modèle client-serveur est de train de se créer et la vague Datawarehouse pourrait bien contribuer au raz de marée annoncé du modèle client-serveur. Ainsi, selon le Gartner Group, le marché du Datawarehouse devrait atteindre 6,9 milliards de dollards US en 1999. Une étude d’un autre organisme, le Meta-Group, confirme cette tendance en indiquant que plus de 90 % des services informatiques envisageraient de mettre en place un Datawarehouse dans les trois ans à venir ! (Echantillon de 2000 entreprises américaines référencées dans American Fortune) Justification technique Le Datawarehouse, pourquoi maintenant ? Aussi pour des raisons technologiques. En effet, cette approche a aujourd’hui les moyens techniques de se concrétiser. Une convergence d’innovations technologiques permet maintenant d’envisager la mise en oeuvre de tels projets. Pêle-mêle, on peut citer les progrès dans les domaines suivants :
Le problème induit par le concept de Datawarehouse est la gestion d’énormes volumes de données (des centaines de Gigaoctets, l’ambition étant de démocratiser rapidement le milliard d’octets ou Teraoctet), donc pour l’utilisateur la nécessité d’avoir à sa disposition une formidable puissance de calcul pour pouvoir exprimer ses requêtes sur ses volumes de données et des outils appropriés. Dans ce contexte, les machines massivement parallèles, jusqu’alors confinées dans le monde du calcul scientifique, trouvent là une opportunité supplémentaire d’entrer dans le monde de la gestion en proposant la puissance de calcul demandée. Un tel système appliqué à l’aide à la décision doit offrir la capacité de répondre, dans des délais raisonnables, à des requêtes complexes auparavant insolubles. Toutefois, il faut pouvoir utiliser au mieux une machine multi-processeurs, donc adapter les logiciels à cet environnement parallèle. L’application centrale dans ce type de projet est évidemment la base de données : on constate que tous les principaux éditeurs de bases de données relationnelles proposent des versions parallélisées de leur moteur. Ainsi, on peut citer Informix OnLine Dynamic Server XPS (pour machines massivement parallèles), Oracle Parallel Server, Sybase System 11 et enfin IBM DB2/Parallel Edition. Justification économique La dernière et certainement la plus importante des raisons du succès futur des Datawarehouses est l’avantage concurrentiel réel apporté par ce type de système et les bénéfices directs perçus par l’utilisateur. L’entreprise actuelle croule sous les données. Cette surabondance (certains parlent de déluges) a comme conséquence directe un rejet par saturation. Pourtant ces données représentent une mine d’informations. Le problème est de mettre en place les moyens permettant d’une part de comprendre la valeurs de ces informations et d’autre part d’y accéder de manière efficace pour prendre les meilleures décisions.
Le Datawarehouse vise à fédérer cette connaissance. L’ambition avouée : proposer un outil décisionnel s’appuyant sur les informations pertinentes pour l’entreprise, c’est à dire centrées sur le métier de l’utilisateur. Ainsi, ce type d’outil va permettre d’anticiper et dans l’idéal de prévoir les évolutions de son marché à partir des données historiques accumulées : En d’autres termes, être plus réactif, pour être plus compétitif et plus efficace ! La justification financière n’est pas toujours évidente au départ, lorsqu’on souhaite lancer un projet de ce type. Pour chiffrer le retour sur investissement, un dès moyen possible peut être de chiffrer les coûts engendrés par les limitations du système actuel. La société américaine Ertl, fabricante de jouets, (220 M$ de CA) a justifier ainsi son besoin de mise en oeuvre d’un Datawarehouse par le chiffre édifiant suivant : supprimer les 18 000 heures par an, passées à créer des rapports et éditions à la main ! Aujourd’hui, Ertl ne regrette pas sa décision et est arrivée à ses fins. En fait, l’ambition avouée par tous est de créer un nouveau type d’applications décisionnelles destinées à devenir un outil de pilotage et d’analyse central pour l’entreprise. En d’autres termes, devenir un facteur critique de succès et par suite se rendre indispensable, ce que les anglo-saxons traduisent souvent par " business critical ". Le secteur de la grande distribution aux Etats-Unis fournit un certain nombre d’exemples à ce propos. Ainsi, les premiers projets mis en place ont permis par exemple d’analyser le comportement de la clientèle en fonction de différents critères (la période, les offres promotionnelles, les emplacements dans les rayonnages...). Des succès célèbres comme Walmart ou Mervyn’s (500 Go), gros distributeurs américains, ont contribué au lancement du concept de Datawarehousing. Carol Pecoraro, directeur du projet chez Mervyn’s, déclare " Nous passons aujourd’hui seulement 10% de notre temps à rassembler les données et 90 % à les utiliser, contrairement au passé ! ". Le problème avec de tels systèmes est souvent d’évaluer a priori le potentiel informationnel qu’il contient : pour cette raison, B. Inmon conseille une démarche itérative de mise en oeuvre avec une première phase de constitution rapide autour d’un premier sujet donné. Ainsi, les utilisateurs appréhendent directement les apports d’un tel outil et surtout, donnent leur sentiment sur la pertinence des données mises à leur disposition. De cette manière, la conception peut être corrigée et enrichie par les remarques des utilisateurs. Dans son ouvrage, Bill Inmon décrit cette approche par cette formule intéressante : " Donnez moi ce que je veux, je vous dirait alors ce que je voulais vraiment ! " Mise en oeuvre d’un DataWarehouse Notre but n’est pas de décrire en détail une méthodologie complète, ni un cahier des charges de réalisation exhaustif mais plutôt de donner un aperçu de la complexité cachée derrière toute problématique de Datawarehousing. Nous essaierons en fait de sensibiliser le lecteur à l’approche de mise en oeuvre d’un tel projet.
L’environnement de développement décisionnel universel n’existant pas encore, on assiste à une myriade d’offres sur le marché, répondant chacune à une partie du puzzle Datawarehouse. Par conséquent, créer une base décisionnelle nécessite forcément un travail d’intégration et d’assemblage de technologies souvent diverses. Afin de fixer les idées, voici par exemple, un aperçu des principales classes d’outils susceptibles de trouver une place dans un contexte de Datawarehousing :
Enfin, la mise en place d’un projet de ce type a souvent des effets de bord sur les systèmes opérationnels. Plus exactement, le travail effectué sur la qualité des données lors de la conception du Datawarehouse, permet de mettre en lumière les anomalies des systèmes de production. A partir de ce moment, la décision d’engager des actions correctives dans les systèmes transactionnels peut être envisagée sur la base des travaux réalisés pour le Datawarehouse. Rob Mattison, considéré comme le père du concept de Data Mining , désigne cette possibilité par le terme backflush. Les écueils à éviter Le lancement d’un projet de Datawarehousing est une entreprise d’envergure et comme tout projet d’envergure, il convient de bien être conscient des principaux dangers inhérents à ce genre d’aventure :
Répondre à cet article et Acceder au Forum Nouvelle approche du decisionnel
|
Plan Web Ntic | Espace rédacteurs | Résumé | XML
Copyright © 2008 Web-ntic MOE MOA - Tous droits réservés. Responsable éditorial : km |