Web-ntic MOE MOA

Du concept au projet informatique - De la maîtrise d’oeuvre à la maîtrise d’ouvrage

Web-ntic > Dictionnaires et glossaires > Répartition et réplication

Répartition et réplication

vendredi 21 mars 2003, par km

TermeDéfinition
Appartenance Fait qu’un site possède la faculté (le droit) de mettre à jour une donnée. Les différents modes d’appartenance définis dans un système répliqué sont les suivants : Appartenance dynamique Appartenance fixe Appartenance partagée
Appartenance dynamique Se dit d’un système où la donnée est mise à jour par un site à la fois mais ce site varie dans le temps.Par exemple, une commande est mise à jour sur des sites différents selon son état : saisie, préparée, livrée...
Appartenance fixe Se dit d’un système où la donnée n’est mise à jour que par un seul site.Exemple : mise à jour des tables de référence au siège pour diffusion en lecture sur les agences.
Appartenance partagée Se dit d’un système où la donnée peut être mise à jour par plusieurs sites en même temps. Il existe alors un risque de conflit (ou collision).
Asynchronisme Caractère du mécanisme de transmission d’information entre deux sites respectant une étape de temporisation entre le traitement effectué sur le premier site et le transfert d’informations sur le deuxième site. Cette étape de temporisation se réalise généralement par un stockage en file d’attente qui permet de ne pas être dépendant des pannes de liaison ou de machines.
Cascade Architecture d’un système répliqué autorisant la copie à se propager par étapes sur plus de deux sites.
Champ Croisement ligne/colonne d’une table relationnelle.
Collision Phénomène d’interaction détecté sur le site local en conséquence d’une tentative de réplication de données externes. Ce problème survient dans les systèmes dits à appartenance partagée lorsque deux sites modifient la même donnée au même moment. Les mises à jour ne peuvent être répliquées sans danger que si elles portent sur les mêmes données de départ (mêmes images avant). Ce n’est pas le cas lorsque deux sites modifient la version de donnée locale puis réplique la mise à jour.Une fois détectée, la collision doit être résolue pour garder les données cohérentes sur tous les sites. Il existe certaines méthodes de résolution standard mais aucune n’est totalement satisfaisante.
Conflit Voir collision.
Donnée Terme générique désignant l’information stockée dans une base de données.
DRDA (Distributed Relational Data Architecture) Architecture permettant d’établir un dialogue entre des SGBD sur des environnements différents. Elle est constituée de deux parties : le client DRDA situé sur le poste émetteur d’une requête et le serveur DRDA situé sur le poste qui prend en charge la requête. Elle est publiée sous la forme de deux versions :·La version 1 de DRDA met en oeuvre l’unité d’oeuvre à distance (une transaction ne s’adresse qu’à un SGBD),·La version 2 met en oeuvre l’unité d’oeuvre distribuée (une transaction peut agir sur plusieurs SGBD),Pour l’instant seules certains SGBD IBM implémentent complétement cette architecture. Certains éditeurs commencent à la proposer.
Hétérogénéité Caractère d’un système global intégrant plusieurs types de machines ou de SGBD. Dans un monde parfait, le système hétérogène, très souvent distribué, doit être transparent pour l’utilisateur afin d’intégrer automatiquement les systèmes existants d’une entreprise. Cela n’est pas le cas pour les produits de réplication du marché.
Granule Taille minimale d’informations pouvant être répliquée. Dépend des produits. Généralement un champ (croisement ligne/colonne d’une table).
Image avant Valeur d’un champ d’une table avant une modification ; l’image après d’un champ étant sa valeur après la modification.
Intégrité Ensemble de contraintes appliquées aux mises à jour d’une base de donnée permettant de garantir la cohérence des données. Ces contraintes peuvent être des listes de valeurs à respecter (non-nullité et intégrité de domaine) ou bien des liens entre des tables (intégrité référentielle).Par exemple, une commande doit forcément référencer un client : le numéro de client inséré dans une ligne de la table commande doit exister dans la table client.
Maître Voir Primaire
MIB Management Information Base Base de stockage des descriptions d’objets administrés par le protocole SNMP. Il existe des MIB standards définies en commun par plusieurs éditeurs et des MIB privées.Par exemple, les informations sur la couche TCP sont composées entre autre des objets suivants : maximum de connexions, table des connexions actives, compteurs de trafic et d’erreurs....
Partitionnement Séparation de l’information pour une transmission plus adaptée aux besoins. Le partitionnement d’une table peut être vertical (une partie des colonnes) ou horizontal (une partie des lignes) ou un mixage des deux techniques. Le partitionnement des tables sources permet de ne transférer aux sites cibles que l’information nécessaire.
Périodicité Intervalle de temps entre deux copies d’une même donnée sur le site local.
Primaire Utilisé dans un modèle à appartenance fixe ou dynamique. Se dit d’une table sur laquelle portent les mises à jour et donc à partir de laquelle les données vont être répliquées. Se dit également du site contenant la table.
Secondaire Utilisé dans un modèle à appartenance fixe ou dynamique. Se dit d’une table sur laquelle porte la réplication (la copie). Se dit également du site contenant la table.
Site Terme désignant la localisation source ou cible d’une réplication. Un site désigne une base de données particulière du système global, c’est-à-dire une association machine-serveur-database.
Site de secours Désigne un site pouvant suppléer à un autre site en cas de défaillance de ce dernier. Ils doivent être semblables sur bien des points : mêmes données dans les mêmes versions, mêmes droits, même sécurité, mêmes services, mêmes contraintes, même dimensionnement. Le site de secours doit être capable à tout moment de prendre la relève du site de départ et de supporter les mêmes accès.Maintenir un site de secours, cela signifie bien souvent posséder une deuxième machine et dupliquer les données par un dispositif matériel (disques miroirs, architecture en cluster ) ou logiciel (réplication) moins performant.
SNMP Simple Network Management Protocol Protocole de communication d’information d’administration standardisé en 1990 par l’IAB (Internet Activities Board) qui est l’organisme responsable de la définition des standards relatifs à l’architecture de réseaux TCP/IP.
Synchronisme Caractère du mécanisme de transmission d’information entre deux sites effectuant le traitement sur le premier site, le transfert d’informations sur le deuxième site et l’application du traitement sur ce deuxième site comme une seule opération unitaire. L’opération se réalise entièrement ou pas du tout. Elle est donc irréalisable si un des deux sites est en panne. Le synchronisme assure que les données répliquées ont toutes la même valeur au même moment sur tous les sites.
Système distribué Se dit d’un système d’information composé de plusieurs machines serveurs stockant chacune une partie unique des données de l’entreprise.
Système réparti Voir Système distribué. Dans ce document, aucune distinction n’est faite entre les deux systèmes. Il n’existe qu’un seul terme anglais pour définir ce type de système : distributed.
Système répliqué Se dit d’un système d’information composé de plusieurs bases de données stockant des données de l’entreprise dont au moins une partie est dupliquée sur au moins deux bases.
Timestamp Indicateur de mise à jour. Un timestamp est associé à une donnée. Il est constitué de la date et de l’heure précise de la dernière modification de la donnée. Dans un modèle répliqué, les timestamps sont utilisés pour comparer les versions de données provenant de différentes machines et ainsi en isoler la plus récente. Il y a alors nécessité de gérer une horloge universelle commune à toutes les machines du système.
Transaction Ensemble de requêtes (au moins une), appliqué sur la base de données et respectant les propriétés ACID listées ci-dessous, garantissant la constante cohérence des données. Les propriétés ACID sont : Atomicité,Une transaction est une unité de cohérence de la base de données. Elle doit effectuer toutes ses mises à jour ou ne rien faire du tout. Ainsi en cas d’interruption, une transaction doit annuler toutes les modifications qu’elle a commencé à engager. Cohérence,La transaction doit faire passer la base de donnée d’un état cohérent à un autre état cohérent. En cas d’interruption, il lui incombe de restaurer l’état cohérent initial. Isolation,Les résultats d’une transaction ne sont visibles aux autres transactions qu’une fois la transaction terminée. Il n’y a pas d’interférence avec les autres transactions (principe de sérialisation). Durabilité,Dès qu’une transaction engage des modifications, le système garantit que ces modifications seront protégées contre toute défaillance du système.Dans un système répliqué, pour garantir la cohérence sur chaque site et entre chaque site, l’information doit circuler sous la même forme et dans le même ordre que sur le site source. En clair, il faut copier des transactions dans l’ordre d’exécution choisi sur le site source.
Tuple Ligne d’une table relationnelle.
Unité de réplication Désigne l’ objet que le produit fournit au site cible en totalité. En cas de panne, l’ objet n’est pas du tout copié sur le site cible. L’unité de réplication varie selon les produits étudiés, il s’agit soit de la table cible, soit de la transaction d’origine.
Validation à deux phases Protocole de validation d’une transaction distribuée, agissant sur plusieurs sites. Ce protocole, coûteux en termes d’échanges de messages et sensible aux pannes, est le seul à garantir que l’exécution des mises à jour distribuées a lieu en totalité partout ou nulle part.
Workflow Gestion des flux d’information.Application de routage de l’information dont la circulation est basée sur des circuits programmés dans lesquels sont définis les destinataires, les actions à entreprendre, les délais et les conditions de cheminement.