Créer et supprimer les groupes de tables

Principes de configuration des groupes de tables

Configurer un groupe de tables consiste à :

définir les caractéristiques du groupe de tables,
définir les tables et les séquences à assigner au groupe de tables,
optionnellement, définir quelques propriétés spécifiques à chaque table.

Le groupe de tables

Un groupe de tables est identifié par son nom. Le nom doit donc être unique pour la base de données concernée. Un nom de groupe de tables doit contenir au moins un caractère. Il peut contenir des espaces et/ou des caractères de ponctuation. Mais il est recommandé d’éviter les caractères virgule, guillemet simple ou double.

Il faut également spécifier à sa création si le groupe de tables est de type ROLLBACKABLE ou AUDIT_ONLY. Notons que cette caractéristique du groupe de tables ne peut être modifiée après la création du groupe. Pour la changer, il faut supprimer puis recréer le groupe de tables.

Les tables et séquences à assigner

Un groupe de tables peut contenir des tables et/ou des séquences d’un ou plusieurs schémas.

Toutes les tables d’un schéma n’appartiennent pas nécessairement au même groupe. Certaines peuvent appartenir à des groupes différents. D’autres peuvent n’être affectées à aucun groupe.

Mais à un instant donné, une table ou une séquence ne peut être affectée qu’à au plus un seul groupe de tables.

Prudence

Pour garantir l’intégrité des tables gérées par E-Maj, il est fondamental de porter une attention particulière à cette phase de définition des groupes de tables. Si une table était manquante, son contenu se trouverait bien sûr désynchronisé après une opération de rollback E-Maj sur le groupe de tables auquel elle aurait dû appartenir. En particulier, lors de la création ou de la suppression de tables applicatives, il est important de tenir à jour la configuration des groupes de tables.

Toute table appartenant à un groupe de tables non créé en mode AUDIT_ONLY doit posséder une clé primaire explicite (clause PRIMARY KEY des CREATE TABLE ou ALTER TABLE).

E-Maj gère les partitions élémentaires de tables partitionnées créées avec le DDL déclaratif. Toutes les partitions d’une même table partitionnée n’ont pas nécessairement besoin d’être couvertes par E-Maj. Des partitions d’une même table partitionnée peuvent être affectées à des groupes de tables différents.

De par leur nature, les tables temporaires (TEMPORARY TABLE) ne peuvent être supportées par E-Maj. Les tables de type UNLOGGED ne peuvent appartenir qu’à un groupe de tables de type AUDIT_ONLY.

Si une séquence est associée à une table applicative, il est recommandé de l’assigner au même groupe que sa table. Ainsi, lors d’une opération de rollback E-Maj, elle sera remise dans l’état où elle se trouvait lors de la pose de la marque servant de référence au rollback. Dans le cas contraire, l’opération de Rollback E-Maj provoquera simplement un trou dans la suite de valeurs de la séquence.

Les tables de log E-Maj et leur séquence NE doivent PAS être référencées dans un groupe de tables.

Propriétés spécifiques aux tables

Il existe 4 propriétés spécifiques aux tables affectées à un groupe de tables :

le niveau de priorité,
le tablespace pour les données des tables de log,
le tablespace pour les index des tables de log,
la liste des triggers dont l’état (ENABLED/DISABLED) doit rester inchangé lors des opérations de rollback E-Maj.

Le niveau de priorité est un entier (INTEGER). Par défaut, il prend la valeur NULL, Il correspond à l’ordre dans lequel les tables seront traitées par les principales fonctions d’E-Maj. Ceci peut-être en particulier utile pour faciliter la pose des verrous. En effet, en posant les verrous sur les tables dans le même ordre que les accès applicatifs typiques, on peut limiter le risque de deadlock. Les fonctions E-Maj traitent les tables dans l’ordre croissant de priorité, les valeurs NULL étant traitées en dernier. Pour un même niveau de priorité, les tables sont traitées dans l’ordre alphabétique de nom de schéma puis de nom de table.

Pour optimiser les performances des installations E-Maj comportant un très grand nombre de tables, il peut s’avérer intéressant de répartir les tables de log et leur index dans plusieurs tablespaces. Deux propriétés sont disponibles pour spécifier :

un nom de tablespace à utiliser pour la table de log d’une table applicative,
un nom de tablespace à utiliser pour l”index de la table de log.

Par défaut, ces propriétés prennent la valeur NULL, indiquant l’utilisation du tablespace par défaut de la session courante.

Lors du rollback E-Maj d’un groupe de tables, les triggers actifs (ENABLED) de chacune des tables concernées sont neutralisés pour qu’ils ne soient pas déclenchés par les changements apportés au contenu des tables. Mais, en cas de besoin, ce comportement par défaut peut être modifié. Notez que ceci ne concerne pas les triggers E-Maj ou système.

Créer des groupes de tables

Pour créer un groupe de tables, il exécuter la requête SQL suivante :

SELECT emaj.emaj_create_group(p_group, p_isRollbackable, p_comment);

Paramètres en entrée

p_group (TEXT) : Nom du groupe de tables à créer.
p_isRollbackable (BOOLEAN, optionnel) :
- TRUE (par défaut) : Le groupe est de type ROLLBACKABLE.
- FALSE : Le groupe est de type AUDIT_ONLY.
p_comment (TEXT, optionnel) : Commentaire décrivant le groupe. S’il n’est pas fourni ou s’il est valorisé à NULL, aucun commentaire n’est enregistré.

Données retournées

La fonction retourne le nombre de groupes créés, c’est à dire 1.

Notes

Le commentaire décrivant le groupe de tables peut être modifié ou supprimé ultérieurement avec la fonction emaj_comment_group().

Pour insérer la création d’un groupe de tables dans un script idempotent, il est possible de conditionner cette création à sa non existence préalable, en utilisant la fonction emaj_does_exist_group() dans une clause WHERE.

Assigner des tables à un groupe de tables

Trois fonctions permettent d’ajouter des tables à un groupe de tables.

Pour ajouter une seule table à un groupe de tables :

SELECT emaj.emaj_assign_table(p_schema, p_table, p_group, p_properties, p_mark);

Pour ajouter plusieurs tables d’un même schéma à un groupe de tables :

SELECT emaj.emaj_assign_tables(p_schema, p_tables, p_group, p_properties, p_mark);

ou

SELECT emaj.emaj_assign_tables(p_schema, p_tablesIncludeFilter, p_tablesExludeFilter,
                          p_group, p_properties, p_mark);

Paramètres en entrée

p_schema (TEXT) : Schéma contenant la/les table(s) à assigner.
p_table (TEXT) : Nom de la table à assigner.
p_tables (TEXT[]) : Tableau des noms de table à assigner.
p_tablesIncludeFilter (TEXT) : Expression rationnelle pour sélectionner les tables.
p_tablesExludeFilter (TEXT) : Expression rationnelle pour exclure les tables.
p_group (TEXT) : Nom du groupe de tables cible.
p_properties (JSONB, optionnel) : Propriétés des tables (voir le détail ci-dessous).
p_mark (TEXT, optionnel) : Marque posée si le groupe de tables cible est en état LOGGING. Il peut contenir un caractère % représentant l’heure courante au format hh.mm.ss.mmmm. Si le paramètre n’est pas fourni ou a une valeur non NULL ou vide, un nom de marque est généré : ASSIGN_%.

Données retournées

Les fonctions retournent le nombre de tables ajoutées au groupe de tables.

Notes

Pour les fonctions traitant plusieurs tables en une seule opération, la liste des tables à traiter est soit fournie par un paramètre de type tableau de TEXT, soit construite à partir de deux expressions rationnelles fournies en paramètres.

Un tableau de TEXT est typiquement exprimé avec une syntaxe du type :

ARRAY['élément1', 'élément2', ...]

Les deux expressions rationnelles suivent la syntaxe POSIX (se référer à la documentation PostgreSQL pour plus de détails). La première définit un filtre de sélection des tables dans le schéma, La seconde définit un filtre d’exclusion appliqué sur les tables sélectionnées. Un filtre d’inclusion valorisé à NULL ou à une chaîne vide ne sélectionne aucun élément. Un filtre d’exclusion valorisé à NULL ou à une chaîne vide n’exclut aucun élément. Quelques exemples de filtres.

Pour sélectionner toutes les tables du schéma mon_schema:

'mon_schema', '.*', ''

Pour sélectionner toutes les tables de ce schéma, et dont le nom commence par tbl:

'mon_schema', '^tbl.*', ''

Pour sélectionner toutes les tables de ce schéma, et dont le nom commence par tbl, à l’exception de celles dont le nom se termine par _sav:

'mon_schema', '^tbl.*', '_sav$'

Les fonctions d’assignation à un groupe de tables construisant leur sélection à partir des deux expressions rationnelles tiennent compte du contexte des tables concernées. Les tables ne sont pas sélectionnées si :

elles sont déjà affectées à un groupe,
elles n’ont pas de clé primaire pour un groupe de tables ROLLBACKABLE,
elles sont de type UNLOGGED.

Le paramètre <propriétés> des fonctions d’ajout de tables à un groupe de tables est optionnel. Il permet de préciser les propriétés spécifiques pour la ou les tables. De type JSONB. on peut le valoriser ainsi :

'{ "priority" : <n> ,
   "log_data_tablespace" : "<ldt>" ,
   "log_index_tablespace" : "<lit>" ,
   "ignored_triggers" : ["<tg1>" , "<tg2>" , ...] ,
   "ignored_triggers_profiles" : ["<regexp1>" , "<regexp2>" , ...] }'

où :

<n> est le niveau de priorité pour la ou les tables
<ldt> est le nom du tablespace pour les tables de log
<lit> est le nom du tablespace pour les index de log
<tg1> et <tg2> sont des noms de trigger
<regexp1> et <regexp2> sont des expressions rationnelles permettant de sélectionner des noms de triggers parmi ceux existant pour la ou les tables à assigner dans le groupe

Si une des propriétés n’est pas valorisée dans le paramètre JSONB, sa valeur est considérée comme NULL.

Si des tablespaces spécifiques pour les tables de log ou pour leurs index sont référencés, ceux-ci doivent exister au préalable et l’utilisateur (ou le rôle emaj_adm) doit avoir les droits CREATE sur ces tablespaces.

Les deux propriétés ignored_triggers et ignored_triggers_profiles définissent les triggers dont l’état doit rester inchangé lors des opérations de rollback E-Maj. Les deux propriétés sont de type tableau (array). ignored_triggers peut être une simple chaîne (string) s’il ne doit contenir qu’un seul trigger.

Les triggers listés dans la propriété ignored_triggers doivent exister pour la table ou les tables référencées dans l’appel de la fonction. Les triggers créés par E-Maj (emaj_log_trg et emaj_trunc_trg) ne doivent pas être listés.

Si plusieurs expressions rationnelles sont listées dans la propriété ignored_triggers_profiles, celles-ci agissent comme autant de filtres sélectionnant des triggers.

Les deux propriétés ignored_triggers et ignored_triggers_profiles peuvent être utilisées conjointement. Dans ce cas, les triggers sélectionnés correspondront à l’union de l’ensemble des triggers listés par la première et des ensembles de triggers sélectionnés par les expressions rationnelles de la seconde.

Davantage d’information sur la gestion des triggers applicatifs.

Si le groupe de table est actif, une marque est posée automatiquement.

Pour toutes les fonctions, un verrou exclusif est posé sur chaque table du ou des groupes de tables concernés, afin de garantir la stabilité des groupes durant ces opérations.

Les fonctions d’assignation de tables dans un groupe de tables créent les tables de log, les fonctions et triggers de log, ainsi que les triggers traitant les exécutions de requêtes SQL TRUNCATE. Elles créent également les éventuels schémas de log nécessaires.

Assigner des séquences à un groupe de tables

Trois fonctions permettent d’ajouter des séquences à un groupe de tables.

Pour ajouter une seule séquence dans un groupe de tables :

SELECT emaj.emaj_assign_sequence(p_schema, p_sequence, p_group, p_mark);

Pour ajouter plusieurs séquences d’un schéma à un groupe de tables :

SELECT emaj.emaj_assign_sequences(p_schema, p_sequences, p_group, p_mark);

ou

SELECT emaj.emaj_assign_sequences(p_schema, p_sequencesIncludeFilter, p_sequencesExludeFilter,
                             p_group, p_mark);

Paramètres en entrée

p_schema (TEXT) : Schéma contenant la/les table(s) à assigner.
p_sequence (TEXT) : Nom de la séquence à assigner.
p_sequences (TEXT[]) : Tableau des noms de séquence à assigner.
p_tablesIncludeFilter (TEXT) : Expression rationnelle pour sélectionner les séquences.
p_tablesExludeFilter (TEXT) : Expression rationnelle pour exclure les séquences.
p_group (TEXT) : Nom du groupe de tables cible.
p_mark (TEXT, optionnel) : Marque posée si le groupe de tables cible est en état LOGGING. Il peut contenir un caractère % représentant l’heure courante au format hh.mm.ss.mmmm. Si le paramètre n’est pas fourni ou a une valeur non NULL ou vide, un nom de marque est généré : ASSIGN_%.

Données retournées

Les fonctions retournent le nombre de séquences ajoutées au groupe de tables.

Notes

Pour les fonctions traitant plusieurs séquences en une seule opération, la liste des séquences à traiter est soit fournie par un paramètre de type tableau de TEXT, soit construite à partir de deux expressions rationnelles fournies en paramètres.

Un tableau de TEXT est typiquement exprimé avec une syntaxe du type :

ARRAY['élément1', 'élément2', ...]

Les deux expressions rationnelles suivent la syntaxe POSIX (se référer à la documentation PostgreSQL pour plus de détails). La première définit un filtre de sélection des séquences dans le schéma, La seconde définit un filtre d’exclusion appliqué sur les séquences sélectionnées. Un filtre d’inclusion valorisé à NULL ou à une chaîne vide ne sélectionne aucun élément. Un filtre d’exclusion valorisé à NULL ou à une chaîne vide n’exclut aucun élément. Quelques exemples de filtres.

Pour sélectionner toutes les séquences du schéma mon_schema:

'mon_schema', '.*', ''

Pour sélectionner toutes les séquences de ce schéma, et dont le nom se termine par seq:

'mon_schema', 'seq$', ''

Pour sélectionner toutes les séquences de ce schéma, et dont le nom commence par seq, à l’exception de celles dont le nom se termine par _sav:

'mon_schema', '^seq.*', '_sav$'

Les fonctions d’assignation à un groupe de tables construisant leur sélection à partir des deux expressions rationnelles excluent les séquences déjà affectées à un groupe de tables.

Si le groupe de table est actif, une marque est posée automatiquement.

Supprimer un groupe de tables

Pour supprimer un groupe de tables créé au préalable par la fonction emaj_create_group(), exécuter la requête SQL :

SELECT emaj.emaj_drop_group(p_group);

Paramètres en entrée

p_group (TEXT) : Nom du groupe de table à supprimer.

Données retournées

La fonction retourne le nombre de tables et de séquences contenues dans le groupe.

Notes

Le groupe de tables à supprimer doit être inactif. Si ce n’est pas le cas, il faut d’abord utiliser la fonction emaj_stop_group().

Pour ce groupe de tables, la fonction emaj_drop_group() supprime tous les objets qui ont été créés par les fonctions d’assignation : tables, séquences, fonctions et triggers de log. Les éventuels schémas de log qui deviennent inutilisés sont également supprimés.

La pose de verrous qu’entraîne cette opération peut se traduire par la survenue d’une étreinte fatale (deadlock). Si la résolution de l’étreinte fatale impacte la fonction E-Maj, le deadlock est intercepté et la pose de verrou est automatiquement réitérée, avec un maximum de 5 tentatives.

Pour insérer la suppression d’un groupe de tables dans un script idempotent, il est possible de conditionner l’opération à l’existence préalable du groupe, en utilisant la fonction emaj_does_exist_group() dans une clause WHERE.