XML - Transformations avec XSLT
XSLT et XSL/FO
XSL (eXtensible Stylesheet Language) possède deux composantes :
- XSLT, eXtensible Stylesheet Transformation
- XSL/FO, eXtensible Stylesheet formatting
- le langage de transformation des données (XSLT, eXtensible Stylesheet Transformation) permettant
de transformer la structure des éléments XML.
Un document XML peut être représenté comme une structure arborescente. Ainsi
XSLT permet de transformer les documents XML à l'aide de feuilles de style contenant
des règles appelées template rules (ou règles de gabarit en français).
Le processeur XSLT (composant logiciel chargé de la transformation) crée
une structure logique arborescente (on parle d'arbre source) à partir du document XML
et lui fait subir des transformations selon les template rules contenues dans la feuille
XSL pour produire un arbre résultat représentant, par exemple, la structure
d'un document HTML. Les composants de l'arbre résultat sont appelés objets de flux.
Chaque template rule définit des traitements à effectuer sur un
élément (noeud ou feuille) de l'arbre source.
On appelle "patterns" (en français motifs, parfois "éléments cibles")
les éléments de l'arbre source.
L'arbre source peut être entièrement remodelé et filtré
ainsi qu'ajouter du contenu à l'arbre résultat, si bien que l'arbre résultat
peut être radicalement différent de l'arbre source.
- le langage de formatage des données (XSL/FO), c'est-à-dire
un langage permettant de définir la mise en page (affichage de texte ou de graphiques) de ce qui a été
cré par XSLT.
Une fois l'arbre source créé, XSL/FO permet de formater le
résultat, c'est-à-dire d'interpréter l'arbre résultat, ou plus exactement
les objets de flux le composant en leur appliquant des objets de mise en forme
afin d'en faire une représentation visuelle (papier, écran, ...)
Les template rules (règles de gabarit)
Les template rules sont des balises XSL permettant de définir des opérations à
réaliser sur certains éléments du document XML utilisant la page XSL, c'est-à-dire généralement de transformer un tag XML et au moins un tag HTML (généralement plusieurs).
Ainsi le tag XML suivant :
<personne>
<nom>Pillou</nom>
<prenom>Jean-François</prenom>
</personne>
<personne>
<nom>VanHaute</nom>
<prenom>Nico</prenom>
</personne>
<personne>
<nom>Andrieu</nom>
<prenom>Seb</prenom>
</personne>
pourra être transformé en les tags HTML suivants :
<ul>
<li>Pillou - Jean-François</li>
<li>VanHaute - Nico</li>
<li>Andrieu - Seb</li>
</ul>
L'attribut "match" de la balise <xsl:template> permet de définir (grâce à la notation XPath)
le ou les éléments du document XML sur lesquels s'applique la transformation.
<xsl:template match="conditions"/>
La notation Xpath permet de définir des patterns, c'est-à-dire des
chaînes de caractères permettant de repérer un noeud dans le document XML.
Les principaux patterns sont :
Pattern |
Exemple |
Signification |
Nom |
toto |
Sélectionne les éléments par leur nom |
Nom[0] |
toto[0] |
Sélectionne le premier élément ayant un nom donné (toto[0] sélectionne le premier élément rencontré ayant le nom 'toto') |
Nom[end()] |
toto[end()] |
Sélectionne le dernier élément ayant un nom donné |
| |
Gauche|Milieu |
Indique une alternative (un noeud OU bien l'autre (ou les deux)) |
/ ou Arbre/Feuille |
/ |
- utilisé seul: Définit l'élément de plus haut niveau de l'arborescence (appelé root ou racine en français)
ainsi que (de façon implicite) tous ses éléments fils.
- utilisé entre deux éléments: décrit la localisation d'un élément dans son arborescence (comme pour l'arborescence des répertoires sur un disque - /usr/bin/toto)
|
* |
* |
Motif "joker" désignant n'importe quel élément |
// |
//personne |
Indique tous les descendants d'un noeud |
. |
. |
Caractérise le noeud courant |
.. |
.. |
Désigne le noeud parent. Permet de remonter d'un niveau dans l'arborescence hiérarchique |
@ |
@nom |
Indique un attribut caractéristique (@nom décrit l'attribut value). La notation @*
désigne tous les attributs d'un élément |
text() |
text() |
Désigne le contenu d'un élément (le texte contenu entre ses balises) |
ID() |
ID('a2546') |
Sélectionne l'élément dont l'identifiant (la valeur de l'attribut ID) est celui spécifié en paramètre |
La transformation peut être réalisée
- soit par ajout de texte,
- soit en définissant des éléments de transformation, c'est-à-dire des éléments permettant de
définir des règles de transformation à appliquer aux éléments
sélectionnés par l'attribut match
Voici un exemple de feuille XSL permettant d'effectuer la transformation
XML vers HTML décrite ci-dessus :
<?xml version="1.0" encoding="ISO-8859-1"?>
<xsl:stylesheet
xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
xmlns="http://www.w3.org/TR/REC-html40"
result-ns="">
<xsl:template match="/">
<HTML>
<HEAD>
<TITLE>Titre de la page</TITLE>
</HEAD>
<BODY BGCOLOR="#FFFFFF">
<xsl:apply-templates/>
</BODY>
</HTML>
</xsl:template >
<xsl:template match="personne" >
<ul>
<li>
<xsl:value-of select="nom"/>
-
<xsl:value-of select="prenom"/>
</li>
</ul>
</xsl:template >
</xsl:stylesheet>
Voici la signification de cette feuille XSL
- Le premier tag <xsl:template> permet d'appliquer une transformation à
l'ensemble du document (la valeur "/" de l'attribut match indique l'élément racine du document XML). Ce tag contient des balises HTML qui seront transmises dans l'arbre
résultat
- L'élément <xsl:apply-templates/> indique le
traitement de tous les enfants directs de la racine.
- La balise <xsl:template match="personne" > permet d'aller
traiter les éléments de type personne
- Enfin les deux éléments <xsl:value-of select="nom"/>
et <xsl:value-of select="prenom"/> permettent de recuperer les valeurs
des balises nom et prenom
Discussions pertinentes trouvées dans le forum