Archives de catégorie : FRBRisation des catalogues

Journée d’étude AFNOR CN46 / BnF (26 juin2015)

Vendredi 26 juin 2015 [9h – 17h]
BnF, Petit Auditorium, Site François-Mitterrand 75013 Paris

« L’adoption d’un nouveau code de catalogage se profile dans les bibliothèques et donne l’occasion de faire le point sur les nouvelles exigences normatives : quelles seront les modalités françaises d’application de RDA ? Concrètement, comment basculer d’un modèle de description des ressources à l’autre ? Dans quelle mesure cette transition ouvre-t-elle des opportunités d’alignement entre métadonnées culturelles ?

Des témoignages viendront éclairer les enjeux du signalement 3.0 au sein des différentes communautés professionnelles, pour un meilleur service auprès des utilisateurs […] »

Consultez le programme !

FRBR dans les solutions Archimed

Par Christophe Arnoult [décembre 2014]

FRBR (Functionnal Requirements for Bibliographic Records) est l’un des acronymes actuellement les plus discutés dans le monde des bibliothèques. Une des raisons de son actualité, et sans doute la principale, est la refonte des normes de description bibliographique avec RDA (Resource Description and Access) qui notamment reprend et met en œuvre les principes de FRBR.

Il ne faut pas pour autant confondre FRBR et RDA. FRBR est un modèle conceptuel, une définition formelle des données qui servent à décrire l’objet bibliographique, pour adapter l’identification et la recherche documentaire aux usages de toutes les catégories d’utilisateurs (bibliothécaires, éditeurs, usagers…). Notre propos n’est pas ici de présenter une énième fois FRBR. Nous voulons juste insister sur le fait que FRBR n’édicte aucune règle normative et opérationnelle pour améliorer la description et la recherche mais pose juste des principes intellectuels sans préjuger de la manière de les mettre en œuvre. Ce qui n’est pas le cas de RDA qui pose les règles très précises à appliquer et constitue donc à la fois une interprétation et une instanciation du modèle FRBR.

Ceci posé, et sachant que la norme RDA est encore largement discutée par l’EURIG, qu’elle n’est pas prête d’être adoptée par la France qui passera d’abord par un format de transition bibliographique, il n’existe donc à ce jour en France d’autres préconisations FRBR que le modèle conceptuel lui-même. Toute mise en œuvre de FRBR représente donc une initiative libre et originale qui n’engage que ses concepteurs.

Les explications qui précèdent sont importantes pour comprendre la position et la démarche d’Archimed. Comme d’autres acteurs (agences bibliographiques, fournisseurs de données, éditeurs informatiques), Archimed avance un projet propre de mise en œuvre du modèle FRBR. Ce projet est fondé, d’une part sur les ressources actuellement disponibles pour FRBRiser un catalogue, d’autre part sur les usages de recherche en bibliothèque de lecture publique.

Comment FRBRiser le catalogue ?

Dans l’absolu, FRBRiser le catalogue exige de décomposer l’actuelle notice de document en trois objets hiérarchiquement liés :  œuvre – expression – manifestation, afin de dissocier le processus créatif d’un contenu intellectuel d’une part et le document qui n’en est que le vecteur d’autre part. L’idée des Misérables (l’œuvre) exprimée par son auteur sous la forme d’un texte littéraire (l’expression) est consignée dans un livre (la manifestation).

Une dénormalisation de ce modèle revient à remplacer les objets d’œuvre et d’expression par de simples attributs de la manifestation. Les données se lisent alors dans l’autre sens : un livre contient un texte littéraire qui correspond à l’œuvre Les Misérables. Cette dénormalisation peut être interprétée soit comme un moyen d’atteindre plus facilement en pratique les principes du FRBR, compte tenu de l’état actuel des catalogues et des possibilités de l’indexation : c’est l’approche anglo-saxonne. Dans le cas de la France qui défend le modèle original avec ses trois objets liés, la dénormalisation peut être perçue comme un risque de ne pas pouvoir centrer sa recherche sur le contenu intellectuel pour déboucher plus sûrement sur les documents qui lui correspondent. Dès lors en effet qu’il n’existe plus d’autre objet que la manifestation, toute recherche garderait pour pivot le document, comme c’est déjà le cas aujourd’hui [1].

Les différents scénarios de mise en œuvre du modèle [2] montrent que la FRBRisation du catalogue est un sujet complexe qui se règlera notamment par les choix qu’édicteront les normes et qui s’imposeront à tous.

Devant de telles difficultés et en l’absence de normes, la première position d’Archimed est de ne pas chercher à définir et embarquer dans le catalogue un modèle de description riche qui sera évidemment remis en cause dès que les nouvelles normes de catalogage seront connues et appliquées. L’approche choisie est donc de FRBRiser le plus simplement possible le catalogue, non pas pour décrire exhaustivement la relation du document avec son expression et son œuvre, mais dans la perspective d’améliorer le service à l’utilisateur dans le cadre de ses recherches.

La FRBRisation sera disponible avec la nouvelle solution Syracuse, soit dans le module SIGB, soit dans le module Portail quand il s’interface avec un SIGB tiers.

Elle va consister à enrichir l’indexation des notices de documents en injectant automatiquement dans celles-ci, chaque fois que c’est possible, les données de base qui caractérisent l’œuvre associée : le titre de l’œuvre, sa date, son auteur et sa catégorie (littéraire ou musicale par exemple).

Ces quelques données sont disponibles dans data.bnf.fr, le cloud de la BnF. Elles sont récupérables par web service, plus précisément à l’aide du serveur Sparql qui a été ouvert cet été par la BnF. En partant de l’identifiant du document fourni dans la notice du catalogue local (l’isbn, l’ean, voire le FRBNF de la notice BnF si la notice locale en est dérivée), Syracuse interroge data.bnf.fr et récupère, quand elles existent, les données de l’œuvre qui viennent automatiquement enrichir la notice.

image002

La récupération de données auprès de data.bnf.fr. permet ensuite de rebondir sur d’autres entrepôts de données web. Il est par exemple possible, en remontant les liens entre les données, de récupérer les distinctions littéraires obtenues par l’œuvre par une seconde recherche Sparql cette fois dans le cloud DbPedia.

Tous les identifiants normalisés qui peuvent être récupérés lors de ces opérations le sont: FRNBF (BnF), PPN (Sudoc), ISNI pour l’auteur de l’œuvre…. Conservés au même titre que les métadonnées dans la notice, ce sont eux qui développeront dans la durée l’enrichissement du catalogue ou de la recherche en permettant, comme dans le cas de DbPedia, de retrouver dans le web de données des informations éparses complémentaires sur l’œuvre ou le document.

Au final, la notice du catalogue est enrichie avec les métadonnées de l’œuvre. L’opération d’enrichissement est automatique et repose sur les données actuellement disponibles dans le web de données.

Comment FRBRiser la recherche ?

L’objectif du modèle FRBR est d’adapter l’information et la recherche documentaire aux attentes des différentes catégories d’utilisateurs : libraires, éditeurs, bibliothécaires, chercheurs… En proposant un modèle plus riche et plus souple, FRBR doit éviter d’imposer une manière unique de rechercher et accroître les chances de satisfaire la demande de l’utilisateur. Nous nous intéressons ici aux usagers des bibliothèques en lecture publique.

Dans les maquettes et les premières expérimentations de recherche basée sur un modèle FRBR, il est fréquent que le scénario de recherche soit calqué sur le modèle de données lui-même. Ainsi, à la question de l’utilisateur, la réponse présente d’abord les œuvres puis les documents. Les interfaces se sont aussi enrichies de multiples rebonds pour parcourir les liens sémantiques que le modèle FRBR valorise  entre les œuvres, les expressions, les auteurs, les sujets, les documents, etc. La recherche peut alors rapidement prendre la forme d’un parcours de graphe de données.

Si l’on se place du point de vue de l’usager en lecture publique, il faut toutefois vérifier que la FRBrisation réponde à son attente.  Avant les questions soulevées par le modèle FRBR, les portails de bibliothèque avaient déjà dû s’adapter aux utilisateurs. C’est ainsi que la recherche des premiers OPAC avec le formulaire du type « Titre – Auteur – Editeur – Date – Sujet » a cédé la place à l’unique zone de  recherche simple beaucoup plus compréhensible et facile d’utilisation par le grand public. Les progrès de l’indexation aidant, le bruit de la recherche simple est régulièrement corrigé à la baisse par des algorithmes de plus en plus perfectionnés pour remonter en priorité les résultats les plus pertinents. La recherche à facettes qui s’est banalisée permet à présent à l’utilisateur en un ou deux clics de circonscrire ses recherches. On peut aussi citer les vignettes qui aident à identifier ou choisir le document.

Cependant, il est intéressant de noter que les facettes sont en réalité assez peu utilisées. Quelques sondages chez nos clients à partir des statistiques du portail Ermes montrent qu’entre 15 et 20% des recherches seulement font appel aux facettes. Il est intéressant aussi de noter que les facettes les plus utilisées sont celles qui portent sur les nouveautés, le type de document, sa localisation. Ces observations renforcent notre conviction que les usagers attendent de la recherche qu’elle soit la plus simple et la plus directe possible et qu’elle vise avant tout à mettre la main sur les documents. Le paradigme de la recherche, dans le contexte de la lecture publique, ne serait donc pas tant l’œuvre que le document et sa disponibilité.

Compte tenu de ces observations, voici comment nous comptons prendre en compte le modèle FRBR dans la recherche du portail Syracuse.

Tout d’abord Syracuse ne change pas le scénario de la recherche simple qui débouche directement sur les documents. La prise en compte de l’œuvre dans l’indexation doit toutefois accroître un peu plus la pertinence des résultats. La recherche peut en effet accorder plus de poids au mots recherchés qui correspondent au titre de l’œuvre plutôt qu’au titre du document qui peut être décalé par rapport au contenu. Il aussi possible de proposer une nouvelle facette pour filtrer les documents en fonction des œuvres identifiées. Le type d’œuvre (roman, poésie, œuvre musicale, spectacle, film….) pourrait aussi à terme constituer une alternative intéressante au type de document (livre, cd, dvd…) qui n’éclaire nullement sur le contenu.

image003

La FRBrisation peut être aussi intéressante en aval de la recherche en donnant à l’utilisateur des informations sur l’œuvre du document , les documents de la même œuvre ou les autre œuvres du même auteur. Ici les identifiants collectés lors de la phase d’enrichissement du catalogue (voir plus haut) jouent leur rôle. Ils permettront par exemple, pour le document affiché, de retrouver tous les documents numérisés sur Gallica, directement consultables en ligne, qui correspondent à la même œuvre.

image004

Dans tous les cas toutefois, il faut garder à l’esprit que dans un catalogue FRBRisé, tous les documents sont loin d’être liés à l’œuvre correspondante et que dans de nombreux cas aussi le document se confond en fait avec l’œuvre dont il est l’unique manifestation. Dans un premier temps donc les effets de la FRBrisation ne peuvent profiter qu’à une partie du fonds. C’est probablement la raison pour laquelle les applications qui mettent en œuvre le modèle FRBR proposent une forme épurée de manifestation en lieu et place de l’œuvre quand celle-ci n’existe pas.

La mise en œuvre du modèle FRBR n’en est qu’à ses débuts. Il faudra du temps et un renouvellement progressif des catalogues pour que les données sur l’œuvre ou l’expression se généralisent. Plus globalement, et sans attendre que les catalogues mutent vers le modèle FRBR par la normalisation et le catalogage, ce sont les identifiants collectés automatiquement lors de l’opération d’enrichissement des notices qui vont permettre avec beaucoup de souplesse et de fiabilité de collecter les informations éparses progressivement disponibles dans le web de données pour enrichir les possibilités de recherche ou les résultats.


 

[1] Voir le blog de Philippe Le Pape à l’Abes qui soulève cette problématique : http://rda.abes.fr/

[2] Pour une présentation simple des différents scénarios 1, 2 et 3, voir par exemple http://frbr.jimdo.com/comment-faire/hypoth%C3%A8ses/les-sc%C3%A9narios-d-impl%C3%A9mentation-du-rda/

 

FRBRisation des bibliothèques de Flandre

4e_chambers

Rosemie Callewaert explique dans le 5e chapitre de cet excellent ouvrage comment les bibliothèques de Flandre (http://zoeken.bibliotheek.be/) ont procédé pour FRBRiser leur catalogue, et surtout l’intérêt pressenti pour la structuration des données bibliographiques selon ce modèle, et dégage très nettement les avantages que le public peut en tirer.

Le bénéfice le plus immédiat réside dans la possibilité de restituer des liens entre les ressources, des liens intellectuels, mais aussi, comme chaque entité se voit attribuer un identifiant, des liens profonds :  il est beaucoup plus simple désormais de lier une notice d’œuvre à un identifiant correspondant à l’identifiant dans un autre entrepôt de données  et rapatrier des micro éléments pour enrichir visuellement  les notices locales, une sorte de surcharge informationnelle qui permet à l’usager d’identifier plus facilement les ressources décrites.