Bnf rencontres numériques

En énonçant cette prédiction, il semblait prophétiser que sa propre pratique allait se généraliser.

Participez aux rencontres numériques à la BNF les 21 et 22 octobre !

Emmanuel Le Roy Ladurie avec ses paperolles et sa machine à calculer. Emmanuel Le Roy Ladurie. Une année plus tard, Emmanuel Le Roy Ladurie publiait une nouvelle étude centrée sur les éditions francophones de à The BN collection, thanks to legal deposit, becomes increasingly more representative of French book production of books with the succession of centuries, as legal deposit becomes more efficiently implemented. Revenons en arrière pour évoquer cette entreprise de conversion rétrospective, entamée en et encore en cours en Le premier article publié par E.

Poursuivant ses prédictions, E. Cependant, loin de se contenter des données massives du catalogue de la BnF, E. Ainsi, cette zone est réservée:. Ainsi, pour cette analyse lexicographique et statistique, il avait envisagé:. En ce sens, compte tenu des enseignements que la fouille des métadonnées textuelles devait délivrer, il nous semble bien que ce projet préfigurait les travaux les plus actuels entrepris par les digital humanists et spécialistes du text mining.

Bnf rencontres numériques

Puissent ces quelques lignes, déjà trop longues, inciter de jeunes praticiens des humanités numériques et du text and data mining à creuser le sillon de la fouille des métadonnées bibliographiques. Citer cet article: Disponible en ligne, url: La BnF mène une démarche interne qui consiste à améliorer la structuration de ses données afin de les publier, notamment sur le web de données.

Les pages du site data. RobotDonnées est issu du projet data. Sur quelle unité baser la comparaison de titres par exemple: RobotDonnées est un outil avec de nombreuses règles métier. Présentation par Etienne Cavalié, Adjoint au chef du service Ingénierie des métadonnées à la BnF et membre du groupe Systèmes et Données dans le cadre du programme national Transition bibliographique.

Bibliostratus donne la possibilité de générer un fichier séparé pour les notices sans alignements ou avec plusieurs alignements afin de pouvoir les vérifier à la main. Extraction and Reasoning Améliorer les clés de liage: Trois laboratoires sont impliqués: Le projet porte essentiellement sur le problème de liage de données dans le contexte du web de données.

Ce problème peut être résumé de la manière suivante: Une clé de liage est une généralisation de la notion de clé propre aux bases de données rationnelles aux cas de jeux des données RDF différents. Par exemple, pour définir si un livre décrit dans un jeu de données exprimé en français Livre est le même décrit dans un jeu de données en anglais Book , on peut comparer les valeurs des paires auteur et creator et les valeurs des paires titre et title.

Figure 5 Exemple de clé de liage. La première phase consiste à extraire de manière automatique à partir jeux de données RDF des clés de liage candidates et, en définissant les mesures de qualité, sélectionner parmi ces clés de liage candidates les meilleures. Figure 6 Exemple de raisonnement avec clés de liage. Quatre acteurs étaient particulièrement intéressés à cette expérimentation: Pour chaque collection, dans un premier temps chaque métadonnée a été scrutée afin de reconstituer les vocabulaires des quatre participants.

Humanités numériques | Carnet de la recherche à la Bibliothèque nationale de France

Ensuite, Cultuurlink a été utilisé par les différents participants pour effectuer les alignements vers MIMO et enrichir les données initiales. Enfin les résultats ont été évalués. Comment lier des données textuelles, qui, à la différence des données dans le web de données, ne sont pas structurées? Une fonctionnalité de visualisation est aussi mise à disposition: Parmi les autres travaux en cours: REDEN est un outil open source. Le code est disponible sur Github. Il porte sur un corpus issu des archives de Foucault conservées à la BnF et constitué de plusieurs milliers de feuillets qui forment une collection de citations et de références bibliographiques, organisées et commentées par Foucault pour la rédaction de ses ouvrages ou la préparation de ses cours.

Figure 11 Modèle de données simplifié. Les avancements du projet sont reportés sur le carnet de recherche du projet. Dans le champ des Humanités numériques, les représentations cartographiques sont principalement utilisées comme outils de visualisation de données. Ce projet veut quant à lui modéliser des cartes interactives qui soient de véritables dispositifs de médiation en proposant au lecteur des parcours guidés à travers les collections.

Dispositif onirique et narratif, il plonge le visiteur sur les traces de Jacques Cartier, dans sa navigation vers le Canada, et illustre la représentation du monde en Europe au XVI e siècle. The Linked Open Data Cloud. Une des promesses de la publication de données en ligne ouvertes est la possibilité de tisser des liens entre jeux de données de nature différente pour en enrichir les réutilisations. Ce corpus concerne environ objets, présentés dans les onze recueils dessinés par Jean-Baptiste Muret au cours de sa carrière de dessinateur au Cabinet des Médailles de la Bibliothèque nationale de France.


  1. Rencontre avec Matthieu Bonicel – L’innovation à la BnF.
  2. mature francaise libertine.
  3. Laisser un commentaire;
  4. sites de rencontre classement 2017?

Accéder directement à la plateforme Zooniverse à cette adresse: Ce corpus sera constitué de vases dessinés intégralement ou seulement par des extraits sélectionnés par Muret. Pour le processus de validation des propositions: Les mêmes images sont proposées à de multiples contributeurs et nous ferons une vérification en compilant les meilleures propositions.

Descripteurs locaux exemple. Légendage automatique. Concernant les outils existants ou en développement et les acteurs, trois types peuvent être distinguées:. Afin de satisfaire les besoins des institutions patrimoniales telles que la BnF, la collaboration avec les laboratoires de recherche, et entre institutions, paraît la solution la plus adaptée en permettant notamment la prise en considération des spécificités des collections et des images anciennes.

La réalisation du PoC a demandé plusieurs étapes: Proximité visuelle entre illustrations éditoriales et publicités illustrées signalées par une icône. À cette échelle, des pages de genres différents peuvent sembler visuellement proches. Partition, presse, carte. Ainsi de ces cartes illustrées. Détection de visages et de genres API Watson. Gallica Images Recherche hybride. Afin de rechercher ces images, une application web a été développée pour fonctionner en deux phases: Exemples de requêtes. En conclusion, Gallica Images propose une nouvelle forme de découverte des collections BnF, rythmée par des rebonds qui incitent la flânerie et la sérendipité.

Ces entités visuelles sont issues de dictionnaires sur lesquels le système de reconnaissance a été entrainé. Les deux bases de données sont donc de deux natures différentes: Le prototype a été testé sur le fonds des vidéos de sport, de musées et les vidéos disponibles en ligne sur le site ina. Résultats avec score de confiance. Un visualiseur spécifique a été aussi développé, dans une logique open source , pour permettre le repérage rapide des entités visuelles dans la temporalité de la vidéo. Visualiseur diginpix. Parallèlement à la distinction des zones textuelles des zones iconographiques, un prototype de topic modeling supervisé, couvrant dix-neuf formes journalistiques, a été développé pour repérer les formes courantes entre et Ce modèle permet donc de classifier les articles mais aussi les illustrations associées et de constituer des sous-corpus thématiques à partir de la classification opérée.

Néanmoins, dans un corpus aussi spécifique le sport dans la presse quotidienne , les catégories prennent sens les unes par rapport aux autres. Taille moyenne des illustrations La première phase du projet consistait à nettoyer les données via les métadonnées pour sélectionner les publicités contenant des éléments iconographiques. La deuxième phase consistait à utiliser des réseaux neuronaux pour identifier les éléments iconographiques dans les images. Les images ont donc été classifiées selon leurs caractéristiques visuelles en utilisant la bibliothèque open source pour TensorFlow qui permet de calculer les regroupements visuels clustering.

Une recherche des plus proches voisins permet ensuite de naviguer dans cet espace de représentation. Ce corpus volumes, 70k pages, français, latin, allemand est conservé aux Archives nationales et à la BnF. Un prototype de recherche et de consultation a été réalisé. Le modèle apprend donc sur un corpus dont la langue a été modernisée et dont les abréviations ont été mises au long. Visualiseur IIIF. Il ouvre les moyens de créer de nouveaux savoirs dans un environnement ouvert.

Deux compétitions ont eu lieu: En , deux tâches étaient en revanche visées: En , le meilleur système pour la reconnaissance globale sous forme de matrice de confusion, à gauche dans la figure suivante met en évidence la capacité de la machine à reconnaître la plupart des classes. La robustesse des systèmes est aussi un enjeu majeur. Le graphe suivant montre par exemple un système bleu foncé offrant de bonnes performances globales mais étant mis en échec sur la classe La moitié des systèmes étaient basés sur des CNN et des architectures profondes, les autres sur des caractéristiques plus ou moins nombreuses.

Les architectures profondes ont donné les meilleurs résultats. Pour ces tâches de classification, des approches interactives sont également envisageables.

Sommet du livre à la BnF – "Traduire et publier de la littérature étrangère en France" 2/2

Plusieurs modèles de réseau sont testés sur cette base. Comme la donnée est le pilier de tout système, une attention méticuleuse devrait lui être portée pour éviter des distorsions à long terme. Dans le cadre de ses plans triennal de la recherche et quadriennal de la recherche , la Bibliothèque nationale de France finance un programme sur les Polices de caractères pour les inscriptions monétaires qui vise à créer des polices de caractères pour transcrire, publier et analyser de façon satisfaisante et uniformisée les inscriptions monétaires.

Le travail se poursuit avec les inscriptions de monnaies ibériques et puniques. Ces coins étant confectionnés à la main, chacun est par définition unique. La fiche Les liaisons de coins et le graphique que nous citons ci-dessous consacrés au sujet par Christian R. Les logiciels de représentation en réseaux pourraient constituer un outil pertinent pour parvenir à ce type de représentation de manière automatisée.


  1. Musée-Oh !.
  2. Agenda (page 1 sur 7) | BnF - Site institutionnel?
  3. sites de rencontre en allemagne.
  4. rencontres en corse?
  5. blague site de rencontre!

Extrait de: Les bibliothèques regorgent de données numériques et elles en produisent quotidiennement de nouvelles: Mais ces données et métadonnées numériques ressortent-elles du concept de big data? Et sont-elles des cibles légitimes pour du data mining? Le traitement OLR consiste en la description de la structure logique de chaque fascicule et de ses articles emprise spatiale, titre et sous-titre, etc. Figure 1. Notre hypothèse est que compter ces grains fig. Figure 2.

L'agenda de la BnF

Des scripts Perl ou XSL fig. Figure 3.

Processus de production des métadonnées dérivées. Ce principe de production de données dérivées offre plusieurs avantages. En tout premier lieu, pour le consommateur des données:. Le jeu de métadonnées pourrait alors être un échantillon représentatif de la collection ou du corpus, les informations recherchées étant majoritairement des mesures statistiques. Citons quelques exemples:.

Figure 4. Nombre moyen de mots par page.


  • Le Blog du LABO BnF: Pour un humanisme numérique.
  • site de rencontre avec orange.
  • LA BnF ET MOI!
  • site de rencontre pour hommes ronds.
  • Figure 6. La communauté des humanités numériques applique des techniques de visualisation de données depuis déjà fort longtemps 2.