Articles

Mises à jour de la Bibliothèque numérique de Persée

État actuel (mis à jour à partir du 01/05/2013)

La récupération au niveau du passage de nombreux textes sources primaires de la collection gréco-romaine devrait maintenant fonctionner via l’API CTS de Persée. Les requêtes suivantes sont actuellement prises en charge :

GetCapabilities :
par exemple
http://www.perseus.tufts.edu/hopper/CTS?request=GetCapabilities
GetValidReff :
par exemple au niveau du travail théorique :
http://www.perseus.tufts.edu/hopper/CTS?request=GetValidReff&urn=urn:cts:greekLit:tlg0012.tlg001
par exemple au niveau de l’édition :
http://www.perseus.tufts.edu/hopper/CTS?request=GetValidReff&urn=urn:cts:greekLit:tlg0012.tlg001.perseus-eng1
GetPassage:
par exemple au niveau du travail théorique:
http://www.perseus.tufts.edu/hopper/CTS?request=GetPassage&urn=urn:cts:greekLit:tlg0012.tlg001:1.1
par exemple au niveau de l’édition :
http://www.perseus.tufts.edu/hopper/CTS?request=GetPassage&urn=urn:cts:greekLit:tlg0012.tlg001.perseus-grc1:1.1

Problèmes connus

  • le paramètre ”level » n’est pas encore pris en charge pour GetValidReff, et il ne renvoie actuellement que le niveau de citation le plus bas (c’est-à-dire le plus spécifique).
  • pour certains textes, GetValidReff peut également renvoyer plusieurs niveaux de citation
  • les schémas de citations sont toujours en cours de révision et peuvent changer pour certains textes
  • Tous les textes ne fonctionnent pas, et les éditions traduites sont un peu moins bien lotis que les éditions en langue originale.
    • De nombreux problèmes peuvent être dus au fait que nous devons encore parcourir chaque texte pour vérifier les schémas de citation canoniques et les nettoyer si nécessaire pour travailler avec le protocole CTS. Pour les textes sources, certains problèmes sont causés par des éléments de citation contenant des caractères qui posent des problèmes pour les CTS, tels que « .”, et des éléments de citation qui ne sont pas numériques séquentiels (par exemple, lorsqu’un texte contient des éléments de citation qui utilisent des alphas comme ‘préface’ ainsi que des numéros de livre / section / etc).
    • Les traductions ont ces problèmes plus supplémentaires. Au moins un ensemble de problèmes peut se trouver dans des textes avec des schémas de citation basés sur des lignes où les lignes n’ont pas été marquées dans la traduction anglaise. Perseus ne récupère pas réellement les lignes mais fonctionne au niveau de l’élément de citation artificielle « carte » pour le découpage. Lorsque des sauts de ligne existent en tant que jalons dans le balisage, nous essayons actuellement de prendre en charge automatiquement les citations au niveau de la ligne dans l’API CTS en utilisant une transformation XSLT pour convertir les jalons, mais souvent ils n’existent pas dans les versions traduites.
  • L’implémentation de GetPassage ne prend actuellement pas en charge les sous-références ou les plages de passage.
  • Les éléments de « citation  » TextInventory sont incomplets — il manque des attributs xpath et de portée

Feuille de route

  • implémentation complète de tous les appels d’API CTS et garantie que toutes les réponses respectent pleinement les normes de l’API
  • synchronisation des espaces de noms greekLit et latinLit avec ceux publiés par le HMT/CHS
  • schémas de citation canoniques d’identification définitive pour tous les textes
  • TEI-A normalisation de tout XML