Articles

Perseus Digital Library Updates

Current Status (updated as of 2013-05-01)

Passage level retrieval for many of the primary source texts in the Greco-Roman collection should now be working via the Perseus CTS API. Os seguintes pedidos são atualmente suportados:

GetCapabilities:
e.g
http://www.perseus.tufts.edu/hopper/CTS?request=GetCapabilities
GetValidReff:
e.g em nocional nível de trabalho:
http://www.perseus.tufts.edu/hopper/CTS?request=GetValidReff&urn=urn:cts:greekLit:tlg0012.tlg001
por exemplo, no nível de edição:
http://www.perseus.tufts.edu/hopper/CTS?request=GetValidReff&urn=urn:cts:greekLit:tlg0012.tlg001.perseus-eng1
GetPassage:
por exemplo, no referencial nível de trabalho:
http://www.perseus.tufts.edu/hopper/CTS?request=GetPassage&urn=urn:cts:greekLit:tlg0012.tlg001:1.1
por exemplo, no nível de edição:
http://www.perseus.tufts.edu/hopper/CTS?request=GetPassage&urn=urn:cts:greekLit:tlg0012.tlg001.perseus-grc1:1.1

Problemas Conhecidos

  • o “nível de” parâmetro não é suportado para o GetValidReff, e atualmente, ele retorna apenas o valor mais baixo (i.e. mais específico) nível de citação.
  • para alguns textos, GetValidReff também pode retornar vários níveis de citação
  • as citações esquemas ainda estão em análise e podem mudar alguns dos textos
  • Nem todos os textos estão trabalhando, e o traduzido edições são um pouco piores que o original edições de idioma.
    • muitos dos problemas podem ser devido ao fato de que ainda precisamos passar por cada texto para verificar os esquemas de citação canônicos e limpá-los conforme necessário para trabalhar com o protocolo CTS. Para os textos Fonte alguns problemas são causados por elementos de citação contendo caracteres que causam problemas para CTS, tais como “.”, e elementos de citação que não são sequenciais numericamente (por exemplo, quando um texto tem elementos de citação que usam Alfas como ‘prefácio’, bem como números de livro/seção/etc) .
    • as traduções têm estes mais problemas adicionais. Pelo menos um conjunto de problemas pode estar em textos com sistemas de citação baseados em linha onde as linhas não foram marcadas na tradução em inglês. Perseus realmente não recupera linhas, mas em vez disso opera no nível do elemento de citação artificial’ card ‘ para chunking. Onde as quebras de linha existem como marcos na marcação, Nós atualmente tentamos suportar automaticamente as citações de nível de linha na API CTS usando uma transformação XSLT para converter os marcos, mas muitas vezes eles não existem nas versões traduzidas.
  • A implementação do GetPassage não suporta actualmente subreferências ou intervalos de passagem.
  • TextInventory ‘citação’ elementos são incompleto — falta de xpath e escopo de atributos

Roteiro

  • implementação completa de todos os CTS chamadas de API, e garantindo que todas as respostas aderir totalmente à API de normas
  • sincronização do greekLit e latinLit namespaces com aqueles publicados pela HMT/CHS
  • definitivo de identificação canônico citação esquemas para todos os textos
  • TEI-A normalização de todos os XML