Posts Tagged ‘lucene’

Library Mashups 3 – Library Catalog Mashup: Using Blacklight to expose collections

22 dicembre 2009

Library Catalog Mashup: Using Blacklight to Expose Collections, il capitolo di Library Mashups dedicato alla soluzione OPAC dell’UVA (University of Virginia Libraries) si apre con una avvertenza preliminare sul concetto di mashup che da questi colleghi viene inteso in senso creativo – e non come semplice giustapposizione di informazioni già esistenti; insomma come nuovo amalgama, remix e riprogrammazione di contenuti, moduli e in sostanza flussi di informazioni ma in maniera inedita, modulare e user-centered.

Altra puntualizzazione degli autori, riguarda la motivazione alla base della creazione di Blacklight, il prodotto-mashup che viene presentato nel capitolo: tutto nasce da un senso di frustrazione che accomunava i bibliotecari e gli utenti di UVA nella fruizione delle classiche interfacce dei cataloghi online (OPAC) che non avevano nulla di moderno, che spesso erano essenziali ma in senso negativo, e comunque lontane mille miglia dai servizi 2.0 cui pian piano siamo andati abituandoci (Flickr, NetFlix etc.).

Bess Sadler, Joseph Gilbert e Matt Mitchella mettono giustamente in luce perché le interfacce di ricerca evolvono così lentamente: esse sono sempre state storicamente agganciate agli ILS, ovvero ai sistemi di automazione bibliotecaria (software con cui si gestiscono catalogazione, prestiti etc.), che di per sé sono sistemi molto complessi, che cambiano con molta difficoltà (e vanno fatti evolvere anche con molta cautela). Il segreto sta dunque nello scorporo delle funzionalità e quindi degli applicativi: che gli ILS continuino con le loro pesanti ma solide articolazioni a sostenere il peso delle biblioteche, e che gli OPAC possano diventare leggeri, agili, integrabili e adattarsi ai desiderata degli utenti.

Blacklight nasce quindi come progetto per la realizzazione di un’interfaccia di search, discovery e delivery diversa: più modulare, più ricca e più facile da sviluppare/implementare/cambiare; è open source e il suo indice si basa sul motore di ricerca Lucene e sul wrapper Apache Solr, che consente un approccio più easy alla gestione del motore (l’invio e la richiesta di contenuti verso il motore di ricerca vengono effettuati in modalità web service-like attraverso chiamate di XML via HTTP). L’utilizzo di Lucene e Solr non è un dettaglio, perché ha consentito al modulo Blacklight ampia libertà nella costruzione non solo di interfacce diversificate di accesso ai dati, ma di indici ed esposizione dei dati stessi personalizzabili e adattati ai vari contesti (es.: una biblioteca di Medicina può mostrare ai suoi utenti solo certi contenuti e magari mostrarli attraverso indici, percorsi o metadati particolari).

D’altronde tra i primi obiettivi di University of Virginia Libraries vi era la creazione di un OPAC unico per tutti i contenuti della biblioteca, e non solo per i classici libri o riviste. Ecco dunque che Blacklight diviene l’interfaccia di ricerca anche per gli oggetti digitali dei repository delle biblioteche della Virginia, portando alla luce un tesoro di immagini, file audio, pubblicazioni accademiche e in genere contenuti che fino a quel momento erano sempre rimasti nascosti agli occhi degli utenti. D’altronde, per ogni tipologia di materiale e/o per ogni collezione, sono possibili punti di accesso diversificati, in modo che la ricerca non debba appiattirsi su un denominatore comune povero o uniformante (ogni tipo di oggetto possiede anche proprie modalità di presentazione: per es. le immagini sono rappresentate attraverso thumbnail mentre i libri mostrano le copertine che vengono recuperate dai vari siti dedicati, e così via).

Blacklight è in grado di acquisire in sé anche contenuti non provenienti da biblioteche: un esempio portato nel capitolo riguarda la collezione di immagini di antiche monete greche e romane – immagini che è stato possibile aggiungere in poche ore all’indice del catalogo. Come? Attraverso una semplice richiesta di POST verso Solr del file XML contenente i dati, e in seguito con la creazione di un’interfaccia HTML di visualizzazione utilizzando il linguaggio Ruby (on Rails) [cfr. Solr: Indexing XML with Lucene and REST].

La finalità della costruzione di Blacklight non solo sono interne, o comunque OPAC-centered. Uno degli aspetti essenziali è che intorno a questo modulo e al suo core Solr, si sviluppano e dipartono diversi web services che consentono un utilizzo massivo e personalizzato delle informazioni contenute nell’indice. Un classico esempio sono le uscite in RSS, PHP o JSON con cui chiunque (intendiamo qualsiasi utente) può costruire a sua volta bookmark, URL permanenti di ricerche e pagine di risultati o ulteriori mashup combinando i contenuti del catalogo con altri contenuti ancora.

Altro servizio che esemplifica bene l’approccio di UVA, è l’incorporazione del server Z39.50 in un’API web, quindi traducendo la difficoltà del linguaggio di querying tipico dei cataloghi di biblioteca, in un set di istruzioni facilmente comprensibili e invocabili da praticamente qualsiasi applicazione web. In conclusione, Blacklight e il suo design web service-like, offrono alle biblioteche la possibilità di differenziare le modalità di presentazione delle informazioni contenute nei vari cataloghi, ma intendono anche marcare uno step importante verso l’utilizzo sempre maggiore di prodotti open source (in questo caso oltre tutto un’interfaccia che può risiedere benissimo on the top di un ILS proprietario) e infine verso l’apertura dei dati e il loro remix (Blacklight incrocia le informazioni provenienti dagli OPAC con quelle offerte gratuitamente da altri web services presenti in Rete).

Bess Sadler, Metadata Specialist for User Projects for the University of Virginia Library; Joseph Gilbert, Head of the Scholars’ Lab at the University of Virginia Library; and Matt Mitchell