Archive for the ‘Web 2.0’ Category

Il web 2.0 e le biblioteche, un incontro possibile?

30 dicembre 2009

Il 15 gennaio 2010 si terrà presso la Biblioteca Universitaria di Torino, una tavola rotonda organizzata dall’A.I.B. Piemonte su biblioteche e web 2.0:

Si discute molto di web 2.0, social network, blog, piattaforme web interattive, di una rete che promuove la partecipazione attiva degli utenti alla costruzione e diffusione delle informazioni. Si tratta davvero di una nuova evoluzione del web? Quali sono le opportunità che la rete offre ai propri utenti e come usarle in biblioteca? Come vedono le biblioteche questi nuovi strumenti? Un’occasione o una nuova minaccia per il ruolo del bilbiotecario/mediatore?

Partecipano: Bonaria Biancu (Università Milano Bicocca), Andrea Marchitelli (Cilea), Rossana Morriello (Università degi studi di Udine), Eleonora Pantò (CSP Piemonte), Gino Roncaglia (Università degli studi della Tuscia). Modera: Eugenio Pintore (Settore Biblioteche e Archivi della Regione Piemonte)

***************************

Aggiornamento [17/01/2010]: ecco le slide del mio intervento:

Library Mashups 3 – Library Catalog Mashup: Using Blacklight to expose collections

22 dicembre 2009

Library Catalog Mashup: Using Blacklight to Expose Collections, il capitolo di Library Mashups dedicato alla soluzione OPAC dell’UVA (University of Virginia Libraries) si apre con una avvertenza preliminare sul concetto di mashup che da questi colleghi viene inteso in senso creativo – e non come semplice giustapposizione di informazioni già esistenti; insomma come nuovo amalgama, remix e riprogrammazione di contenuti, moduli e in sostanza flussi di informazioni ma in maniera inedita, modulare e user-centered.

Altra puntualizzazione degli autori, riguarda la motivazione alla base della creazione di Blacklight, il prodotto-mashup che viene presentato nel capitolo: tutto nasce da un senso di frustrazione che accomunava i bibliotecari e gli utenti di UVA nella fruizione delle classiche interfacce dei cataloghi online (OPAC) che non avevano nulla di moderno, che spesso erano essenziali ma in senso negativo, e comunque lontane mille miglia dai servizi 2.0 cui pian piano siamo andati abituandoci (Flickr, NetFlix etc.).

Bess Sadler, Joseph Gilbert e Matt Mitchella mettono giustamente in luce perché le interfacce di ricerca evolvono così lentamente: esse sono sempre state storicamente agganciate agli ILS, ovvero ai sistemi di automazione bibliotecaria (software con cui si gestiscono catalogazione, prestiti etc.), che di per sé sono sistemi molto complessi, che cambiano con molta difficoltà (e vanno fatti evolvere anche con molta cautela). Il segreto sta dunque nello scorporo delle funzionalità e quindi degli applicativi: che gli ILS continuino con le loro pesanti ma solide articolazioni a sostenere il peso delle biblioteche, e che gli OPAC possano diventare leggeri, agili, integrabili e adattarsi ai desiderata degli utenti.

Blacklight nasce quindi come progetto per la realizzazione di un’interfaccia di search, discovery e delivery diversa: più modulare, più ricca e più facile da sviluppare/implementare/cambiare; è open source e il suo indice si basa sul motore di ricerca Lucene e sul wrapper Apache Solr, che consente un approccio più easy alla gestione del motore (l’invio e la richiesta di contenuti verso il motore di ricerca vengono effettuati in modalità web service-like attraverso chiamate di XML via HTTP). L’utilizzo di Lucene e Solr non è un dettaglio, perché ha consentito al modulo Blacklight ampia libertà nella costruzione non solo di interfacce diversificate di accesso ai dati, ma di indici ed esposizione dei dati stessi personalizzabili e adattati ai vari contesti (es.: una biblioteca di Medicina può mostrare ai suoi utenti solo certi contenuti e magari mostrarli attraverso indici, percorsi o metadati particolari).

D’altronde tra i primi obiettivi di University of Virginia Libraries vi era la creazione di un OPAC unico per tutti i contenuti della biblioteca, e non solo per i classici libri o riviste. Ecco dunque che Blacklight diviene l’interfaccia di ricerca anche per gli oggetti digitali dei repository delle biblioteche della Virginia, portando alla luce un tesoro di immagini, file audio, pubblicazioni accademiche e in genere contenuti che fino a quel momento erano sempre rimasti nascosti agli occhi degli utenti. D’altronde, per ogni tipologia di materiale e/o per ogni collezione, sono possibili punti di accesso diversificati, in modo che la ricerca non debba appiattirsi su un denominatore comune povero o uniformante (ogni tipo di oggetto possiede anche proprie modalità di presentazione: per es. le immagini sono rappresentate attraverso thumbnail mentre i libri mostrano le copertine che vengono recuperate dai vari siti dedicati, e così via).

Blacklight è in grado di acquisire in sé anche contenuti non provenienti da biblioteche: un esempio portato nel capitolo riguarda la collezione di immagini di antiche monete greche e romane – immagini che è stato possibile aggiungere in poche ore all’indice del catalogo. Come? Attraverso una semplice richiesta di POST verso Solr del file XML contenente i dati, e in seguito con la creazione di un’interfaccia HTML di visualizzazione utilizzando il linguaggio Ruby (on Rails) [cfr. Solr: Indexing XML with Lucene and REST].

La finalità della costruzione di Blacklight non solo sono interne, o comunque OPAC-centered. Uno degli aspetti essenziali è che intorno a questo modulo e al suo core Solr, si sviluppano e dipartono diversi web services che consentono un utilizzo massivo e personalizzato delle informazioni contenute nell’indice. Un classico esempio sono le uscite in RSS, PHP o JSON con cui chiunque (intendiamo qualsiasi utente) può costruire a sua volta bookmark, URL permanenti di ricerche e pagine di risultati o ulteriori mashup combinando i contenuti del catalogo con altri contenuti ancora.

Altro servizio che esemplifica bene l’approccio di UVA, è l’incorporazione del server Z39.50 in un’API web, quindi traducendo la difficoltà del linguaggio di querying tipico dei cataloghi di biblioteca, in un set di istruzioni facilmente comprensibili e invocabili da praticamente qualsiasi applicazione web. In conclusione, Blacklight e il suo design web service-like, offrono alle biblioteche la possibilità di differenziare le modalità di presentazione delle informazioni contenute nei vari cataloghi, ma intendono anche marcare uno step importante verso l’utilizzo sempre maggiore di prodotti open source (in questo caso oltre tutto un’interfaccia che può risiedere benissimo on the top di un ILS proprietario) e infine verso l’apertura dei dati e il loro remix (Blacklight incrocia le informazioni provenienti dagli OPAC con quelle offerte gratuitamente da altri web services presenti in Rete).

Bess Sadler, Metadata Specialist for User Projects for the University of Virginia Library; Joseph Gilbert, Head of the Scholars’ Lab at the University of Virginia Library; and Matt Mitchell

Tenurometer: Google Scholar e citazioni a portata di browser

13 dicembre 2009

Tenurometer è un nuovo servizio proposto dall’Università dell’Indiana per il calcolo delle citazioni e dell’H-Index atttraverso Google Scholar. Risulta innovativo che sia offerto come toolbar per Firefox e che poggi su una organizzazione disciplinare collaborativa, che si esplica attraverso il tagging dei contenuti/autori ricercati. Dalla mia esperienza posso dimostrare che, al di là di database citazionali a pagamento come Scopus o Web of Science, Scholar è sempre molto consultato dai docenti e ricercatori, e se Tenurometer riesce a superare i limiti di Publish or Perish, potrà forse aspirare al successo nella comunità accademica. Di seguito qualche info in più dal sito (bold mines):

… Tenurometer is a browser extension that provides a smart interface for Google Scholar, it does not have the limitations of server based citation analysis tools that sit between the user and Google Scholar. At the same time Tenurometer is not an application, such as Publish or Perish, and therefore it is platform independent and runs on every system that supports the Firefox browser. Still, Tenurometer uses Google Scholar, which provides the most comprehensive source of citation data across the sciences and social sciences.

exposes advanced query syntax in a simple way to empower non-experts to submit complex queries such as boolean combinations (and/or/not) of author names and keywords.

provides many advanced features that make it easier and less error prone to compute impact measures based on citations. For example, the user can merge multiple versions of the same paper; exclude papers by different authors with the same name, or other noisy data; filter papers by many criteria such as years, disciplines, name variations, and coauthors; and perform live search over the results.

is a social (crowdsourcing) application that leverages the wisdom of the crowds. It requires users to tag their queries with one or more discipline names, choosing from predefined ISI subject categories or arbitrary tags

Da notare che, oltre all’interessante H-Index universale, che rende comparabili autori di discipline diverse, Tenurometer offre anche indicatori di impatto come il g-index.

Tenurometer is a browser extension that provides a smart interface for Google Scholar, it does not have the limitations of server based citation analysis tools that sit between the user and Google Scholar. At the same time Tenurometer is not an application, such as Publish or Perish, and therefore it is platform independent and runs on every system that supports the Firefox browser. Still, Tenurometer uses Google Scholar, which provides the most comprehensive source of citation data across the sciences and social sciences.
Back to top

Empowers non-experts to submit complex queries and maintains their history

Tenurometer exposes advanced query syntax in a simple way to empower non-experts to submit complex queries such as boolean combinations (and/or/not) of author names and keywords. For example you can search for articles by Jane Smith or JM Smith-White but not JF Smith at Cornell or Stanford. Tenurometer also maintains a history of recent queries to help you remember those complex queries.
Back to top

Allows filtering, sorting, deleting and live search to compute error free impact measures

Tenurometer provides many advanced features that make it easier and less error prone to compute impact measures based on citations. For example, the user can merge multiple versions of the same paper; exclude papers by different authors with the same name, or other noisy data; filter papers by many criteria such as years, disciplines, name variations, and coauthors; and perform live search over the results. The impact measures are dynamically recalculated based on the user’s manipulations.
Back to top

A social application with tagging functionality

Tenurometer is a social (crowdsourcing) application that leverages the wisdom of the crowds. It requires users to tag their queries with one or more discipline names, choosing from predefined ISI subject categories or arbitrary tags. This generates annotations that go into a database, which collects statistics about the various disciplines, such as average number of citations per paper, average number of papers per authors, etc. This data will be made publicly available.
Back to top

Library Mashups 1 – SOPAC 2.0: the trashable, mashable catalog

8 novembre 2009

Per far conoscere Library mashups: exploring new ways to deliver library data, ho pensato di inaugurare una serie di post dedicati ai vari capitoli. Affinché l’impostazione non sia troppo burocratica, non procederò proprio in sequenza. Comincerò la serie con una delle puntate più avvincenti: quella  sul capitolo 12,  SOPAC 2.0: The Trashable, Mashable Catalog, scritto da John Blyberg e dedicato a SOPAC (Social OPAC), l’interfaccia web per i cataloghi di biblioteca creata da Blyberg medesimo, bravissimo programmatore e appassionato di open source e biblioteche.

SOPAC nasce nel 2005 come un progetto open source della Ann Arbor District Library (NdR adesso Blyberg lavora presso la Darien Library), quando a Blyberg viene chiesto di riprogettare l’interfaccia web del catalogo della biblioteca. L’intento del nostro è subito chiaro: disegnare un OPAC che non sia percepito come qualcosa di estrinseco ma che si fonda perfettamente con l’interfaccia web del sito della biblioteca. Dunque SOPAC viene concepito come nativamente integrato nel CMS Drupal, e sviluppato a partire proprio da moduli del Content Management System. La prima interfaccia va online nel 2007 e si presenta molto bene, ricca di funzionalità sociali tipiche della Library 2.0.

Qualcosa però non funziona ancora bene e non permette quell’integrazione seamless tra OPAC e sito web che Blyberg si era proposto. L’interfaccia è da un lato troppo dipendente dalla configurazione del sistema di automazione della AADL e dunque non facilmente esportabile, e dall’altro l’architettura nel suo insieme è troppo poco ricettiva verso i contenuti generati dagli utenti (UGC), che infatti non sono inclusi nell’indice dell’OPAC che viene interrogato all’atto di ricerca di un libro da parte degli utenti.

Così prende il via il progetto SOPAC 2.0, che nasce da un’architettura molto più robusta e concepita in modo da rendere l’interfaccia perfettamente adottabile e adattabile da chiunque. La prima rivoluzione Blyberg la compie “esternalizzando” tutti gli elementi non strettamente inerenti l’interfaccia, in due librerie che accompagnano il prodotto: Locum e Insurge. La prima è un livello di astrazione che viene posto tra l’interfaccia e ciò che sta sotto di essa, ovvero l’ILS (sistema di automazione) specifico usato dalla biblioteca, e che quindi rende veramente l’OPAC agnostico rispetto al sistema sottostante adoperato, mentre la seconda gestisce il nuovo repository di informazioni sociali: ciò che prima era riservato ai soli utenti di una biblioteca (tag, commenti, recensioni, voti), adesso viene esteso a tutte le biblioteche che adottino SOPAC e soprattutto viene utilizzato in fase di ricerca dagli utenti dell’OPAC!

Nel capitolo sono presentati alcuni esempi di come sia facile istanziare le classi delle due librerie: in effetti uno dei driver di SOPAC2 è  proprio la semplicità d’uso anche per il medio IT staff di biblioteca. Il capitolo si conclude con ulteriori esempi di come, essendo SOPAC costruito sul CMS Drupal, sia modulabile e di come i suoi contenuti possano essere integrati davvero in maniera seamless nell’interfaccia web attraverso la composizione e la giustapposizione dei vari blocchi (contenuti del blog/sito della biblioteca con, per esempio, l’elenco dei 50 libri più prestati; contenuti del sito con altri contenuti del sito; contenuti dell’OPAC con altri contenuti dell’OPAC), il tutto con massimi livelli di personalizzazione, flessibilità e… mashabilità (il layout come anche il livello delle informazioni che vengono presentate, possono essere modificati con semplicità, grazie all’architettura di classi e librerie associate a SOPAC). Ugualmente, l’architettura adottata, fa sì che i blocchi di SOPAC possano essere non solo “amalgamati” con contenuti provenienti dall’esterno, ma possano essi stessi venire esportati e pubblicati, per esempio, in un blog o in una pagina web (classico l’esempio del box di ricerca).

Blyberg conclude augurandosi che il numero delle biblioteche che adottano SOPAC 2.0 cresca sempre di più, poiché il reale utilizzo da parte di un numero sempre più ampio di utenti finali è l’unica garanzia perché il progetto continui ad essere sviluppato e il repository di contenuti sociali aggregati ai record bibliografici si arricchisca e divenga sempre più funzionale e utile. Le ultime righe sono quindi un invito alla comunità dei bibliotecari e degli sviluppatori perché aiutino SOPAC a cresce e prosperare, e noi speriamo vivamente che studenti e colleghi interessati all’argomento raccolgano l’invito!

Potete leggere tutti i contenuti relativi al libro attraverso il tag library mashups.