La notizia è passata ieri in primis sulle liste di discussione dedicate al software di Ex Libris Sfx ed è poi dilagata oggi più o meno su tutte le principali mailing list internazionali dedicate alla biblioteconomia: Google Books Search ha rilasciato API pubbliche per l’acquisizione di informazioni sui libri contenuti nel suo database.
Dico “acquisizione di informazioni” perché è bene mettere subito in chiaro che – come rileva giustamente Tim Spalding su NGC4LIB – qui non siamo in presenza di web service à la AWS, laddove le transazioni avvengono in XML e gli utenti hanno la possibilità di fare storage dei dati, lanciare interrogazioni contro database, manipolare le informazioni etc. In GBS API, e in particolare nella Book Viewability API, tutto avviene a livello client-side e ciò rappresenta al contempo una grande possibilità e un limite per le biblioteche e i loro cataloghi.
In pratica le interfacce di programmazione messe a disposizione da Google, sono compilate in JSON, cioè JavaScript che viene interpretato direttamente dal browser dell’utente, cosa che le/gli consente, mentre interroga un OPAC o un catalogo di riviste elettroniche, di accedere alle pagine di GBS dedicate al documento che sta cercando: la biblioteca, in questo caso, rimane al di fuori del processo (e dunque non deve preoccuparsi di laboriose a talvolta impossibili integrazioni di backend), e manifesta la propria presenza solo inviando, all’interno di una pagina web, una richiesta contenente un identificativo ISBN, LCCN o OCLC, verso il database di Google.
Detto ciò, si tratta senza dubbio di un passo in avanti significativo, che aiuta le biblioteche ma anche gli utenti in genere nel reperimento di informazioni sui libri e soprattutto nel riunire tutti i dati utili presenti su Internet circa un particolare item, senza l’obbligo di girare in lungo e in largo e visitare tutti i siti (presumibilmente) papabili… Chiunque può costruirsi le sue richieste: non è necessaria neppure la API key, pure richiesta in molti casi da Google. Basta, con conoscenze davvero minime, costruire una richiesta HTTP GET con i parametri adeguati a quanto richiesto da GBS (e con il limite di caratteri previsto per le richieste di questo tipo) e magari incollare il tutto all’interno del proprio blog o dei record del proprio catalogo o ancora di una pagina creata su Google Pages :-)
Peraltro GBS fornisce anche la possibilità di costruire Url statici, utili in tutti quei casi in cui un utente possa avere disabilitato il JavaScript nel proprio browser (abbiamo detto che tutte le transazioni sono svolte appunto nel browser dell’utente, e non lato server).
Interessanti sperimentazioni su Open Library, Scriblio, che ha subito adattato la sua interfaccia per accogliere la nuova possibilità, l’immancabile LibraryThing (con un avanzamento qui) e finalmente una biblioteca italiana: quella dell’Università di Padova che ha introdotto GBS come target (nel gergo di Sfx) all’interno dei servizi offerti per le risorse elettroniche e anche, all’interno del catalogo online, come database nel quale trovare maggiori informazioni su un testo. Potete vedere una realizzazione pratica seguendo l’indirizzo del libro PERL DBI e poi cliccando su Servizi Esterni -> Google Book Search, per quanto riguarda il catalogo online, e invece cliccando sul pulsante AIRE (in alto a centro pagina), che attiva il menu dei servizi Sfx, nel quale di nuovo trovate la richiesta a GBS, per quanto riguarda le risorse elettroniche.
Le possibilità di richiamare informazioni da GBS sono varie, e rispecchiano il fatto che un libro sia liberamente disponibile alla consultazione in full-text, o che sia solo parzialmente visibile (cioè siano visibili solo alcune sue pagine) o ancora che siano visibili solo degli snippet (piccoli brani interni a una pagina), o infine che nessun tipo di testo sia accessibile all’utente, ma solo la scheda dei metadati bibliografici. Anche le funzionalità che si possono attivare sono molteplici:
- Link to Books in Google Book Search using ISBNs, LCCNs, and OCLC numbers
- Know whether Google Book Search has a specific title and what the viewability of that title is
- Generate links to a thumbnail of the cover of a book
- Generate links to an informational page about a book
- Generate links to a preview of a book
Queste API aperte finalmente destinate ai libri, rappresenteranno un inveramento della mission di Google di organizzare “… the world’s information and make it universally accessible and useful“?
Tag: API, books, google libri, ISBN, javascript, JSON, LCCN, libri, oclc, preview
15 Marzo 2008 alle 6:36 pm
Ciao,
proprio stamattina anche io ho visto, con una certa sorpresa e interesse, questo thread che rimbalzava sulle varie liste di discussione.
Mi pare, come al solito per le soluzioni di Google, ottima per semplicità di gestione (la biblio rimane del tutto al di fuori, o quasi, del processo) ed efficiacia.
Spero di vederne presto un uso massiccio sui cataloghi italiani, che mi piacerebbe si riempissero almeno di immagini di copertine… Un po’ di colore nn guasta mai ;)
15 Marzo 2008 alle 7:01 pm
Caro Andrea, sì, questa delle API sui libri rappresenta proprio una bella notizia e comunque un’occasione da cogliere per le biblioteche.
Tra le varie liste, sto seguendo con molto interesse quella di Sfx, perché lì è stata sollevata una questione importante: perché Sfx sfrutti GBS come target, cioè come database da cui acquisire informazioni e/o full-text, è necessario che la query venga lanciata dal server Sfx e che dunque l’elaborazione non avvenga più client-side bensì attraverso uno script CGI.
Ora, Google in teoria è contrario a questo tipo di utilizzo, perché sostiene che l’utilità dell’elaborazione sul computer dell’utente sta nel fatto che in questo caso viene correttamente riconosciuta la provenienza dell’IP e quindi mostrati i servizi, il full-text, in particolare, solo a chi ha diritto a vederlo.
Il problema potrebbe essere aggirato se, quando Sfx costruisce il suo menu e dunque lancia la query a GBS, potesse accodare alla URL, tra i vari metadati, anche l’indirizzo IP dell’utente. Anche questo però sembra impossibile a realizzarsi.
Insomma, attualmente su Sfx potrebbe nascere il problema che Google chiuda il servizio dopo un certo numero di richieste provenienti dal server (vedi FAQ n. 4). Credo che la questione si dovrà risolvere in questi giorni…
Riguardo alle copertine, LibraryThing ha messo a punto anche un piccolo JavaScript per acquisirle direttamente da Google, piuttosto che da Amazon o IBS, e anche questo mi sembra di grande utilità se è vero, come sostiene il nostro Tim Spalding, che il database di Google è in assoluto il più vasto cui attingere…
Il fatto che Padova sia stata tra le prime quattro biblioteche al mondo a sperimentare le nuove API è un buon segno, e d’altronde i nostri colleghi patavini sono molto avanti su queste sperimentazioni – credo siano gli unici in Italia a derivare le copertine dei libri dai siti di e-commerce e pubblicarle sui record dell’OPAC Aleph (anche questo attraverso un piccolo pezzo di JavaScript); poi hanno la Sbarra e tante altre belle cosine… Luca Drago – l’artefice di queste soluzioni – e gli altri del CAB sono davvero in gamba e pure tremendamente simpatici :-)!
17 Marzo 2008 alle 2:34 pm
Grazie per la citazione e per i complimenti Bonaria!
Per chiarezza devo solo aggiungere una precisazione: mentre per SFX Padova utilizza le API di Google integrate da ExLibris (la sperimentazione è stata seguita da Lucia Soranzo in questi giorni) per il Catalogo non utilizziamo ancora le API di GBS ed infatti viene restituito un link più “stupido”.
In pratica nei record in cui è presente un ISBN questo viene utilizzato per creare un link ai “Servizi esterni” (Amazon, IBS, GBS…, ma se ne potrebbero aggiungere altri) senza alcuna verifica preventiva sulle pagine restituite e quindi senza informazioni sul livello di visibilità disponibile (per i curiosi il Javascript è qui: http://catalogo.unipd.it/exlibris/aleph/u18_2/alephe/www_f_ita/icon/css_js/thumbs.js)
Vedremo come integrare le API nel nostro script oppure se passare direttamente attraverso l’integrazione di ExLibris.
Ciao e buon lavoro!
17 Marzo 2008 alle 9:43 pm
Ciao Luca, grazie per la precisazione. Trovo comunque molto comodo poter disporre nel catalogo della possibilità di accedere ad altri servizi, come appunto GBS, e il tutto senza nemmeno ricaricare la pagina ;-)
Teneteci aggiornati sugli sviluppi, mi raccomando!