Archive for the ‘Search Engines’ Category

Google Books fa pace con gli editori e promette guadagni per tutti (comprese le biblioteche!)

29 ottobre 2008

Con un’azione che si riverbera su molteplici piani, Google Books risolve i suoi problemi legali, incrementa la possibilità (legittima) di trarre ricavi dai suoi progetti di digitalizzazione e implementa una modalità di pubblicazione online che (tenta di) risolve(re) l’annosa questione dei libri orfani (quei libri ancora sotto copyirght ma per i quali non si riesce a risalire al detentore dei diritti) e dei libri fuori stampa (a volte le due categorie coincidono).

Contestualmente alla composizione dei conflitti con gli editori (risoluzione di due cause pendenti), il motore di Mountain View aprirà un registro dei diritti per autori e publisher – sperando che la possibilità di guadagnare possa spingere i detentori dei diritti degli orphan works a farsi avanti e reclamare quanto di loro pertinenza senza lasciarlo nel limbo giuridico – e darà inizio alla commercializzazione dei libri fin qui digitalizzati. Dal NYT:

Libraries, universities, and other organizations will also be able to purchase an institutional subscription, which will give users the ability to access the full text of all the titles in the Google Books index. This, depending on the pricing, could turn out to be a revolutionary development for libraries.

E, dal blog dello stesso Google Books:

This agreement is truly groundbreaking in three ways. First, it will give readers digital access to millions of in-copyright books; second, it will create a new market for authors and publishers to sell their works; and third, it will further the efforts of our library partners to preserve and maintain their collections while making books more accessible to students, readers and academic researchers.

Su questa apertura di Google – che per inciso mi sembra una mossa realmente groundbreaking – non ho ancora le idee chiare, ma credo senz’altro alzi di un (altro) livello il confronto con editori, autori e anche biblioteche (per ora solo statunitensi). Devo però anche dire che avrei auspicato che il problema dei libri orfani (ma anche di quelli out-of-print, per i quali davvero le biblioteche svolgono un ruolo di conservazione della memoria insostituibile…) potesse aspirare a una risoluzione non esclusivamente orientata al ricavo economico (ma alla liberazione dei libri, per esempio – anche se il miraggio del guadagno potrebbe almeno contribuire a una chiara definizione dello status di questa particolare tipologia di testi).

Pur non condividendo la stessa idea di copyirght degli editori, alla fine Google ha trovato un onorevole compromesso sottraendosi alle cause legali ma anche proponendo una visione win-win. Perché, oltre ai libri orfani, anche i libri “in-copyright, out-of-print” ritornano ad avere un mercato che avevano perso (magari anche ingiustamente, perché obiettivamente che i libri vadano fuori stampa dopo così poco tempo è una follia!) – e questo nuovo mercato ora viene spalancato proprio grazie alle digitalizzazioni di Google.

Occorre dire che le biblioteche pubbliche e universitarie avranno la possibilità sia di sottoscrivere abbonamenti alle collezioni proposte da Google Books sia di avere accesso gratuito – solo da una postazione interna alla biblioteca – ai libri fuori commercio digitalizzati e quindi disponibili online (sorta di compensazione per tutto il lavoro di preservazione da esse svolto – lavoro onestamente e pubblicamente riconosciuto da Google).

A fronte dei pacchetti di ebooks o delle piattaforme alla ebrary, bisognerà vedere quanto la forza di milioni di digitalizzazioni e la diversificazione della provenienza dei testi (che vengono non solo da 22.000 editori ma anche dalle più importanti biblioteche al mondo!) spingerà Google più avanti dei suoi concorrenti… Sarà certamente interessante valutare, oltre al valore del mero accesso ai contenuti digitali, anche i servizi editoriali e informativi aggiuntivi offerti dai vari provider. Per esempio, ebrary offre l’integrazione delle collezioni di e-book con le altre risorse elettroniche della biblioteca (es.: con quelle di reference, con le banche dati bibliografiche etc.), ma Google ha dalla sua l’integrazione con… l’intero Web!

I suoi tool di ricerca di citazioni negli e-book così come negli articoli degli e-journal o nei siti web sono una bella finestra aperta sul mondo. L’ideale – come sempre per gli utenti di una biblioteca – sarebbe poter disporre di entrambe le soluzioni e, per esempio, poter consultare al volo le citazioni di un autore selezionando il suo nome all’interno di un e-book e scegliendo un ipotetico “verifica gli articoli di questo autore censiti in Web of Science” (-> banca dati bibliografica a pagamento), così come, con lo stesso meccanismo, scandagliare le parole più ricorrenti o trovare su una mappa i luoghi citati nel testo grazie a Google Books… E così via: su questa strada gli incroci possibili sono teoricamente infiniti.

Interessante il punto di vista dell’Open Access advocate Peter Suber sull’intera vicenda, nonché molti dei commenti seguiti all’annuncio di Google, linkati alla fine del post. Sul sito italiano di Google Libri, invece, una sintetica ma chiara spiegazione in italiano. E voi, che ne pensate?

[dimenticavo: l’accordo con editori/autori è costato a Google la modica cifra di 125 milioni di dollari]

Do it ourselves: Social Technologies for Information Retrieval

13 ottobre 2008

Il workshop Do it ourselves: Social Technologies for Information Retrieval si è svolto il mattino del secondo giorno dell’ottimo convegno ELISAD 2008: si è trattato di un incontro molto partecipato, con bibliotecari e documentalisti provenienti da diverse nazioni europee. Abbiamo cominciato con una presentazione dell’attuale panorama informativo e delle sue tendenze focalizzato sul surplus di contenuti che spesso investe l’utente medio (lo stesso che statisticamente lo ha prodotto!).

Il peso dell’information overload – che i documentalisti e i bibliotecari ben conoscono e che tanto spesso sono chiamati ad attenuare – acquista così una nuova intensità e la sovrabbondanza di contenuti online ci spinge a costruire nuovi strumenti sempre più raffinati di organizzazione e selezione dei contenuti digitali, utili sia per usi interni – auto-formazione – sia soprattutto per aiutare i nostri utenti a svolgere una navigazione consapevole, adeguata ed efficace.

Tra i tool che negli ultimi tempi i grandi o piccoli provider hanno proposto sulla scena 2.0, ho scelto di mostrare l’utilizzo di Google CSE (Customised Search Engine), una piattaforma per realizzare motori di ricerca personalizzati proposta da Google gratuitamente a tutti coloro che vogliano aprire un account presso la società di Mountain View. Google CSE è in tutto e per tutto un vero motore di ricerca, che usufruisce della raffinatezza e dell’efficacia che l’indice di Google può vantare e della semplicità che ha fatto di Google un marchio affidabile e il motore più utilizzato e amato al mondo.

CSE propone ai suoi utilizzatori un pannello di controllo nel quale è possibile stabilire i siti che andranno utilizzati nell’indice, le parole chiave per delimitare il focus delle ricerche, i perfezionamenti (refinement, nel linguaggio di Google) per restringere ulteriormente i risultati a determinati topic o tipologie di documenti, diversi strumenti per calibrare il ranking generale del risultati (per sviluppi più raffinati in CSE si può operare anche direttamente sull’XML che determina la configurazione del motore), la possibilità di personalizzare l’interfaccia e infine il codice, per coloro i quali desiderano embeddare direttamente il motore nel proprio sito o blog.

I partecipanti al workshop hanno avuto la possibilità di sperimentare l’uso di CSE: suddivisi in quattro gruppi – per ognuno dei quali era disponibile un computer collegato a Internet – hanno adoperato la griglia proposta durante la presentazione per provare a sviluppare un motore personalizzato ritagliato sulle particolari esigenze dei centri di documentazione e delle biblioteche sulle dipendenze. Durante la mezz’ora dedicata all’esercitazione diverse sono state le domande e le sperimentazioni pratiche – credo a testimonianza del fatto che Google CSE sia stato percepito come uno strumento di immediata utilità per coloro i quali si trovano ogni giorno a sperimentare le difficoltà della costruzione di filtri per circoscrivere le informazioni di qualità.

Società commerciali e biblioteche: un binomio pericoloso?

25 Maggio 2008

Sic transit gloria mundi – dicevano gli antichi… Microsoft ha realizzato – dopo più di due anni dalla sua messa in produzione – di non avere un business model per i suoi Books Search e Academics Search e si appresta ad azzerare i programmi si digitalizzazione e le interfacce di ricerca da un momento all’altro. Anzi, pur essendo l’annuncio sul blog aziendale solo del 23 u.s., alcuni servizi sono stati già tagliati. Leggo incredula nelle mailing list dedicate a Sfx (software per la gestione delle riviste elettroniche) come per esempio i link nel servizio di ricerca Academics (molto utile e devo dire da me molto apprezzato) siano già stati spenti – senza neppure una mail di preavviso!

Anche se diverse e importanti biblioteche hanno negli anni passati scannerizzato il proprio patrimonio grazie al programma di Microsoft, mi viene da ripensare a ciò che un grande uomo disse in un convegno, un anno fa a Barcelona: “le biblioteche potrebbero avere milioni di dollari dalle fondazioni per creare piani di digitalizzazione in-house e invece preferiscono affidarsi all’impresa commerciale di turno”.

Forse a volte perdiamo di vista il fatto che siamo istituzioni pubbliche, che la nostra mission è far durare gli artefatti (materiali e virtuali), che il nostro profilo istituzionale ci impone di una politica di preservazione teoricamente sine die, non agganciata ai mutevoli business model delle aziende. Poi a un (altro) convegno senti che per tramandare le informazioni sulle scorie radioattive gli scienziati si servono dei papiri e capisci che forse abbiamo imboccato una strada pericolosa.

Adesso, a fare la parte del leone, rimane Google, i suoi programmi di digitalizzazione, il suo (ottimo) Books Search. E sì che Microsoft aveva aderito inizialmente all’Open Content Alliance – pur tradendo i suoi principi dopo poco e mettendosi a fare la concorrenza a Google sul fronte del divieto agli altri motori di effettuare ricerche nei suoi contenuti (quel piccolo vizietto nel quale un po’ tutti i grandi provider di informazioni e contenuti multimediali incappano…).

A darci un altro segnale, interviene in questi giorni anche OCLC – pur da me molto ammirato, in particolare per il suo WorldCat e per le sue interessanti (e molto finanziate) iniziative per far avanzare tecnologicamente le biblioteche. OCLC è un grande consorzio internazionale di biblioteche, i cui membri usufruiscono di molte e pregevolissime funzionalità ma anche di limitazioni in merito alla piena disponibilità dei propri dati (= record bibliografici).

Ecco, ora OCLC ha deciso di essere più liberale e concede alle biblioteche di utilizzare i propri dati. Per farci cosa? Beh, per darli a Google:

OCLC and Google Inc. have signed an agreement to exchange data that will facilitate the discovery of library collections through Google search services.

Under terms of the agreement, OCLC member libraries participating in the Google Book Search™ program, which makes the full text of more than one million books searchable, may share their WorldCat-derived MARC records with Google to better facilitate discovery of library collections through Google.

Google will link from Google Book Search to WorldCat.org, which will drive traffic to library OPACs and other library services. Google will share data and links to digitized books with OCLC, which will make it possible for OCLC to represent the digitized collections of OCLC member libraries in WorldCat.

Personalmente sono molto felice dell’accordo e della possibilità che finalmente i record dei libri digitalizzati rinchiusi nei database delle biblioteche possano essere scovati con ricerche in Rete e linkati da Google Books. Però mi chiedo che succederebbe se un domani anche a Mountain View realizzassero all’improvviso che non hanno un vero undelying business model per tutti questi divertissement, oppure che quello che hanno non basta più.

Le biblioteche dovrebbero cominciare a pensare che tutto ciò che si regge su accordi con società commerciali gode di un equilibrio potenzialmente molto fragile