Open data, Web semantico e Science 2.0

Studio il Web semantico (grazie a certi certi blogger fucine di idee e fornitori di account), organizzo il filo per Sci(bzaar)Net e butto giù due appunti, giusto per riordinare le idee, ma ci ritornerò. Quello che segue continua idealmente il discorso sui dati aperti e il Web semantico (strettamente intrecciati) avviato qualche post fa – in attesa di scrivere qualcosa di decente in particolare su Web semantico e biblioteche.

Qualche tempo fa Richard Poynder ha intervistato lo scienziato Peter Murray-Rust sugli Open Data, e sulle differenze, le convergenze e le sovrapposizioni tra questi e l’open access. Open Data incrocia però soprattutto Linked Data, e così Web semantico, licenze, rappresentazione delle informazioni con Rdf, dati leggibili dalle macchine più che dagli esseri umani e Science 2.0:

… an online interactive environment where a great deal of the information used is more likely to have been discovered, aggregated and distributed by software and machines than it is by humans

Interessante e tangente il progetto di Open Notebook Science dell’apertura ed esposizione dei dati scientifici (chimici in questo caso) e dei risultati (anche fallimentari) di laboratorio. La cosa significativa è che la questione si riallaccia da un lato all’apertura ai dati e dall’altro alla questione del Web semantico, che gli scienziati promotori del progetto Open Data, vedono possibile (giustamente) solo grazie alla apertura, gratuità e possibilità di riutilizzo dei dati (ciò che può essere garantito appunto non dalla sola gratuità ma da particolari condizioni poste sulla proprietà dei dati). Circolarità, loop virtuoso.

Dai dati chimici ai mashup creati sulla base di dati prodotti ai feed aggregati, la parola chiave è Mine the data.

L’Open Access implica letteratura accademica digitale, online, gratuita, e libera dalle restrizioni del copyright e delle licenze. E questo, dice Murray-Rust, è esattamente ciò che è necessario per costruire il semantic Web. [dall’intervista, pag. 1]

Altro elemento che aggiungo a quelli elencati finora è la politica opaca che spesso ha accompagnato i tentativi subdoli da parte di alcuni editori di applicare limitazioni di copyright sui dati, che dovrebbero invece essere sprotetti. Dunque Murray-Rust, già paladino dell’OA si è convertito alla difesa dell’OD con una motivazione molto chiara:

For where the Open Access movement is concerned only with ensuring that scholarly papers are human readable, the Open Data movement requires that they are also machine readable. And since Open Data implies reuse, it is vital that licences are provided that specifically permit this. [sempre dal post di Poynder-Murray Rust]

E concludo guardando alla questione open data (perfino) dal punto di vista dei peer reviewers, che, in uno studio recente affermano che nel loro processo di revisione degli articoli da pubblicare sulle riviste, avrebbero bisogno di accedere ai dati, ai risultati e alle procedure degli esperimenti, anche ai raw data.

A majority of reviewers and editors also said would be desirable to be able to review authors’ data as part of peer rereview.

Tag: , , ,

13 Risposte to “Open data, Web semantico e Science 2.0”

  1. Fabio Metitieri Says:

    Mi sfugge come il Web semantico sia collegato all’apertura dei dati. Voglio dire: e’ banale che se i dati non sono disponibii non possono essere trattati in alcun modo, semantico o no, ma il solo fatto di averli a disposizione in modo open non implica affatto che il trattarli per una loro manipolazione semantica diventi piu’ facile o meno costoso.

    Poi non lo so… si parla sempre di Semantic Web come soluzione universale, come qualcosa di imminente e definitivo. Ogni tanto mi sembra la versione in positivo dell’Ordigno-di-fine-di-mondo del dottor Stranamore.

    Io amo la memoria storica: mi piacerebbe che ogni intervento sul Semantic Web fosse aperto da un piccolo reminder, da un cappellino che ricordasse: “Il Semantic Web, di cui Tim Berners-Lee parla dal 1997 e di cui finora si e’ visto poco o nulla, date le difficolta’ e i costi che comporta, e che probabilmente per alcuni altri anni non portera’ risultati fruibili dalla massa dei navigatori”….

    Ciao, Fabio.

  2. Matteo Brunati Says:

    Ciao Fabio,
    partirei da un piccolo esempio, pratico e semplice per una volta, per favorire una migliore fruizione di una delle cose che usiamo tutti maggiormente: la posta elettronica.
    -> Seek
    -> Cos’e’ il faceted browsing? Hai Mozilla Thunderbird?

    Direi che e’ solo questione di iniziare a vedere alcune cose.
    Lo sforzo per definire la struttura crea fortunatamente alcuni effetti collaterali degni di nota.

    Per quanto riguarda il discorso dei dati: diciamo che come XML e’ stata una rivoluzione per la comunicazione e il passaggio dei dati e il loro interscambio, RDF lo e’ per l’integrazione di dati di cui sappiamo poco o nulla.

    Non e’ una soluzione universale, ma rappresenta la sintesi di direzioni diverse, che mirano a migliorare la gestione dell’informazione.

    In ogni caso la tecnologia sarebbe un passo falso se non la si anticipa con la visione.
    Deve essere chiaro dove si puo’ almeno inizialmente andare a parare, per poi collettivamente rendere l’idea pian piano realta’.

    La manipolazione semantica racchiude una definizione ambigua e proprio per questo difficile da comprendere in modo univoco: io direi che definire una modalita’ per cui alcuni dati possono essere gestiti in forma semi-strutturata, secondo un linguaggio comune e con un minimo di struttura condivisa ( il grafo di rdf per capirci ), senza dover mettersi d’accordo direttamente con i formati stessi o lo schema da usare, non e’ poco.

    In un ambiente aperto e decentralizzato come il web, be’, e’ la condizione per creare cose nuove, che semplificano molto sulla problematica dell’integrazione dati.

    Si sta completando l’infrastruttura per rendere tutto questo possibile, e iniziano i primi utilizzi massivi.
    Ora vedremo se ne vale la pena, ben vengano commenti e idee per portare alla gente un valore aggiunto davvero grande, che forse e’ stato comunicato a volte male e a volte in forme troppo astratte.

    E comunque non serve tutta la visione per trarre vantaggio da questo percorso.
    O meglio: non serve doverla usare tutta per avere delle migliorie nella gestione dell’informazione che subiamo quotidianamente.

    -> Origini, motivazioni e regole di evoluzione del World Wide Web
    -> Semarketing

    Questo lo stato dell’arte:
    -> State of the Semantic Web

  3. Matteo Brunati Says:

    Aggiungo una presentazione che calza a pennello, soprattutto per rispondere al meglio ai dubbi di Fabio, o comunque per dissiparne qualcuno…

    -> Semantic Web 2.0

    Sono elencati e spiegati al volo i maggiori misunderstanding sul semantic web , ottima sintesi direi .)

  4. shaitan Says:

    Scrivo solo per dire che qualunque cosa sostenga il dr. Harry Chen, RDF è uno dei linguaggi, non _il_ linguaggio.

  5. Fabio Metitieri Says:

    Brunati, una vaga idea di cosa fossero Rdf e Owl l’avevo gia’ da parecchio tempo. Interessanti le slide che hai segnalato, ma mi pare di aver capito che:

    – le ontologie hanno ancora qualche problema;

    – un sistema di produzione automatica dei dati semantici che sia abbastanza affidabile non c’e’ ancora;

    – tra i progetti utilizzabili dalla massa degli utenti, forse c’e’ solo l’inserimento di un po’ di Rdf in Wikipedia, di cui sinceramente non ho colto bene l’utilita’ pratica, per quanto mi e’ parso di aver capito che e’ stato fatto finora;

    – Un vero e proprio motore di ricerca semantico che indicizzi tutte le risorse Web non esiste ancora ed e’ ben lungi dall’essere realizzato;

    – Non vedo che cosa c’entri il Web 2.0 (che secondo me non esiste) con la semantica.

    Il tutto dopo 11 anni che si parla e che si lavora sul semantic Web. Per cui, la proposta di inserire sempre negli interventi su questi argomenti il reminder che ho suggerito qui, se non altro per amore di contestualizzazione e di memoria storica, mi pare piu’ che valido.

    Oltre a questo, non vedo cosa c’entrino il faceted browsing o il tagging con la semantica.

    Tutto sommato, cntinuo a ritenere valido quanto riccardo Ridi e io avevamo scritto qui nel lontano 2005.

    Ciao, Fabio.

  6. Matteo Brunati Says:

    Provo a dare delle sensazioni, e mi rimetto a qualche esempio piu’ pragmatico, per quanto posso fare dalla mia esperienza di appassionato, alla seconda meta’ di maggio…

    La mia sensazione e’ questa: il Web e’ nato quale spazio condiviso, creando prima una infrastruttura incompresa e combattuta dagli enti normali, come la storia ci insegna.

    Quella visione e’ stata forse diffusa poco, visto che di fatto, poi, l’innovazione di business sullo strumento Web, ha dovuto e potuto essersi sedimentato, per far arrivare alla gente, almeno una parte molto pragmatica di tutto questo.

    Ma ha nascosto in parte, il continuo work in progress dell’essere Web.

    La conoscenza, la gestione dell’informazione, non sara’ mai precisa e con contorni netti.
    Almeno a livello globale.

    Qualcuno ha creato specifiche e linguaggi tipo HTML e HTTP e browser, prima di poter avere un utilizzo chiaro e facilmene spiegabile per tutta la massa di persone che potrebbero trarne vantaggio.

    E’ giusto e doveroso ricordare che sono 11 anni che si parla di Semantic Web, in un modo o nell’altro: io dico che sono, di fatto, molti di piu’.
    E’ dal 90 e 89 che qualcuno parla di Web.

    Il Semantic Web e’ un passaggio, uno scalino nella crescita di uno strumento ben piu’ antico. Ma e’ la visione stessa del Web, solo una volta piu’ nebulosa, oggi sempre piu’ chiara e gia’ in parte presente.

    Quindi concordo in pieno con te che serve creare maggiore memoria storica di quello che si dice e di quello che si sbaglia, nel tempo.
    Come il Web2.0 serve ad identificare un certo passaggio sociale nell’uso del Web, ma come tecnologia e’ puro marketing, cosi’ lo e’ il Web3 e via dicendo.

    Ma forse e’ un modo, piu’ commerciale e legato al business, di far arrivare certi concetti alla gente comune.

    Letto quello che dicevi nel 2005: cito

    La carica fortemente utopica delle ricerche in questo settore potrebbe comunque condurre a risultati sia teorici che tecnologici utilmente spendibili anche praticamente, soprattutto se ci si «rassegnasse» a ragionare in termini di tanti piccoli Web semantici dotati di ontologie e metadati coerenti e sostenibili su scala locale, senza illudersi di poter estendere, moltiplicare e fondere fra loro tali oasi fino a rendere lussureggiante, ovvero semanticamente coerente, l’intero World Wide Web.

    In fondo si sta dicendo le stesse cose: sul materiale che ho segnalato, emerge una risposta a quello che dici qui, che forse nel 2005 non era abbastanza chiara.

    Punto uno: questo era vero nel 2005, oggi sono stati creati i ponti per unire le isole, on forme abbastanza indolori, e sono quasi del tutto completate.
    E’ servito un approccio bottom-up comunque, per far emergere questa cosa.

    Punto secondo.
    Non serve strutturare tutto per averne un vantaggio reale.
    Non serve complicarci la vita piu’ di quanto lo sia gia’, obbligando le persone ad imparare a fare cose astruse, come le ontologie.

    Ognuno puo’ trarre vantaggio, piccolo o grande che sia, dagli effetti collaterali di cui giustamente parli.

    Ecco perche’ ho citato il faceted browsing e Seek: usando in una forma immediata su un mezzo conosciuto e massivo la potenzialita’ di una navigazione strutturata, senza sforzo apparente fa capire uno dei possibili vantaggi di queste metodologie, senza dover entrare nella loro complessita’.

    La trovabilita’. Il tempo che si guadagna e il minor sforzo cognitivo che si deve fare.
    Grazie all’utilizzo di concetti e strumenti di derivazione di tutto questo.

    Finisco riguardo al motore di ricerca semantico: non mi sono mai interessato tanto all’estrazione automatica di semantica da dati non strutturati, ma qui e’ in gioco una questione diametralmente opposta.

    Passiamo tutti noi moltissimo tempo a compilare form, campi di testo e altro.
    Creiamo dati, in forme che la nostra mente interpreta correttamente.
    Tipo il commento che sto inserendo adesso, ha un campo che contiene il nome.

    L’idea e’ di non cambiare in questo momento questo processo.
    Ma di integrarlo, per aumentare la semantica che gia’ stiamo inserendo tutti i giorni, in forme anche interpretabili maggiormente dai sistemi automatici.

    Questo per la massa ha poco impatto, per quello che poi si puo’ fare e migliorare invece, tantissimo potenziale.

    Se penso ad un motore di ricerca semantico, al momento penso a Yahoo e a valutare le differenze con Google nella bonta’ dei risultati.
    Nel fatto che RDFa sia sempre piu’ adottato.
    Una fonte di oggi puo’ essere questa, per capire meglio:
    -> Reflecting on the news Digg embraces RDFa

    E nel fatto che l’accademia dietro al semantic Web si sia mossa per avvicinarsi alla gente comune.

    Altro arrivera’ comunque, mi stai stimolando a portare esempi concreti e ti ringrazio Fabio.

    Chiudo per tornare in topic con quanto fatto emergere da Bonaria: apertura dei dati.

    Possiamo discutere moltissimo del livello tecnologico, se vogliamo: ma oggi e’ piu’ importante smuovere il lato culturale nel promuovere il passaggio e i vantaggi che abbiamo nel condividere per competere ad un livello successivo.
    Darsi proprieta’ sui dati e’ un’aberrazione in molti ambiti di normative nate con ben altri scopi.

    E’ una fortuna che ci siano voluti 11 anni per avere certi strumenti e certe tecnologie. Se non abbiamo la forza, le vie legali e le aperture mentali per poterli sfruttare appieno nemmeno oggi, sarebbe stata fatica sprecata averli prima forse.

    Ti riquoto Fabio:

    Mi sfugge come il Web semantico sia collegato all’apertura dei dati. Voglio dire: e’ banale che se i dati non sono disponibii non possono essere trattati in alcun modo, semantico o no, ma il solo fatto di averli a disposizione in modo open non implica affatto che il trattarli per una loro manipolazione semantica diventi piu’ facile o meno costoso.

    Mettiamola cosi’: prima metterli a disposizione era folle, perche’ in ogni caso poterli gestire al meglio creava dei costi enormi, e delle complicazioni notevoli, per mancanza di strumenti e di tempi adeguati.

    E quindi il problema non si poneva nemmeno.

    Oggi invece potenzialmente abbiamo la possibilita’ tecnica: questo spinge ad innovare e a chiedersi, e a mettere in discussione vecchi assunti dati per scontati forse…
    Averli non implica che sia piu’ facile, ma non e’ tanto la manipolazione semantica che mi viene in mente, quanto la facilita’ ,mai raggiunta prima, di poterli integrare ed aggregare a costi ben diversi da un tempo.

    Non e’ un caso che il Linked Data sia la nuova bandiera da far sventolare sul Semantic Web.

    Per chiudere un po’, lancerei un altro sasso:
    -> Comments about recent Semantic Gang Podcast

    dove riprendo una cosa che ti fara’ piacere Fabio:

    History is a great tutor, answers to many of today’s problems always lie somewhere in plain sight of the past.

    e chiuderei con un’altra intepretazione del perche’ vale la pena continuare in certe direzioni, con piu’ umilta’ forse di anni fa, ma pur sempre in avanti.
    -> Perspective Applications

    ops, sono andato lungo, mea culpa .)

  7. Antonio LdF Says:

    Ciao Bonaria,
    perdona l’OT ma non so ho la tua mail.
    Ho visto che sarai all’Iword camp e sarei felice di conoscerti.
    Non dovessi vederti, ma tu dovessi veder me, fai un fischio!
    :-)

  8. bonaria Says:

    Ciao Antonio, nessun problema per l’OT :)
    Purtroppo a causa di vari impegni concomitanti non sono riuscita a partecipare al barcamp: ci racconti com’è andato?
    Grazie e (spero) a presto!

  9. Casual.info.in.a.bottle » Blog Archive » Origini, motivazioni e regole di evoluzione del World Wide Web, per collocare nel modo giusto l’Enterprise 2.0 Says:

    […] L’ho segnalata in altri lidi, ma vale la pena, nella calura di questi giorni, rinfrescarsi la mente con simile perle. E poi magari non era facile da scovare nei post lunghi, sia mai che non si veda… […]

  10. Paolo Manzelli Says:

    WEB- SCIENCE, DNA & Music :
    frontiers on transdisciplinary science & art
    SEARCH for Partners .

    Genn-2009/ 10 Firenze paolo manzelli pmanzelli@gmail.com ; ( http://www.egocreanet.it)

    DNA is more than just an instruction for protein’s production for life. In fact, genes may actually function more like a well-orchestrated symphony of communication .
    Some Scientists are finding that DNA—the blueprint of life – is really more like a “musical antenna” than a static blueprint. Some information about genes of DNA are active constantly, like the sound of a piano in some symphonies, while other protein’s interactive information wait for the right signal, to reply to the DNA’s signaling in a resonant synchronic cyber-system .
    Till now researchers on the issue DNA-MUSIC report in the Science journals their studies looking at the root cells of the wild mustard plant, in this case they’ve found that genes turn on and off in complex and rhythmic ways.
    Another team looked at sea urchin eggs and found a jazz-like feedback between genes, with each one affecting the performance of others. Understanding the role of timing in DNA expression could lead to new insights into developmental disorders, in plants, animals and even humans.

    Starting from those reseachers ,the Open Network for new science and art (ON-NS&A/ EGOCREANET) would search for partners for a new project idea that is prelminarly synthetized in :
    http://www.edscuola.it/archivio/lre/DNA-MUSIC.pdf ; http://www.wbabin.net/science/manzelli54.pdf
    see also : http://pubs.acs.org/doi/abs/10.1021/jp7112297

    SO PLEASE I HOPE IN YOUR INTEREST AND COLLABORATION AS PARTNERS OF SUCH INTERNATIONAL PROJECT PROPOSAL ON THE ISSUE
    “SCIENCE , DNA &MUSIC” :- 2009, Europe year of Creativity and Innovazion

    APPLICATION CAN BE ADRESSED TO – PAOLO MANZELLI- PMANZELLI@GMAIL.COM ; phone +39/055/4573135

    OPEN NETWORK FOR NEW SCIENCE & ART

  11. Le leggi su Internet in versione RDFa, integrate in Sig.ma, ovvero: il Web semantico oltre Google : Casual.info.in.a.bottle Says:

    […] puo’ creare davvero qualcosa di nuovo. Una nuova trasparenza? La mia sensazione è questa. E mi dispiace che il caro Fabio Metitieri non ci sia più per non dire, con la sua acutezza, che stiam…: il confronto duro a volte che creava era comunque stimolante per andare oltre, per portare […]

  12. Lessig, Fini, e Open Data: ovvero la libertà non è solo questione di principio : Casual.info.in.a.bottle Says:

    […] UPDATE: aggiungo un riferimento datato 2008, che ritengo utile come confronto e come discussione, dove c’era anche Fabio Metitieri che interveniva, tra le altre cose. Alcuni elementi non sono così recenti, in effetti. -> Open data, Web semantico e Science 2.0 […]

  13. Liberate i dati: da Nova24 a Facebook, dagli Open Data al Semantic Web : Casual.info.in.a.bottle Says:

    […] Si era partiti da qui a parlare di Open Data e di strada un po’, è stata fatta per fortuna -> Open data, Web semantico e Science 2.0 […]

Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...


%d blogger cliccano Mi Piace per questo: