Vatti a fidare dei motori di ricerca… Google ritira il suo appoggio a OAI-PMH, il protocollo adoperato negli archivi aperti per l’harvesting dei metadati, per sposare monogamicamente il Sitemap nella sua versione standard (file XML con elenco di Url del sito).
OAI-PMH è un ottimo protocollo RESTful, che consente a un harvester di sfruttare HTTP per veicolare sei tipi di verbi con cui richiedere informazioni (inclusi i record in esso contenuti) a un repository. OAI-PMH è adottato primariamente nell’ambito degli archivi aperti ma è un protocollo che può rivelarsi utile e soprattutto di facile implementazione anche per altre tipologie di servizi di ricerca.
Se ora gli archivi aperti dovranno costruire i loro elenchi di Url come previsto da Sitemap, una buona notizia arriva per chi ha adottato la piattaforma DSpace: la release 1.5 offre questa funzionalità nativamente.
E’ vero che l’obiettivo dei crawler di Google (e degli altri motori) è sostanzialmente quello di setacciare la Rete in cerca di nuove Url di cui nutrirsi, ed è chiaro che Sitemap XML è molto più conforme e immediato allo scopo. Un rovello però mi resta: il protocollo OAI-PMH è ancora troppo embrionale per rappresentare un’alternativa realisticamente praticabile ai vari Sitemap o è comunque troppo raffinato per le esigenze dei motori di ricerca?
Sono interessanti i commenti alla notizia – i pochi apparsi sul blog di Google Webmaster, e soprattutto quelli apparsi sul blog di Paul Walks. Che ne pensate?
Tag: crawlers, Search Engines, sitemaps