Microformati dublin core: un’introduzione e un visualizzatore

Introduzione

Alcuni giorni fa avevo accennato ai microformati dublin core in una delle tante parentesi che sono solito aprire (e che spesso, come mi viene, “rimproverato” non chiudo).
Cercherò di riprendere brevemente l’argomento.

I microformati

Microformats are markup that allow expression of semantics in an HTML (or XHTML) web page. Programs can extract meaning from a standard web page that is marked up with microformats.

Existing XHTML (and HTML) standards allow for semantics to be embedded and encoded within them. This is done using specific HTML attributes (class, rel, rev).

Adding microformats to a standard HTML web page allows machines to process HTML text and to possibly load data into remote databases. This would allow programs such as web crawlers to find items such as contact information, events, and reviews on web pages.

Fonte: Wikipedia

I microformati sono semplice markup che permette di inserire espressioni semantiche all’interno di pagine (X)HTML. E’ possibile estrarre conoscenza da una pagina web che è marcata con microformati.

Gli attuali standard (X)HTML permettono di includere espressioni semantiche. Questo avviene utilizzando specifici attributi HTML (class, rel, rev).

Aggiungere microformati a una pagina web permette alle macchine di processare il testo html e, eventualmente, salvare i dati in un database remoto. Questo permetterebbe a programmi come i web crawler di trovare informazioni come contatti, eventi e recensioni nelle pagine web.

La spiegazione, piuttosto ridotta, di wikipedia può essere integrata con l’introduzione maggiormente approfondita (e entusiastica) di microformats.org.

Microformato Dublin Core

Sorvolando su cosa sia Dublin Core, approdo direttamente al microformato Dublin Core.
Un semplice esempio basato sulla mia tesi inserita in E-LIS. E-LIS descrive le risorse attraverso metadati dublin core, ma un inserimento di medatadi nel microformato dublin core non sarebbe affatto difficile:
<dl class="dublincore">
<dt>Titolo</dt>
<dd class="title">Navigare fra archivi, biblioteche e musei : le mappe topiche come strumento di armonizzazione</dd>
<dt>Autore</dt>
<dd><a href="https://culturalheritage.wordpress.com/about" class="creator">Salvatore Vassallo</a></dd>
<dt>Identificatore (URL)</dt>
<dd><a href="http://eprints.rclis.org/archive/00008228/" class="identifier">http://eprints.rclis.org/archive/00008228/</a></dd>
<dt>Soggetti:</dt>
<dd class="subject">
<ul>I. Information treatment for information services > IC. Index languages, processes and schemes.</ul>
<ul>I. Information treatment for information services > ID. Knowledge representation.</ul>
<ul>I. Information treatment for information services > IE. Data and metadata structures.</ul>
<ul>I. Information treatment for information services > IG. Information presentation: hypertext, hypermedia.</ul>
<ul>L. Information technology and library technology > LC. Internet, including WWW.</ul>
<ul>I. Information treatment for information services > II. Filtering.</ul>
<ul>I. Information treatment for information services > IA. Cataloging, bibliographic control.</ul>
</dd>
</dl>

E così via.
Ovviamente il layout grafico può essere personalizzato con semplicità attraverso un foglio di stile

Visualizzatore di Microformati Dublin Core

Leandro Mariano López (aka inkel) ha sviluppato un’estensione per Firefox che permette di visualizzare i microformati dublin core presenti nella pagina web. L’estensione è basata su Dublin Core Viewer di cui ho spesso parlato.
Ho cercato di tradurre questa estensione, permettendo la traduzione anche dei metadati, come nel caso di Dublin Core NeViewer.
Il codice utilizzato da inkel è leggermente diverso: non utilizza gli array, ma semplicemente verifica se il termine contenuto in una classe (all’interno di un blocco con classe “dublin core”) esiste all’interno di una lista (la lista di tutti i termini dublincore, incluso dublin core qualified). In ogni caso con un piccolo aiuto dato dalle RegExp ho sostituito il semplice identificatore dublin core con la sua etichetta (traducibile).

Visualizzatore di Microformati Dublin Core

Visualizzatore di Microformati Dublin Core

Invierò le mie modifiche a inkel, nel frattempo è possibile scaricare l’estensione modificata (con il locale in italiano e in inlgese) per chi la volesse provare.

Una pagina che include metadati nel microformato dublin core è, ad esempio, la pagina del progetto.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s