Multilingual thesaurus or ontologies and Topic Maps

For italian people see also the original post and the review of this thesis.

I dedicate this post to the Joint Research Centre – European Commission of Ispra and to Carlo Ferigato who selected for this work one of my fellow student…
Well, she is certainly a skilful cataloguer, but I don’t know if she is able to manage thesaurus or ontologies.
I must say great game and good luck mates ūüôā
Maybe this post could also help her (and them) ;-).

This post is about multilingual thesaurus or ontologies.

The problem is underlined in several translations of Vanda Broughton’s manual Essential Thesaurus Construction: hierarchical relations (narrower term  and broader term) could be different according to the language.

A simple example.

Continue reading

Advertisements

FRAD – ISAAR(CPF) – EAC-CPF – Topic Maps Mapping

Italian Version

A corollary subject of my phd thesis was the analysis of parallelisms between libriarian and archival world.
One of the points of contact is in the description of agents and in the costitution of authority files.

For those aims, a mapping between FRAD (Functional Requirements for Authority Data) and ISAAR(CPF) (International Standard Archival Authority Record for Corporate Bodies, persons and families) could be useful.

In 2008 the names project developed a mirror mapping between ISAAR, FRAD and EAC (EAC 2004 beta version).

My mapping is quite different:

  • It’s from the point of view of FRAD (instead of ISAAR)
  • It uses the new EAC-CPF
  • It provides some ideas to how express FRAD and ISAAR elements in Topic Maps

Probably it’s a bit rough and incomplete, but if you want to take a look…

edit: it seems that university server has some problems… you can download PDF version here

Mappatura FRAD – ISAAR(CPF) – EAC-CPF – Topic Maps

English version

Aggiornamento 2010-09-23: corretti errori di copia e incolla nei file, migliorata la leggibilità, messa a disposizione una versione PDF

Un argomento corollario trattato nella mia tesi di dottorato, ha riguardato i punti di contatto fra il mondo degli archivi e quello biblioteconomico (nella sezione dal titolo apocalittico “Quando due mondi collidono”).

All’interno di questa sezione vi era un capitolo (dal brillante titolo, brillante si riferisce solo al titolo, “FRADelli di ISAAR”) incentrato su un’analisi delle differenze e delle similitudini fra FRAD (FUNCTIONAL REQUIREMENTS FOR AUTHORITY DATA) e ISAAR(CPF) (International Standard Archival Authority Record for Corporate Bodies, persons and families).

A qualcuno potrebbe servire il risultato di questo capitolo, ovvero una mappatura fra FRAD, ISAAR, il nuovo EAC-CPF, e le (immancabili) Topic Maps (altro tassello nella riflessione sulla possibilità di esprimere descrizioni archivistiche direttamente nel web semantico).

Nel 2008, il names project aveva già sviluppato una mappatura tra ISAAR e FRAD, la mia mappatura si differenzia sostanzialmente in tre aspetti:

  • √® dal punto di vista di FRAD (e non dal punto di vista di ISAAR)
  • utilizza il nuovo EAC-CPF invece di EAC beta del 2004
  • fornisce qualche idea su come esprimere gli elementi di FRAD e ISAAR in Topic Maps

Ecco i file in formato ODS, per excel e in PDF. Tutti i file sono rilasciati sotto CC-BY

Edit: il server dell’universit√† √® un po’ ballerino… il PDF √® disponibile anche qui

Per altri formati contattarmi

Dottorato, finalmente

Sostanzialmente dopo 4 anni (visto che il progetto è stato presentato nel lontano settembre 2006) ho concluso il mio dottorato.

Avrei voluto scrivere molte cose, considerazioni personali, valutazioni sul corso di dottorato etc.

Alla fine, per√≤, questo mio spazio √® un diario di lavoro per cui mi limito a inserire le slide delle mia presentazione “Frammenti semantici. Riflessioni su descrizioni archivistiche e web semantico: il caso dell’archivio Giovanni Testori” (come suggerivo a suo tempo, l’intervento √® riassunto nelle note) disponibili su slideshare o come pdf con note inluse.

A chi interessasse l’argomento rimando al mio articolo su JLIS sempre incentrato sulla questione semantic web e descrizioni archivistiche.

Nasce JLIS

A poco ore dalla sua presentazione ufficiale, oggi presso la Biblioteca del Dipartimento di studi sul Medioevo e Rinascimento dell‚ÄôUniversit√† di Firenze,¬†√® uscito il primo numero di JLIS (Rivista italiana di biblioteconomia, archivistica e scienza dell’informazione).

Cos’ha di importante questa rivista?

Che √® la prima rivista ad accesso aperto italiana (in italiano e in inglese) nell’ambito delle Library Information Science (sulla mailing list AIB-CUR c’√® chi si √® interrogato se non sia un clone di altre esperienze: pur sottolineando l’importanza per la diffusione della letteratura scientifica avuta in questi anni dal Bollettino AIB, mi sembra che le differenze e le novit√† siano evidenti).

Un doveroso ringraziamento credo vada attribuito al prof. Mauro Guerrini, direttore della rivista, per aver promosso e favorito l’iniziativa e a Andrea Marchitelli per averla portata a compimento.

Come sostenevo tempo fa, l’accesso non √® solo gratuito ma libero e la licenza degli articoli √® semplice e minimale: CC-BY (creative commons attribution).

Nel primo numero ci sono diversi saggi che colpiscono la mia attenzione, sicuramente una menzione particolare va a:

Pecora nera √® l’articolo dello scriba di questo blog: ¬†“Descrizioni archivistiche e web semantico, un connubio possibile?” non ve lo consiglio, ma¬†nelle notti di luna piena pu√≤ essere una cura contro l’insonnia.

Topincs 4, awesome

Da vecchio appassionato di wrestling in, ormai sempre pi√Ļ rare, occasioni davanti allo spettacolo offerto dai lottatori non potevo esimermi dall’esplodere nel coro “this is awesome”.

Lo stesso pensiero mi è balenato provando il nuovo topincs 4 (ad oggi giunto alla versione 4.2.2) rilasciato da Robert Cerny.

La grossa novità è il supporto a TMCL (Topic Maps Constraint Language Рstandard ISO 19756).

Che roba è questo TMCL? Detto in parole povere tratte dalla mia tesi di dottorato :

Il TMCL è un linguaggio vincolato per creare schemi di validazione per le Topic Maps (sostanzialmente è possibile paragonare il TMCL a ciò che rappresentano XML Schema e Document Type Definition (DTD) nel caso dei documenti XML). Utilizzando il TMCL è possibile esprimere obbligatorietà e ripetibilità degli elementi e dei costrutti previsti all’interno del TMDM o vincolare (anche tramite regular expression) il valore che questi possono assumere

Dunque Topincs 4 ci dovrebbe permettere, a titolo di esempio, di dichiarare che un soggetto produttore o, meglio, un’istanza di topic appartenente a una sottoclasse di agente, deve avere almeno un nome di tipo “forma autorizzata del nome”, pu√≤ avere uno o pi√Ļ “altre forme del nome” etc.

Una volta creati tutti questi vincoli, magicamente la nostra interfaccia di inserimento √® gi√† creata da Topincs, che richieder√†, continuando l’esempio precedente, che un topic di tipo ente (sottoclasse di agente) abbia un nome di tipo “forma autorizzata del nome” etc.

Ma veniamo a un esempio pratico:

Continue reading

Finalmente la Library of Congress (ri)mette a disposizione i subject headings come linked data

Ricordate a fine anno la triste notizia della chiusura di lcsh.info che ci ha “allietato” le feste? (cfr. Ci saluta lcsh.info)

Lcsh.info era rinato come lcsubjects.org ospitato da Talis, ma la LoC aveva creato (a fine gennaio) un sito per ospitare i suoi vocabolari: id.loc.gov

Il ritardo nel rilascio (promesso a 6-8 settimane dall’avvento del sito) aveva preoccupato alcuni, ma con un mesetto di ritardo sono finalmente disponibili i subject headings come linked data, scaricabili anche in RDF/XML.

Pensando anche a eXtensible Catalog che ha rilasciato i suoi tool nei tempi promessi, mi viene da chiedere se e quando in Italia la tempistica (quantomeno nel mondo dei beni culturali) sarà rispettata e le date non saranno avvolte in un futuro misterioso.

A tal proposito mi viene in mente il capocantiere che ha costruito la mia casa che inveiva contro l’elettricista che prometteva di passare il marted√¨:

Sì, ma di quale settimana? di quale mese?

Di quale anno, aggiungerei io…