Multilingual thesaurus or ontologies and Topic Maps

For italian people see also the original post and the review of this thesis.

I dedicate this post to the Joint Research Centre – European Commission of Ispra and to Carlo Ferigato who selected for this work one of my fellow student…
Well, she is certainly a skilful cataloguer, but I don’t know if she is able to manage thesaurus or ontologies.
I must say great game and good luck mates :-)
Maybe this post could also help her (and them) ;-).

This post is about multilingual thesaurus or ontologies.

The problem is underlined in several translations of Vanda Broughton’s manual Essential Thesaurus Construction: hierarchical relations (narrower term  and broader term) could be different according to the language.

A simple example.

Continue reading

Mappatura FRAD – ISAAR(CPF) – EAC-CPF – Topic Maps

English version

Aggiornamento 2010-09-23: corretti errori di copia e incolla nei file, migliorata la leggibilità, messa a disposizione una versione PDF

Un argomento corollario trattato nella mia tesi di dottorato, ha riguardato i punti di contatto fra il mondo degli archivi e quello biblioteconomico (nella sezione dal titolo apocalittico “Quando due mondi collidono”).

All’interno di questa sezione vi era un capitolo (dal brillante titolo, brillante si riferisce solo al titolo, “FRADelli di ISAAR”) incentrato su un’analisi delle differenze e delle similitudini fra FRAD (FUNCTIONAL REQUIREMENTS FOR AUTHORITY DATA) e ISAAR(CPF) (International Standard Archival Authority Record for Corporate Bodies, persons and families).

A qualcuno potrebbe servire il risultato di questo capitolo, ovvero una mappatura fra FRAD, ISAAR, il nuovo EAC-CPF, e le (immancabili) Topic Maps (altro tassello nella riflessione sulla possibilità di esprimere descrizioni archivistiche direttamente nel web semantico).

Nel 2008, il names project aveva già sviluppato una mappatura tra ISAAR e FRAD, la mia mappatura si differenzia sostanzialmente in tre aspetti:

  • è dal punto di vista di FRAD (e non dal punto di vista di ISAAR)
  • utilizza il nuovo EAC-CPF invece di EAC beta del 2004
  • fornisce qualche idea su come esprimere gli elementi di FRAD e ISAAR in Topic Maps

Ecco i file in formato ODS, per excel e in PDF. Tutti i file sono rilasciati sotto CC-BY

Edit: il server dell’università è un po’ ballerino… il PDF è disponibile anche qui

Per altri formati contattarmi

Dottorato, finalmente

Sostanzialmente dopo 4 anni (visto che il progetto è stato presentato nel lontano settembre 2006) ho concluso il mio dottorato.

Avrei voluto scrivere molte cose, considerazioni personali, valutazioni sul corso di dottorato etc.

Alla fine, però, questo mio spazio è un diario di lavoro per cui mi limito a inserire le slide delle mia presentazione “Frammenti semantici. Riflessioni su descrizioni archivistiche e web semantico: il caso dell’archivio Giovanni Testori” (come suggerivo a suo tempo, l’intervento è riassunto nelle note) disponibili su slideshare o come pdf con note inluse.

A chi interessasse l’argomento rimando al mio articolo su JLIS sempre incentrato sulla questione semantic web e descrizioni archivistiche.

Nasce JLIS

A poco ore dalla sua presentazione ufficiale, oggi presso la Biblioteca del Dipartimento di studi sul Medioevo e Rinascimento dell’Università di Firenze, è uscito il primo numero di JLIS (Rivista italiana di biblioteconomia, archivistica e scienza dell’informazione).

Cos’ha di importante questa rivista?

Che è la prima rivista ad accesso aperto italiana (in italiano e in inglese) nell’ambito delle Library Information Science (sulla mailing list AIB-CUR c’è chi si è interrogato se non sia un clone di altre esperienze: pur sottolineando l’importanza per la diffusione della letteratura scientifica avuta in questi anni dal Bollettino AIB, mi sembra che le differenze e le novità siano evidenti).

Un doveroso ringraziamento credo vada attribuito al prof. Mauro Guerrini, direttore della rivista, per aver promosso e favorito l’iniziativa e a Andrea Marchitelli per averla portata a compimento.

Come sostenevo tempo fa, l’accesso non è solo gratuito ma libero e la licenza degli articoli è semplice e minimale: CC-BY (creative commons attribution).

Nel primo numero ci sono diversi saggi che colpiscono la mia attenzione, sicuramente una menzione particolare va a:

Pecora nera è l’articolo dello scriba di questo blog:  “Descrizioni archivistiche e web semantico, un connubio possibile?” non ve lo consiglio, ma nelle notti di luna piena può essere una cura contro l’insonnia.

Le maschere di inserimento sono semplici, ma excel è veloce (Topincs inside)

Siamo chiari:

le maschere di interfaccia di catalogazione di descrizione o, usando una brutta parola, di metadatazione sono utili… ormai nessuno si sognerebbe di rilasciare un programma di descrizione e catalogazione senza una comoda interfaccia grafica che permetta di inserire i dati cliccando qua e là…

Eppure a volte queste interfacce sono estremamente lente, soprattutto laddove si debbano modificare diverse istanze in sequenza…

Ed è lì che vorremmo che la nostra comoda, ma ingombrante, maschera di data entry si dissolvesse in un semplice foglio di calcolo… con i campi e le relazioni che si distribuiscono in varie celle pronte a essere editate in sequenza.

Che questa sia un’esigenza sentita è rappresentato anche dalle modalità di modifica “bulk” (letteralmente “in grande quantità”) che si stanno diffondendo su alcuni social network come delicious o anobii.

Sicuramente anche il nuovo software di descrizione e inventariazione archivistica (di cui ho accennato in precedenza e di cui si parla in altri lidi) dovrà avere una modalità “tabella” per la modifica rapida delle schede inserite.

Continue reading

Perché abbiamo bisogno di software di descrizioni flessibili

Leggo dalla mailing list di ica-atom la domanda di un utente italiano che chiede:

Hi!
I’m Patrizia, a university student and I’ve recently started to use
ICA AtoM for a project.
For this project I need to add new metadata to extend the Dublin Core
standard. Please can you tell me if I can do this from the web
interface, as I do to add taxonomical terms?
If not, how can I do that?
Thanks a lot.

Sostanzialmente si chiede se con ICA-AtoM sia possibile estendere i campi descrittivi popolando adeguatamente l’interfaccia di data entry.

La risposta ahimè è no.

ICA AtoM è un software in buona parte basato sulla logica degli EAV model, ovvero si basa su accoppiate di chiave/valore. Quindi è, teoricamente, estensibile con l’aggiunta di nuovi campi o anche differenti standard descrittivi. Ma questo modifica richiede un intervento sul codice visto che i campi per l’inserimento sono “hard coded” (codificati direttamente all’interno del codice).

Soluzione? Usare Topincs, o forse l’ho già detto in passato?

A parte gli scherzi (ma neanche tanto) qui abbiamo un caso concreto di archivista italiana che ha bisogno di un software che sia flessibile rispetto alle singole esigenze di descrizioni. Come si potrà/dovrà comportare il sostituto di Sesamo/Guarini, l’Aggeggio, il Coso, il Guaresimo, sì insomma il nuovo software di descrizione archivistica?

Sulle intestazioni (Topincs Inside)

Finalmente giungo, seppur incidentalmente, anch’io a parlare del “Coso”, l'”Aggeggio” (con la A maiuscola come si confà ai nomi), il “Guaresimo”, insomma il nuovo software di descrizione archivistica il cui nome è ancora avvolto nelle nebbie (l’ultima mia proposta, Archinauta, è stata accolta tiepidamente) e di cui in altri lidi hanno già scritto in dettaglio.

Discutendo sugli elementi del Soggetto Produttore si è toccato il punto fondamentale delle stringhe di intestazione… stringhe composite, in cui la denominazione (a sua volta composita) è soltanto uno dei vagoncini componenti (seppur uno dei fondamentali).

Una proposta che, a mio avviso, è degna di essere presa in considerazione è quella di prevedere una modalità (superutente? pensando al mondo *nix) che permetta di “disegnarsi” la propria regola di intestazione.

Del resto è senz’altro vero che le indicazioni (più o meno normate) possono divergere (il neonato o, meglio, neo nascente Sistema Archivistico Nazionale, prevede regole di intestazione piuttosto complesse e lunghe, PLAIN – o, come bisognerebbe dire ora, Lombardia Beni Culturali Archivi – ne prevede altre etc.).

A tal riguardo risulta di particolare interesse la possibilità nel nuovo Topincs 4, di cui ho parlato recentemente, di comporre regole di intestazioni.

Ecco un semplice esempio.

Continue reading