Jei - Jus e Internet

Il primo organo di informazione giuridica su internet per gli operatori del diritto - in linea dal 1996

Strumenti intelligenti per l'accesso all'informazione giuridica su Internet.

Scritto da Daniela Tiscornia

Una visione 'sostanziale' del diritto di accesso alla legge.

 Introduzione.

Si è tanto discusso del diritto dei cittadini a conoscere i testi legislativi, della opportunità di utilizzare il mezzo più efficace, quello telematico, e del dovere, da parte dello Stato, di offrire tale servizio in modo gratuito. Oggi pare che almeno tre iniziative istituzionali tendano a raggiungere tale obiettivo: la messa in linea, per un determinato spazio temporale, delle Gazzette Ufficiali dal sito del Poligrafico dello Stato, la proposta di accesso gratuito all'archivio legislativo nella annunciata nuova versione del Sistema Italgiure-Find, il progetto Norme in Rete, che intende trasformare i produttori delle norme nei diretti e contestuali distributori dell'informazione normativa ai cittadini.
Dall'esperienza maturata collaborando a quest'ultimo progetto nascono le considerazioni e le proposte che seguono, volte ad analizzare il tema dell'accesso da una prospettiva concreta. 
Coloro che progettano i sistemi informativi conoscono bene l'importanza del 'profilo d'utente', e modellano le strutture di supporto alla ricerca di informazione tenendo conto delle esigenze, delle conoscenze, delle attitudini di chi cerca le informazioni. Nel campo dell'informazione giuridica, come in tutti i settori tecnici, la distinzione fra utenti esperti e non esperti è netta, con la differenza, rispetto agli altri settori tecnici, che i destinatari principali a cui va garantito il diritto di accesso sono i secondi, i cittadini. Ad essi, che sono tenuti ad osservare le norme, va garantita la conoscenza della legge in termini non solo formali (il testo della legge), ma anche sostanziale: i contenuti normativi.
Affrontare il tema della difficoltà di comprensione delle norme porterebbe a sollevare una quantità di problemi: dagli aspetti testuali/linguistici affrontati in parte dalla legistica e dalla legimatica, a quelli strettamente giuridici sulla vigenza, la consolidazione e la semplificazione legislativa. In questa sede affrontiamo un aspetto che chiameremo, in modo un pò ambizioso, 'cognitivo', cioè come gli strumenti informatici possono semplificare oltre alla conoscenza, la comprensione delle norme, anticipando e supportando i meccanismi mentali dell'utente sprovvisto di un background giuridico.
Di norma le informazioni che interessano il cittadino non toccano né la dinamica del sistema normativo, né gli aspetti strutturali/organizzativi (organizzazione degli uffici, copertura finanziaria, transitorietà, ecc.), ma gli aspetti strettamente prescrittivi; il cittadino vuole sapere se un suo comportamento è consentito, se esistono sanzioni, quali procedure vanno seguite per il riconoscimento di un diritto, ecc.
Ne deriva che anche la forma delle domande risponderà in una certa misura a strutture linguistiche prevedibili, del genere: 'quale sanzione è prevista..', 'devo, posso, è facoltà…', sono obbligato a..', 'quale è la mia situazione…', 'come posso…', 'quale è la procedura per…, 'a quale ufficio…', ecc. Senza scendere in particolari tecnici, le tecniche informatiche di parsing consentono di riconoscere, all'interno di stringhe in linguaggio naturale, solo i termini rilevanti dal punto di vista informativo da utilizzare in ricerca. Quindi si può affermare che il primo passaggio di semplificazione, che consente la formulazione di domande in linguaggio naturale, è attuabile.
Secondo punto: dalla domanda così 'filtrata' saranno utilizzati per la ricerca solo i termini significativi; essi, con alta probabilità, descrivono l'ambito di realtà (soggetto del comportamento, l'azione, l'oggetto di interesse o l'ambito..) a cui l'utente è interessato ed il tipo di qualificazione normativa (permesso, obbligo, sanzione, procedura, ecc..) previsto dalla legge. Quale aiuto può dare un sistema informativo efficiente? Può fornire all'utente non una risposta 'da esperto', ma una documentazione estremamente specifica, ad esempio pochi articoli di legge o addirittura commi che direttamente riguardano il caso in questione.
Questo, che dal punto di vista informativo sarebbe un bel passo avanti rispetto agli attuali sistemi, richiede, da un lato, una maggiore granularità nella definizione delle unità documentarie (non più la legge o l'articolo, ma il comma), dall'altro, la descrizione dei contenuti attraverso strumenti concettuali.

1. Un web semantico per il diritto
Fondamentalmente, la ricerca di informazioni si basa sul browsing, vale a dire sulla navigazione attraverso i link ipertestuali, o sui motori di ricerca che utilizzano il matching di termini del linguaggio naturale. L'efficacia dei primi è limitata dalla genericità delle relazioni sottostanti ai link, quella dei secondi dall'ambiguità delle strutture linguistiche, che comporta, ad esempio, che gli interscambi di informazioni in lingue diverse siano veicolate dalla traduzione di termini e non dei concetti corrispondenti. Per migliorare i risultati gli 'ingegneri della conoscenza' sviluppano: a) strutture dati che dettagliano gli aspetti formali e b) adottano classificazioni tematiche delle informazioni. Vediamo nel seguito i due aspetti.
A.
La necessità di definire standard, cioè codici o linguaggi convenzionali con cui descrivere le informazioni, i dati, gli oggetti della conoscenza è una necessità riconosciuta in ogni ambito di informazione. In molti casi non si tratta di superare difficoltà tecniche o metodologiche, quanto piuttosto di far convergere la comunità degli addetti ai lavori (a seconda della sfera di conoscenze che si esamina) su scelte da adottare comunemente. In campo giuridico, ad esempio, sono sorte molte iniziative per adottare modelli comuni per descrizione dei documenti giuridici: in Italia il progetto Norme in Rete (NIR) propone standard di strutturazione e di citazione dei testi legislativi, ed iniziative simili sono sviluppate da amministrazioni locali per le tipologie di atti normativi e per la modulistica per gli atti amministrativi (nell'ambito del progetto RUPA, Rete Unitaria per la Pubblica Amministrazione); standard per la redazione delle sentenze sono stati proposti dal iniziativa del Tribunale Civile di Bologna (Progetto Polis). XML è poi il metalinguaggio comune con cui esprimere gli standard definiti.
Si può affermare che nel dominio giuridico, come nel generale settore di gestione delle conoscenza, gli aspetti strutturali o formali hanno raggiunto un buon livello di standardizzazione. Ciò che ancora rimane scoperto è la possibilità di trattare la semantica, vale a dire di definire un modello in cui sono 'convenzionalmente' fissati i significati dei concetti usati per descrivere la realtà. Il filone di ricerca che si occupa di questi aspetti prende il nome di Web semantico.
B.
La definizione dei concetti è un'operazione familiare ai giuristi, che pare a prima vista richiamare tecniche ben definite di assegnazione del significato, i ben noti 'criteri interpretativi', ove comunque sul piano strettamente linguistico, l'ambiguità semantica viene limitata soggettivamente dal giurista.
Il concetto 'informatico' di definizione del significato è diverso: i concetti, in quanto rappresentano l'intenzione, l'aspetto universale della conoscenza, non possono essere definiti da parole, altrimenti si ricadrebbe nella circolarità del linguaggio naturale, bensì sono definiti dalle relazioni semantiche con altri concetti, che consentono di rendere esplicite le assunzioni di significato che sottostanno e governano, convenzionalmente, l'uso quotidiano dei termini. Per fare un esempio semplice, il concetto di 'casa' assume connotazioni dipendenti dal contesto (normativo, ambientale, storico, architettonico, artistico, sociologico, ecc.) ma può essere 'universalizzato' facendo riferimento a tassonomie (è un edificio) combinate con categorie ontologiche, (es. 'artefatto') ed alle funzioni ('ricovero, protezione..'). Ugualmente, nel diritto, concetti come 'notaio' possono non avere un riscontro diretto in contesti diversi (vale a dire, altri sistemi giuridici), ma possono essere collegati a concetti corrispondenti attraverso la descrizione a livello più astratto (es., l'attributo 'pubblico ufficiale' e la funzione ' certificazione, attestazione di identità, ecc.'). 
Nel seguito, partendo dalla descrizione degli standard definiti per il progetto 'Norme in Rete', al momento il progetto più avanzato nel settore dell'informazione giuridica su Internet, si illustrano le metodologie da seguire per integrare standard documentari con modelli di descrizione dei contenuti (standard semantici). 

2. Il progetto Norme in Rete
Il progetto Norme in Rete,(NIR), iniziato nel 1999, cui collaborano i maggiori enti istituzionali italiani (Camera, Senato, Ministero di Grazia e Giustizia, Autorità per l'Informatica nella Pubblica Amministrazione), vuole risolvere un doppio ordine di problemi. In primo luogo vuole consentire un accesso gratuito all'informazione normativa, che ad oggi è disponibile su Internet in modo parziale e frammentario, oltreché disperso su più siti. Il secondo obiettivo del progetto è quello di arrivare alla razionalizzazione degli strumenti informativi, mediante la standardizzazione delle metodologie di trattamento e distribuzione del dato, che consentirà l'accesso alle norme raggiungendo direttamente i siti degli organi produttori (e distributori). Il progetto fornisce infatti degli standard di codifica delle tipologie delle fonti, degli identificatori (uniform references notation: urn), della struttura, dei links, della metainformazione. Sulla base dello studio di fattibilità curato dall'IDG (1), nel 2000 il progetto è passato alla fase operativa: sono state pubblicate proposte dai gruppi di lavoro su tutti gli aspetti da sviluppare), ed è stato sviluppato un portale sperimentale (www.normeinrete.it). Attualmente il progetto è focalizzato nella sperimentazione e validazione dei DTD da adottare per la strutturazione dei testi legislativi da distribuire in rete. 

2. 1. La meta informazione
I metadati sono 'tutti gli elementi necessari a descrivere una risorsa', ove con risorsa si intende la fonte giuridica (legge, circolare, sentenza, contratto, atto amministrativo, ecc.) (2) ; rispetto ad altre fonti di informazione, i documenti giuridici non presentano grosse ambiguità strutturali ed hanno il vantaggio di aderire a requisiti formali ben precisi, in molti casi previsti dalle norme stesse. Questo semplifica la definizione di standard della struttura testuale e attraverso questi ultimi, l'individuazione delle classi di documenti. Inoltre, tutti gli elementi spazio-temporali necessari all'identificazione sono facilmente standardizzabili.
Nell'accezione ampia di metadati rientrano dunque tutti gli elementi volti ad identificare l'atto, oltre ad elementi volti a dare informazioni sulla semantica. Su questo secondo aspetto per il progetto Nir sono state fatte delle scelte, condizionate da una serie di fattori: necessità di adottare semantiche standardizzate(ad esempio schemi di classificazione adottati dai produttori istituzionali, Dublin Core. ecc.) improponibilità di modelli descrittivi tropo profondi e raffinati, inapplicabili sull'enorme pregresso da recuperare e per un futuro utilizzo nel drafting. Come ultima considerazione, ha pesato la consapevolezza di intervenire su una materia delicata, in cui la descrizione dei contenuti normativi va a sconfinare nell'operazione interpretativa che il giurista riserva a sé.
Allo stato attuale la metainformazione è contenuta nel DTD Meta (3) , collegato dalle URN al DTD Norma che provvede alla strutturazione del testo; nel DTD Meta ogni entità normativa (le disposizioni), non necessariamente coincidente con le entità strutturali, viene classificata in base alla funzione normativa (ad es., sanzione: art. x, co. Y, z...). Si ha dunque una doppia visione del testo, come documento e come collezione di disposizioni, che consente di unire in una descrizione funzionale più entità o di attribuire alla stessa entità più di una descrizione, di stabilire relazioni fra entità, e così via. Per funzione si intende lo scopo regolativo che il legislatore intende raggiungere: obbligare, vietare, definire, sanzionare, abrogare, ecc. La classificazione delle funzioni normative fa riferimento ad uno schema elaborato da Carlo Biagioli (4). 
Nella progettazione dei DTD per Nir non si è ritenuto realistico dettagliare ulteriormente la descrizione, individuando le entità coinvolte (soggetto passivo dell'obbligo, azione sanzionata, soggetto/oggetto del diritto, ecc.), che richiede la definizione di standard semantici, vale a dire la possibilità di individuare in modo non ambiguo e universalmente accettato i termini/concetti da utilizzare nella descrizione. In termini tecnici ciò significa disporre di un' ontologia di dominio. 

3. L'ontologia formale
Per garantire la comunicazione, i criteri adottati per la descrizione dei significati devono essere stabiliti convenzionalmente e, per poter essere applicati in modo oggettivo, devono essere espressi in un linguaggio formale. Questa serie di assunzioni costituiscono l'Ontologia Formale (Guarino 1995, Smith 1998). L'ontologia è diventata una componente fondamentale delle ricerche di intelligenza artificiale, di linguistica computazionale, di gestione dei databases.
Può sembrare sorprendente che una disciplina collocata da sempre nella sfera filosofica sia diventata elemento essenziale degli studi sulle tecnologie dell'informazione, ma va considerato che più si affinano i risultati delle ricerche tecnologiche, più la necessità di una base teorica solida aumenta. In questo caso è evidente che funzioni informatiche fondate sulla rappresentazione della realtà e delle conoscenze sulla realtà necessitano in primo luogo di criteri per impostare una metodologia su 'cosa' e 'come' rappresentare e che questo deve essere il più possibile generalizzabile e universalizzabile, vale a dire ontologicamente e formalmente fondato. Ecco dunque che il termine ontologia può oggi essere inteso in due accezioni: l'ontologia come disciplina filosofica e come possibile interpretazione della realtà, per la quale spesso in letteratura si preferisce usare il termine concettualizzazione; e l'ontologia come intesa dalla Comunità della IT, vale a dire: 'an ontology refers to an engineering artifact, constituted by a specific vocabulary used to describe a certain reality, plus a set of explicit assumptions regarding the intended meaning of the vocabulary words' (5). 
I rapporti fra le due ontologie sono molto stretti, in quanto sull'ontologia filosofica si fondano le assunzioni con cui l'ontologia computazionale stabilisce il significato inteso del vocabolario. Mediante l'ontologia gli oggetti del mondo sono raggruppati in classi di concetti ed ogni concetto è definito in termini di proprietà; ogni elemento appartenente ad una classe condivide con gli altri alcune proprietà (necessarie), tali che, se mancano, un concetto non appartiene a quella classe; quindi esistono proprietà prototipiche (la dimensione spazio temporale, la massa sono comuni a tutti gli oggetti fisici) e altre proprietà che distinguono le sottoclassi. Ad es. persona condivide con gli animali la proprietà essere vivente, ma si distingue da essi per proprietà quali provare emozioni, ridere, ecc. Non tutte le proprietà hanno la stessa natura ontologica, ad esempio la dimensione spazio-temporale ha una natura diversa (categoria) dai tipi, cui appartengono elementi dotati in una forte criterio di identità; ruoli ed attributi sono dotati di criteri di identità più deboli.
Le meta-proprietà, fra cui la più importante è proprio l'identità (6), servono ad individuare in modo formalmente valido la natura ontologica delle proprietà ed a disporre in una struttura tassonomica i concetti che le possiedono; le categorie più alte, oltre alla Collocazione spazio temporale, sono gli Eventi e le Entità, alla quale afferiscono i tipi: Oggetto fisico, Entità sociale. Essere vivente, ecc. 


Nella top ontology sono organizzate perciò le classi ontologiche cui fare afferire le ontologie di dominio: ad esempio, il concetto persona è distinto da organizzazione e da gruppo di persone (l'organizzazione non perde la sua identità se cambiano le persone, il gruppo sì); la proprietà agente (soggetto che compie un'azione) è un ruolo, dipendente dalla possibilità di compiere un'azione; come si è detto, i ruoli sono più deboli dei tipi, in quanto un'entità es., persona, può perdere il ruolo di agente, mantenendo quello di persona. L'agente giuridico è un ruolo che specifica agente in quanto dipendente dall'esistenza di un entità separata (sistema giuridico), che da valore legale alle azioni. Il ruolo di agente giuridico è valido per i tre tipi di entità: persone, organizzazioni, stati; soggettività giuridica è un attributo di un sottoinsieme di organizzazioni sociali (non tutte le organizzazioni sono persone giuridiche).
Altre esempio: gli eventi sono oggetti occorrenti, disgiunti e dipendenti dagli oggetti continuanti, anche se fanno parte degli oggetti concreti; gli eventi naturali possono essere distinti dal ruolo effetti giuridici in fatti naturali a cui il diritto attribuisce rilevanza (es. la nascita, la morte), fatti involontari (es. fatti illeciti colposi), fatti volontari, da cui si specializza la grande categoria degli atti (7). Per mantenere la corrispondenza con la tradizionale tripartizione della dottrina in fatti, atti, negozi, pur se questi ultimi potrebbero essere compresi ontologicamente nella categoria degli atti, si può considerare i negozi, ad es. i contratti, il testamento, come oggetti occorrenti e distinguere il negozio come fonte di effetti giuridici dal negozio (documento che lo rappresenta) come oggetto fisico.

Conclusioni e futuri sviluppi
Tornando ai temi posti all'inizio, una descrizione granulare dei segmenti legislativi che individui le disposizioni come significato del testo (es., Definizione titolare dei dati: art. 1, co.2, L.675/96; Obbligo del titolare dei dati di notifica al garante: art. 7, co.1 L.675/96) consente agli utenti non giuristi di selezionare con precisione l'informazione giuridica. La caratteristica dell'utente non esperto è di non conoscere con precisione ciò che sta cercando (ad es. gli estremi del testo di legge), e di utilizzare termini generici del linguaggio naturale piuttosto che concetti giuridici precisi; perciò può essere supportato dalla navigazione nella stessa rete di concetti su cui è basata la descrizione accurata delle disposizioni, a loro volta legate da univoci riferimenti al testo (8).
Questo approccio, anche se ad oggi è proponibile solo su settori giuridici ridotti, ma di particolare rilievo sociale (privacy, sanità, telecomunicazioni…), può prestarsi ad ulteriori utilizzi: confronto fra normative, link concettuali a testi multilingue, riusabilità per domini di applicazione affini, sistemi di legal advising (9), ecc.

(1) Pubblicato su ‘Informatica e Diritto’, ESI, Napoli, n.1, 2000.
(2) Al momento il progetto NIR si occupa della produzione normativa in senso stretto, vale a dire le fonti legislative, anche se in prospettiva, si estenderà alle fonti giurisprudenziali ed agli atti amministrativi.
(3) Con DTD, Document Type Definition, si intendono lo schema ‘vuoto’ degli elementi che costituiscono un testo di legge.

(4) Vedi l’home di C.Biagioli in www.idg.fi.cnr.it/organizzazione/organizzazione.htm
(5) N.Guarino Formal Ontology in Information Systems, in N.Guarino, a cura di, Formal Ontology in Information Systems, Amsterdam, IOS Press, 1998, p.4.
(6) Le altre sono: Rigidità, Unità, Dipendenza,. Per approfondimenti si veda: http://www.ladseb.pd.cnr.it/infor/Ontology/
(7) “Le azioni umane possono rilevare per il diritto sotto due profili diversi e cioè in riferimento all’obiettiva incidenza che possono avere sull’assetto di interessi preesistente….sia in riferimento alla loro conformità o meno alle regola stabilite dall’ordinamento. Sotto il primo profilo rientrano, insieme ai fatti naturali, nella categoria dei fatti giuridici in senso stretto e possono più propriamente qualificarsi fatti umani; sotto il secondo vanno a costituire quella particolare categoria dei fatti giuridici che sono gli atti giuridici” (R.Moschella, voce Fatto giuridico, in Enciclopedia Giuridica Treccani).
(8)D.Tiscornia, Ontology Driven Access to Legal Information, in Proceedings of Workshop on Dexa 2001, IEEE Computer Society, pp. 792-799.
(9) Winkels R., Clime: Intelligent Legal Information Serving, in “Droit et Intelligence Artificielle”, Nice, 1998.

Daniela Tiscornia
Istituto per la Documentazione Giuridica del CNR
Questo indirizzo email è protetto dagli spambots. È necessario abilitare JavaScript per vederlo.