Il progetto JurisWiki. Articolo di Simone Aliprandi per Informatica e diritto

07/03/2016, 23:11

[Titolo completo] Il progetto JurisWiki. Qualche informazione di background sulla prima piattaforma aperta per l’informazione giuridica


SOMMARIO: 1. Da cosa nasce l’idea di JurisWiki – 2. Tecnologie utilizzate e modalità di organizzazione del database – 3. La gestione del copyright: una piattaforma davvero open – 4. La gestione della privacy nelle sentenze. Un nodo intricato

AUTORE: Simone Aliprandi è avvocato e dottore di ricerca, ideatore di JurisWiki  --  LICENZA: Creative Commons Attribution-ShareAlike 4.0 International (https://creativecommons.org/licenses/by- sa/4.0/).

Articolo uscito a fine 2015 sulla rivista Informatica e diritto (Vol. XXIII, 2014, n. 2, pp. 139-143). La versione PDF editoriale dell'articolo è disponibile all'indirizzo http://www.slideshare.net/simonealiprandi/il-progetto-juriswiki-informatica-e-diritto-22014.

screenshot articolo informatica e diritto

JurisWiki è una piattaforma collaborativa e open per l’informazione giuridica, grazie alla quale i provvedimenti giurisdizionali nonché i relativi commenti e massime sono raccolti in un unico contenitore virtuale liberamente fruibile via web senza vincoli di copyright o barriere di accesso come richieste di registrazione o sottoscrizione di abbonamenti.
Si tratta di un database aperto e basato sul crowdsourcing, nel senso che chiunque può caricare nuove sentenze (oltre alle centinaia di migliaia già inserite dallo staff del sito e dai parser automatici installati sulla piattaforma); ma si tratta anche di un wiki a cui gli utenti possono contribuire perfezionando e commentando i provvedimenti, scrivendo massime, aggiungendo annotazioni e inserendo link ad altri provvedimenti o testi legislativi.
JurisWiki è un progetto personale di chi scrive, avvocato da sempre impegnato nel settore delle nuove frontiere del diritto d’autore e dell’open licensing. Il sito è online ufficialmente dal 21 aprile 2015 ed è attualmente ancora in una fase sperimentale (“beta”), in attesa di consolidare alcuni aspetti sia tecnici che giuridici. In questi paragrafi cercheremo di mettere in luce i retroscena che hanno portato all’ideazione di questa piattaforma e le problematiche tecniche e giuridiche incontrate nello sviluppo.

1. DA COSA NASCE L’IDEA DI JURISWIKI
L’idea nasce da due constatazioni empiriche fondamentali: la crescente disponibilità di giurisprudenza liberamente accessibile in rete e la conseguente tendenza degli utenti a cercare sentenze sul web attraverso i comuni motori di ricerca (e non più solo attraverso servizi specializzati).
Bisogna infatti registrare che sono ormai numerosissimi i provvedimenti messi regolarmente online dalle stesse corti sui loro siti istituzionali, a partire dalla Corte Costituzionale che ha messo liberamente a disposizione l’intero archivio (dal 1956 ad oggi) digitalizzato in un formato standard (XML) che ne consente una facile ripubblicazione sul web. Vi sono poi i siti della Corte dei Conti e della giustizia amministrativa (Consiglio di Stato e Tribunali amministrativi regionali); inoltre da qualche tempo anche il CED della Corte di Cassazione ha aperto parzialmente (solo gli ultimi cinque anni) il suo ItalGiure. Oltre a questi siti istituzionali vi sono ormai una miriade di siti di informazione giuridica o anche semplici blog di avvocati, commercialisti e altri professionisti in cui vengono pubblicati i testi delle sentenze. Ricordiamo infatti che, per effetto dell’art. 5 della legge sul diritto d’autore, i testi delle sentenze (come di tutti gli atti ufficiali della pubblica amministrazione) non sottostanno ad alcuna privativa e sono quindi in pubblico dominio per loro stessa natura.
Da questo primo dato, legato appunto alla crescente disponibilità in rete di giurisprudenza, deriva un secondo dato: sono sempre di più i giuristi e in generale i professionisti interessati a questi contenuti (quindi intendiamo anche commercialisti, consulenti del lavoro, consulenti fiscali, giornalisti, docenti di diritto, etc.) che si affidano a motori di ricerca generici (Google, Yahoo...) per reperire questi documenti, vuoi per la gratuità, vuoi per la semplicità d’uso, vuoi per la maggiore famigliarità acquisita con questi strumenti. Ovviamente le grandi banche dati proprietarie curate e aggiornate dalle principali case editrici specializzate, per completezza e affidabilità, restano ancora il principale punto di riferimento in questo settore. Ciò nonostante, non si può negare che vi sia anche una buona fetta di utenza che si accontenta di una ricerca più generica e che comunque non intende versare il costo di abbonamenti (a volte molto oneroso).
JurisWiki si inserisce proprio nel solco tracciato da questi due dati cercando di fornire uno strumento più efficiente rispetto ad un motore di ricerca generico e di offrire uno spazio aperto in cui i giuristi possono condividere liberamente e con approccio collaborativo massime e commenti alle sentenze.

2. TECNOLOGIE UTILIZZATE E MODALITÀ DI ORGANIZZAZIONE DEL DATABASE
L’architettura di JurisWiki è sviluppata in Ruby, linguaggio tra i più avanzati ed efficienti per un progetto di questo tipo.
Il motore interno di JurisWiki è basato su tecnologie di ricerca specificamente pensate per i testi giuridici e permette quindi di organizzare i documenti secondo standard più chiari e precisi.
Uno dei problemi incontrati in fase di progettazione è stato proprio l’assenza di standard univoci e riconosciuti a livello internazionale per la catalogazione e il tagging semantico dei provvedimenti giurisdizionali.
La scelta è stata comunque quella di predisporre il database in modo da isolare cinque metadati essenziali, cioè le informazioni che rendono un provvedimento giurisdizionale certamente e univocamente individuato:
    1. la corte o tribunale che ha emesso il provvedimento;
    2. il tipo di provvedimento (sentenza, ordinanza, decreto);
    3. la data di emissione del provvedimento (più precisamente la data del deposito in cancelleria);
    4. il numero identificativo attribuito al provvedimento dalla cancelleria;
    5. la lingua in cui è scritto il provvedimento (ricordiamoci infatti che in Trentino-Alto Adige e Valle d’Aosta vengono emessi documenti ufficiali in lingue diverse dall’italiano).
Questi cinque metadati essenziali vanno anche a comporre l’URL del provvedimento, che rimane quindi stabile e immodificabile per sempre. Oltre a questi metadati essenziali vi è la possibilità di arricchire ulteriormente il database con altri dati aggiuntivi, come ad esempio il numero di ruolo del procedimento, la sezione della corte o tribunale, il nome del giudice che ha firmato il provvedimento, la data dell’udienza in cui il provvedimento
è stato assunto e firmato dal giudice.
Inoltre, in prospettiva, quando la community degli utenti si consoliderà, il tutto verrà completato e arricchito dai commenti e dalle massime caricate, nonché dalla classificazione (tagging) proposta dagli utenti stessi.

3. LA GESTIONE DEL COPYRIGHT: UNA PIATTAFORMA DAVVERO OPEN
L’approccio di tutto il progetto è “open”, concetto che – come noto – implica qualcosa di più della semplice gratuità. D’altronde, il web in buona parte è già di per sé gratuito, ma spesso i titolari dei siti non sono particolarmente chiari nella gestione del copyright sui contenuti, arrivando alla situazione paradossale di imporre, attraverso strani disclaimer e termini d’uso, vincoli aggiuntivi alla riproduzione dei contenuti rispetto a quelli normalmente imposti dalla legge. E ciò accade anche nel caso di documenti – come appunto i provvedimenti giurisdizionali – che nascono liberi dai vincoli del copyright; nonché su alcuni siti istituzionali che hanno dei termini d’uso del tutto irragionevoli e spesso contrari alle nuove norme sull’informazione del settore pubblico e sul cosiddetto “open by default”.
JurisWiki ha invece una policy di gestione del copyright molto più chiara. Come emerge dall’apposita pagina “copyright”, i testi delle sentenze vengono chiaramente dichiarati come documenti in pubblico dominio; a tal proposito basti ricordare il dettato dell’articolo 5 della legge italiana sul diritto d’autore (legge 633/1941), secondo cui ai testi degli atti ufficiali dello Stato e delle amministrazioni pubbliche, sia italiane che straniere, non si applicano privative di proprietà intellettuale e dunque sono “public domain by law”.
Per quanto riguarda invece i contenuti creati dagli utenti (cioè massime e commenti), la piattaforma applica di default una licenza Creative Commons Attribution-ShareAlike 4.0 International. Gli utenti, registrandosi alla piat- taforma, accettano i relativi termini d’uso nei quali è prevista una specifica clausola di accettazione di questo status di copyright.
Si noti poi che anche il diritto sui generis, che in un sito come questo può avere un peso essenziale, viene “rilasciato” in ottica open.
Infine, i diritti d’autore sui contenuti originali, sulla veste e interfaccia grafica, sull’architettura del sito, nonché il diritto sui generis sul database sono di Simone Aliprandi e sono anch’essi regolati dalla licenza Creative Commons Attribution – Share Alike 4.0 International.

4. LA GESTIONE DELLA PRIVACY NELLE SENTENZE. UN NODO INTRICATO
Rispetto al nodo del copyright, il nodo della privacy invece è indubbiamente più delicato da dipanare ed è tutt’ora irrisolto perché non esiste ancora un solido consenso sui criteri da adottare per l’anonimizzazione di questi documenti.
La normativa di riferimento [che ho provato a ricostruire nell’articolo “Privacy e sentenze: un quadro che non quadra (neanche per la Cassazione)” uscito sul sito MySolutionPost.it il 16 ottobre 2014] ha le sue principali radici negli articoli 51 e 52 del Codice Privacy (d.lgs. 196/2003), oltre che nell’articolo 734-bis Codice Penale, e consta di alcune indicazioni che si possono dedurre da provvedimenti del Garante Privacy e da apposite linee guida emesse nel 2010 (all’epoca di Franco Pizzetti).
Inutile negare (come in realtà alcuni giuristi ingenuamente fanno) che il quadro giuridico emergente non risulti di facile e cristallina interpretazione, attesa anche l’assenza di solida giurisprudenza su questi temi (almeno finora). Una situazione che non sembra destinata ad uscire facilmente e agilmente dallo stallo se consideriamo l’eventualità paradossale per cui il Garante (organo extracostituzionale di creazione relativamente recente) potrebbe trovarsi a dover giudicare sulla Corte di Cassazione (massimo rappresentante del potere giurisdizionale) emettendo un provvedimento impugnabile di fronte alla Cassazione stessa.
Tutto ciò ovviamente non ha reso serene le decisioni relative alla progettazione e messa online del sito JurisWiki.
Tra l’altro, molti colleghi giuristi esperti di privacy hanno fatto notare in più occasioni e in più sedi che spesso sono gli stessi siti istituzionali delle corti a non rispettare le indicazioni del Garante, creando così sia una generale percezione di incertezza del diritto (hanno più peso le scelte della Cassazione o le indicazioni del Garante?) sia una scomoda situazione per progetti come JurisWiki che, per certi versi, non fanno altro che ripubblicare asetticamente ciò che viene esposto dai siti istituzionali. La scomodità di questa situazione si aggrava se pensiamo che in alcuni casi l’ordinamento giuridico prevede sanzioni penali e non solo amministrative (come possono essere quelle irrogate dalle autorità garanti) a carico non solo di colui per per primo diffonde i dati personali ma anche di tutti coloro che successivamente li diffondono.
Proprio per questo motivo, JurisWiki ha dovuto cautelativamente “congelare” tutti provvedimenti della Corte di Cassazione inizialmente prelevati dal sito www.italgiure.giustizia.it/sncass/ (circa 411 mila documenti, relativi agli anni dal 2010 al 2015) e pubblicati per pochi giorni sul sito.
Effettivamente un progetto come JurisWiki va inevitabilmente a toccare e amplificare uno dei principali interrogativi del diritto di Internet: come trovare un equilibrio tra la possibilità di condividere e accedere alle informazioni e il diritto degli individui di vedere tutelata la loro riservatezza? Come si usa dire, “la coperta è corta” e non è possibile mantenere la massima copertura di entrambe le istanze; dunque non resta che arrivare ad una soluzione di compromesso che possa risultare soddisfacente.

« Torna al blog