GattoWeb

*Corpus DeLirIO*	CNR-Opera del Vocabolario Italiano
Guida ai contenuti

Il Corpus DeLirIO è un'evoluzione del Corpus LirIO (Corpus della poesia lirica italiana delle Origini), banca dati settoriale dedicata alla poesia italiana dalle Origini ai primi anni del XV secolo, e in particolare alla tradizione lirica. Nato in stretta connessione con il progetto LIO. Lirica Italiana delle Origini. Repertorio della tradizione poetica italiana dai Siciliani a Petrarca e più in generale con il portale Mirabile presso la Fondazione Ezio Franceschini, il Corpus LirIO è stato pubblicato in CD-rom in due puntate, nel 2011 e nel 2013, dalla SISMEL-Edizioni del Galluzzo di Firenze, e quindi reso disponibile dal 2015 in GattoWeb ad accesso libero e gratuito.

La nuova versione presenta da un lato un rinnovamento dei contenuti, in principal modo grazie alle attività di aggiornamento del Corpus OVI dell'italiano antico, che in una prima fase avevano a loro volta beneficiato dei lavori per la costituzione del Corpus LirIO, dall'altro lato una diversa articolazione delle unità testuali che coincidono ora con il singolo componimento, allineando così la banca dati alla struttura del portale Mirabile-LIO, in cui una delle unità fondamentali è rappresentata proprio dalla scheda testo che si riferisce al singolo componimento, a lato delle schede autore e manoscritto. Si ricorda che viceversa nel Corpus OVI il criterio alla base della definizione di un'unità testuale è in genere l'edizione. Pertanto per es. mentre nel Corpus OVI i Rerum vulgarium fragmenta sono raccolti in un solo testo, nel Corpus DeLirIO sono divisi in 366 testi secondo il criterio "un testo-un componimento". In questa prima versione non seguono questo criterio soltanto poche unità testuali, che saranno allineate nei futuri aggiornamenti (come per es. i Documenta Amoris di Francesco da Barberino).

Nel Corpus DeLirIO in un certo numero di casi, quando ritenuto utile, sono state inserite più edizioni dello stesso testo, con particolare attenzione alla tradizione lirica, in modo che l'aggregazione di questi materiali possa favorire una prospettiva critica supplementare, tanto sul piano della discussione testuale e dell'esame della storia della tradizione, quanto sul piano della storicità delle edizioni.

Il corpus è reso disponibile in rete per le ricerche filologiche e linguistiche e consente di scaricare brevi citazioni per uso di ricerca.

Avvertenze per la consultazione

1. La scheda bibliografica

I campi della scheda bibliografica sono stati in parte rimodulati rispetto al Corpus OVI per consentire la definizione di sottocorpora specifici.

Per impostare un sottocorpus in GattoWeb: dal menu in alto: "Altre funzioni.." > "definizione di sottocorpora" > (impostati i criteri di definizione del sottocorpus) "Opera selezione.." > "nuova" (o "aggiuntiva" se si vogliono selezionare ulteriori testi rispetto a quelli già selezionati in base ad altri criteri); N.B.: i campi a scelta libera sono interrogabili per stringa esatta, quindi è opportuno impostare sempre una ricerca con caratteri jolly, per es. in campo autore: "*Boccaccio*" e non "Boccaccio", perché la stringa esatta è "Boccaccio, Giovanni".

Si richiama qui il contenuto di ciascun campo:

● autore: è indicato se possibile nella forma "Cognome, Nome" (per es. Orbicciani, Bonagiunta), altrimenti nella forma "Nome ecc." (per es. Giacomo da Lentini). Si usa "Anonimo" per i testi anonimi. Se esistono dubbi sull'attribuzione del testo, compare la stringa "(dubbio)": pertanto cercando "Orbicciani, Bonagiunta" si recuperano i soli testi di attribuzione sicura; cercando "*Orbicciani, Bonagiunta*" si recuperano tutti i testi, anche quelli di attribuzione dubbia. A "(dubbio)" nel campo autore possono corrispondere nel titolo abbreviato le indicazioni "(?)" o "D." (il punto di domanda non è ricercabile). Con "(attr.)" si intende "attribuibile" (e non "attribuito"), come per es. nel caso del Fiore.

● titolo: presenta di regola l'incipit del testo senza alcuna normalizzazione rispetto alla forma con cui si presenta nel corpus con la sola eliminazione eventuale delle parentesi quadre per le integrazioni e delle parentesi uncinate per le espunzioni (per es. Salva lo vescovo senato). L'incipit può essere seguito dal titolo redazionale o di tradizione tra parentesi quadre (per es. [Ritmo laurenziano]). Tra barre oblique si dà conto del genere metrico in forma estesa con eventuali specificazioni come nel caso delle ballate e dei sonetti (per es. /lasse/, /canzone/, /ballata stravagante/, /sonetto ritornellato/). Sono possibili ulteriori formulazioni come nel caso dei contrasti (per es. /ballata grande/ /contrasto/) o dei cantari (per es. /ottave/ /cantare/). Per la nomenclatura, si fa riferimento a Pietro G. Beltrami, La metrica italiana, Bologna, il Mulino, 1994.

● titolo abbreviato: dà informazioni sintetiche sul nome dell'autore, sul titolo, sulla datazione e sulla localizzazione del testo. Quando l'autore è anonimo, non compare alcuna specificazione (invece nel Corpus OVI si utilizzano formulazioni come Poes. an. e simili). Indicazioni tra parentesi tonde come per es. "(ed. De Robertis)" suggeriscono che il corpus dei testi di un autore è completato da più di un'edizione o che lo stesso testo è presente secondo più edizioni (vedi infra campo indice di qualità). Se un testo non è identificato dall'incipit o dal titolo redazionale, compare di norma il numero d'ordine dell'edizione.

● edizione: fornisce il riferimento bibliografico del testo. Per ragioni tecniche, in alcuni casi il riferimento è stato scorciato, per cui si rinvia alla Bibliografia dei Testi Volgari (BTV), dove si potrà trovare il riferimento completo nel campo note.

● curatore: è indicato nella forma "Cognome, N.".

● area generica: si adottano le stesse abbreviazioni del Corpus OVI, con l'avvertenza che è inevitabile una certa oscillazione tra una localizzazione orientata all'origine dell'autore e una localizzazione orientata alla facies linguistica restituita dall'edizione.

● area specifica: valgono le stesse avvertenze illustrate per il campo area specifica. Il simbolo ">" indica che l'ibridismo del testo è dovuto alla tradizione del testo (per es. "tosc.>padov." significa che un testo originariamente toscano è stato copiato in area padovana); il simbolo "/" indica che l'ibridismo è originario (per es. "tosc./orviet." allude all'ibridismo tipico dei poeti non toscani i cui testi presentano un influsso linguistico toscano).

● indice di qualità: indica la presenza nel corpus di un altro testo che offre la possibilità di un confronto, dettagliato nel modo che segue:

o cfE: esiste un'altra edizione dello stesso testo.

o cfV: esiste un'altra "versione" dello stesso testo, con l'avvertenza che i criteri di attribuzione di questa etichetta sono alquanto eterogenei, comprendendo il riconoscimento di possibili varianti d'autore, di rielaborazioni o di rifacimenti più radicali sul piano della sostanza, di commutazioni linguistiche significative, ecc. Pertanto rientrano in questa tipologia testi molto diversi tra loro, in cui le differenze sul piano sostanziale e/o formale sono più o meno apprezzabili, ma dipendono prioritariamente dalla storia della tradizione: per es. le rime della Vita nuova edite da De Robertis secondo la tradizione extravagante versus le stesse rime edite da Barbi nella Vita nuova; le due redazioni del Rainaldo e Lesengrino secondo i codici di Oxford e di Udine, oltre al frammento nei memoriali bolognesi; gli stessi memoriali bolognesi in rapporto ai testi che testimoniano; di regola le laudi anche quando il confronto si potrebbe meglio riferire al tipo cfE.

o cfP: esistono più testi che rientrano sotto entrambe le categorie cfE e cfV. Per es. la tenzone sulla natura di Amore tra Jacopo Mostacci, Piero della Vigna e Giacomo Lentini è interrogabile secondo l'ed. Antonelli nei PSs, l'ed. Contini nei PD e secondo la versione venetizzata del Barb. Lat. 3953 edita dallo stesso Antonelli nei PSs: da sole le prime due rientrerebbero nella categoria cfE, la prima (o la seconda) e la terza nella categoria cfV, sono invece tutte e tre classificate nella categoria cfP.

o cfC: esiste un testo in forma di citazione dello stesso testo presente in forma integrale nel corpus (e viceversa). Questa formula è usata per es. per le citazioni delle opere di Girardo Patecchio nella Cronica di Salimbene de Adam.

Per recuperare un testo secondo l'edizione o la versione corrispondente è consigliabile definire un sottocorpus secondo più criteri, per es. indice di qualità: cfE + autore: *Cognome* e/o titolo: *stringa dell'incipit*, ma considerando che nella bibliografia possono essere registrate attribuzioni diverse e che l'incipit si può presentare in forme diverse tra un'edizione e un'altra. Un altro modo può essere impostare una ricerca per cooccorrenze utilizzando i "lemmi muti" (vedi infra).

● genere: indica il genere metrico in forma sintetica; pertanto per definire un sottocorpus con i sonetti di ogni tipo è consigliabile utilizzare questo campo, per un sottocorpus con i soli sonetti caudati va utilizzato il campo titolo.

● tipo: è compilato soltanto per i testi che non rientrano nella categoria dei testi originali. Sono ammesse le seguenti abbreviazioni:

P = "parafrasi".
V = "volgarizzamento".
M = "misto tra originale e volgarizzamento".
T = "traduzione o più in generale trasposizione".

● forma: è compilato soltanto per i testi che non rientrerebbero nella categoria dei testi in versi. Sono usate le seguenti abbreviazioni:

P = "prosa" per i testi che contengono solo rubriche e simili che abbiano un interesse per lo studio della terminologia metrica e sono stati inseriti eccezionalmente nel corpus, come nel caso per es. delle rubriche del Libro delle rime di Sacchetti.
M = "misto" per i testi che sono originariamente prosimetri, di cui il corpus isola soltanto i componimenti poetici, come nel caso per es. dei volgarizzamenti del De consolatione philosophiae di Boezio.
V/p = "versi con prosa" per i testi che contengono brevi parti in prosa che sono state eliminate o escluse dall'interrogazione, come nel caso per es. del Ristorato di Ristoro Canigiani.
P/v = "prosa con versi" per i testi poetici che si trovano all'interno di un testo in prosa, le cui parti sono state eliminate o escluse dall'interrogazione, come nel caso per es. delle ballate del Decameron di Boccaccio.

● data descrittiva: si adottano le stesse abbreviazioni del Corpus OVI. In linea di principio l'articolazione del corpus secondo il criterio "un testo-un componimento" dovrebbe agevolare la formulazione di datazioni più puntuali di quelle del Corpus OVI, spesso fondate sulla morte dell'autore, ma questo lavoro di raffinamento è demandato a una seconda fase. Nondimeno questa possibilità è colta in un certo numero di casi, come per es. per i sonetti d'amore di Guittone nel canzoniere Laurenziano, datati qui a. 1265 e non a. 1294.

● collocazione interna: fornisce informazioni sulla presenza o meno del testo nel Corpus OVI indicandone la sigla corrispondente alla data di aggiornamento del Corpus DeLirIO, in modo da poter recuperare la scheda bibliografica nella Bibliografia dei Testi Volgari (BTV) e quindi la Documentazione filologica con il quadro sugli interventi sul testo da parte dell'Ufficio filologico dell'OVI. Sono possibili tre combinazioni:

"Presente nel Corpus OVI con sigla xxx";
"Assente nel Corpus OVI con sigla xxx[provenienza o destinazione]": questa formulazione è usata per i testi che sono stati eliminati o sostituiti nel Corpus OVI, in questo caso la provenienza sarà "[TLIO storico]", per i testi che erano presenti nel Corpus LirIO, ma non sono destinati a entrare nel Corpus OVI, in questo caso la provenienza sarà "[LirIO]", o viceversa per i testi di cui è prevista l'inclusione nel Corpus OVI, in questo caso la destinazione sarà [OVI];
"Assente nel Corpus OVI": questa formulazione è usata per i testi di cui non è prevista l'inclusione nel Corpus OVI e che non provengono da alcun corpus.

Pertanto per ricerche che intendano escludere la documentazione già presente nel Corpus OVI, bisognerà:

o cercare la stringa con carattere jolly "Assente*[OVI]" per isolare i testi assenti nel Corpus OVI di cui è previsto l'inserimento;

o cercare la stringa esatta "Assente nel Corpus OVI" per isolare i testi di cui non è previsto l'inserimento nel Corpus OVI.

Le due modalità di definizione di un sottocorpus si possono combinare con la funzione "Opera selezione.." > "aggiuntiva" (in luogo di "nuova").

● data inserimento: al momento questo campo non è popolato.

● note: contengono il link a Mirabile, in genere con il riferimento alla scheda testo di Mirabile-LIO (ma si ricorda che a partire dalla scheda testo di Mirabile-LIO si può andare alla scheda autore e quindi alla scheda TRALIRO). Quando non è stata rintracciata almeno una scheda, il campo presenta l'indicazione "noMirabile".

2. La ricerca con i "lemmi muti"

Il Corpus DeLirIO non è lemmatizzato come il Corpus OVI, ma come quest'ultimo è presentato con il "dizionario di macchina" del Corpus TLIO per il vocabolario, vale a dire l'insieme delle associazioni forma-lemma del corpus lemmatizzato limitato alle sole forme presenti nel Corpus DeLirIO, per poter sfruttare almeno in parte le potenzialità della lemmatizzazione. Al netto delle indicazioni contenute in questo documento, si ricorda che l'uso dei "lemmi muti" è consigliato soprattutto nella ricerca per cooccorrenze impostando il codice "Glemma", o meglio, di rigore nel caso dei verbi, "Glemma*" in modo da estendere la ricerca alle forme del lemma pronominale, come per es. parlare e parlare(-si). In questo modo la ricerca include tutte le forme associate al lemma nel dizionario di macchina del Corpus TLIO.

Si ricorda una volta di più che il sistema dei "lemmi muti" non assicura ricerche affidabili, rispetto alle quali rimane insostituibile la ricerca per forme con i caratteri jolly previsti da GattoWeb, in cui lo studioso dovrà sollecitare le proprie competenze storico-linguistiche sui testi italiani antichi.

Crediti

Il Corpus DeLirIO, in sostanziale continuità con il Corpus LirIO, è curato da Lino Leonardi, e da Alessio Decaria, Diego Dotto, Pär Larson, Giuseppe Marrani, Paolo Squillacioti.

Collaborano con un contributo fondamentale alla sua costruzione Carolina Borrelli, Ugo Conti, Giuseppina Orobello, Giulia Zava.

Nel 2021, nell'àmbito di uno stage presso l'OVI-CNR, Caterina Bellenzier e Flavia Guidi sotto la guida di Paolo Squillacioti avevano allestito una versione sperimentale del Corpus LirIO con la preparazione di alcuni materiali che hanno rappresentato la base di partenza per il Corpus DeLirIO.

Il Corpus DeLirIO è uno dei prodotti in corso di preparazione nel quadro del progetto PRIN 2022 CLIO. Corpora per la lirica italiana delle Origini, coordinato da Giuseppe Marrani presso l'Università per Stranieri di Siena, con un'unità di ricerca presso l'Opera del Vocabolario Italiano sotto la responsabilità di Diego Dotto. L'unità di ricerca dell'Università per Stranieri di Siena è composta da Benedetta Aldinucci, Ugo Conti, Giuseppina Orobello, Elena Stefanelli. L'unità di ricerca dell'OVI-CNR è composta da Luca Barbieri, Carolina Borrelli, Irene Falini, Giulia Zava.

Si ricorda che la prima versione del Corpus LirIO è stata realizzata nel quadro di un progetto PRIN 2008 L'affettività lirica romanza: lemmi e temi, coordinato da Roberto Antonelli, in particolare grazie alla collaborazione di due unità di ricerca, una presso l'Università di Siena, guidata da Lino Leonardi, e un'altra presso l'Opera del Vocabolario Italiano, guidata da Paolo Squillacioti.

Per la comunicazione di osservazioni o di eventuali errori nel Corpus DeLirIO, saremo grati a chi vorrà inviare un messaggio di posta elettronica all'indirizzo dotto@ovi.cnr.it.