Prospettiva
Con la funzionalità “concordanze” questo sito offre uno strumento che permette di rintracciare l’uso di lemmi ed espressioni nel loro contesto (la/le frase/i in cui essi occorrono). Cominciamo con due testi, uno di narrativa (Il barone rampante) ed uno di saggistica (Una pietra sopra). La navigazione è altamente intuitiva e non richiede particolari istruzioni. Inserite il termine che cercate, o anche solo le prime lettere, ed otterrete la/le frase/i in cui questo viene usato e la loro posizione nel testo.
L’indicazione della posizione di una determinata frase viene segnalata indicando l’opera, il capitolo o il saggio in cui questa occorre e la posizione percentuale del testo in cui questa si trova. Per esempio, cercando la parola “albero” nella categoria “elenco completo dei termini non flessi” lo strumento segnalerà il numero di occorrenze offrendo la possibilità di visualizzare la frase in cui ognuna si trova. Troviamo ad esempio un’occorrenza di “albero” in Una pietra sopra/Natura e storia nel romanzo a 20% del testo contando dall’inizio. Abbiamo scelto questa soluzione a riguardo del rintracciamento della posizione in quanto l’impaginazione varia da edizione in edizione e volevamo che tutti gli utenti fossero in grado di trovare le posizioni dei testi indipendentemente da quanto possano avere sottomano.
Vi chiederete ora perché cominciamo solo con due volumi invece di offrire l’intera opera. Tale limitazione è dovuta al fatto che abbiamo avviato il lavoro solo nell’ottobre del 2022. Ci siamo dati un anno di tempo per completarlo e pensiamo di riuscirci grazie alla scelta tecnologica che abbiamo fatto. Va detto che in un passato non troppo lontano le concordanze venivano fatte manualmente e che per un’opera come quella di Italo Calvino ci sarebbe voluto un secolo. Le cose cominciarono a cambiare quando nel 1949 il padre gesuita e linguista Roberto Busa ebbe l’idea di utilizzare dei computer per indicizzare l’opera di S. Tommaso d’Aquino dando nascita all’Informatica Umanistica. La tecnologia della metà del secolo scorso (le macchine elettrocontabili operanti su schede perforate) era però ancora lenta e richiedeva un notevole intervento umano (qualcuno doveva pur perforare le schede), e così ci vollero trent’anni. Noi ve ne chiediamo uno.
Da allora la capacità computazionale è vastamente aumentata mentre sono stati perfezionati gli algoritmi che permettono di generare elettronicamente strumenti di studio come appunto le concordanze. Per il nostro progetto abbiamo avuto la fortuna di ottenere il supporto di Expert.ai, impresa di informatica basata a Modena e specializzata in applicazioni di analisi testuale, seppure in campi commerciali. Non crediate però che basti rivolgersi ad un impresa d’avanguardia e “schiacciare un bottone” per ottenere quanto cerchiamo di offrirvi. Malgrado il clamore che circonda il mondo dell’informatica rimangono notevoli problemi da risolvere. Così il nostro progetto è al tempo stesso un progetto di innovazione umanistica quanto di innovazione tecnologica.
Offriamo qui alcuni esempi dei problemi con i quali ci confrontiamo. Non tutti i testi dell’opera di Italo Calvino sono disponibili nello stesso formato, né essi sono tutti disponibili in formati facilmente elaborabili elettronicamente. In alcuni casi abbiamo vere e proprie cartelle digitali (p.e. in formato Word), in altri solo immagini (p.e. in formato PDF). Abbiamo poi a che fare con testi letterari con un alto livello di ambiguità semantica. Ecco allora che estrarre i contenuti necessari alla generazione delle concordanze diventa una vera sfida. Risolvere tali problemi ci costringe dunque ad innovare e significa quindi anche avanzare la tecnologia di cui ci serviamo.
Nel corso dei lavori finora intrapresi abbiamo poi fatto una sorprendente scoperta. I testi di Italo Calvino sono grammaticalmente e sintatticamente perfetti. Al tempo stesso sono lessicalmente “facili” nel senso che non introducono neologismi mentre fanno uno scarsissimo uso di espressioni dialettali. Questo fatto apre un nuovo orizzonte per uno strumento di ricerca che cercheremo di estendere al campo delle valenze semantiche, cioè a come le parole assumono significato all’interno di un particolare contesto (i famosi “giochi di parole” di Wittgenstein). Facciamo un esempio: la parola “albero” può essere una semplice denotazione (albero come oggetto fisico, nella foresta o su una nave), oppure un concetto (l’albero della vita), o forse un’allegoria (albero come simbolo di fermezza), o una metafora (vivere come su un’albero). Aspiriamo ad arrivare ad un punto dove le concordanze permetteranno di ricercare un lemma in funzione del suo uso simbolico.
Tocchiamo qui quanto corrisponde alla “pietra filosofale” nel campo dell’elaborazione elettronica delle lingue naturali. La “purezza” dell’Italiano usato da Italo Calvino consente di concentrarsi sull’emergenza dei significati senza venire distratti dal rumore lessical-grammatical-sintattico che così facilmente confonde le macchine.
Pare improbabile che avremo successo, ma è una sfida che ci pare valga la pena di accettare. Nella peggiore delle ipotesi vi avremo offerto con le concordanze un’ambito strumento.