LA TRASCRIZIONE È UNA PERIZIA E RICHIEDE ESPERTI CERTIFICATI

Luciano Romito*

La Cassazione penale, sezione I, nella sentenza del 24 aprile 1982, n. 805, stabilisce che la trascrizione deve consistere «[…] nella mera riproduzione in segni grafici corrispondenti alle parole registrate». Inoltre, l’incarico di trascrizione viene affidato dal giudice nelle forme della perizia, e quindi il trascrittore non deve avere competenze o specializzazioni specifiche. «La perizia di trascrizione delle intercettazioni sono operazioni non di carattere “valutativo”, bensì “descrittive” e ciò esclude che la trascrizione possa essere assimilata a una perizia» (Cassazione penale, sezione VI, 3 novembre 2015, n. 44415);
«la trascrizione delle registrazioni telefoniche si esaurisce in una serie di operazioni di carattere meramente materiale, non implicando l’acquisizione di alcun contributo tecnico scientifico» (cfr. Cassazione penale, sez. VI, 15/03/2016, n. 13213);
«[…] non comporta l’equiparazione del trascrittore al perito, dovendo il primo – a differenza del secondo, chiamato ad esprimere un “giudizio tecnico” – porre in essere soltanto una “operazione tecnica”, non implicante alcun contributo tecnico-scientifico e connessa esclusivamente a finalità di tipo “ricognitivo”» (cfr. Cassazione penale , sez. I , 26/03/2009 , n. 26700).

In ambito accademico e di ricerca, invece, sono stati sviluppati metodi e procedure per rappresentare su carta il complesso processo multimodale di una conversazione. La trascrizione diventa l’oggetto di studio dell’analisi conversazionale. La fonetica uditiva, percettiva e cognitiva concentra la propria attenzione sullo studio dei correlati acustici utili alla percezione dei suoni. Molti studi dimostrano come i suoni vengono percepiti in diverse situazioni comunicative, in particolare in vari ambienti, specialmente quelli rumorosi.

Per comprendere come si sia concretizzata questa grande differenziazione tra ricerca accademica e applicazione in ambito giudiziario, è necessario approfondire due aspetti fondamentali:

  1. la magistratura e l’avvocatura sembrano nutrire una presunzione di conoscenza delle complesse dinamiche del linguaggio e della percezione, basata sull’uso quotidiano del linguaggio per comunicare. Si ritiene che, poiché le intercettazioni consistono in parole che tutti siamo in grado di ascoltare e comprendere, siamo anche capaci di trascriverle adeguatamente senza necessitare di competenze specifiche;
  2. la storia delle intercettazioni e delle trascrizioni in Italia ha indotto tutti noi a falsi convincimenti.

La prima intercettazione in Italia è stata effettuata casualmente nel 1903 durante il governo Giolitti (De Giovanni, 2017). Un operatore dei telefoni ascoltò una conversazione telefonica tra un ministro e sua moglie riguardante informazioni finanziarie sensibili. Il ministro riferiva alla moglie di un imminente decreto che avrebbe fatto oscillare alcuni titoli finanziari e suggeriva il loro acquisto. Ovviamente la telefonata non fu registrata e l’operatore telefonico appuntò gli estremi del chiamante, del decreto e dei titoli azionari e li consegnò al Capo Gabinetto del Primo Ministro. La prima trascrizione in diretta di una intercettazione è di fatto un riassunto che riporta esclusivamente ciò che il trascrittore ha ritenuto importante comunicare.

Questo evento determina la nascita del Servizio di Intercettazione, che ha il compito di controllare le personalità politiche. Ovviamente non è prevista la registrazione delle comunicazioni, ma l’operatore, fungendo da filtro, appunta su un foglio le informazioni che ritiene più importanti. Il personale assegnato a questo servizio è costituito da operatori abituati ad ascoltare, cioè il personale telefonico. Già da allora si richiede l’esperienza all’ascolto più che una competenza certificata. A questi operatori, in seguito, sono stati aggiunti, in qualità di ausiliari, alcuni stenografi. Questi, avendo tra le proprie competenze la scrittura veloce, possono fissare su carta tutte le informazioni più importanti.

La Prima guerra mondiale vede l’istituzione del servizio IT (intercettazioni telefoniche) presso le Forze Armate. Il comando riceve dai vari centri e dalle varie stazioni un verbale che contiene le notizie più importanti ascoltate per telefono e intercettate. Il comando dell’Armata produce un riassunto che viene pubblicato in un bollettino giornaliero e inviato a tutti i comandi. Anche in questo caso nessuna registrazione, nessuna conservazione, ma solo un appunto scritto frutto di una interpretazione e di una scelta effettuata dall’operatore della singola stazione.

Dopo la Prima guerra mondiale in Italia si afferma il Fascismo. Il servizio di intercettazione già fondato da Giolitti si potenzia e i controllati non sono solo i politici ma anche le sedi dei giornali e i rappresentanti delle opposizioni politiche. Le telefonate vengono stenografate, numerate progressivamente e il verbale contiene il nome degli interlocutori e un riassunto del contenuto: insomma un prematuro brogliaccio delle intercettazioni dei giorni nostri.

Il 19 ottobre 1930 viene presentato il terzo codice di procedura penale. Nell’articolo 339 si riporta che «il giudice può accedere agli uffici o impianti telefonici di pubblico servizio e trasmettere, intercettare o impedire comunicazioni, assumere cognizione. Può anche delegare un ufficiale di polizia giudiziaria». Il giudice ascolta direttamente l’intercettazione proprio come fa oggi nella sua funzione di peritus peritorum, in camera di consiglio per raggiungere il proprio convincimento.

Nei codici di procedura penale successivi, le intercettazioni possono anche essere ambientali, tutte devono avere una preventiva richiesta di autorizzazione e una durata massima. Cambia anche la forma del processo e l’intercettazione diventa mezzo di ricerca della prova, quindi un atto del Pubblico Ministero e non più della Polizia Giudiziaria. Nel 1993, con la legge 547, si prevede la possibilità di intercettare i flussi telematici. In questo profilo storico tracciato dal 1903 ad oggi, nulla o quasi è cambiato riguardo la figura del trascrittore e soprattutto all’equiparazione del documento sonoro a quello cartaceo. Ancora oggi, infatti, al trascrittore viene richiesta esperienza nell’ascolto e velocità nella vide-scrittura e non una competenza in ambito linguistico o fonetico. Tutto ciò, pur sapendo che l’affidabilità del documento prodotto (la trascrizione) è fortemente legata all’attendibilità di chi lo produce (il trascrittore), all’osservazione di regole e procedure standardizzate che consentono di stimarne l’autenticità, l’affidabilità, l’integrità e la possibilità di utilizzo (iso/uni 15489/2006). L’intercettazione, per sua natura, non ha forma in un documento scritto e strutturato in senso diplomatico-archivistico. La lunga tradizione di scrittura delle fonti orali e dei documenti sonori nei vari ambiti disciplinari ha causato la difficoltà del riconoscimento del documento/testimonianza come documento informativamente autonomo perché considerato come strumento di lavoro ad uso del solo ricercatore.

La trascrizione non è definita nel Codice di Procedura Penale. È possibile dedurne una dall’art. 268, comma 7, c.p.p. Esecuzione delle operazioni: Il giudice dispone la trascrizione integrale delle registrazioni ovvero la stampa in forma intelligibile delle informazioni contenute nei flussi di comunicazione informatiche o telematiche da acquisire, osservando le forme, i modi e le garanzie previsti per l’espletamento delle perizie (articolo 220). Le trascrizioni o le stampe sono inserite nel fascicolo per il dibattimento. La nostra attenzione si sofferma sugli aggettivi integrale e intelligibile di questa definizione. ‘Integrale’ per alcuni magistrati sottende all’interezza del progressivo o del RIT soggetto a trascrizione. Al contrario, dovrebbe essere inteso come trascrivere l’atto comunicativo nella sua interezza, comprendendo le pause, i rumori, i cambi di intonazione, il linguaggio non verbale, ecc. D’altronde, il dispositivo dell’art. 266 c.p.p., Capo IV, stabilisce che il contenuto dell’intercettazione è costituito dalle “conversazioni o comunicazioni” e non solo dalle “parole dette”. Dunque, oggetto di intercettazione è il complesso evento comunicativo che si è realizzato. La trascrizione, conseguentemente, dovrebbe restituire l’interezza dell’evento comunicativo, compresi i fenomeni prosodici, paralinguistici, ecc. Oggi la riforma Cartabia prevedendo la video registrazione delle udienze al posto del fascicolo solo ed esclusivamente cartaceo, riconosce che la comunicazione è un atto complesso e multimodale molto difficile da trasporre interamente su carta.

L’aggettivo “intelligibile” deve essere interpretato come la capacità di una trascrizione di essere letta e compresa da chiunque, anche da chi non possiede competenze specifiche, evitando simboli o segni non convenzionali.

Nell’ambito della Linguistica Forense la trascrizione viene differenziata in base allo scopo e può essere:

  1. Logopedica: il trascrittore si concentra su suoni prodotti male; la trascrizione fonetica stretta segnala disartrie, mal occlusioni, e diventa la base su cui programmare il percorso riabilitativo;
  2. Articolatoria: il trascrittore trascrive gli atti articolatori utilizzati per la produzione dei suoni;
  3. Ritmica prosodica: il trascrittore trascrive la prosodia e l’intonazione;
  4. Comparazione fonica: il trascrittore trascrive le porzioni di segnale che soddisfano i requisiti minimi per misure acustiche utili nella comparazione e identificazione del parlante;
  5. Apprendimento di una lingua straniera: il trascrittore si concentra sui processi di interlingua e interferenza della lingua madre sulla lingua straniera da apprendere, per progettare un percorso formativo adeguato;
  6. Lista o appunti: il trascrittore produce una lista o un riassunto di ciò che ascolta, interpretando, riassumendo (vedi gli appunti di uno studente in classe, di un giornalista ecc.).
  7. Verbalizzazione: il trascrittore di udienza o di una riunione di lavoro, produce un verbale che verrà approvato dagli stessi parlanti nella seduta successiva. Durante queste registrazioni la volontà dei parlanti è farsi capire ed essere riconosciuti;
  8. Trascrizione di un video: è necessaria una trascrizione multimodale che tenga conto della voce e del canale extralinguistico e non verbale;
  9. Forense: I processi sono costituiti da fatti che nel caso delle intercettazioni sono basati sulla lingua parlata, il trascrittore ricostruisce un fatto accaduto traducendo il canale orale in codice scritto. In questo caso, la volontà del parlante è opposta a quella della verbalizzazione, poiché egli non vuole farsi capire da tutti ma solo dal suo diretto interlocutore.

Il trascrittore effettua sempre una scelta in base all’obiettivo e allo scopo della trascrizione, favorendo alcune informazioni e omettendone altre. Una trascrizione integrale di una intercettazione, includendo tutte le informazioni, renderebbe il documento illeggibile, violando il principio dell’intelligibilità. Anche la migliore trascrizione è un’astrazione e il frutto di precise scelte.

Lo scopo della trascrizione forense non è uguale per tutti i trascrittori. Gli operatori di Polizia Giudiziaria aggiungono omissis o i nomi degli interlocutori e ricostruiscono azioni in base a rumori ascoltati o altre conoscenze sul caso. La Cassazione richiede ai periti e ai consulenti solo la trascrizione delle parole e censura ogni forma di interpretazione o di ricostruzione di un fatto. Tuttavia, le trascrizioni della polizia giudiziaria possono influenzare ordinanze di custodia cautelare, le strategie difensive degli avvocati e la percezione pubblica attraverso la loro diffusione sui mass media. Tutte le trascrizioni sono spesso presentate come fedeli riproduzioni del segnale sonoro intercettato ma in realtà rappresentano una finzione, secondo la quale il dialogo intercettato si sarebbe svolto in modo ordinato e lineare, senza pause, esitazioni, sovrapposizioni, indecisioni, negoziazioni o conflitti. Nella realtà, le conversazioni sono molto diverse e la trascrizione nasconde l’oralità originaria allontanandosi pericolosamente dalla realtà.

Esistono diversi tipi di intercettazioni che richiedono diversi approcci di trascrizione. Le registrazioni possono essere trasparenti (interrogatori, deposizioni in aula), clear (intercettazioni telefoniche), poor (registrazioni ambientali in movimento come auto, treni o in ambienti come uffici, case) o multimodali (registrazioni video e audio). Ognuna di queste diverse intercettazioni produce registrazioni diverse che richiedono approcci differenti. Nelle registrazioni trasparenti il parlante sa di essere registrato e il suo scopo è quello di farsi capire; nelle registrazioni clear o in assenza, i parlanti sono sempre due, non si vedono quindi mettono in atto tutte le strategie di cooperazione esplicitando acusticamente ogni messaggio (ad esempio un ‘si’ deve essere acustico, il cambio di interlocutore viene comunicato: ti passo Gianni, l’inizio o la fine della conversazione vengono segnalate con un pronto o con un ciao), la distanza tra il microfono e i parlanti è fissa, la qualità della registrazione è sufficiente; nelle registrazioni poor, non è noto il numero degli interlocutori, la cooperazione viene meno (un ‘si’ può essere sostituito da un cenno del capo, il cambio degli interlocutori non viene mai segnalato), la distanza tra i parlanti e il microfono è variabile e ciò crea registrazioni sature in alcuni casi e di bassissima intensità in altri, la qualità della registrazione è spesso scarsa e il segnale è coperto da rumore (nel processo “Gioco d’azzardo” sono state effettuate nove diverse trascrizioni della stessa porzione di segnale, variando dalla valutazione di segnale “non trascrivibile” a trascrizioni comprendenti ben 2764 parole). Nelle registrazioni multimodali è necessario aggiungere al testo scritto alcuni fotogrammi con un preciso riferimento al linguaggio non verbale. Non esistendo un solo tipo di intercettazione e quindi un solo tipo di trascrizione, risulta essere di fondamentale importanza la competenza del trascrittore. Egli, nello svolgere il proprio compito, deve affrontare problemi linguistici e tecnici:

Problemi linguistici
Numero dei parlanti: identificare e caratterizzare ogni singola voce, anche quando sono simili o lontane dalla microspia e assegnare ogni frase ascoltata ad ognuno di loro.
• Caratteristiche personali: Riconoscere la naturalezza, chiarezza della voce, stato emotivo e fisico, difetti di pronuncia, competenza linguistica e ricchezza lessicale del parlante.
• Codice e stile: Identificare il codice linguistico, l’uso del dialetto, gergo o codice, e lo stile utilizzato.
• Contesto: Identificare il luogo della conversazione, la situazione e interpretare le conoscenze condivise tra i parlanti e il loro livello di cooperazione.
• Intonazione e prosodia: Interpretare le frasi ascoltate assegnando correttamente un valore ironico, scherzoso, canzonatorio, minaccioso ecc. Interpretare la frase ascoltata in base alla posizione e alla durata delle pause presenti.

Problemi tecnici
• Tipi di registrazione: Gestire diversi tipi di intercettazione, diversi formati di registrazione, con diverse frequenze di campionamento ecc.
• Qualità della registrazione: Affrontare bassa intensità, saturazione della registrazione e presenza di rumori additivi o convolutivi.

Alcuni problemi presenti nelle trascrizioni forensi
L’uso degli omissis è una scelta volontaria del tutto ingiustificata, di omettere una parte della conversazione perché ritenuta “irrilevante” (compiendo di fatto quella valutazione che la Cassazione afferma che non può essere fatta).

Gli omissis diventano un esercizio di potere discrezionale del trascrittore che per legge non viene riconosciuto come Perito. Gli omissis sono la dimostrazione di come la trascrizione spesso contenga un’alterazione della rappresentazione della conversazione registrata. Poiché la registrazione costituisce la prova della conversazione, la trascrizione che presenta scelte volontarie rischia di rappresentare in modo alterato una prova.

Anche le porzioni incomprensibili sono cruciali per la ricostruzione di un fatto accaduto. Non si tratta solo della mancata comprensione di una parola o di una frase, ma dell’impossibilità di ricostruire un evento o di farlo in modo errato a causa della mancanza di informazioni complete. Nelle trascrizioni, “incomprensibile” viene spesso utilizzato per indicare un segnale fortemente disturbato dal rumore di fondo, la difficoltà nel comprendere parole mal pronunciate o la non conoscenza della lingua o del dialetto da trascrivere. Spesso, il trascrittore, di fronte a parole incomprensibili, cerca di supplire utilizzando le proprie conoscenze del contesto, delle parti coinvolte o dei reati oggetto di procedimento, invece di segnalare l’incomprensibilità. È portato a compiere tale sforzo interpretativo pur di fornire una sua versione “leggibile” e coerente di ciò che è stato detto, invece di astenersi dal trascrivere e segnalare che quel brano di parlato è incomprensibile. I risultati di un questionario somministrato ai trascrittori iscritti all’Albo dei periti del Tribunale di Roma riguardo al loro atteggiamento di fronte a una parola o frase incomprensibile, rivelano che ben il 38% del campione, con l’intento di dimostrare dedizione nel proprio lavoro (ma ignorando completamente i meccanismi della percezione), dichiara di riascoltare il segmento audio fino a quando non ‘diventa’ comprensibile. La trascrizione di un segnale sonoro intercettato non può essere un’opinione o un’interpretazione personale, ma deve tendere a essere la corretta, oggettiva e veritiera rappresentazione grafica della realtà sonora.

Inoltre non viene mai segnalata la durata della porzione incomprensibile come ad esempio nel processo Contrada del Tribunale di Palermo. Una analisi accurata rileva che la somma delle porzioni incomprensibili ha una durata di 28,96 secondi su un segnale lungo poco più di 30. Traducendo il tempo in possibili sillabe prodotte, si constata che ne sono state trascritte solo 56 mentre ben 482,6 risultano essere incomprensibili. In questa situazione, il fatto ricostruito attraverso la traduzione dell’intercettazione in trascrizione risulta essere la completa rappresentazione della realtà?

Segnalare la durata dell’incomprensibile in una trascrizione è fondamentale per la corretta ricostruzione degli eventi. Anche le pause, spesso non segnalate, sono cariche di informazioni (al contrario di quanto afferma la Cassazione riguardo la trascrizione delle sole parole). Una lunga pausa prima di una risposta o una pausa tra un verbo e un soggetto paziente possono aiutare la corretta comprensione. Nell’esempio ‘sono arrivate (pausa) le scarpe?’, la presenza della pausa indica una precisa chiave di lettura che indirizza la comprensione: l’ascoltatore non deve intendere con scarpe l’oggetto ma la cosa di cui entrambi devono parlare ma che non può essere nominata in maniera esplicita. In questo caso la maggiore informazione comunicativa risiede proprio in quella pausa, in quel silenzio che quindi deve essere segnalato e trascritto.

Un ulteriore problema riguarda gli errori inconsci legati alla qualità del segnale e causati dal malapropismo (effetto mondegreen) o dal mutamento semantico indotto da una cattiva comprensione del significato globale o dalla sintassi della frase. Questa ricostruzione del segnale degradato si basa inconsciamente sulle proprie conoscenze (quelle che Goodwin chiama propria visione professionale) e introduce un pericoloso elemento di soggettività. Il parlante normalmente ipoarticola le proprie produzioni linguistiche soprattutto in presenza. L’ascoltatore, nel processo che va dalla percezione alla comprensione, non si basa solo sul segnale acustico, ma ricorre a fattori esterni, a tutto ciò che l’intera situazione comunicativa offre e che può tornare utile per decifrare il messaggio, anche quando questo è degradato. Il trascrittore, esterno alla comunicazione, integra continuamente ciò che ascolta, ‘immaginando’ inconsciamente la singola parola o l’intera frase utilizzando le proprie conoscenze o le conoscenze pregresse, partecipando attivamente e condizionando ciò che egli stesso ascolta. Un errore simile può essere effettuato, sempre inconsciamente, anche dal giudice quando ascolta la porzione di segnale degradato in camera di consiglio leggendo una trascrizione già effettuata da altri. In seguito “all’effetto priming“ (in psicolinguistica descrivere l’influenza di uno stimolo detto “prime”=innesco sull’elaborazione di uno stimolo presentato immediatamente dopo detto “target” o “bersaglio“) il giudice cerca conferma nell’audio di ciò che sta leggendo e non il contrario.

La Cassazione penale, sezione VI, nella sentenza del 28 marzo 2018, n. 24744, afferma che <<In tema di intercettazioni di conversazioni telefoniche o ambientali, la prova è costituita dalle bobine e dai verbali, sicché il giudice può utilizzare il contenuto delle intercettazioni indipendentemente dalla trascrizione, che costituisce la mera trasposizione grafica del loro contenuto, procedendo direttamente al loro ascolto>>, Cassazione penale, sez. VI, 30/10/1992, in Mass. Pen. Cass. 1993, fasc. 6,12 (s.m.) <<La trascrizione delle registrazioni, non soltanto non costituisce mezzo di prova, ma non può neppure identificarsi come una tipica attività di documentazione, fornita di una propria autonomia conoscitiva, rappresentando esclusivamente un’operazione di secondo grado volta a trasporre con segni grafici il contenuto delle registrazioni>>; Nota della Cassazione Penale Sez.V  di 11/03/2002, n°9633 <<[…] la prova è costituita dalla bobina. […] La trasposizione su carta del contenuto delle registrazioni rappresenta solo un’operazione di secondo grado>>.

L’ascolto può risultare complesso poiché i brani intercettati, come già detto, sono spesso di scarsa qualità acustica e, nella maggior parte dei casi, sono in dialetto o in lingua straniera. In quest’ultimo caso, il giudice si affida alla trascrizione giurata di un traduttore certificato e iscritto all’albo dei traduttori. Se la registrazione è in dialetto, il giudice tende a ritenersi competente nell’ascolto, basandosi sulla propria conoscenza dialettale o su quella del trascrittore. Tuttavia, a differenza del traduttore, il trascrittore non possiede una certificazione di competenza nei dialetti e non è iscritto a nessun albo professionale che garantisca tale competenza dialettologica. Si tende a ignorare che le lingue e, ovviamente, anche i dialetti, non sono monoliti, ma sono costituiti da repertori di varietà; non esiste un dialetto calabrese ma numerosissime varietà spesso totalmente diverse le une dalle altre. Un giudice, un Pubblico Ministero o un Avvocato anche se calabrese può non essere in grado di comprendere una determinata varietà locale o situazionale del dialetto che sta ascoltando rischiando di effettuare errori di interpretazione.

Conclusioni
Nel campo delle trascrizioni, non possiamo continuare a fidarci dell’opinione di un singolo senza competenze certificate. È necessario individuare e prevedere la figura professionale di esperto linguista in ambito forense, programmare percorsi formativi pubblici come lauree triennali o master di primo o secondo livello, e far sì che magistratura e avvocatura, nella nomina di un perito o consulente, si affidino a queste figure professionali, intervenendo sull’art. 221 del Codice di Procedura Penale che oggi lascia piena libertà al giudice nella nomina.

Solo così potremmo evitare i tanti errori giudiziari causati da trascrizioni inaccurate o mal interpretate e limitare i ritardi nei processi laddove spesso viene richiesta più volte la trascrizione della stessa porzione di segnale.

 

*Prof. Ordinario di Glottologia e Linguistica presso l’Università della Calabria e Coordinatore dell’Osservatorio sulla Linguistica Forense (OLF) gruppo tematico dell’Associazione Italiana di Scienze della Voce (AISV)

 

Torna in alto