Andare a ritroso a partire dalle informazioni trapelate da un’immagine è possibile grazie all’Intelligenza Artificiale e ai modelli di Machine Learning, che utilizzano le modalità di accesso e trasformazione delle informazioni tipiche delle Reti Neurali Convoluzionali e la Term Frequency-Inverse Document Frequency
In questo articolo si parla di:
Estrarre informazioni da reti neurali convoluzionali (CNN), ovvero dei tipi di reti neurali in cui la connettività tra i neuroni è di tipo feed-forward – e si ispira al funzionamento della corteccia visiva nell’animale – è utile per elaborare immagini e modelli ricorrenti nella loro fonte primaria di input. Come nel modello di organizzazione della corteccia visiva animale, anche la convoluzione combina più livelli di immagine per determinare una forma media. Nel Machine Learning questa tecnica individua dei documenti – delle informazioni – che formano un modello dalle caratteristiche complesse e sfaccettate.
Le librerie di segnali e l’uso delle Reti Convoluzionali nella Machine Learning
Già prima dell’applicazione delle CNN nel Machine Learning, un’idea di come dalle immagini potevano essere estratte informazioni e viceversa era alla base della Neocognitron, nel 1986, dove fu prodotta una libreria di segnali, che successivamente fu migliorata nel design e semplificata per l’utilizzo. Una rete convoluzionale a 7 livelli fu progettata da Yann LeCun nel 1998. Utilizzata per riconoscere i numeri scritti a mano sugli assegni digitalizzati, fu riconosciuta come scoperta pioneristica. Oggi questo tipo di approvvigionamento di informazioni viene utilizzato, oltre che nel riconoscimento di immagini e video, anche nell’elaborazione del linguaggio naturale e in bioinformatica.
“Si può misurare la frequenza di un termine, identificando quali termini sono più incisivi per attingere dal testo un significato logico e coerente.”
Tecniche diverse per generare livelli superiori di informazione
Dall’immagine, attraverso la Machine Learning è possibile estrarre testo e viceversa. Testo e immagine in tal modo si contrappongono generando un ulteriore livello di informazione. Nel testo, l’apprendimento automatico si può dividere in due categorie, a seconda del tipo di algoritmo risultante dalle operazioni di apprendimento: la categoria della classificazione del tipo di documento e quella della estrazione di informazioni. Nel primo caso l’algoritmo determina parole chiave in un testo.
La Term Frequency-Inverse Document Frequency per estrarre informazioni dal testo
Utilizzando la Term Frequency-Inverse Document Frequency (TF-IDF) si può misurare la frequenza di un termine, identificando quali termini sono più incisivi per attingere dal testo un significato logico e coerente. In tal modo è possibile valutare natura e scopo di un testo. Nella seconda categoria citata di algoritmo – quella relativa alla estrazione delle informazioni – grazie alla lettura del testo ottenuto nella precedente fase, l’accuratezza dei dati estratti è di maggior valore.
Author: Claudia Sistelli
© Riproduzione Riservata


Lascia un commento