L'elaborazione del linguaggio naturale (NLP) consente ai computer di interpretare il linguaggio umano.
Dopo aver letto questo articolo sarai in grado di:
Argomenti correlati
Cos'è l'intelligenza artificiale (IA)?
Cos'è il machine learning?
Cos'è il deep learning?
Cos'è un modello linguistico di grandi dimensioni (LLM)?
Big data
Abbonati a theNET, il riepilogo mensile di Cloudflare sulle tematiche più discusse in Internet.
Copia link dell'articolo
L'elaborazione del linguaggio naturale (NLP) è un metodo che i programmi informatici possono utilizzare per interpretare il linguaggio umano. L'elaborazione del linguaggio naturale è un tipo di intelligenza artificiale (IA). I modelli NLP moderni sono per lo più sviluppati tramite il machine learning e attingono anche al campo della linguistica, ovvero lo studio del significato del linguaggio.
Tutti i computer possono interpretare comandi e istruzioni in linguaggi compatibili con i computer. Ad esempio, un computer (in particolare un'applicazione browser) può comprendere e interpretare codice JavaScript come:
window.addEventListener("scroll", popup);
function popup() {
window.alert("Hello, world!");
}
Ma non è in grado di comprendere e interpretare testi in linguaggio naturale come:
Se l'utente scorre la pagina, mostra un avviso che dice "Hello, world!"
Tuttavia, un programma per computer dotato di elaborazione del linguaggio naturale potrebbe essere in grado di comprendere la frase di cui sopra, anche se non riesce a eseguire il comando.
Sebbene i linguaggi di programmazione siano il modo migliore per impartire comandi ai computer, l'elaborazione del linguaggio naturale consente ai programmi per computer di svolgere un'ampia gamma di attività utilizzando il linguaggio umano, sia parlato che scritto. Ad esempio, può aiutare a elaborare grandi raccolte di dati di registrazioni vocali e testi scritti, automatizzare le interazioni con gli utenti umani o interpretare le query degli utenti.
Altri usi dell'elaborazione del linguaggio naturale includono:
L'elaborazione del linguaggio naturale utilizza il machine learning per analizzare statisticamente i contenuti generati dall'uomo e imparare a interpretarli. Durante il processo di addestramento, ai modelli NLP vengono forniti esempi di parole e frasi nel contesto, insieme alle loro interpretazioni. Ad esempio, un modello NLP potrebbe non capire quando la parola "arancio" indica il colore anziché il frutto. Ma dopo aver ricevuto migliaia di esempi, frasi come "Ho mangiato un arancio" o "Questa macchina è arancio", il modello può iniziare a comprendere la parola e a interpretare correttamente la differenza tra i suoi significati.
Data la complessità e le incoerenze del linguaggio umano, l'elaborazione del linguaggio naturale si basa spesso sul deep learning, che è un tipo più potente di machine learning. I modelli di deep learning possono elaborare dati grezzi non etichettati, sebbene necessitino di grandi quantità di dati per essere addestrati correttamente. Il deep learning richiede anche una grande potenza di elaborazione.
La pre-elaborazione NLP è la preparazione del testo non elaborato per l'analisi da parte di un programma o di un modello di machine learning. La pre-elaborazione NLP è necessaria per inserire il testo in un formato che i modelli di deep learning possano analizzare più facilmente.
Esistono diversi metodi di pre-elaborazione NLP che vengono utilizzati insieme. I principali sono:
Un modello linguistico di grandi dimensioni (LLM) è un tipo di modello di machine learning in grado di comprendere il testo generato dall'uomo e generare output dal suono naturale. Gli LLM, come l'ampiamente utilizzato ChatGPT, vengono addestrati su set di dati di testo molto grandi.
Esiste una certa sovrapposizione tra i termini NLP e LLM: entrambi utilizzano il machine learning, set di dati di grandi dimensioni e addestramento per interpretare il linguaggio umano. In effetti, alcune fonti definiscono un LLM come un tipo di NLP.
Tuttavia, gli LLM differiscono dai modelli NLP in diversi modi:
Ad esempio, un modello NLP sarebbe più utile per l'analisi del sentiment, mentre un LLM funzionerebbe bene se incorporato in un chatbot che interagisce con i clienti. Oppure, un modello NLP potrebbe aiutare un motore di ricerca a interpretare la query di un utente e generare risultati di ricerca pertinenti, mentre un LLM potrebbe scrivere la propria risposta alla query basata sull'analisi statistica di contenuti rilevanti preesistenti.
L'elaborazione del linguaggio naturale (NLP) è diversa anche dall'IA generativa, sebbene siano correlate. L'IA generativa è un modello di deep learning in grado di generare testo, audio, video, immagini o codice. I modelli NLP, al contrario, spesso non sono progettati per generare testo. I modelli linguistici di grandi dimensioni, invece, sono un tipo di IA generativa in quanto possono produrre testo in risposta a delle query.
Cloudflare consente agli sviluppatori di eseguire deep learning avanzato su GPU in tutto il mondo, offrendo loro la potenza di calcolo necessaria per addestrare modelli di intelligenza artificiale con una latenza minima. E Cloudflare R2 è un metodo di archiviazione conveniente per l'enorme quantità di dati su cui deve essere addestrata l'elaborazione del linguaggio naturale basata sul deep learning. Scopri di più su Cloudflare per l'intelligenza artificiale.