Chatbot, AI, Modelli linguistici: quanta confusione!
2023-06-13 11:55:05
I Chatbot stanno diventando un'importante parte dell'esperienza di molti utenti online. Grazie alla loro capacità di conversare in maniera semplice e intuitiva, sono diventati una risorsa utile per molte aziende e organizzazioni. Vogliamo usare questa occasione per fare chiarezza su alcune terminologie che vengon spesso confuse dai profani: Chatbot, AI, e Modello Linguistico.
Il Chatbot è una applicazione che riceve un input dall'utente, lo analizza, e produce un output di conseguenza. Come funziona un Chatbot? Quali sono le sue mansioni principali?
La prima è di raccogliere l'input, generalmente attraverso l'uso di un forma HTML; la seconda è di far passare questo input attraverso un sistema di elaborazione capace di 'capire' illinguaggio utilizzato dall'utente e tradurlo in qualcosa di comprensibile al chatbot stesso. Questo sistema di elaborazione è il Modello Linguistico.
Ci sono diversi modelli linguistici utilizzati per creare chatbot. Questi modelli sono basati su algoritmi, definiti impropriamente 'algoritmi di AI', e sono in grado di apprendere dalle conversazioni umane, migliorando continuamente la loro capacità di comunicazione.
Tra i principali modelli linguistici utilizzati si trovano:
Il modello basato su Machine Learning, d'altra parte, si basa su algoritmi di apprendimento automatico. In questo caso, il chatbot impara dalle conversazioni che ha con gli utenti e utilizza queste informazioni per migliorare le proprie risposte. Questo tipo di modello è molto più flessibile e in grado di apprendere rapidamente, ma richiede un maggiore sforzo nell'addestramento e nella correzione degli errori. Come fa il modello ad imparare? La sua programmazione lo rende capace di dare un 'peso' alle componenti del linguaggio, di stabilire dei passaggi chiave, e di 'pesare' elementi sconociuti nell'input valutando il loro effetto nei confronti della frase o richiesta ricevuta.
I modelli ibridi, invece, combinano i due precedenti. Questi modelli utilizzano sia le regole predefinite che l'apprendimento automatico per migliorare le proprie prestazioni.
A dir la verità, dovremmo parlare anche di un altro genere di modello: i modelli a Rete Neurale. Un modello linguistico a rete neurale è un tipo di modello che utilizza una rete neurale artificiale per analizzare il linguaggio naturale. La rete neurale è composta da diversi strati di componenti che lavorano insieme per elaborare l'input e produrre l'output; man mano che l'input viene elaborato attraverso i vari strati della rete neurale, viene trasformato in una rappresentazione numerica (questo genere di modelllo viene infatti chiamato anche trasformativo). Può quindi essere utilizzato per allenare la rete neurale attraverso un processo di apprendimento supervisionato o non supervisionato, intendendo con questo che possono essere impiegate risorse di 'controllo' sia degli input che della coerenza dell'output, risorse che possono essere routine software o persone in carne ed ossa...
Per fare qualche esempio, ChatGPT3.5 è un modello a rete neurale trasformativo, mentre DaVinci è un modello linguistico basato su Deep Learning classico, la cui versione 03 si dimostra particolarmente efficiente per la generazione e conversione di testo comunicativo.
Cosa ha a che fare l' AI con questo discorso?
Intanto chariamo che il termine Intelligenza Artificiale è usato in questo ambito molto impropriamente, più per un valore mediatico e per immediatezza comunicativa che altro; l'aspetto intelligente, o quasi, del sistema, sta nella capacità di un chatbot di valutare la giusta connessione tra utilizzo delle regole di base e risultato dell'apprendimento. Questo sistema, anche nei migliori casi attualmente a disposizione, come Bard e GTP4, è estremamente 'costoso' in termini di elaborazione, e produce risultati lenti, a volte molto elementari, ma capaci di gestire molto abilmente le ambiguità, molto meglio dei classici sistemi di machine learning.
La scelta del modello linguistico da utilizzare dipenderà ovviamente da tanti fattori, tra i quali le esigenze specifiche del progetto, le risorse disponibili per lo sviluppo, il livello di precisione necessario, la necessità o meno di 'ricordare' le interazioni, etc. A tale scopo son state sviluppate appositamente quelle che vengono chiamate Reti di Memoria a Lungo Termine, ossia modelli sviluppati per aiutare i chatbot ad apprendere dalle interazioni precedenti e a mantenere un contesto di conversazione lungo il tempo, al tempo stesso affinando le regole interne del modello a regole usato come base, e fornendo maggiore precisione nelle 'pesate' delle componenti linguistiche dell' input utente.
Ultimamente, numerosi progetti di Chatbot basati su modelli ormai ben addestrati e di medio livello (come DaVinci 02 e 03) stanno offrendo all'utente la possibilità di creare la propria versione di un chatbot addestrato; proprio in questa ottica abbiamo creato la nostra VivacityGPT Online, sia in versione Desktop che come servizio online... si tratta di un prodotto non certo competitivo rispetto alla versione professionale dei maggiori sistemi (Bing, Bard, ChatGPT4) ma, in quanto basata sul progetto Codex con modello DaVinci 03, è molto più capace - rispetto ad altri sistemi - di interagire con la rete e reperire informazioni aggiornate (contrariamente, per esempio, a ChatGPT3.5).
Il Chatbot è una applicazione che riceve un input dall'utente, lo analizza, e produce un output di conseguenza. Come funziona un Chatbot? Quali sono le sue mansioni principali?
La prima è di raccogliere l'input, generalmente attraverso l'uso di un forma HTML; la seconda è di far passare questo input attraverso un sistema di elaborazione capace di 'capire' illinguaggio utilizzato dall'utente e tradurlo in qualcosa di comprensibile al chatbot stesso. Questo sistema di elaborazione è il Modello Linguistico.
Ci sono diversi modelli linguistici utilizzati per creare chatbot. Questi modelli sono basati su algoritmi, definiti impropriamente 'algoritmi di AI', e sono in grado di apprendere dalle conversazioni umane, migliorando continuamente la loro capacità di comunicazione.
Tra i principali modelli linguistici utilizzati si trovano:
- il modello basato su regole,
- il modello basato su machine learning
- il modello ibrido.
Il modello basato su Machine Learning, d'altra parte, si basa su algoritmi di apprendimento automatico. In questo caso, il chatbot impara dalle conversazioni che ha con gli utenti e utilizza queste informazioni per migliorare le proprie risposte. Questo tipo di modello è molto più flessibile e in grado di apprendere rapidamente, ma richiede un maggiore sforzo nell'addestramento e nella correzione degli errori. Come fa il modello ad imparare? La sua programmazione lo rende capace di dare un 'peso' alle componenti del linguaggio, di stabilire dei passaggi chiave, e di 'pesare' elementi sconociuti nell'input valutando il loro effetto nei confronti della frase o richiesta ricevuta.
I modelli ibridi, invece, combinano i due precedenti. Questi modelli utilizzano sia le regole predefinite che l'apprendimento automatico per migliorare le proprie prestazioni.
A dir la verità, dovremmo parlare anche di un altro genere di modello: i modelli a Rete Neurale. Un modello linguistico a rete neurale è un tipo di modello che utilizza una rete neurale artificiale per analizzare il linguaggio naturale. La rete neurale è composta da diversi strati di componenti che lavorano insieme per elaborare l'input e produrre l'output; man mano che l'input viene elaborato attraverso i vari strati della rete neurale, viene trasformato in una rappresentazione numerica (questo genere di modelllo viene infatti chiamato anche trasformativo). Può quindi essere utilizzato per allenare la rete neurale attraverso un processo di apprendimento supervisionato o non supervisionato, intendendo con questo che possono essere impiegate risorse di 'controllo' sia degli input che della coerenza dell'output, risorse che possono essere routine software o persone in carne ed ossa...
Per fare qualche esempio, ChatGPT3.5 è un modello a rete neurale trasformativo, mentre DaVinci è un modello linguistico basato su Deep Learning classico, la cui versione 03 si dimostra particolarmente efficiente per la generazione e conversione di testo comunicativo.
Cosa ha a che fare l' AI con questo discorso?
Intanto chariamo che il termine Intelligenza Artificiale è usato in questo ambito molto impropriamente, più per un valore mediatico e per immediatezza comunicativa che altro; l'aspetto intelligente, o quasi, del sistema, sta nella capacità di un chatbot di valutare la giusta connessione tra utilizzo delle regole di base e risultato dell'apprendimento. Questo sistema, anche nei migliori casi attualmente a disposizione, come Bard e GTP4, è estremamente 'costoso' in termini di elaborazione, e produce risultati lenti, a volte molto elementari, ma capaci di gestire molto abilmente le ambiguità, molto meglio dei classici sistemi di machine learning.
La scelta del modello linguistico da utilizzare dipenderà ovviamente da tanti fattori, tra i quali le esigenze specifiche del progetto, le risorse disponibili per lo sviluppo, il livello di precisione necessario, la necessità o meno di 'ricordare' le interazioni, etc. A tale scopo son state sviluppate appositamente quelle che vengono chiamate Reti di Memoria a Lungo Termine, ossia modelli sviluppati per aiutare i chatbot ad apprendere dalle interazioni precedenti e a mantenere un contesto di conversazione lungo il tempo, al tempo stesso affinando le regole interne del modello a regole usato come base, e fornendo maggiore precisione nelle 'pesate' delle componenti linguistiche dell' input utente.
Ultimamente, numerosi progetti di Chatbot basati su modelli ormai ben addestrati e di medio livello (come DaVinci 02 e 03) stanno offrendo all'utente la possibilità di creare la propria versione di un chatbot addestrato; proprio in questa ottica abbiamo creato la nostra VivacityGPT Online, sia in versione Desktop che come servizio online... si tratta di un prodotto non certo competitivo rispetto alla versione professionale dei maggiori sistemi (Bing, Bard, ChatGPT4) ma, in quanto basata sul progetto Codex con modello DaVinci 03, è molto più capace - rispetto ad altri sistemi - di interagire con la rete e reperire informazioni aggiornate (contrariamente, per esempio, a ChatGPT3.5).
Tags: Chatbot, deep learning, reti neurali, AI, ChatGPT, VivacityGPT, DaVinci, LLM, modelli linguistici
Condividi su Facebook // Dai un like // Assegna una lettura
Like ricevuti: 298 -
Letture riconosciute: 307
Condividi su Facebook // Dai un like // Assegna una lettura
Precedente - Torna alla lista - Successivo