Quali sono le fasi di un RAG?
Ho una buona notizia: se avete compreso le prime tre lezioni, allora sapete già cosa sia un RAG. Un processo tipico di RAG è il seguente:
- si spezzetta un testo in parti più piccole (chunking), in modo da renderle più gestibili e facilmente contestualizzabili dagli step successivi;
- i testi vengono convertiti in vettori numerici (embedding), che vengono solitamente salvati in un database vettoriale;
- anche le query di ricerca (ad esempio le domande poste da un utente) vengono trasformate in vettori numerici, che vengono poi utilizzati per interrogare il database (retrieval);
- se necessario, i documenti estratti possono essere riordinati tramite un ulteriore passaggio di reranking, prima di essere passati al modello linguistico;
- infine, i risultati vengono forniti a un modello linguistico (LLM), che genera la risposta più adeguata alla domanda iniziale.
Come si può notare, si tratta di concetti che abbiamo già incontrato. Possiamo quindi descrivere un RAG come una pipeline che, interrogando opportune fonti — spesso basate su rappresentazioni vettoriali, ma in alcuni casi anche su semplice testo — recupera informazioni rilevanti da una base dati e le utilizza per generare una risposta.
Questo sito non utilizza cookie, non mostra nessuna pubblicità e non profila nulla. Navigate serenamente, siete i benvenuti.