Generative AI Aplicat: Sisteme RAG pentru Enterprise
Sesiuni programate
Dincolo de chatbox: Treci de la simple interfețe LLM la aplicații de Generative AI robuste, de nivel enterprise, folosind datele private ale companiei tale.
Stăpânește arhitectura RAG (Retrieval-Augmented Generation). Învață cum să ingerezi documente complexe, să aplici strategii avansate de chunking și să conectezi căutarea semantică cu modelele Large Language Models.
Framework-uri și Tooling: Lucrează hands-on cu framework-urile standard din industrie, precum LangChain și LlamaIndex, pentru a orchestra pipeline-uri AI complexe.
Focus pe Producție: ~70% din curs reprezintă laboratoare practice concentrate nu doar pe construirea sistemului RAG, ci și pe evaluarea acestuia. Învață să reduci halucinațiile, să măsori precizia (folosind RAGAS) și să gestionezi prompt injection.
Cui i se adresează: Software Engineers, AI Developers și Data Scientists responsabili de livrarea unor soluții fiabile bazate pe Generative AI.
Abilități dobândite
Curriculum
Fundamente LLM & Integrare API
- Înțelegerea LLM-urilor: Tokeni, ferestre de context, temperature și limite de generare
- Interacțiunea cu API-uri LLM (OpenAI) și modele locale (Ollama / HuggingFace)
- Prompt Engineering avansat: Few-shot prompting, Chain-of-Thought (CoT) și instrucțiuni de formatare
- Lab: Construirea unui extractor de date structurate folosind function calling / modul JSON
Arhitectura RAG & Ingestia Datelor
- Ce este Retrieval-Augmented Generation (RAG) și de ce este necesar?
- Document Loaders: Ingestia de PDF-uri, pagini de Confluence și fișiere Markdown
- Strategii avansate de Chunking: Recursive character splitting, semantic chunking și gestionarea overlapping-ului
- Lab: Construirea unui pipeline automat de ingestie a datelor într-un vector store
Orchestrare: LangChain & LlamaIndex
- Introducere în LangChain: Chains, Prompts și Output Parsers
- Bazele LlamaIndex: Nodes, Indices și Query Engines
- Conectarea retrieverelor la LLM-uri: Stuffing, Map-Reduce și lanțuri de documente de tip Refine
- Lab: Construirea unui bot conversațional QA peste un repository de documentație tehnică
Evaluarea și pregătirea RAG pentru producție
- Problema halucinațiilor și tehnici de atenuare a acestora
- Evaluarea RAG: Măsurarea preciziei contextului, a recall-ului și a relevanței răspunsului (folosind RAGAS/TruLens)
- Transformări de query: Query re-writing, sub-queries și căutare hibridă
- Lab: Implementarea unui pipeline de evaluare și ajustarea dimensiunilor de chunk-uri pentru a îmbunătăți mAP (Mean Average Precision)
Module opționale
Opțional — Tehnici Avansate de Retrieval
- Implementarea de Re-ranking (Cross-Encoders) pentru a îmbunătăți top-K results
- Parent-Document Retrieval și pattern-uri de la mic-la-mare
- Self-RAG: Învățarea LLM-ului să își critice propriul context extras
Structura zilei de curs
- Partea 1: 09:00–10:30
- Pauză: 10:30–10:45
- Partea 2: 10:45–12:15
- Pauză de prânz: 12:15–13:15
- Partea 3: 13:15–15:15
- Pauză: 15:15–15:30
- Partea 4: 15:30–17:30