Kursplan

Införandet

  • Vad är Large Language Models (LLMs)?
  • LLM:er jämfört med traditionella NLP-modeller
  • Översikt över LLM: s funktioner och arkitektur
  • Utmaningar och begränsningar med LLM

Förstå LLM:er

  • Livscykeln för en LLM
  • Hur LLM:er fungerar
  • Huvudkomponenterna i en LLM: kodare, avkodare, uppmärksamhet, inbäddningar, etc.

Komma igång

  • Konfigurera utvecklingsmiljön
  • Installera en LLM som ett utvecklingsverktyg, t.ex. Google Colab, Hugging Face

Arbeta med LLM:er

  • Utforska tillgängliga LLM-alternativ
  • Skapa och använda en LLM
  • Finjustera en LLM på en anpassad datauppsättning

Sammanfattning av text

  • Förstå uppgiften med textsammanfattning och dess tillämpningar
  • Använda en LLM för extraktiv och abstrakt textsammanfattning
  • Utvärdera kvaliteten på de genererade sammanfattningarna med hjälp av mätvärden som ROUGE, BLEU osv.

Svar på frågor

  • Förstå uppgiften att svara på frågor och dess tillämpningar
  • Använda en LLM för att svara på frågor med öppen domän och sluten domän
  • Utvärdera noggrannheten i de genererade svaren med hjälp av mätvärden som F1, EM, etc.

Generering av text

  • Förstå uppgiften med textgenerering och dess tillämpningar
  • Använda en LLM för villkorlig och ovillkorlig textgenerering
  • Styra stilen, tonen och innehållet i de genererade texterna med hjälp av parametrar som temperatur, top-k, top-p, etc.

Integrera LLM:er med andra ramverk och plattformar

  • Använda LLM:er med PyTorch eller TensorFlow
  • Använda LLM:er med Flask eller Streamlit
  • Använda LLM:er med Google Cloud eller AWS

Felsökning

  • Förstå de vanliga felen och buggarna i LLM:er
  • Använda TensorBoard för att övervaka och visualisera träningsprocessen
  • Använda PyTorch Lightning för att förenkla träningskoden och förbättra prestationen
  • Använda Hugging Face datauppsättningar för att ladda och förbearbeta data

Sammanfattning och nästa steg

Krav

  • En förståelse för naturlig språkbehandling och djupinlärning
  • Erfarenhet av Python och PyTorch eller TensorFlow
  • Grundläggande erfarenhet av programmering

Publik

  • Utvecklare
  • NLP-entusiaster
  • Datavetare
 14 timmar

Antal deltagare


Price per participant

Upcoming Courses

Relaterade Kategorier