Kursplan

Introduktion till Reinforcement Learning

  • Vad är förstärkande inlärning?
  • Nyckelbegrepp: agent, miljö, tillstånd, åtgärder och belöningar
  • Utmaningar inom förstärkande inlärning

Utforskning och Utnyttjande

  • Balansering av utforskning och utnyttjande i RL-modeller
  • Utforskningsstrategier: epsilon-greedy, softmax och fler

Q-Lärande och djupa Q-nätverk (DQNs)

  • Introduktion till Q-lärande
  • Implementering av DQNs med TensorFlow
  • Optimering av Q-lärande med upplevelsereplay och målnätverk

Policybaserade Metoder

  • Policygradientalgoritmer
  • REINFORCE-algoritmen och dess implementering
  • Aktör-kritik-metoder

Arbeta med OpenAI Gym

  • Inställning av miljöer i OpenAI Gym
  • Simulering av agenter i dynamiska miljöer
  • Utvärdering av agenter

Avancerade Reinforcement Learning Tekniker

  • Multi-agent förstärkande inlärning
  • Deep deterministic policy gradient (DDPG)
  • Proximal policy optimization (PPO)

Distribution av Reinforcement Learning Modeller

  • Praktiska tillämpningar av förstärkande inlärning
  • Integration av RL-modeller i produktionsmiljöer

Sammanfattning och Nästa Steg

Krav

  • Erfarenhet av Python programmering
  • Grundläggande förståelse för djuplärande och maskininlärningskoncept
  • Kunskap om algoritmer och matematiska koncept som används inom förstärkande inlärning

Målgrupp

  • Datavetenskapsmän
  • Maskininlärningspraktiker
  • AI-forskare
 28 timmar

Antal deltagare


Price per participant

Upcoming Courses

Relaterade Kategorier