Kursplan

Introduktion till Google Colab och Apache Spark

  • Översikt över Google Colab
  • Introduktion till Apache Spark
  • Konfigurera Spark i Gogogo Colab

Databehandling med Apache Spark

  • Arbeta med RDD:er och DataFrames
  • Läsa in och bearbeta stora datamängder
  • Använda Spark SQL för att fråga strukturerade data

Avancerad analys med Spark

  • Maskininlärning med Spark MLlib
  • Utföra dataanalys i realtid
  • Distribuerad databehandling med Spark

Visualisering och Collaboration i Gogole Colab

  • Integrera Colab med populära visualiseringsbibliotek
  • Samarbetsarbetsflöden med Colabs anteckningsböcker
  • Dela och exportera resultat

Optimera Big Data arbetsflöden

  • Trimma Spark för prestanda
  • Optimera minnes- och lagringsanvändning
  • Skalning av arbetsflöden för stora datamängder

Big Data i molnet

  • Integrera Google Colab med molnbaserade verktyg
  • Använda molnlagring för stordata
  • Arbeta med Spark i distribuerade molnmiljöer

Fallstudier och bästa praxis

  • Granskning av verkliga big data-applikationer
  • Fallstudier med hjälp av Apache Spark och Colab
  • Metodtips för stordataanalys

Sammanfattning och nästa steg

Krav

  • Grundläggande kunskaper om begrepp inom datavetenskap
  • Förtrogenhet med Apache Spark
  • Python Kunskaper i programmering

Publik

  • Datavetare
  • Datatekniker
  • Forskare som arbetar med big data
 14 timmar

Antal deltagare


Price per participant

Vittnesmål (5)

Upcoming Courses

Relaterade Kategorier