Curso Apache Spark en Madrid, Barcelona y Online

Formación Apache Spark para profesionales de empresa que deseen aprender a realizar análisis de datos con dicho framework. Curso ofrecido en la modalidad de formación presencial In Company en Madrid, Barcelona, Valencia, Alicante, Málaga, Sevilla y Bilbao, bajo demanda para empresas o en modalidad online.

¿Qué es Apache Spark? Es una plataforma de computación de código abierto para análisis y procesos avanzados, que tiene muchas ventajas sobre Hadoop. Desde el principio, Spark fue diseñado para soportar en memoria algoritmos iterativos que se pudiesen desarrollar sin escribir un conjunto de resultados cada vez que se procesaba un dato.

Spark está ganando terreno a otros sistemas Big Data como Hadoop al realizar procesamiento en memoria distribuida para grandes volúmenes de datos. Además, aporta un conjunto mayor de operaciones para manipularlos cómodamente. Por otro lado, dispone de librerías para tratar los datos como en una base de datos relacional con queries SQL y cuenta con librerías de Machine Learning distribuidas. Es muy útil si se integra en la nube con DevOps, además se puede sacar provecho combinándolo con NoSQL para aplicaciones dirigidas a datos.

Aprende todas las novedades en torno a Apache Spark y prepárate para la certificación para empresas para trabajar como Big Data Developer.

formacion in company

Presencial In Company

Formación presencial In Company

Formación presencial en las instalaciones del cliente
formacion presencial convocatorias

Presencial Convocatorias

Convocatorias en abierto

Próximos cursos en tu ciudad
formacion online en streaming

Classroom Training

Formación online en Streaming

Profesor en directo con el sistema GoToMeeting

Online Classroom

Formación Online Asíncrona

Accede a nuestros contenidos multimedia desde nuestra plataforma LMS

Características del curso Apache Spark

24 horas

– Descubrir Spark: ¿Qué es Spark?
– Comprender los principios fundamentales de la computación distribuida.
– Desarrollar con Spark: dominar los conceptos asociados con Spark.
– Manipular bibliotecas Spark a través de varios ejercicios prácticos.

Desarrolladores Scala, Python o Java que deseen desarrollar aplicaciones sobre Spark.

Temario: Plan de formación | Apache Spark

Tema 1. Presentación de Spark

  • Historia: de MapReduce a Spark 2
  • Beneficios, alternativas y competidores.
  • ¿Qué lugar en el ecosistema de Hadoop?

Tema 2. Iniciación a la computación distribuida

  • Programación funcional
  • El paradigma de MapReduce

Tema 3. Desarrollo con Spark

  • Introducción a las API de Scala y Python
  • Manejo de RDDs y marcos de datos
  • Acciones vs Transformaciones
  • Gráfico Acíclico Dirigido (DAG)
  • Gestión de memoria y rendimiento (caché, broadcasting).

Tema 4. Nociones avanzadas

  • Tratamientos en tiempo real con Spark Streaming
  • Visión general de la biblioteca MLlib
  • Principios de operación Conductores / Trabajadores.
  • Introducción a Cluster Manager

Novedades en torno a Apache Spark

¿Cómo puedo aprender a hacer streaming analytics? Con esta formación para empresas verás todas las novedades que trae Apache Spark, DataFrame y DataSet, así como los beneficios de su implementación.

Formación Bonificada para empresas

Si actualmente estás trabajando, tu empresa podrá bonificarse nuestros cursos a través de FUNDAE (antiguamente la Fundación Tripartita) y salirle prácticamente gratis.

Curso de Apache Spark Online

– Método OnLine mediante servicios streaming enfocado a empresas.

– Curso apto para visualizar en tablets, multinavegador y multiplataforma.

Tecnología GoToMeeting.

Curso de Apache Spark en Madrid, Barcelona y Online