- contacto@formadoresit.es
- + 34 692 317 648
-
Calle Velázquez, 80
28001, Madrid
SUSCRÍBETE A LA NEWSLETTER
- Recibe información acerca de nuestros cursos y próximas convocatorias
Inicio » ¿Qué Hacemos? » Formación a Empresas » Big Data & Analytics » Curso Diseño y Construcción de Aplicaciones Big Data
Formación diseño aplicaciones big data para desarrolladores y profesionales de empresa que deseen actualizarse a dicha versión. Curso ofrecido en la modalidad presencial In Company u online en Madrid, Barcelona, Valencia, Alicante, Málaga, Sevilla y Bilbao, bajo demanda para empresas.
¿Qué es el Big Data?
Una de las áreas de conocimiento de moda en los últimos años en el mundo de las IT es el Big Data. Cuando hablamos de este concepto nos referimos al análisis de grandes volúmenes de datos, tanto estructurados como no estructurados, que inundan las empresas debido a su volumen, complejidad y velocidad de crecimiento, ya que superan la capacidad de las aplicaciones de software y herramientas convencionales de capturarlos, procesarlos y analizarlos en un tiempo razonable.
Esta capacidad de manejar una gran cantidad de datos, sin embargo, no es el aspecto más importante, sino lo que hacen las organizaciones con esos datos. En este sentido, el Big Data nos ofrece la posibilidad de procesar y analizar todos esos datos, a gran velocidad y de manera flexible, con el objetivo de obtener ideas e información relevante que nos ayuden a tomar mejores decisiones en nuestra empresa, proporcionando respuestas a muchas preguntas e identificando previamente los problemas que pueden poner en riesgo sus beneficios o reputación.
El Big Data es capaz de procesar y realizar un análisis de datos procedentes de múltiples fuentes, como aquellos producidos por personas (mensajes en redes sociales, emails, datos de encuestas, etc), los compartidos entre máquinas, “machine-to-machine”, a través de redes de comunicación como WiFi o Bluetooth (los contadores de electricidad, los parquímetros, los GPS de vehículos, etc), los datos biométricos (huellas dactilares, lectores de ADN, sensores de reconocimiento facial, etc), aquellos aportados por el marketing web o las transacciones de datos (la reserva de un billete de tren, una transferencia bancaria, la compra en una tienda online, etc).
25 horas
– Desarrolladores e ingenieros de software con conocimientos básicos de Hadoop
Utilizar los diferentes componentes del ecosistema Hadoop para la creación y optimización de aplicaciones Big Data
TEMA 1. Arquitectura de aplicaciones
TEMA 2. Grupos de datos con Apache Avro
TEMA 3. El módulo de datos Kite SDK
TEMA 4. Importación de datos relacionales con Apache Sqoop
TEMA 5. Captura de datos con Apache Flume
TEMA 6. Desarrollo de componentes Flume
TEMA 7. Administración de flujos de trabajo con Apache Oozie
TEMA 8. Procesamiento de Pipelines de datos con Apache Crunch
TEMA 9. Trabajar con tablas en Apache Hive
TEMA 10. Desarrollo de funciones predefinidas por usuarios
TEMA 11. Ejecución de consultas interactivas con Impala
TEMA 12. Indexación de datos con Cloudera Search
TEMA 13. Presentación de resultados a usuarios
La flexibilidad que nos ofrece este proceso nos permite identificar nuevas oportunidades de negocio, llevando a cabo operaciones más eficientes y aumentando la satisfacción de nuestros clientes. Otras de las ventajas más importantes que nos aporta a nivel empresarial es la calidad de los datos obtenidos.
Entre las características más importantes del Big Data se suelen destacar las 5 «V»:
– Volumen. Es un concepto muy variable. La cantidad de datos generados aumenta cada vez más, aumentando nuestra base de datos, y por consiguiente, las aplicaciones y la arquitectura construida para su recogida y almacenamiento. Así, estamos hablando de realizar tratamientos de Terabytes o Petabytes.
– Velocidad. La rapidez con que se obtienen, procesan y analizan los datos de cara a la toma de decisiones. Como el concepto de inmediatez ha ido cambiando con el paso de los años, la exigencia cada vez es mayor a la hora de recibir la información de manera instantánea. En este sentido, la incorporación del concepto de tiempo real cobran una mayor relevancia, ejecutando algoritmos cada vez más complejos en menos tiempo (Machine Learning). Así, podremos usar de manera más eficiente nuestros sistemas de detección de fraude o realizar ofertas personalizadas a nuestros clientes en el menor tiempo posible.
– Valor. Obtener información valiosa de manera eficiente a partir de un gran volumen de datos es uno de los retos que en la actualidad afrontan todas las empresas en el área de Data Science. El valor o lo que es lo mismo, saber qué datos son los que debemos analizar, es una cualidad fundamental en el proceso de Big Data. Por ello, cada vez cobra un mayor protagonismo el perfil técnico de Data Scientist, capaz de fusionar el componente científico, tecnológico y empresarial.
– Variedad. Los datos sobre los que trabajamos son tan diversos porque se encuentran en distintos formatos e incluimos fuentes diferentes a las que se utilizan de forma tradicional. Por eso, los datos obtenidos de redes sociales o en el número cada vez mayor de dispositivos electrónicos conectados, tienen una mayor relevancia que antes, obligándonos a recurrir a nuevas metodologías y tecnologías para su análisis.
– Veracidad. La fiabilidad de la información relevante de la que disponemos es muy importante para conseguir unos datos de calidad. Precisamente por ese motivo, debemos eliminar la imprevisibilidad inherente a alguno de esos datos, como el tiempo o la economía, para de esta forma conseguir una ventaja competitiva en la explotación del Big Data respecto a nuestra competencia.
Si actualmente estás trabajando, tu empresa podrá bonificarse nuestros cursos a través de FUNDAE (antiguamente la Fundación Tripartita) y salirle prácticamente gratis.
– Método OnLine mediante servicios streaming enfocado a empresas.
– Curso apto para visualizar en tablets, multinavegador y multiplataforma.
– Tecnología GoToMeeting.