Data Engineering Zoomcamp

El próximo día 16 de Enero de 2023 arranca el bootcamp Data Engineering gratuito organizado por Data Talks Club. Organizado a lo largo de 10 semanas, se trata de hacer un proyecto end-to-end de data desde la ingesta (streaming con Kafka y batch con Spark) mediante scripting python, orquestación (el anterior fue Airflow y en esta edición apuestan por Prefect) hasta la generación de un dataset listo para reporting. Todo ello contenerizado con Docker, desplegando infra con Terraform y utilizando la Google Cloud Platform (GCP). Tanto si acabas de llegar nuevo al mundo del dato como si gozas de cierta experiencia, me parece un bootcamp imprescindible para afianzar conocimientos y perder el miedo ciertas chuches o tecnologías (como es mi caso, hello Kafka & GCP!).

En la repo de Github está todo el contenido del bootcamp 2023, y además toda la información de contenido y registro a la nueva edición (desde aquí). Os recomiendo que echéis un ojo a toda la documentación, especialmente a las notas/apuntes que han publicado personas que ya lo han realizado. Por aquí os dejo también las FAQ, muy interesantes.

Cada semana intentaré publicar un post con los stoppers que me he podido ir encontrando mientras practico con todo el ecosistema de tecnologías (muchas de ellas la primera vez que voy a tener la oportunidad y tiempo de trabajarlas).

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

What is 3 + 7 ?
Please leave these two fields as-is: