Desarrollador de Data Lake (AWS -SQL-Python)
Sobre el Rol
Desde Common MS, estamos apoyando a uno de los mayores bancos con un nuevo proyecto greenfield, Origin, para desarrollar una solución interna de data lake. Esta plataforma apoyará servicios de BI, herramientas de ciencia de datos y otras iniciativas dentro de SCIB. Ingerirá datos de mercado en tiempo casi real desde múltiples fuentes y los almacenará en la nube de AWS.
Buscamos un Desarrollador Senior con experiencia en ingestión de big data, procesos ETL y manejo de grandes volúmenes de datos. Este rol será clave para desarrollar y mantener ETLs de alta calidad, asegurando escalabilidad, rendimiento y eficiencia en el procesamiento de datos.
Responsabilidades:
1. Desarrollar y mantener pipelines ETL para la ingestión de datos estructurados y no estructurados en lotes y tiempo casi real.
2. Optimizar el almacenamiento y procesamiento de datos utilizando Parquet, servicios de AWS (Athena, EMR, QuickSight) y herramientas externas (Tableau, Apache Spark, Presto, etc.).
3. Diseñar y gestionar un catálogo centralizado de metadatos para garantizar la consistencia y accesibilidad de los datos.
4. Colaborar con ingenieros de datos, científicos de datos y partes interesadas del negocio para comprender los requisitos y entregar soluciones de alta calidad.
5. Garantizar la calidad, integridad y seguridad de los datos en la plataforma.
6. Optimizar continuamente el rendimiento y reducir costos mediante buenas prácticas en computación en la nube y arquitectura de datos.
7. Trabajar en un equipo ágil, asegurando iteraciones rápidas y adaptación a las necesidades del negocio.
Requisitos:
1. Experiencia sólida en SQL, Python.
2. Experiencia demostrada en tecnologías de big data y desarrollo de ETL.
3. Conocimientos prácticos de servicios de AWS (S3, Athena, Glue, EMR, Lambda, etc.).
4. Dominio de frameworks de procesamiento de datos (Apache Spark, Presto, Tableau, etc.).
5. Conocimiento de formatos de datos Parquet, gestión de metadatos y particionamiento de datos.
6. Familiaridad con pipelines CI/CD y sistemas de control de versiones como Git.
7. Capacidad para trabajar en entornos dinámicos y colaborar con equipos multifuncionales.
8. Experiencia en el sector financiero, especialmente en trading electrónico y flujos de precios.
9. Conocimiento de mercados de renta fija y procesamiento de datos de mercado.
10. Habilidades analíticas y de resolución de problemas con un enfoque en escalabilidad y rendimiento.
¡Únete a nosotros y forma parte del futuro de la toma de decisiones basada en datos en la banca de inversión!
#J-18808-Ljbffr