Ingeniero de datos
hace 1 día
Ingeniero de Datos - Microsoft Fabric
1. DESCRIPCIÓN GENERAL DEL CARGO
El Ingeniero de Datos será responsable de liderar y ejecutar la transformación de analíticos hacia Microsoft Fabric. Este rol requiere sólida experiencia en ingeniería de datos moderna, con dominio de SQL, PySpark y Microsoft Fabric, así como capacidad para diseñar e implementar pipelines robustos con pruebas automatizadas que garanticen la calidad de los datos. Se valorará altamente el conocimiento previo de plataformas analíticas como SAS o Cloudera, ya que facilitará la comprensión y migración de la lógica de negocio existente.
2. RESPONSABILIDADES PRINCIPALES
- Analizar y documentar estructuras de datos, flujos y lógica de negocio existentes en las plataformas legacy
- Diseñar e implementar pipelines de datos escalables en Microsoft Fabric utilizando Azure Data Factory y Databricks
- Desarrollar transformaciones de datos utilizando PySpark y SQL optimizado para grandes volúmenes
- Diseñar e implementar estrategias de pruebas automatizadas para validar calidad, integridad y consistencia de datos
- Realizar la migración de objetos analíticos (programas, scripts, queries) a las nuevas tecnologías cloud
- Validar la equivalencia funcional entre procesos legacy y procesos migrados, asegurando consistencia de resultados
- Optimizar el rendimiento de queries y pipelines en el entorno Azure
- Implementar estrategias de monitoreo, logging y alertas para pipelines de datos
- Colaborar con el equipo de arquitectura para definir estándares de codificación y mejores prácticas
- Documentar soluciones técnicas, decisiones de diseño y procedimientos de migración
- Uso de LLM para migración de código
3. REQUISITOS TÉCNICOS
3.1 Competencias Obligatorias
- SQL avanzado: Experiencia demostrable con queries complejas, optimización de consultas, funciones analíticas (window functions), CTEs y subqueries. Capacidad para trabajar con grandes volúmenes de datos.
- PySpark: Conocimiento sólido de Apache Spark con Python. Experiencia en transformaciones de datos distribuidos, operaciones sobre DataFrames, optimización de jobs Spark y manejo de particiones.
- Microsoft Fabric: Experiencia práctica con los componentes de Fabric incluyendo Lakehouse, Data Warehouse, Data Pipelines y notebooks. Conocimiento de la arquitectura OneLake y semantic models.
- Desarrollo de Pipelines de Datos: Experiencia diseñando e implementando pipelines ETL/ELT robustos, incluyendo orquestación, manejo de errores, reintentos y paralelización. Conocimiento de Azure Data Factory o herramientas similares.
- Pruebas Automatizadas para Datos: Experiencia diseñando e implementando estrategias de testing para validación de calidad de datos. Capacidad para crear pruebas de esquema, completitud, unicidad, rangos de valores y reglas de negocio.
3.2 Conocimientos Altamente Valorados
- Los siguientes conocimientos, aunque no obligatorios, serán altamente valorados durante el proceso de selección:
- Experiencia con SAS: Conocimiento de programación SAS (Base SAS, SAS/SQL, SAS Macros), SAS Enterprise Guide, SAS Studio o SAS Viya. Capacidad para interpretar y documentar código SAS legacy.
- Experiencia con Cloudera: Conocimiento del ecosistema Hadoop, específicamente Cloudera Distribution (CDH). Experiencia con HDFS, Hive, Impala y gestión de datos en entornos Big Data on-premise.
- Certificaciones en Microsoft Azure: Certificaciones como Azure Data Engineer Associate, Azure Database Administrator Associate, Databricks Certified Data Engineer, o Fabric Analytics Engineer serán consideradas un diferenciador importante.
3.3 Tecnologías Complementarias
- Azure Databricks: Configuración de clusters, optimización de jobs, Unity Catalog
- Azure Synapse Analytics: SQL pools, Spark pools, integración con Data Factory
- Azure Data Lake Storage Gen2: Gestión de datos, organización de carpetas, permisos y seguridad
- Python: Librerías para procesamiento de datos (Pandas, NumPy), testing (pytest, unittest)
- Git/GitHub: Control de versiones, colaboración en código, CI/CD
- Herramientas de observabilidad: Azure Monitor, Application Insights, Log Analytics
- Formatos de datos: Parquet, Delta Lake, ORC, Avro
- Apache Airflow para orquestación de malla de procesamiento
4. FORMACIÓN ACADÉMICA
- Título profesional en Ingeniería de Sistemas, Ciencias de la Computación, Ingeniería Electrónica, Estadística, Matemáticas o carreras afines
- Postgrado o especialización en Ciencia de Datos, Big Data o áreas relacionadas (deseable)
5. EXPERIENCIA REQUERIDA
- Mínimo 2 años de experiencia profesional en ingeniería de datos o roles relacionados
- Al menos 1 año de experiencia trabajando con tecnologías cloud, preferiblemente Azure
- Experiencia implementando pipelines de datos en producción con volúmenes significativos (millones de registros)
- Experiencia en proyectos del sector financiero, bancario o seguros (deseable)
6. HABILIDADES BLANDAS
- Capacidad analítica excepcional y atención meticulosa al detalle para garantizar precisión en migraciones
- Excelentes habilidades de comunicación técnica oral y escrita
- Capacidad para trabajar de manera autónoma con mínima supervisión
- Trabajo en equipo efectivo y colaboración con equipos distribuidos
- Proactividad para identificar problemas técnicos y proponer soluciones innovadoras
- Adaptabilidad y apertura para aprender nuevas tecnologías y metodologías
- Capacidad para gestionar múltiples tareas y priorizar efectivamente
- Habilidad para documentar de forma clara y transferir conocimiento al equipo
7. CONDICIONES DEL CARGO
- Posibilidad de trabajo remoto
- Horario: Lunes a viernes, jornada laboral estándar de 8am a 6pm
- Ambiente de trabajo colaborativo con oportunidades de aprendizaje continuo
-
Ingeniero de Datos Ingeniero de Datos
hace 1 día
Medellín, Antioquia, Colombia GFT Technologies SE A tiempo completoQue buscamos?Ingeniero de DatosTus principales responsabilidades a desarrollar:Responsabilidades1. Diseño y Desarrollo de Infraestructura de Datos- Crear y mantener sistemas de almacenamiento y procesamiento de datos que sean eficientes y escalables.2. Integración de Datos:- Recopilar y transformar datos de diversas fuentes para hacerlos accesibles y...
-
Ingeniero de Datos
hace 1 día
Medellín, Antioquia, Colombia GFT TECHNOLOGIES A tiempo completoQue buscamos?Ingeniero de DatosTus principales responsabilidades a desarrollar:Responsabilidades Diseño y Desarrollo de Infraestructura de Datos Crear y mantener sistemas de almacenamiento y procesamiento de datos que sean eficientes y escalables.Integración de Datos: Recopilar y transformar datos de diversas fuentes para hacerlos accesibles y útiles...
-
Ingeniero de Datos
hace 1 semana
Medellín, Antioquia, Colombia EX Squared A tiempo completoConviértete en un EXpert como Ingeniero de Datos en Azure Cloud¿Te motiva trabajar con datos a gran escala y desarrollar soluciones que generen impacto real?En EX Squared LATAM, buscamos un Ingeniero de Datos que disfrute diseñar, construir y optimizar flujos de datos en entornos Azure Cloud, colaborando con equipos de negocio y ciencia de datos en...
-
Ingeniero de datos
hace 1 día
Medellín, Antioquia, Colombia GFT Technologies A tiempo completoGFT Technologies es una compañía global de soluciones tecnológicas, con operaciones en más de 20 países alrededor del mundo. Una de nuestras casas matrices se encuentra en Colombia y contamos con filiales en 14 países incluyendo Brasil, Perú, México, Chile y Panamá. Somos más de personas expertas en tecnología, liderando proyectos que están...
-
Ingeniero de datos AWS Senior
hace 2 semanas
Medellín, Antioquia, Colombia XpertGroup A tiempo completoSomosXpertGroup, una compañía enfocada en el desarrollo de software, analítica avanzada, Big Data, DevSecOps y Agilísimo. Contamos con productos tanto propios como a la medida del cliente y actualmentenos encontramos en la búsqueda de un Ingeniero(a) de datos AWS Senior, para que forme parte de nuestra familia de#xpertlovers.Necesitas Contar Con...
-
Ingeniero de datos
hace 2 semanas
Medellín, Antioquia, Colombia Crystal S.A.S A tiempo completoTu objetivo principal será diseñar, construir y administrar arquitecturas y pipelines de datos escalables en la nube que garanticen la disponibilidad, calidad, seguridad y gobernanza de la información, para habilitar procesos analíticos de BI, machine Learning, y web scraping.ResponsabilidadesDiseñar, implementar y mantener pipelines de datos escalables...
-
Ingeniero Consultor de data
hace 1 día
Medellín, Antioquia, Colombia GFT Technologies SE A tiempo completo¿Que buscamos?Ingeniero Consultor de data (ODI)Tus principales responsabilidades a desarrollar:Ingeniero Consultor de data con experiencia entre 2 y 3 años de experiencia en ODI obligatorio, y datastage opcional.Conocimiento de metodologías ágiles Scrum, excelente trabajo en equipo.Soft skills: • Comunicación • Agilidad para
-
Ingeniero Comercial
hace 1 día
Medellín, Antioquia, Colombia metalandes sas A tiempo completoEmpresa del sector eléctrico busca Ingeniero Comercial - KAM con experiencia comprobada en subestaciones eléctricas en media y baja tensión, enfocado en apertura de mercado y cierre de negocios.Requisitos indispensables:Ingeniero Electricista con experiencia mínima de 3 años en ventas técnicas del sector eléctrico, conocimiento sólido de norma RETIE,...
-
Ingeniero/a de datos semi senior
hace 2 semanas
Medellín, Antioquia, Colombia Nequi A tiempo completo¿Quieres construir y mantener pipelines de datos, participando en la implementación de nuevas fuentes, transformación y disponibilización de datos de forma segura y eficiente, que apoyan la estrategia de crecimiento de cartera rentable, sostenible, la operación y cumplimiento regulatorio?Este reto es para tiEn Nequi, ayudarás a mejorar la vida de las...
-
Ingeniero mecánico
hace 7 días
Medellín, Antioquia, Colombia Navitrans Colombia A tiempo completoNavitrans sas requiere para su equipo de trabajo Ingeniero ProyectosProfesional en Ingeniería Mecánica o Mecatrónica, Ingeniería Industrial o afinesExperiencia superior a 2 años en Conocimientos en mantenimiento de maquinaria amarilla, auditoría o interventoría de contratos de mantenimiento, Habilidades en programación, analítica y desarrollo de...