Ingeniero de datos

hace 1 día


Medellín, Antioquia, Colombia SYNAPTICA S.A.S A tiempo completo

Ingeniero de Datos - Microsoft Fabric

1. DESCRIPCIÓN GENERAL DEL CARGO

El Ingeniero de Datos será responsable de liderar y ejecutar la transformación de analíticos hacia Microsoft Fabric. Este rol requiere sólida experiencia en ingeniería de datos moderna, con dominio de SQL, PySpark y Microsoft Fabric, así como capacidad para diseñar e implementar pipelines robustos con pruebas automatizadas que garanticen la calidad de los datos. Se valorará altamente el conocimiento previo de plataformas analíticas como SAS o Cloudera, ya que facilitará la comprensión y migración de la lógica de negocio existente.

2. RESPONSABILIDADES PRINCIPALES

  • Analizar y documentar estructuras de datos, flujos y lógica de negocio existentes en las plataformas legacy
  • Diseñar e implementar pipelines de datos escalables en Microsoft Fabric utilizando Azure Data Factory y Databricks
  • Desarrollar transformaciones de datos utilizando PySpark y SQL optimizado para grandes volúmenes
  • Diseñar e implementar estrategias de pruebas automatizadas para validar calidad, integridad y consistencia de datos
  • Realizar la migración de objetos analíticos (programas, scripts, queries) a las nuevas tecnologías cloud
  • Validar la equivalencia funcional entre procesos legacy y procesos migrados, asegurando consistencia de resultados
  • Optimizar el rendimiento de queries y pipelines en el entorno Azure
  • Implementar estrategias de monitoreo, logging y alertas para pipelines de datos
  • Colaborar con el equipo de arquitectura para definir estándares de codificación y mejores prácticas
  • Documentar soluciones técnicas, decisiones de diseño y procedimientos de migración
  • Uso de LLM para migración de código

3. REQUISITOS TÉCNICOS

3.1 Competencias Obligatorias

  • SQL avanzado: Experiencia demostrable con queries complejas, optimización de consultas, funciones analíticas (window functions), CTEs y subqueries. Capacidad para trabajar con grandes volúmenes de datos.
  • PySpark: Conocimiento sólido de Apache Spark con Python. Experiencia en transformaciones de datos distribuidos, operaciones sobre DataFrames, optimización de jobs Spark y manejo de particiones.
  • Microsoft Fabric: Experiencia práctica con los componentes de Fabric incluyendo Lakehouse, Data Warehouse, Data Pipelines y notebooks. Conocimiento de la arquitectura OneLake y semantic models.
  • Desarrollo de Pipelines de Datos: Experiencia diseñando e implementando pipelines ETL/ELT robustos, incluyendo orquestación, manejo de errores, reintentos y paralelización. Conocimiento de Azure Data Factory o herramientas similares.
  • Pruebas Automatizadas para Datos: Experiencia diseñando e implementando estrategias de testing para validación de calidad de datos. Capacidad para crear pruebas de esquema, completitud, unicidad, rangos de valores y reglas de negocio.

3.2 Conocimientos Altamente Valorados

  • Los siguientes conocimientos, aunque no obligatorios, serán altamente valorados durante el proceso de selección:
  • Experiencia con SAS: Conocimiento de programación SAS (Base SAS, SAS/SQL, SAS Macros), SAS Enterprise Guide, SAS Studio o SAS Viya. Capacidad para interpretar y documentar código SAS legacy.
  • Experiencia con Cloudera: Conocimiento del ecosistema Hadoop, específicamente Cloudera Distribution (CDH). Experiencia con HDFS, Hive, Impala y gestión de datos en entornos Big Data on-premise.
  • Certificaciones en Microsoft Azure: Certificaciones como Azure Data Engineer Associate, Azure Database Administrator Associate, Databricks Certified Data Engineer, o Fabric Analytics Engineer serán consideradas un diferenciador importante.

3.3 Tecnologías Complementarias

  • Azure Databricks: Configuración de clusters, optimización de jobs, Unity Catalog
  • Azure Synapse Analytics: SQL pools, Spark pools, integración con Data Factory
  • Azure Data Lake Storage Gen2: Gestión de datos, organización de carpetas, permisos y seguridad
  • Python: Librerías para procesamiento de datos (Pandas, NumPy), testing (pytest, unittest)
  • Git/GitHub: Control de versiones, colaboración en código, CI/CD
  • Herramientas de observabilidad: Azure Monitor, Application Insights, Log Analytics
  • Formatos de datos: Parquet, Delta Lake, ORC, Avro
  • Apache Airflow para orquestación de malla de procesamiento

4. FORMACIÓN ACADÉMICA

  • Título profesional en Ingeniería de Sistemas, Ciencias de la Computación, Ingeniería Electrónica, Estadística, Matemáticas o carreras afines
  • Postgrado o especialización en Ciencia de Datos, Big Data o áreas relacionadas (deseable)

5. EXPERIENCIA REQUERIDA

  • Mínimo 2 años de experiencia profesional en ingeniería de datos o roles relacionados
  • Al menos 1 año de experiencia trabajando con tecnologías cloud, preferiblemente Azure
  • Experiencia implementando pipelines de datos en producción con volúmenes significativos (millones de registros)
  • Experiencia en proyectos del sector financiero, bancario o seguros (deseable)

6. HABILIDADES BLANDAS

  • Capacidad analítica excepcional y atención meticulosa al detalle para garantizar precisión en migraciones
  • Excelentes habilidades de comunicación técnica oral y escrita
  • Capacidad para trabajar de manera autónoma con mínima supervisión
  • Trabajo en equipo efectivo y colaboración con equipos distribuidos
  • Proactividad para identificar problemas técnicos y proponer soluciones innovadoras
  • Adaptabilidad y apertura para aprender nuevas tecnologías y metodologías
  • Capacidad para gestionar múltiples tareas y priorizar efectivamente
  • Habilidad para documentar de forma clara y transferir conocimiento al equipo

7. CONDICIONES DEL CARGO

  • Posibilidad de trabajo remoto
  • Horario: Lunes a viernes, jornada laboral estándar de 8am a 6pm
  • Ambiente de trabajo colaborativo con oportunidades de aprendizaje continuo


  • Medellín, Antioquia, Colombia GFT Technologies SE A tiempo completo

    Que buscamos?Ingeniero de DatosTus principales responsabilidades a desarrollar:Responsabilidades1. Diseño y Desarrollo de Infraestructura de Datos- Crear y mantener sistemas de almacenamiento y procesamiento de datos que sean eficientes y escalables.2. Integración de Datos:- Recopilar y transformar datos de diversas fuentes para hacerlos accesibles y...

  • Ingeniero de Datos

    hace 1 día


    Medellín, Antioquia, Colombia GFT TECHNOLOGIES A tiempo completo

    Que buscamos?Ingeniero de DatosTus principales responsabilidades a desarrollar:Responsabilidades Diseño y Desarrollo de Infraestructura de Datos Crear y mantener sistemas de almacenamiento y procesamiento de datos que sean eficientes y escalables.Integración de Datos: Recopilar y transformar datos de diversas fuentes para hacerlos accesibles y útiles...

  • Ingeniero de Datos

    hace 1 semana


    Medellín, Antioquia, Colombia EX Squared A tiempo completo

    Conviértete en un EXpert como Ingeniero de Datos en Azure Cloud¿Te motiva trabajar con datos a gran escala y desarrollar soluciones que generen impacto real?En EX Squared LATAM, buscamos un Ingeniero de Datos que disfrute diseñar, construir y optimizar flujos de datos en entornos Azure Cloud, colaborando con equipos de negocio y ciencia de datos en...

  • Ingeniero de datos

    hace 1 día


    Medellín, Antioquia, Colombia GFT Technologies A tiempo completo

    GFT Technologies es una compañía global de soluciones tecnológicas, con operaciones en más de 20 países alrededor del mundo. Una de nuestras casas matrices se encuentra en Colombia y contamos con filiales en 14 países incluyendo Brasil, Perú, México, Chile y Panamá. Somos más de personas expertas en tecnología, liderando proyectos que están...


  • Medellín, Antioquia, Colombia XpertGroup A tiempo completo

    SomosXpertGroup, una compañía enfocada en el desarrollo de software, analítica avanzada, Big Data, DevSecOps y Agilísimo. Contamos con productos tanto propios como a la medida del cliente y actualmentenos encontramos en la búsqueda de un Ingeniero(a) de datos AWS Senior, para que forme parte de nuestra familia de#xpertlovers.Necesitas Contar Con...

  • Ingeniero de datos

    hace 2 semanas


    Medellín, Antioquia, Colombia Crystal S.A.S A tiempo completo

    Tu objetivo principal será diseñar, construir y administrar arquitecturas y pipelines de datos escalables en la nube que garanticen la disponibilidad, calidad, seguridad y gobernanza de la información, para habilitar procesos analíticos de BI, machine Learning, y web scraping.ResponsabilidadesDiseñar, implementar y mantener pipelines de datos escalables...


  • Medellín, Antioquia, Colombia GFT Technologies SE A tiempo completo

    ¿Que buscamos?Ingeniero Consultor de data (ODI)Tus principales responsabilidades a desarrollar:Ingeniero Consultor de data con experiencia entre 2 y 3 años de experiencia en ODI obligatorio, y datastage opcional.Conocimiento de metodologías ágiles Scrum, excelente trabajo en equipo.Soft skills:  •  Comunicación  •  Agilidad para

  • Ingeniero Comercial

    hace 1 día


    Medellín, Antioquia, Colombia metalandes sas A tiempo completo

    Empresa del sector eléctrico busca Ingeniero Comercial - KAM con experiencia comprobada en subestaciones eléctricas en media y baja tensión, enfocado en apertura de mercado y cierre de negocios.Requisitos indispensables:Ingeniero Electricista con experiencia mínima de 3 años en ventas técnicas del sector eléctrico, conocimiento sólido de norma RETIE,...


  • Medellín, Antioquia, Colombia Nequi A tiempo completo

    ¿Quieres construir y mantener pipelines de datos, participando en la implementación de nuevas fuentes, transformación y disponibilización de datos de forma segura y eficiente, que apoyan la estrategia de crecimiento de cartera rentable, sostenible, la operación y cumplimiento regulatorio?Este reto es para tiEn Nequi, ayudarás a mejorar la vida de las...

  • Ingeniero mecánico

    hace 7 días


    Medellín, Antioquia, Colombia Navitrans Colombia A tiempo completo

    Navitrans sas requiere para su equipo de trabajo Ingeniero ProyectosProfesional en Ingeniería Mecánica o Mecatrónica, Ingeniería Industrial o afinesExperiencia superior a 2 años en Conocimientos en mantenimiento de maquinaria amarilla, auditoría o interventoría de contratos de mantenimiento, Habilidades en programación, analítica y desarrollo de...