Site Reliability Engineer

hace 1 día


Barranquilla, Colombia Careers at SunDevs A tiempo completo

**Descripción del puesto**:
Como Site Reliability Engineer en SunDevs, colaborarás con otros ingenieros de software senior y Platform Engineers para diseñar y desarrollar sistemas y plataformas en la nube altamente disponibles, escalables, seguras y mantenibles para resolver grandes desafíos.

Brindarás asesoramiento y guía a nuestros ingenieros de software y SRE para implementar altos estándares y prácticas de seguridad durante el ciclo de vida del desarrollo de software para las nuevas funciones y correcciones de errores en nuestros productos y servicios.

Tendrás que liderar algunas reuniones con clientes y partes interesadas del negocio para explicar tus planes para mejorar la seguridad, escalabilidad, disponibilidad y fiabilidad en nuestros sistemas, tus descubrimientos y las soluciones propuestas.

**Lo que buscamos**:
En SunDevs estamos en una etapa de crecimiento, tratando con clientes basados en Estados Unidos, Canadá y Latinoamérica que exigen un alto nível de compromiso y transparencia sobre el progreso de las nuevas funciones e ideas que les proponemos.

En SunDevs aprendemos y nos movemos rápido, estamos implementando varios cambios en toda la empresa, incluida la adopción de prácticas de SRE, Road Maps basados en resultados y una sólida cultura de Equipos de Producto.

Buscamos un Site Reliability Engineer calificado y experimentado para unirse a nuestro equipo dinámico, alguien con un fuerte sentido de pertenencia con su equipo y la misión del producto o servicio que están construyendo, y un alto sentido de urgencia para entregar resultados que generen un impacto positivo en los objetivos de negocio. Como Ingeniero de Fiabilidad del Sitio, desempeñarás un papel crucial en garantizar la disponibilidad, escalabilidad y fiabilidad de nuestros sistemas. Colaborarás con equipos multifuncionales para diseñar, construir y mantener una infraestructura altamente eficiente y automatizada.

**Responsabilidades clave**:

- Diseñar, implementar y mantener una infraestructura robusta y escalable para respaldar nuestras aplicaciones y servicios.
- Desarrollar y mantener sistemas de monitoreo y alerta para identificar y resolver proactivamente problemas potenciales.
- Colaborar con ingenieros de software para optimizar el rendimiento, la escalabilidad y la disponibilidad de las aplicaciones.
- Automatizar procesos manuales para mejorar la eficiencia y reducir la carga operativa.
- Realizar análisis regulares de rendimiento y capacidad para identificar y abordar cuellos de botella.
- Implementar planes de recuperación ante desastres y continuidad del negocio para garantizar la resiliencia del sistema.
- Solucionar y resolver incidentes de producción y proporcionar una respuesta oportuna a los incidentes.
- Colaborar con equipos multifuncionales para definir y hacer cumplir las mejores prácticas y estándares para la fiabilidad y el rendimiento del sistema.
- Mantenerse actualizado con las tendencias de la industria y las tecnologías emergentes, y evaluar su impacto potencial en nuestros sistemas y procesos.
- Mantener una actitud positiva, empática y profesional hacia los clientes, terceros interesados, gerentes de producto, gerentes de entrega, diseñadores de producto, ingenieros de software y cualquier otro miembro de tu equipo.
- Asegurarse de entregar a tiempo todas las tareas programadas a las que tú y tu equipo se comprometieron.
- Notificar rápidamente y de manera oportuna al cliente, a las partes interesadas, a otros gerentes y a tu equipo sobre cualquier cambio o riesgo que pueda afectar la entrega a tiempo de tus tareas y resultados.
- Hacer que el estado de las tareas del producto/proyecto sea siempre visible para los clientes y cualquier otra parte interesada relevante.
- Participar en una reunión 1:1 con el resto de tu equipo.
- Proporcionar retroalimentación oportuna a tu equipo.
- Participar en la definición de los OKR del producto para tu equipo.
- Participar en la Encuesta de Retroalimentación 360 para los miembros del equipo.

**Requisitos**:

- Inglés B1 como mínimo
- Excelentes habilidades de comunicación con partes interesadas de alto nível y de negocios
- Licenciatura en Ciencias de la Computación, Ingeniería de Software o Sistemas, o experiência práctica equivalente en un campo relacionado con el software.
- Más de 2 años manejando sistemas operativos Linux
- Más de 3 años de experiência escribiendo código seguro en lenguajes como Python, Java, JavaScript, GO y Bash, lo que significa que puedes automatizar tareas y procesos
- Amplia experiência con protocolos de enrutamiento, encriptación, firewalls, Nubes Privadas Virtuales (VPC) y redes privadas virtuales (VPN).
- Familiaridad con herramientas de monitoreo y análisis de rendimiento (por ejemplo, Prometheus, Grafana, CloudWatch).
- Comprensión de los sistemas de bases de datos y experiência en administración de bases de datos (por ejemplo, MySQL, PostgreSQL, MongoDB).
- Conocimie


  • Reliability Engineer

    hace 6 días


    Barranquilla, Atlántico, Colombia Toeshee A tiempo completo

    We are seeking an experiencedDatabase Reliability Engineerwith aDBRE-focused background to join its expanding team, which utilizes DevOps/Reliability Engineering philosophies.This role will be key in hardening, scaling, and optimizing our mission-critical databases to ensure world class performance and reliability as we grow. As a Database Reliability...

  • Site Reliability Engineer

    hace 2 semanas


    Barranquilla, Colombia FullStack Labs A tiempo completo

    FullStack Labs is the fastest-growing software consultancy in the Americas. We help organizations like Uber, GoDaddy, MGM, Siemens, Stanford University, and the State of California, build distributed software development teams, and deliver transformational digital solutions. As an employee-first company, we focus on hiring the most talented software...

  • Systems Engineer

    hace 1 semana


    Barranquilla, Colombia Fortinet A tiempo completo

    **Skills & Qualifications** - Typically requires 8 - 12 years of field sales experience. - Experience in technical/pre-sales support as a sales or systems engineer - Experience in LAN/WAN/Internet services administration - Experience with Wireless technologies, deploying, supporting and doing site surveys. - Solid understanding of Wireless Authentication...


  • Barranquilla, Colombia SellCord A tiempo completo

    **Senior Full Stack Engineer**: **Job Logistics Summary**: - Position: Senior Full Stack Engineer - Type: Full-Time, Contract - Location: Barranquilla, Colombia - Compensation: Dependent on Experience - Timeline: Immediate Hire **Who We Are**: SellCord is a leading agency specializing in launching and scaling brands exclusively with Walmart. As...

  • Software Engineer

    hace 2 semanas


    Barranquilla, Colombia Angi A tiempo completo

    Angi® is transforming the home services industry, creating an environment for homeowners, service professionals and employees to feel right at "home." For most home maintenance needs, our platform makes it easier than ever to find a qualified service professional for indoor and outdoor jobs, home renovations (or anything in between!). We are on a mission to...

  • Software Engineer

    hace 2 semanas


    Barranquilla, Colombia Angi A tiempo completo

    Angi® is transforming the home services industry, creating an environment for homeowners, service professionals and employees to feel right at "home." For most home maintenance needs, our platform makes it easier than ever to find a qualified service professional for indoor and outdoor jobs, home renovations (or anything in between!). We are on a mission to...

  • NOC Tier 1 Engineer

    hace 2 semanas


    Barranquilla, Atlántico, Colombia TESYS NETWORKS A tiempo completo

    Job description: NOC Tier 1 EngineerGeneral Description:The NOC Tier 1 Engineer is responsible for resolving incidents escalated and providing constant updates to the customer.Primary Job Functions:Detect alarms / events on customers' monitoring tools or company monitoring tools.Open incidents in incident ticketing systems and report them to the customers...

  • Tier 2

    hace 3 días


    Barranquilla, Colombia LinkAmerica A tiempo completo

    **We Are Hiring!** **Position**: Tier 2 NOC Engineer **Work Modality**: Hybrid (primarily remote, with occasional on-site presence) **Location**: Barranquilla, Colombia At LinkAmerica, we are looking for a proactive and analytical Bilingual Tier 2 NOC Engineer with a passion for delivering exceptional technical support. If you have strong networking...

  • Software Engineer

    hace 2 semanas


    Perímetro Urbano Barranquilla, Colombia AgileEngine A tiempo completo

    AgileEngine is an Inc. 5000 company that creates award-winning software for Fortune 500 brands and trailblazing startups across 17+ industries. We rank among the leaders in areas like application development and AI/ML, and our people-first culture has earned us multiple Best Place to Work awards. WHY JOIN US If you're looking for a place to grow, make an...

  • BPO Operations Manager

    hace 6 días


    Barranquilla, Atlántico, Colombia OP360 (OfficePartners360) A tiempo completo

    Job summary:The Operations Manager is responsible for leading, optimizing, and scaling the delivery of services to ensure operational excellence, client satisfaction, and profitability. This role requires a strategic leader with strong analytical, people management, and client relationship skills to oversee daily operations, meet contractual KPIs, and drive...