About the job DevOps Engineer
DevOps Engineer (AWS + Terraform + GitHub Actions | IoT/OT Industrial)
Resumen del rol
Buscamos un/a DevOps Engineer con dominio de AWS y Terraform para diseñar, automatizar y operar infraestructura y pipelines de entrega en un entorno IoT/OT industrial. El CI/CD se realiza exclusivamente con GitHub Actions.
El rol integra datos desde planta (KEPServerEX/Kepware en Windows – OPC UA/DA) hacia la nube, operando componentes edge en Linux con AWS IoT Greengrass v2 y modelado/ingesta industrial con AWS IoT SiteWise, utilizando una capa de streaming para la ingesta. El objetivo es asegurar seguridad, observabilidad y resiliencia end-to-end.
Arquitectura (alto nivel)
-
Planta/OT: KEPServerEX (Windows) expone tags vía OPC UA/DA
-
Edge: Gateway Linux con AWS IoT Greengrass v2 (normalización, buffering, store-and-forward)
-
Streaming: publicación a capa streaming (Kinesis/MSK o IoT Core Rules streaming) con backpressure y retries
-
Cloud: consumidores procesan/enriquecen e ingieren a AWS IoT SiteWise + observabilidad/almacenamiento complementario
Responsabilidades
-
IaC (Terraform): diseñar y mantener infraestructura AWS (módulos reutilizables, remote state/locking, multi-entorno dev/stg/prod, naming/tagging).
-
Estandarización de IaC: estructura de repos, versionado de módulos, estrategia de cambios vía PRs y trazabilidad.
-
CI/CD (GitHub Actions – exclusivo): workflows para fmt/validate/plan/apply, approvals por ambiente, despliegues controlados; reusable workflows/composite actions.
-
Seguridad en pipelines: OIDC/assume-role, gestión de secretos (Secrets Manager/Parameter Store), controles automáticos (secret scanning, policy/IaC scanning si aplica).
-
Edge (Greengrass en Linux): empaquetar/desplegar/actualizar componentes, operación del runtime, hardening, observabilidad y manejo de conectividad intermitente.
-
Integración con KEPServerEX (Windows): coordinación con OT (permisos/conectividad), mapeo de tags, troubleshooting OPC UA/DA y performance.
-
Streaming a cloud: publicación confiable (idempotencia, retries, orden/ventanas si aplica), monitoreo de lag/throughput/errores, DLQ y reprocesos.
-
AWS IoT SiteWise: soporte en modelado de activos (asset models), jerarquías y propiedades; monitoreo de ingesta/latencia/calidad; alertas/tableros.
-
Observabilidad end-to-end: métricas, logs, alertas y dashboards (CloudWatch y herramientas complementarias).
-
Operación e incidentes: RCA/postmortems, automatización de runbooks, mejora continua; participación en guardias si aplica.
-
FinOps: tagging/cost allocation, budgets/alerts, optimización de costos (retención de logs/datos, rightsizing).
Requisitos (Must-have)
-
Experiencia sólida en AWS (redes, seguridad, operación e integración de servicios).
-
Dominio práctico de Terraform (módulos, remote state, entornos, import/migraciones, buenas prácticas).
-
Experiencia comprobable con GitHub Actions (workflows, environments, runners, secrets, reusable workflows, approvals).
-
Operación Linux (edge) + conocimientos de Windows para interoperar con KEPServerEX; scripting Bash y/o Python.
-
Conocimiento práctico de streaming y patrones de confiabilidad (retries, DLQ, backpressure, idempotencia).
-
Buen manejo de Git (PRs, code review, branching).
-
Seguridad: IAM least privilege, KMS, segmentación de red, gestión de secretos y auditoría.
Deseables
-
Experiencia directa con AWS IoT Greengrass v2 y/o AWS IoT SiteWise.
-
Kinesis/MSK e integración con consumers (Lambda/ECS/EKS).
-
Conocimiento de SCADA/PLC/OPC y troubleshooting en redes industriales.
-
Observabilidad avanzada (Grafana/Prometheus, ELK/OpenSearch, Datadog).
-
Certificaciones AWS o Terraform Associate.