Ingeniero Líder De Mlops Y Arquitectura De Ia

20 de enero, 2026

No location

Full-time

RemotoJOB

Apply
Descripción

Job Description

Descripción del trabajo
El candidato será responsable de definir la arquitectura, construir infraestructura automatizada y escalable, y establecer estándares técnicos que impulsen soluciones de inteligencia artificial para millones de usuarios. Además, colaborará con investigadores, científicos de datos, ingenieros de ML y arquitectos de la nube para convertir la investigación en productos, asegurando automatización, gobernanza y rendimiento en todas las iniciativas de IA/ML.
Responsabilidades:
Diseñar y construir infraestructura MLOps en AWS utilizando Terraform, con enfoque en seguridad, escalabilidad y rentabilidad.
Construir pipelines de CI/CD de extremo a extremo utilizando GitLab y Jenkins para entrenamiento, validación, implementaciones y reversiones.
Contener modelos de ML con Docker e implementarlos en Kubernetes utilizando Helm; colaborar en el diseño y gestión de la plataforma Kubernetes.
Implementar y gestionar la pila de observabilidad, incluyendo métricas de rendimiento, fiabilidad y seguridad.
Tomar decisiones técnicas clave, estableciendo patrones, herramientas y mejores prácticas para operaciones de ML.
Colaborar con equipos de investigación y desarrollo para convertir la investigación en productos funcionales.
Requisitos:
Más de 5 años en un puesto sénior de DevOps, SRE o MLOps con enfoque en sistemas de producción.
Amplia experiencia en la arquitectura y administración de clústeres de Kubernetes en un entorno de producción.
Dominio demostrado de al menos una herramienta de infraestructura como código (IaC), preferiblemente Terraform.
Competencia en un lenguaje de scripting a nivel de sistemas, como Python o Go.
Experiencia en la creación y mantenimiento de pipelines de CI/CD para servicios de producción críticos.
Experiencia directa en la implementación y administración de modelos de ML específicos como Agentic AI, NLU, ASR o TTS.
Experiencia con herramientas de orquestación de flujos de trabajo de ML, como Kubeflow o Apache Airflow.
Familiaridad con herramientas de seguimiento de experimentos de ML y registro de modelos, como MLflow o SageMaker Model Registry.
Experiencia en la implementación de modelos en hardware especializado, incluyendo GPU, Inferentia o Trainium.

Salario a percibir
A convenir