Ofertas de empleo Ingeniero Multimodal (contrato temporal)

Acerca del puesto Ingeniero Multimodal (contrato temporal)

Ingeniero Multimodal Integración de Modelos de Imagen, Audio y Video

Ubicación: 100% Remoto (LATAM)
Idioma: Español nativo o avanzado (excluyente)
Tipo de contratación: Contractor (pago por hora en USD)
Duración estimada: 4 a 6 meses
Horario: Flexible, con algunas horas de trabajo sincrónico con el equipo en España

Sobre la oportunidad

Desde Acciona IT estamos acompañando a una empresa del sector tecnológico en la búsqueda de un/a Ingeniero/a Multimodal con perfil técnico y experiencia en la integración de modelos de IA que trabajan con distintas modalidades: imagen, audio y video. Esta posición es ideal para profesionales con mentalidad innovadora, capacidad de experimentación y habilidades para conectar modelos generativos en flujos funcionales y escalables.

Responsabilidades

  • Integrar y orquestar modelos de IA como Stable Diffusion (imagen), Whisper (ASR), TTS (text-to-speech) y generadores de video.
  • Diseñar pipelines que combinen múltiples modalidades (texto, audio, imagen, video) para crear experiencias generativas completas.
  • Desarrollar APIs y servicios que permitan el uso eficiente de estos modelos en entornos productivos.
  • Optimizar el rendimiento y la interoperabilidad entre modelos y herramientas.
  • Colaborar con equipos de producto, diseño y ciencia de datos para traducir ideas en soluciones funcionales.

Requisitos

  • Experiencia en desarrollo con Python y frameworks de IA.
  • Conocimiento práctico de modelos generativos como Stable Diffusion, Whisper, TTS (ej. Coqui, Bark, ElevenLabs), y generadores de video (ej. Runway, Pika, Sora).
  • Experiencia en integración de APIs, manejo de pipelines de datos y despliegue de modelos.
  • Familiaridad con herramientas de procesamiento multimedia (OpenCV, ffmpeg, librosa, etc.).
  • Capacidad para trabajar en entornos ágiles y colaborativos.

Deseables

  • Experiencia en proyectos de IA generativa multimodal.
  • Conocimientos en MLOps y despliegue en la nube (Azure, AWS, GCP).
  • Contribuciones a proyectos open source relacionados con IA generativa.
  • Interés en UX y diseño de experiencias interactivas con IA.