Ingeniero Multimodal (contrato temporal)

Andalusia, Spain

Ofertas de empleo Ingeniero Multimodal (contrato temporal)

Acerca del puesto Ingeniero Multimodal (contrato temporal)

Ingeniero Multimodal Integración de Modelos de Imagen, Audio y Video

Ubicación: 100% Remoto (LATAM)
️Idioma: Español nativo o avanzado (excluyente)
Tipo de contratación: Contractor (pago por hora en USD)
Duración estimada: 4 a 6 meses
Horario: Flexible, con algunas horas de trabajo sincrónico con el equipo en España

Sobre la oportunidad

Desde Acciona IT estamos acompañando a una empresa del sector tecnológico en la búsqueda de un/a Ingeniero/a Multimodal con perfil técnico y experiencia en la integración de modelos de IA que trabajan con distintas modalidades: imagen, audio y video. Esta posición es ideal para profesionales con mentalidad innovadora, capacidad de experimentación y habilidades para conectar modelos generativos en flujos funcionales y escalables.

Responsabilidades

Integrar y orquestar modelos de IA como Stable Diffusion (imagen), Whisper (ASR), TTS (text-to-speech) y generadores de video.
Diseñar pipelines que combinen múltiples modalidades (texto, audio, imagen, video) para crear experiencias generativas completas.
Desarrollar APIs y servicios que permitan el uso eficiente de estos modelos en entornos productivos.
Optimizar el rendimiento y la interoperabilidad entre modelos y herramientas.
Colaborar con equipos de producto, diseño y ciencia de datos para traducir ideas en soluciones funcionales.

️ Requisitos

Experiencia en desarrollo con Python y frameworks de IA.
Conocimiento práctico de modelos generativos como Stable Diffusion, Whisper, TTS (ej. Coqui, Bark, ElevenLabs), y generadores de video (ej. Runway, Pika, Sora).
Experiencia en integración de APIs, manejo de pipelines de datos y despliegue de modelos.
Familiaridad con herramientas de procesamiento multimedia (OpenCV, ffmpeg, librosa, etc.).
Capacidad para trabajar en entornos ágiles y colaborativos.

Deseables

Experiencia en proyectos de IA generativa multimodal.
Conocimientos en MLOps y despliegue en la nube (Azure, AWS, GCP).
Contribuciones a proyectos open source relacionados con IA generativa.
Interés en UX y diseño de experiencias interactivas con IA.

O remitir a alguien