Ofertas de empleo
Ingeniero Multimodal (contrato temporal)
Acerca del puesto Ingeniero Multimodal (contrato temporal)
Ingeniero Multimodal Integración de Modelos de Imagen, Audio y Video
Ubicación: 100% Remoto (LATAM)
️Idioma: Español nativo o avanzado (excluyente)
Tipo de contratación: Contractor (pago por hora en USD)
Duración estimada: 4 a 6 meses
Horario: Flexible, con algunas horas de trabajo sincrónico con el equipo en España
Sobre la oportunidad
Desde Acciona IT estamos acompañando a una empresa del sector tecnológico en la búsqueda de un/a Ingeniero/a Multimodal con perfil técnico y experiencia en la integración de modelos de IA que trabajan con distintas modalidades: imagen, audio y video. Esta posición es ideal para profesionales con mentalidad innovadora, capacidad de experimentación y habilidades para conectar modelos generativos en flujos funcionales y escalables.
Responsabilidades
- Integrar y orquestar modelos de IA como Stable Diffusion (imagen), Whisper (ASR), TTS (text-to-speech) y generadores de video.
- Diseñar pipelines que combinen múltiples modalidades (texto, audio, imagen, video) para crear experiencias generativas completas.
- Desarrollar APIs y servicios que permitan el uso eficiente de estos modelos en entornos productivos.
- Optimizar el rendimiento y la interoperabilidad entre modelos y herramientas.
- Colaborar con equipos de producto, diseño y ciencia de datos para traducir ideas en soluciones funcionales.
️ Requisitos
- Experiencia en desarrollo con Python y frameworks de IA.
- Conocimiento práctico de modelos generativos como Stable Diffusion, Whisper, TTS (ej. Coqui, Bark, ElevenLabs), y generadores de video (ej. Runway, Pika, Sora).
- Experiencia en integración de APIs, manejo de pipelines de datos y despliegue de modelos.
- Familiaridad con herramientas de procesamiento multimedia (OpenCV, ffmpeg, librosa, etc.).
- Capacidad para trabajar en entornos ágiles y colaborativos.
Deseables
- Experiencia en proyectos de IA generativa multimodal.
- Conocimientos en MLOps y despliegue en la nube (Azure, AWS, GCP).
- Contribuciones a proyectos open source relacionados con IA generativa.
- Interés en UX y diseño de experiencias interactivas con IA.