Senior Data Scientist – GenAI & RAG (LATAM) en BC Tecnología

FULL_TIME

Remoto | Senior | Full time | Machine Learning / AI

4 postulaciones
Responde entre 3 y 11 días
Revisado por última vez hoy

Buscamos incorporar un profesional para participar en una iniciativa estratégica de Inteligencia Artificial Generativa enfocada en el desarrollo de capacidades de análisis semántico y agentes conversacionales.

El proyecto tiene como objetivo transformar grandes volúmenes de información no estructurada proveniente de diversas fuentes, como chats, transcripciones de llamadas y registros CRM, en conocimiento accionable mediante el uso de tecnologías de IA Generativa, Large Language Models (LLMs), embeddings y arquitecturas RAG (Retrieval-Augmented Generation).

La persona seleccionada participará en el diseño e implementación de soluciones que permitan mejorar la recuperación inteligente de información, la trazabilidad de respuestas y la experiencia de interacción conversacional.

Este aviso es original de la plataforma Get on Board.

Principales Responsabilidades

Diseñar e implementar soluciones de Ciencia de Datos e Inteligencia Artificial.
Procesar, limpiar y transformar grandes volúmenes de datos provenientes de distintas fuentes.
Desarrollar pipelines de datos para la automatización de procesos analíticos.
Construir modelos predictivos, analíticos y de IA Generativa según las necesidades del negocio.
Implementar soluciones basadas en Large Language Models (LLMs).
Generar embeddings y trabajar con bases de datos vectoriales.
Participar en la definición de arquitecturas de datos y analítica avanzada.
Integrar distintas fuentes de información para generar modelos y automatizaciones.
Colaborar con equipos de negocio para identificar oportunidades de uso de datos e inteligencia artificial.
Documentar procesos, modelos y soluciones implementadas.

Competencias Críticas (Excluyentes)

Curado y limpieza de texto no estructurado proveniente de múltiples fuentes (chats, llamadas transcritas, registros CRM).
Diseño de curado y limpieza de texto no estructurado para preparación de contenido destinado a modelos de lenguaje.
Generación, gestión y versionado de embeddings.
Implementación y administración de bases de datos vectoriales (ej. pgvector, Qdrant, Chroma, Weaviate, Pinecone, Milvus) y búsqueda híbrida.
Construcción de pipelines RAG (Retrieval-Augmented Generation) completos, incluyendo evaluación y trazabilidad de respuestas.
Integración con APIs de modelos de lenguaje (LLM), tanto en servidores propios/internos como proveedores externos (Anthropic, OpenAI, Azure OpenAI, Google Gemini), con diseño agnóstico al proveedor.
Requisitos Técnicos
Programación y Datos
Python. SQL. PySpark. Apache Spark. Big Data. Desarrollo de procesos ETL/ELT. Manipulación y análisis de grandes volúmenes de datos.
Ciencia de Datos e IA
Análisis exploratorio de datos. Feature Engineering. Evaluación y optimización de modelos.
Herramientas y Framework
Bases de datos vectoriales (Pinecone, Weaviate, Chroma, Qdrant, Milvus o similares). Git.
Cloud
Azure. Servicios de almacenamiento y procesamiento de datos.

Conocimientos Deseables

(No excluyentes, ya que contamos con apoyo interno para esta parte)
Experiencia en Microsoft Fabric.

GETONBRD Job ID: 61821

Condiciones

Trabajo 100% remoto El cargo puede ser desempeñado desde cualquier lugar del mundo.

Política de trabajo remoto

Totalmente remoto

El trabajo es 100% remoto desde cualquier país.

Reporta este empleo
  1. Empleos
  2. Machine Learning / AI
  3. BC Tecnología
  4. Senior Data Scientist – GenAI & RAG (LATAM)

Acerca de BC Tecnología

Somos una consultora de TI con personal experto en diferentes áreas de tecnología. — Perfil completo de BC Tecnología

Senior Data Scientist – GenAI & RAG (LATAM)
BC Tecnología • Remoto
Compartir este empleo Compartir