sábado, 30 de mayo de 2026

Pinterest Redujo Costos de IA 90 Optimizando Modelos

Pinterest ha logrado una hazaña impresionante en el mundo de la inteligencia artificial: reducir sus costos operativos en un 90% mientras simultáneamente mejora la precisión en un 30%. Con 620 millones de usuarios activos mensuales, la plataforma no podía permitirse llamar a un modelo de IA frontera para cada recomendación de imagen. La solución vino de la mano de Matt Madrigal, CTO de Pinterest, quien tomó la audaz decisión de desmantelar la capa de visión del modelo Qwen3-VL y reconstruirla con embeddings propietarios.

Pinterest Redujo Costos de IA 90% Optimizando Modelos

El equipo de Madrigal ha estado invirtiendo fuertemente en la personalización de modelos de código abierto de manera fundamental. La clave del éxito radica en aprovechar los datos únicos de Pinterest para afinar estos modelos, demostrando que la calidad de los datos puede superar incluso al tamaño del modelo. La compañía ha utilizado históricamente modelos de código abierto como BERT de Google y CLIP de OpenAI para búsqueda y descubrimiento visual, desarrollando su propio Pin CLIP que incorpora embeddings visuales propietarios y metadatos de imágenes.

El asistente de compras conversacional de Pinterest, Navigator 1, fue construido sobre Qwen3-VL con personalizaciones significativas. El equipo literalmente eliminó la capa de codificador de visión de Qwen y afinó el modelo con embeddings multimodales propietarios. Esto permite capturar metadatos sobre pines e imágenes que pueden ser precomputados sin conexión y reentrenados regularmente con nueva información para ofrecer experiencias personalizadas. Sin estos embeddings, los desarrolladores tendrían que llamar y codificar cada imagen devuelta en tiempo de ejecución, una por una, resultando en una latencia 20 veces peor desde la perspectiva de inferencia.

Para guiar a los usuarios desde la inspiración hasta la compra, el equipo construyó un "grafo de gustos": una representación dinámica de lo que realmente les gusta a los usuarios individuales, no solo lo que hacen clic. Esta arquitectura combina una estructura de grafos con aprendizaje representacional, donde los embeddings de usuario capturan los gustos en evolución. Por ejemplo, un usuario puede estar interesado en diseños modernos de mediados de siglo, mientras que otro prefiere una estética de Nantucket. Estas preferencias se capturan en embeddings de usuario, y el grafo de gustos entrega productos específicos y relevantes como resultado, transformando el descubrimiento en intención de compra.

Fuente Original: https://venturebeat.com/orchestration/pinterest-cut-ai-costs-90-by-gutting-a-frontier-models-vision-layer

Artículos relacionados de LaRebelión:

Artículo generado mediante LaRebelionBOT

No hay comentarios:

Publicar un comentario