Búsqueda vectorial para desarrolladores web: clara, útil y sorprendente
4 min readMarie Fa
Otros idiomas:fren

Búsqueda vectorial para desarrolladores web: clara, útil y sorprendente

Una explicación concreta y sencilla de la búsqueda vectorial aplicada a sitios web. Para desarrolladores que quieren entender y adelantarse.

Durante 20 años, hemos construido sitios web que buscan palabras.

SELECT * FROM articles WHERE content ILIKE '%masaje%'

Ahora, podemos construir sitios web que buscan significado.

Y cuando descubrí lo fácil que era implementarlo --- y lo potente que se sentía en uso --- entendí que esto podía redefinir no solo cómo escribimos código, sino también cómo diseñamos la experiencia del usuario.

Nota: Este artículo está dirigido a desarrolladores web, diseñadores, fundadores o personas curiosas que quieran entender qué es la búsqueda vectorial, ver cómo puede aplicarse y usarla con criterio (sin caer en el hype de la IA).


Breve contexto histórico

La búsqueda vectorial no es tan nueva.

Las primeras ideas de "modelos de espacio vectorial" en recuperación de información datan de los años 70. Pero el verdadero cambio vino cuando empezamos a representar el texto por su significado, y no por sus palabras exactas.

No con palabras clave. Con vectores.

Y eso se hizo posible gracias al surgimiento de modelos de IA potentes como BERT (Google, 2018), GPT (OpenAI, 2019+), y más recientemente, modelos de embeddings como text-embedding-3-large.


¿Qué es exactamente la búsqueda vectorial?

Es una forma de recuperar contenido cercano semánticamente a una consulta, no solo por coincidencia textual.

Una pregunta como "¿Debo tomar agua después del tratamiento?" puede devolver: "Recomiendo mantenerse bien hidratado después de un masaje."

No hay palabras idénticas, pero el significado es el mismo. Y la máquina lo entiende.

¿Sorprendente? Sí. Y además, técnicamente accesible.


¿Cómo funciona? (versión para desarrolladores)

  1. Cada texto se transforma en un vector numérico (embedding) → 3072 valores si usas text-embedding-3-large

  2. Ese vector se guarda en tu base de datos (por ejemplo, PostgreSQL con la extensión pgvector)

  3. Cuando un usuario hace una pregunta, esa consulta también se convierte en un vector → Y se busca el vector más cercano (similaridad del coseno, distancia euclidiana, etc.)

  4. Se devuelve el contenido más relevante semánticamente → Y opcionalmente, GPT lo reformula con elegancia.

Todo esto puede ocurrir en milisegundos.


¿Dónde ya se está usando?

Probablemente ya interactúas con este tipo de búsqueda:

  • YouTube → sugerencias de video
  • Spotify → recomendaciones musicales
  • ChatGPT / Notion AI / Perplexity → búsqueda híbrida
  • Amazon / Shopify → productos similares
  • Chatbots modernos → respuestas contextuales en soporte

¿Y para un sitio web de empresa?

Algunos ejemplos concretos:

  • Una empresa de servicios puede crear un FAQ inteligente que entienda las variaciones de las preguntas
  • Un e-commerce puede responder a: "¿Este suéter abriga para el invierno?"
  • Una agencia puede integrar un asistente que entienda preguntas técnicas, incluso mal formuladas
  • Un sitio de contenidos puede mostrar los artículos adecuados, aunque el usuario no use las palabras exactas

Y todo esto, sin ElasticSearch ni modelos NLP personalizados.

Solo necesitas:

  • OpenAI para los embeddings
  • pgvector para el almacenamiento
  • Una consulta SQL bien pensada

Ojo: No es magia. Hay que diseñar bien el esquema, los umbrales y los planes de fallback. Pero una vez armado, es potentísimo.


Por qué lo integré en mis proyectos

Construyo asistentes de IA --- para empresas y, a veces, para personas que quieren dejar una huella.

En estos proyectos, la gente no busca palabras. Busca respuestas, significado, una interacción real.

Y el día que conecté mi base vectorial y vi que el asistente respondía con coherencia a una pregunta nunca antes vista, supe que ya no quería volver atrás.


Lo que realmente cambia

  • Ya no filtras por palabras: creas comprensión
  • Ya no ordenas por etiquetas: ordenas por intención
  • Ya no solo diseñas visualmente: creas una experiencia inteligente

Y no requiere seis meses de I+D. Solo requiere atreverse a añadir una capa semántica a lo que construyes.


Para quienes quieran probarlo

Si sabes escribir una consulta SQL, puedes implementar búsqueda vectorial esta misma semana.

Aquí algunas herramientas clave:

Herramienta
`pgvector`
Función
Extensión de PostgreSQL para almacenar y buscar vectores
Herramienta
`text-embedding-3-large`
Función
Modelo de embedding de OpenAI para convertir texto en vectores
Herramienta
`OpenAI API`
Función
Plataforma API de OpenAI para generar vectores desde consultas

Si te interesa ver cómo lo integré en mis asistentes --- escríbeme.

Construir con vectores hoy, es como haber hecho diseño responsive en 2012:
Te pone un paso adelante --- pero pronto, todo el mundo lo hará.