Conoce Chroma una base de datos vectorial de código abierto nativa de IA para LLMs una forma más rápida de construir aplicaciones LLM en Python o JavaScript con memoria.

Chroma una base de datos vectorial de código abierto para LLMs en Python o JavaScript con memoria rápida.

Las bases de datos de vectores de inserción de palabras se han vuelto cada vez más populares debido a la proliferación de modelos de lenguaje masivos. Utilizando el poder de técnicas sofisticadas de aprendizaje automático, los datos se almacenan en una base de datos de vectores. Esto permite búsquedas de similitud muy rápidas, esenciales para muchos usos de IA como sistemas de recomendación, reconocimiento de imágenes y PLN.

La esencia de los datos complicados se captura en una base de datos de vectores representando cada punto de datos como un vector multidimensional. La recuperación rápida de vectores relacionados es posible gracias a técnicas modernas de indexación como árboles k-d y hashing. Para transformar la analítica de big data, esta arquitectura genera soluciones altamente escalables y eficientes para sectores con gran cantidad de datos.

Echemos un vistazo a Chroma, una base de datos de vectores pequeña, gratuita y de código abierto.

Chroma se puede utilizar para crear vectores de inserción de palabras utilizando programación en Python o JavaScript. El backend de la base de datos, ya sea en modo de memoria o cliente/servidor, se puede acceder mediante una API sencilla. La instalación de Chroma y el uso de la API en un cuaderno Jupyter durante la prototipación permite a los desarrolladores utilizar el mismo código en un entorno de producción, donde la base de datos puede ejecutarse en modo cliente/servidor.

Los conjuntos de datos de la base de datos Chroma se pueden persistir en disco en formato Apache Parquet cuando se opera en memoria. El tiempo y los recursos necesarios para generar vectores de inserción de palabras se pueden minimizar almacenándolos para recuperarlos más tarde.

Cada cadena referenciada puede tener metadatos adicionales que describen el documento original. Puedes omitir este paso si quieres. Los investigadores fabricaron algunos metadatos para usar en el tutorial. Específicamente, se organizan como una colección de objetos de diccionario.

Chroma se refiere a grupos de medios relacionados como colecciones. Cada colección incluye documentos, que son solo listas de cadenas, IDs, que sirven como identificadores únicos para los documentos, y metadatos (que no es obligatorio). Las colecciones solo estarían completas con vectores de inserción. Estos se pueden generar de forma implícita utilizando el modelo de inserción de palabras incorporado de Chroma o de forma explícita utilizando un modelo externo basado en OpenAI, PaLM o Cohere. Chroma facilita la incorporación de APIs de terceros, lo que permite la generación y el almacenamiento automatizados de vectores de inserción.

De forma predeterminada, Chroma genera vectores de inserción con un modelo de Sentence Transformers MiniLM-L6-v2. Este modelo de inserción puede producir vectores de oraciones y documentos para diversas aplicaciones. Dependiendo de la situación, esta función de inserción puede requerir la descarga automática de archivos del modelo y ejecutarse localmente en la PC.

También se pueden consultar metadatos (o IDs) en la base de datos Chroma. Esto facilita la búsqueda, dependiendo del origen de los documentos.

Características clave

  • Es fácil: cuando todo está escrito, probado y documentado.
  • Los tres entornos (desarrollo, pruebas y producción) pueden utilizar la misma API en el cuaderno.
  • Rico en funcionalidad: búsquedas, filtros y estimación de densidad.
  • Software de código abierto con licencia Apache 2.0.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Investigadores del MIT presentan LILO un marco neuro-simbólico para aprender bibliotecas interpretables para la síntesis de programas

Los grandes modelos de lenguaje (LLMs) se están volviendo cada vez más expertos en programación en varios contextos, ...

Inteligencia Artificial

Tres formas en que la IA generativa puede reforzar la ciberseguridad

Los analistas humanos ya no pueden defenderse de manera efectiva ante la creciente velocidad y complejidad de los ata...

Inteligencia Artificial

Microsoft Research lanza el 'Cuarteto de Heavy Metal' de los compiladores de IA Rammer, Roller, Welder y Grinder

La evolución de los modelos de inteligencia artificial (IA) y los aceleradores de hardware ha traído desafíos únicos ...

Inteligencia Artificial

AWS y Accel lanzan ML Elevate 2023 para potenciar el ecosistema de startups de IA en India

En una emocionante colaboración, Amazon Web Services (AWS) y Accel han presentado “ML Elevate 2023”, un r...