ChromaDB pour l'esprit SQL

DEV - 04/12
Bonjour, Chroma DB est une base de données vectorielle utile pour travailler avec les applications GenAI. Dans ce...

Bonjour, Chroma DB est une base de données vectorielle utile pour travailler avec les applications GenAI. Dans cet article, j'explorerai comment exécuter des requêtes sur Chroma DB en examinant des relations similaires dans MySQL.

Schéma

Contrairement à SQL, vous ne pouvez pas définir votre propre schéma. Dans Chroma, vous obtenez des colonnes fixes, chacune avec son propre objectif :

import chromadb #configuration du client client = chromadb.Client() collection = client.create_collection(name="name") collection.add( documents = ["str1","str2","str3",...] ids = [1,2,3,....] métadonnées=[{"chapter": "3", "verse": "16"},{"chapter":"3", "verse": "5" }, ..] intégrations = [[1,2,3], [3,4,5], [5,6,7]] )
Entrer en mode plein écran Quitter le mode plein écran

Identifiants : ce sont des identifiants uniques. Notez que vous devez les fournir vous-même, contrairement à SQL, il n'y a pas d'incrémentation automatique des documents : il est utilisé pour insérer les données texte utilisées pour générer les intégrations. Vous pouvez fournir le texte et il créera automatiquement les intégrations. ou vous pouvez simplement fournir des intégrations directement et stocker le texte ailleurs. Embeddings : Ils constituent à mon avis la partie la plus importante de la base de données car ils sont utilisés pour effectuer des recherches de similarité. Métadonnées : elles sont utilisées pour associer toutes les données supplémentaires que vous pourriez souhaiter ajouter à votre base de données pour tout contexte supplémentaire.

Maintenant que les bases d'une collection sont claires, passons aux opérations CR...
[Courte citation de 8% de l'article original]

Loading...