Résumez les articles avec les LoRA IA de Cloudflare Workers

DEV - 12/07
Apprenez à créer une application Web en Python qui résume le contenu d'une URL d'entrée à l'aide des adaptateurs LoRA publics Cloudflare Workers AI, Streamlit et Beautifulsoup.

Ce didacticiel expliquera comment créer une application Web Streamlit en Python qui prend une URL et, avec les adaptateurs Workers AI LoRA, résume l'article dans le ton choisi par l'utilisateur, comme gen z ou humoristique.

L'utilisation de la plupart des modèles d'IA hébergés sur Cloudflare est gratuite !

Testez-le vous-même ici.

Le code complet peut être trouvé ici sur GitHub.

LoRA

Le réglage fin est un processus qui prend un modèle pré-entraîné et le forme davantage sur un ensemble de données spécifique pour l'adapter à une tâche ou un domaine particulier, améliorant ainsi ses performances et sa pertinence pour cette tâche. Les LoRA constituent une approche plus efficace de réglage fin qui ajoute un petit nombre de matrices de bas rang aux paramètres du modèle lors du réglage fin.

Cela signifie que les LoRA offrent un moyen plus efficace et évolutif d'adapter les LLM à des tâches spécifiques sans les lourdes exigences de calcul et de mémoire du réglage fin traditionnel.

Installation

Étant donné que ce projet nécessite l'installation de packages Python, créez un nouveau répertoire de projet et un nouveau environnement virtuel.

Si vous utilisez un système Unix ou macOS, ouvrez un terminal et entrez les commandes suivantes :

mkdir lora-summarize cd lora-summarize python3 -m venv venv source venv/bin/activate pip install streamlit pip install bs4 pip install request pip install load_dotenv
Entrer en mode plein écran Quitter le mode plein écran

Si vous suivez ce didacticiel sous Windows, saisissez les commandes suivantes dans une fenêtre d'invite de commande :

mkdir lora-summarize cd lora-summarize python -m venv venv venv\Scri...
[Courte citation de 8% de l'article original]
Loading...