Modèle GLM-OCR open source Zhipu : seulement 0,9 B de paramètres, atteignant des performances SOTA sur plusieurs benchmarks

Sina - 03/02
Modèle GLM-OCR open source Zhipu : seulement 0,9 B de paramètres, atteignant des performances SOTA sur plusieurs benchmarks

IT House a rapporté le 3 février que Zhipu avait annoncé aujourd'hui la sortie officielle et open source de GLM-OCR. Selon les rapports, le modèle n'a qu'une échelle de paramètres de 0,9 milliard, prend en charge le déploiement de vLLM, SGLang et Ollama et a atteint les performances SOTA dans plusieurs benchmarks traditionnels en matière de reconnaissance de formules, de reconnaissance de tables et d'extraction d'informations.

IT Home joint l'introduction détaillée officielle comme suit :

Aujourd'hui, nous avons officiellement publié et open source GLM-OCR pour atteindre une nouvelle référence en matière de capacités d'analyse de documents avec « petite taille et haute précision ». En tant que modèle OCR léger de qualité professionnelle, ses principaux points forts sont les suivants :

Grâce à l'encodeur visuel CogViT auto-développé et à l'optimisation approfondie de la scène, GLM-OCR atteint « une petite taille, une grande précision ».

La taille du paramètre GLM-OCR n'est que de 0,9 B, mais il a atteint les performances SOTA avec un score...
[Courte citation de 8% de l'article original]

Loading...