Gemini révélation SEO sur les robots google
Ce matin, Gemini a remplacé Bard, donc je teste Bard n’étant pas mon agent conversationnel préféré, il était un peu amnésique (j’entends par là que Bard avait du mal à garder le fil d’une conversation alors que GPT le faisait très bien).
Donc je teste le Gemini et je lui envoie une image, puis une autre en lui demandant de décrire : et là, excellente reconnaissance de l’image et même interprétation des intentions de l’auteur…
Puis une autre image, un schéma de tunnel de conversion, parcours utilisateur de vente. (une capture d ‘écran à l’arrache )
La surprise c’est qu’il l’a très bien compris et qu’il a su m’en faire un résumé concis en listant les états contextualisés, des conseils d’amélioration et surtout avec les mêmes mots que ceux que j’utilisais.
Il est donc capable de reconnaître une image ET de lire le texte.
Il utilise l’OCR (reconnaissance optique de caractères) pour reconnaître les caractères et en extraire le contenu.
Je lui demande :
Est-ce que OCR est utilisé par les moteurs de recherche Googlebot pour lire le texte sur des images sur une page web ?
Oui, Google utilise la technologie OCR (reconnaissance optique de caractères) pour lire le texte sur les images des pages Web. Cela permet à Google de mieux comprendre le contenu des images et de les indexer plus précisément dans ses résultats de recherche.
Googlebot, le robot d’exploration de Google, utilise l’OCR pour extraire le texte des images suivantes :
- Images JPEG, PNG et GIF
- Images dans les fichiers PDF
- Images dans les documents Microsoft Word
- Images dans les présentations PowerPoint
- Images dans les feuilles de calcul Excel
Google utilise ensuite le texte extrait pour :
Comprendre le sujet de l’image
Identifier les mots clés pertinents
Associer l’image à des pages Web pertinentes
L’utilisation de l’OCR par Google permet d’améliorer la pertinence des résultats de recherche pour les requêtes qui incluent des images. Cela permet également aux utilisateurs de trouver des images plus facilement, même si elles ne contiennent pas de texte alternatif.
Voici quelques exemples de l’utilisation de l’OCR par Google :
- Si vous recherchez « chat », Google peut afficher des images de chats, même si les images ne contiennent pas de texte alternatif.
- Si vous recherchez « tour Eiffel », Google peut afficher des images de la tour Eiffel, même si les images sont en français.
- Si vous recherchez « recette de gâteau au chocolat », Google peut afficher des images de gâteaux au chocolat, même si les images sont dans un livre de cuisine.
L’OCR est un outil puissant qui permet à Google de mieux comprendre le contenu des images et de les indexer plus précisément dans ses résultats de recherche.
Est-ce que les balises alt des images vont devenir obsolètes à terme avec une telle technologie ?
Il est peu probable que les balises alt des images deviennent obsolètes à court terme, même avec l’avènement de technologies comme l’OCR. Voici quelques raisons :
1. Accessibilité:
Les balises alt sont essentielles pour l’accessibilité. Elles permettent aux personnes qui ne peuvent pas voir les images, comme les utilisateurs de lecteurs d’écran, de comprendre le contenu des images. L’OCR n’est pas encore assez précis pour remplacer les balises alt pour les utilisateurs malvoyants.
2. Contexte et information:
Les balises alt peuvent fournir des informations contextuelles et sémantiques que l’OCR ne peut pas toujours extraire. Par exemple, une balise alt peut décrire l’action représentée dans une image ou identifier les personnes présentes.
3. Contrôle et précision:
Les balises alt sont créées par des humains, ce qui permet un contrôle plus précis sur le contenu et la sémantique de l’image. L’OCR, en revanche, est un processus automatisé qui peut parfois faire des erreurs.
4. Fiabilité:
L’OCR peut être sensible à la qualité de l’image et à d’autres facteurs, ce qui peut la rendre moins fiable que les balises alt créées par des humains.
5. Optimisation du référencement:
Les balises alt sont un élément important du référencement des images. Elles permettent aux moteurs de recherche de comprendre le contenu des images et de les indexer correctement. L’OCR n’est pas encore utilisé par les moteurs de recherche pour indexer les images.
Cependant, il est possible que l’OCR joue un rôle plus important à l’avenir pour compléter les balises alt. Par exemple, l’OCR pourrait être utilisé pour :
- Générer automatiquement des balises alt pour les images qui n’en ont pas.
- Améliorer la précision des balises alt générées par des humains.
- Fournir des informations supplémentaires sur les images, comme la description des émotions ou des objets présents.
En conclusion, les balises alt et l’OCR sont des technologies complémentaires qui peuvent être utilisées pour améliorer l’accessibilité, la compréhension et la recherche des images. Il est peu probable que les balises alt deviennent obsolètes à court terme, mais l’OCR pourrait jouer un rôle plus important à l’avenir pour les compléter.
Fin de citation de Gemini
Bref, ce n’est pas pour tout de suite, mais à long terme, il y a des chances que les Googlebots boudent les balises alt pour arrêter de se faire berner par des référenceurs qui blinde les balises de mots-clés.
Prochainement
La prise en charge du nouveau modèle de langage, Ultra 1.0, par Google, marque un tournant majeur dans la compréhension linguistique, dépassant même les capacités des experts humains en MMLU.
L’intégration de Bard, ou devrais-je dire Gemini, avec les autres outils et applications de Google pourrait être la clé de son succès en tant que chatbot.