Google Drive étend les capacités de ROC pour lire le texte sur les documents numérisés dans plus de 200 langues

Reconnaissance optique de caractères, aussi connu comme OCR, est vraiment une technologie étonnante. Si vous n'êtes pas familier, il prend des images et lit le texte sur eux. Pour les fichiers PDF, il peut faire les mots qu'il trouve consultable, sélectionnable, et tout ce que vous voudrez peut-être à voir avec eux. Les meilleures implémentations de OCR fonctionnent assez bien qu'ils font à peu près CAPTCHAs inutile. Et tandis que Google Drive a offert cette fonction en anglais depuis plus d'un an maintenant, il est maintenant le déployer à plus de 200 langues différentes.

image02



Cela est simple comme bonjour. Dans Drive, juste aller à une image ou PDF et l'ouvrir avec Google Docs, comme vous voyez ci-dessus. Cela fonctionne également sur l'app Android, où vous pouvez utiliser l'appareil photo pour numériser des documents, aussi. Ce que vous obtiendrez est une version modifiée du document où vous voyez l'image et le texte transcrit en dessous. Google fait de son mieux pour préserver le formatage comme gras et en italique, mais cela est l'endroit où vous êtes le plus susceptible de voir des erreurs. Les nouvelles capacités linguistiques ne changent rien sur le côté de l'utilisateur, car il détecte automatiquement la langue, même en travaillant pour les systèmes de caractères non-latins.

Si vous avez utilisé le logiciel OCR avant ou tout simplement avoir une expérience avec une reconnaissance optique de documents, la manière d'entraînement est un peu différent. Il ne produit pas un fichier PDF où le texte est sélectionnable dans l'image, mais il lit le texte et il se déplace vers une nouvelle page. Un point positif est que vous pouvez modifier le texte pour corriger les erreurs, mais il peut ne pas être la meilleure option pour tout le monde.

De toute façon, cela est un bel exemple de Google se soucier des marchés non américains du monde (plus les nombreuses personnes qui utilisent des langues autres que l'anglais aux États-Unis).

  • La source:
  • Recherche Google



» » » Google Drive étend les capacités de ROC pour lire le texte sur les documents numérisés dans plus de 200 langues