Buscador:

25 jun. 2010

Google añade OCR a ficheros PDF e imágenes

Fuente: the INQUIRER.

Una nueva característica de Google Docs permitirá que cuando subamos documentos PDF e imágenes a este servicio se puedan tratar de reconvertir esos documentos a texto con un software propio de reconocimiento de caracteres.
La característica ya lleva un tiempo disponible de forma experimental, y Google ha tenido desde entonces suficiente tiempo para irla afinando y mejorando para convertirla ahora en una opción por defecto en la subida de documentos a Google Docs.
En Google Operating System han realizado unas pruebas básicas y han comprobado que aunque la conversión de PDF a texto funciona, está lejos de ser perfecta, con un 10% del texto incorrectamente convertido, y con la ausencia del formato original, lo que hace del reconocimiento OCR en Google Docs una característica limitada, aunque útil.

No hay comentarios: