Este nuevo comando te permite convertir imágenes (como PDF, JPG, PNG) en texto editable. Es ideal para automatizar tareas que involucran la extracción de datos de documentos escaneados, formularios o cualquier otra imagen que contenga texto.
¿Cómo funciona? #
Selecciona la imagen: Indica la ubicación de la imagen (en tu computadora, en la plataforma o en una URL).
Ejecuta el comando: Utiliza el comando específico para iniciar el proceso de extracción.
Obtén los resultados: El texto extraído se almacena en una variable para que puedas usarlo en tus automatizaciones.
Ejemplo:
{azure_ocr} ; “C:\Users\tu_usuario\Documentos\factura.pdf” ; resultados;
Este comando analizará el archivo PDF y almacenará el texto extraído en la variable “resultados”.
¿Qué tipo de información puedo obtener? #
Texto completo: Todo el texto de la imagen en una sola cadena.
Texto por línea: El texto se divide en líneas para un mejor análisis.
Texto por palabra: Puedes acceder a cada palabra individualmente.
¿Dónde se almacenan los resultados? #
Los resultados se almacenan en una variable que tú defines. Por ejemplo, en el ejemplo anterior, el texto extraído se almacena en la variable “resultados”.
Estructura de los resultados: #
[resultados]
content = Todo el texto del documento
page_1_line_1 = Primera línea de la página 1
page_1_line_2 = Segunda línea de la página 1
…
page_2_line_1 = Primera línea de la página 2
…
Ventajas: #
Automatización: Reduce el trabajo manual al extraer texto de forma automática.
Flexibilidad: Funciona con diferentes tipos de imágenes y formatos de texto.
Precisión: Ofrece una alta precisión en el reconocimiento de texto.
Casos de uso: #
Digitalización de documentos: Convierte documentos escaneados en texto editable.
Automatización de procesos: Extrae datos de facturas, formularios y otros documentos.
Creación de bases de datos: Recolecta información de múltiples fuentes.
En resumen, este nuevo comando te permite transformar imágenes en datos útiles para tus automatizaciones.
A continuación dejamos un video explicativo sobre la utilización del comando: