Comando OCR Azure - STELA Automation made Simple

Contenido:

Descripción General
Ejemplo de Uso Rápido
Parámetros y Opciones
¿Qué tipo de información puedo obtener?
¿Dónde se almacenan los resultados?
Estructura de los resultados
Ejemplos de Uso Avanzado
Errores Comunes y Soluciones
Casos de Uso
Video Explicativo

Descripción General #

El comando OCR Azure te permite utilizar la tecnología de Reconocimiento Óptico de Caracteres (OCR) de Azure directamente desde STELA. Su principal función es extraer el texto contenido en archivos de imagen (como PDF, JPG o PNG) y ponerlo a tu disposición en forma de texto digital.

Ejemplo de Uso Rápido #

Imagina que recibiste por correo electrónico la foto de una factura en formato JPG y necesitas registrar la información en una hoja de cálculo. Normalmente, tendrías que escribir cada dato manualmente. Con el comando OCR Azure, puedes crear un flujo de trabajo en STELA donde simplemente le indiques la ubicación de la imagen de la factura. Al ejecutar el comando, STELA utilizará el OCR de Azure para leer el texto de la factura y guardarlo en una variable. Luego, podrías usar esa variable para, por ejemplo, copiar la información a tu hoja de cálculo automáticamente.

Parámetros y Opciones #

Selecciona la imagen: Debes indicar a STELA dónde se encuentra el archivo de imagen que quieres procesar. Puedes especificar la ruta del archivo si está guardado en tu computadora, la ubicación dentro de la plataforma STELA (si la has subido previamente), o incluso la URL de una imagen que esté en internet.
Ejecuta el comando: Una vez que has indicado la imagen, utilizas el comando específico de STELA para iniciar el proceso de extracción de texto. Este comando generalmente incluirá la referencia a la imagen que seleccionaste.
Obtén los resultados: Después de ejecutar el comando, el texto que se ha extraído de la imagen se guarda automáticamente en una variable.

Ejemplo:

{azure_ocr} ; «C:\Users\tu_usuario\Documentos\factura.pdf» ; resultados;

Este comando analizará el archivo PDF y almacenará el texto extraído en la variable «resultados».

¿Qué tipo de información puedo obtener? #

Texto completo: Todo el texto de la imagen en una sola cadena.
Texto por línea: El texto se divide en líneas para un mejor análisis.
Texto por palabra: Puedes acceder a cada palabra individualmente.

¿Dónde se almacenan los resultados? #

Los resultados se almacenan en una variable que tú defines. Por ejemplo, en el ejemplo anterior, el texto extraído se almacena en la variable «resultados».

Estructura de los resultados #

[resultados]
content = Todo el texto del documento
page_1_line_1 = Primera línea de la página 1
page_1_line_2 = Segunda línea de la página 1
…
page_2_line_1 = Primera línea de la página 2
…

Ejemplos de Uso Avanzado #

Monitorización de contenido visual en redes sociales: Si necesitas rastrear menciones o información específica que aparece en imágenes publicadas en redes sociales, podrías integrar el comando OCR Azure en un flujo de trabajo de STELA. Este robot digital podría tomar capturas de pantalla de las publicaciones relevantes y utilizar el OCR para extraer el texto. Luego, podrías analizar este texto en busca de palabras clave o patrones específicos.

Procesamiento automático de formularios escaneados: Imagina que tu empresa recibe muchos formularios de papel que necesitan ser digitalizados. Puedes crear un flujo de trabajo en STELA que tome los formularios escaneados (en formato PDF o JPG), utilice el comando OCR Azure para extraer la información clave de cada campo y luego guarde esos datos automáticamente en una base de datos o en una hoja de cálculo.

Errores Comunes y Soluciones #

Baja calidad de la imagen: Si la imagen es borrosa, está mal iluminada o el texto es muy pequeño o ilegible, la precisión del reconocimiento puede disminuir.
- Solución: Intenta obtener una imagen de mejor calidad. S
Texto con formatos complejos: Tablas complejas, texto manuscrito, o fuentes de letra inusuales pueden dificultar el reconocimiento.
- Solución: En algunos casos, puede ser necesario reprocesar la imagen (por ejemplo, enderezarla o mejorar el contraste).
Problemas de conexión (si la imagen es una URL): Si la imagen a la que intentas acceder mediante una URL no está disponible o la conexión a internet es inestable, el comando no podrá procesarla.
- Solución: Asegúrate de que la URL sea correcta y que tu conexión a internet esté funcionando correctamente.

Casos de Uso #

Digitalización de documentos: Convierte documentos escaneados en texto editable.
Automatización de procesos: Extrae datos de facturas, formularios y otros documentos.
Creación de bases de datos: Recolecta información de múltiples fuentes.

En resumen, este nuevo comando te permite transformar imágenes en datos útiles para tus automatizaciones.