Este artículo les enseñare cómo crear un programa que pueda realizar el reconocimiento de texto desde una imagen y traducir el texto con la API de Google Translator para Python. Después de investigar un poco, descubrí que la API de Google Translator estaba disponible para su uso gratuito. En este proyecto, combinaremos el reconocimiento de texto con la biblioteca de traducción de idiomas.

En este proyecto, usaremos tres bibliotecas de Python. Voy a usar una terminal/consola para instalarlos, también crearemos un archivo requirements.txt. Una recomendación: cree un entorno antes de instalarlos. Personalmente prefiero Anaconda: tiene una interfaz agradable y es fácil de usar. Pero de todos modos, volvamos a las librerías. Estas son las tres librerías que necesitaremos:

  • Pillow: una potente librería de procesamiento de imágenes. La usaremos para abrir y editar un archivo de imagen. (Esta librería también se conoce como PIL).
  • Pytesseract: la biblioteca que usaremos para reconocer texto en una imagen.
  • Googletrans: la usaremos para traducir el texto reconocido. Además, debido a algunas actualizaciones de Google, este paquete muestra mensajes de error en algunas versiones. Es por eso que, al instalar, usaremos la versión alfa 3.1.0.

Vamos a crear un archivo llamado requirements.txt y vamos a copiar las librerías que necesitamos

Pillow==8.1.0
pytesseract
googletrans==3.1.0a0

Una vez creado el archivo requirements.txt con las librerías, vamos a proceder a instalarlas con el siguiente comando:

pip install -r requirements.txt 

Ahora, vamos a crear un archivo llamado app.py en el cual vamos a poner todo nuestro código fuente. Abrimos nuestro app.py y vamos a importar las librerías.

from PIL import Image 
import pytesseract 
from googletrans import Translator
Volver arriba