#!/bin/bash/
# ------------------------------------
# Conseguimos el árbol del directorio,
# sólo sirve para archivos con nombres
# escritos sin espacios
files=$(ls | grep pdf)
declare -i counter
# Recorremos el output del comando
for file in $files
do
# Separamos el nombre para poder crear archivos "regulares"
name=$(echo $file | tr "." "\n")
counter=0
for i in $name
do
if [ $counter -eq 0 ]; then
baseName=$i
else
extension=$i
fi
counter=+1
done
scannedName="scann"$file
textName=$basename".txt"
# Ahora procesamos OCR
ocrmypdf $file $scannedName
# Si el PDF ya es OCR entonnces no existe
# mi archivo, y proceso para TXT al original
if ls $scannedName; then
pdftotext $scannedName $textName
else
pdftotext $file $textName
fi