O arquivo com as palavras e os arquivos de treinamento, que eu criei e disponibilizei no post mais lido deste blog (OCR de qualidade no Linux) , foram aceitos na versão oficial do programa, a partir da sua versão 2.01. Atualize o Tesseract e use aquele arquivo ao invés do que eu coloquei no post.