Lê o texto contido em uma imagem.
MyImage is Image
let MyString = OCRExtractText ( MyImage )
MyImage é Imagem
r é Retângulo
r .X = 346
r .Y = 2258
r .Largura = ( 2158 - 346 )
r .Altura = ( 2323 - 2258 )
deixe sString = OCRExtractText ( MyImage , r )
Traço ( sString )
p é Polígono
p. Ponto [ 1 ] .. X = 346
p. Ponto [ 1 ] .. Y = 2258
p. Ponto [ 2 ] .. X = 2158
p. Ponto [ 2 ] .. Y = 2258
p. Ponto [ 3 ] .. X = 2158
p. Ponto [ 3 ] .. Y = 2323
p. Ponto [ 4 ] .. X = 346
p. Ponto [ 4 ] .. Y = 2323
deixe sString2 = OCRExtractText ( MyImage ,p )
Rastrear ( sString2 )
Sintaxe
<Result> = OCRExtractText (<Imagem para usar> [, <Área para ler>])
<Result>: Cadeia de caracteres
Texto extraído da imagem.
<Imagem a ser usada>: Nome do controle, variável da imagem, string de caracteres (com aspas)
Imagem na qual as áreas de texto devem ser detectadas. Esta imagem pode corresponder a:- um controle de imagem,
- uma variável de imagem,
- um item de memorando de imagem,
- o caminho de um arquivo de imagem
- o caminho do arquivo PDF.
<Área para ler>: Variável retângulo ou poligonal opcional
- Nome da variável Retângulo que representa a área que contém o texto a ser extraído.
- Nome da variável Polygon que representa a área que contém o texto a ser extraído. Neste caso, a área lida corresponde ao retângulo que contém o polígono.
Por padrão, se este parâmetro não for especificado, todo o texto da imagem será extraído.
Observações
- No Windows, Linux e Android, o mecanismo de OCR permite o uso de modelos Legacy ou LSTM da Tesseract.
- Para arquivos PDF:
- se o parâmetro <Area to read> não for especificado, OCRExtractText extrairá o texto de todas as páginas do arquivo PDF especificado.
- se o parâmetro <Area to read> for especificado, o arquivo PDF deverá conter uma única página. Se um arquivo PDF contém várias páginas, extraia a página desejada como uma imagem usando PDFExtractPage . Esta imagem pode então ser usada com OCRExtractText .
- Para obter os melhores resultados possíveis, é recomendado:
- Use uma imagem de alta resolução.
- Corte a imagem ao redor do texto, se possível (evite áreas desnecessárias).
- Limite a inclinação do texto. Se a imagem estiver ligeiramente inclinada, o OCR pode detectar o texto, mas a qualidade será afetada.
Imagens distorcidas podem ser lidas. - Limite o número de modelos / idiomas usados.
- Observe que, se a imagem usada corresponder a um controle Image, a imagem de origem será manipulada diretamente. Portanto, as alterações feitas no controle Imagem (tamanho da imagem por exemplo) não serão levadas em consideração. Para aplicar essas mudanças, é necessário salvar a imagem.
Classificação de negócios / IU: lógica de negócios