Dic. usuario: un diccionario del usuario es un diccionario personal que incluye palabras que usted desea que el
motor de OCR use como referencia para una mejor exactitud al convertir el documento a texto editable. Por
ejemplo, si escanea documentos con términos altamente técnicos o acrónimos que no se encuentran en
diccionarios comunes, puede agregarlos a su diccionario personal. También puede agregar nombres que espera
encontrar en los documentos. De esta forma, a medida que el proceso de OCR reconoce cada letra o símbolo, hay
una posibilidad más alta de que el término técnico o el nombre aparezca correctamente en el documento final.
Puede crear varios diccionarios del usuario. Consulte la sección
Haga clic en la flecha del menú y seleccione un diccionario del usuario desde la lista.
Si selecciona [ninguno] como el diccionario del usuario, el texto se valida con los términos de los diccionarios
de los idiomas seleccionados, además de los diccionarios profesionales, en caso de que se hayan seleccionado.
La etiqueta [actual] aparece junto al diccionario del usuario seleccionado.
Diccionarios profesionales: son diccionarios legales y médicos que contienen palabras y frases altamente
especializadas. Las opciones son: Legal holandés, Médico holandés, Financiero inglés, Legal inglés, Médico
inglés, Legal francés, Médico francés, Legal alemán y Médico alemán. Seleccione el diccionario adecuado para
el motor de OCR que desee usar para validar el texto escaneado.
Rechazar carácter: éste es el carácter que el proceso de OCR inserta para un carácter de texto irreconocible.
Por ejemplo, si el proceso de OCR no puede reconocer la C de RECHAZAR y ~ es el carácter de rechazo, la
palabra aparece como RE~CHAZAR en el documento. El carácter ~ es el carácter de rechazo predeterminado.
En el cuadro Rechazar carácter, ingrese el carácter que desea usar. Intente seleccionar un carácter que no
aparezca en los documentos.
Falta carácter: éste es el carácter que el proceso de OCR inserta para un carácter de texto omitido. Un carácter
de texto omitido es un carácter que el proceso de OCR reconoce, pero que no puede representar porque no
está disponible para el idioma seleccionado. Por ejemplo, si el documento incluye el símbolo de texto "Ç", pero
el proceso de OCR no puede representar ese carácter, el proceso de OCR inserta el símbolo de carácter omitido
en cada lugar en que aparece "Ç". El símbolo de intercalación (^) es el símbolo predeterminado para el carácter
omitido.
En el cuadro Falta carácter, ingrese el carácter que desea usar. Intente seleccionar un carácter que no aparezca
en los documentos.
Calidad de reconocimiento: arrastre el control deslizante hacia la izquierda o hacia la derecha para ajustar el
grado de exactitud del proceso de OCR. Mientras mayor sea la exactitud, más tiempo requerirá el proceso de
OCR. Para documentos claros y altamente legibles, puede ajustar la calidad de reconocimiento en un nivel más
bajo de manera de producir resultados con mayor rapidez.
2.
Haga clic en Aceptar o en Aplicar.
Estas opciones se aplican al procesamiento de OCR cuando usted selecciona como formato de página
cualquier formato de texto.
120
Xerox DocuMate 3125
Guía del usuario
Creación de diccionarios propios
en la página 121.