Rogue Scholar Beiträge

language
Veröffentlicht in Lucidarios

En la entrada anterior hablé sobre los errores por alteración del orden. En esta entrada me dedicaré a los errores por sustitución. A diferencia de los errores por adición, omisión y alteración del orden, los errores de sustitución afectan palabras enteras.

Veröffentlicht in Lucidarios

En la entrada anterior expliqué los contenidos de la ventana de resumen del entrenamiento y la importancia de los valores de los CER de entrenamiento y de validación. En la primera versión del modelo, Lucid D 0.1, utilicé 3374 líneas de texto (o 50 páginas), logrando un CER de entrenamiento de 1.15% y un CER de validación de 2.97%. Este es el paso final del entrenamiento en Transkribus.

Veröffentlicht in Lucidarios

Al final de la entrada anterior habíamos recibido un correo de confirmación sobre la finalización exitosa del entrenamiento de un modelo de transcripción de letra manuscrita. Como dije entonces, el correo contiene un corto resumen y los datos más relevantes del nuevo modelo: los porcentajes de error de caracteres o CER ( character error rate ) en el set de entrenamiento y en el set de validación.

Veröffentlicht in Lucidarios

En la entrada anterior escribí sobre cómo comenzar un entrenamiento de un modelo CITLab HTR+ en Transkribus. Continúo aquí con el proceso. Lo último que había hecho era seleccionar el set de entrenamiento ( training set ) y el set de validación ( validation set ). Como dije entonces, este último set permite a la máquina evaluar la precisión del aprendizaje en el modelo que está desarrollado.

Veröffentlicht in Lucidarios

Tras tres entradas de presentación sobre el trabajo con Transkribus –que en realidad son los sucesivos párrafos de introducción que me vi forzado a ampliar para darle un poco de sentido al trabajo que viene a continuación–, llego finalmente al punto más importante del trabajo con Transkribus: la creación y entrenamiento de un modelo de transcripción.

Veröffentlicht in Lucidarios

Finalmente llegamos al momento en el que toca hablar sobre cómo realizar una transcripción automatizada. En esta entrada comienzo a describir el trabajo para el desarrollo de un modelo de transcripción para el testimonio D del Lucidario , el códice de Puñonrostro.

Veröffentlicht in Lucidarios

En la entrada anterior escribí sobre los errores por adición y omisión. En esta me dedicaré a aquellos que tienen que ver con el reordenamiento del contenido en un manuscrito. Como con los tipos anteriores, los errores por alteración del orden ocurren a nivel de fonema, sílaba, palabra y frase.

Veröffentlicht in Lucidarios

Habiendo dedicado la anterior entrada a las causas del error accidental durante la copia de los manuscritos, en esta ofrezco la primera parte de una tipología de los errores que encontré al transcribir el testimonio C del Lucidario , partiendo –aunque ampliando– los tipos propuestos por Blecua en su Manual de crítica textual . Gracias a que el manuscrito cuenta con un largo colofón, sabemos que los errores que se discutirán aquí

Veröffentlicht in Lucidarios

Como explica Alberto Blecua, en su ya clásico Manual de crítica textual , el error de copia es la razón de ser de la crítica textual (18). Por error se entiende el acto de copiar algo diferente a lo que aparece en un modelo (antígrafo) del que se copia –aunque, como explicaré en una próxima entrada dedicada al error, no copiar lo mismo puede no ser un error–. Tanto Balduino (53) como Blecua (19), entre muchos otros, proponen una serie de

Veröffentlicht in Lucidarios

En la entrada anterior sobre Transkribus describí el proceso para subir y preparar un documento para la transcripción automatizada. Continuamos aquí donde nos habíamos quedado. Al final de la entrada anterior teníamos un documento listo para ser transcrito, con las regiones de texto y líneas establecidas correctamente.