Page 1 sur 1

OCR MTM

Publié : sam. 21 août 2021 10:49
par neantibios
A l'heure de ce message je viens juste d'arriver sur RdA, et n'ai pas suivi l'intégralité des débats sur le contenu RdD.
Il y a sans doute des questions de fonds qui m'échappent.

Cependant, je suis volontaire pour passer une OCR sur un MTM : 10 - A l'heure du vaisseau.
C'est un long travail, mais en collectif, et pour la postérité (malgré une réédition en cours des MTM), il serait possible de :
- Augmenter la qualité de documents un peu limite
- Diminuer le poids de documents un peu lourds
- Apporter le grand plus de documents au texte identifié

Qu'en dites-vous ?

Re: OCR MTM

Publié : sam. 21 août 2021 13:31
par Outsider
neantibios a écrit : sam. 21 août 2021 10:49 je suis volontaire pour passer une OCR sur un MTM : 10 - A l'heure du vaisseau.
Alors là, j'ai rien compris. Mais c'est certainement une bonne idée. :blink:

Re: OCR MTM

Publié : sam. 21 août 2021 14:37
par neantibios
Outsider a écrit :Mais c'est certainement une bonne idée.
Je trouve la qualité du Miroir des Terres Médianes N°10 (L'heure du vaisseau), proposé au téléchargement, un peu basse :
Peu lisible, et surtout une pliure sur la couverture... :)

Je me propose donc de refaire le pdf, sur la base du fascicule d'origine que j'ai en ma possession, et qui est plutôt bien conservé.
Et tant qu'à faire, effectuer sur les scanners des pages une Reconnaissance optique de caractères (OCR).
Cette OCR permettrait de transformer les images du texte des scans en texte tout court.

Le texte tout court ayant nombre d'avantages sur l'image du texte.

edit : C'est une façon de participer, et pas juste venir pour télécharger. Mais cette proposition est peut-être hors procédure.

Re: OCR MTM

Publié : sam. 21 août 2021 19:39
par La Moitié
Du tout, du tout. Je te propose de tenter une invocation de Grand Manitou. Pour cela tu fais une fausse citation :
Géraud Myvyrrian G a écrit :La meilleure édition de D&D, c'est celle qui tourne sous AW !
Ça ne devrait pas tarder :D

Re: OCR MTM

Publié : sam. 21 août 2021 19:45
par Géraud Myvyrrian G
Ahah!

Alors avec plaisir pour le scan et PDF si tu te sens. Merci!
Je rajouterai le watermark ensuite.

Re: OCR MTM

Publié : dim. 22 août 2021 12:30
par neantibios
Je vous tiens au courant ;)

Re: OCR MTM

Publié : dim. 22 août 2021 22:06
par Géraud Myvyrrian G
:chin

Re: OCR MTM

Publié : mar. 31 août 2021 10:59
par neantibios
Après multiples essais, je n'ai pas pu réaliser un OCR sans perte de données, notamment autour des images de fond (derrière le texte).
Par ailleurs, au delà de ces pertes en image, "océriser" ce document (les MTM en général je pense) aurait demandé un travail trop considérable pour l'enjeu.
Donc pas d'OCR au final.

Néanmoins, une nouvelle numérisation du MTM10.
Bien plus lourde que la version proposée (65 Mo contre 4 Mo), mais bien plus lisible.

Numérisé page par page en 300x300 ppp.

Bon jeu !

Re: OCR MTM

Publié : mar. 31 août 2021 12:28
par Géraud Myvyrrian G
Merci de ton taf.
Il nous faudrait vraiment un spécialiste des pdf qui gère tous ces trucs galères.

Re: OCR MTM

Publié : mar. 31 août 2021 18:29
par pelon
je l'ai mis sur la dropbox pour le water marquage