15-09-2008

Pourquoi Google veut numériser les livres de la bibliothèque de Lyon

Google va mettre en ligne près de 500 000 livres de la bibliothèque de la Part-Dieu. Une première. Explications du responsable de ce projet chez Google.

Pourquoi vous avez choisi Lyon ?
Philippe Colombet : En fait, c’est la mairie de Lyon qui a lancé un appel d’offres début 2007, pour numériser les fonds anciens de la bibliothèque de la Part-Dieu. Soit 450 000 à 500 000 ouvrages édités entre le XVIe et le XIXe siècle. Et c’est Google qui a été choisi. Il faut dire que nous avons déjà réalisé ce genre de travail avec 28 bibliothèques en Europe et aux Etats-Unis. Dont les prestigieuses universités d’Oxford, de Princeton et de Harvard.
L’intérêt pour Google ?
C’est un moyen de proposer aux internautes des contenus plus pertinents et surtout plus fiables, car les informations contenues dans les livres sont souvent plus sûres que celles qu’on trouve sur le web. De plus, cette numérisation va nous permettre d’enrichir notre base de données pour attirer plus d’internautes, donc plus de publicité.
Au fond, vous allez vous faire du fric sur le dos des contribuables !
Mais cette numérisation est aussi un avantage pour la bibliothèque de Lyon, car ses ouvrages anciens seront accessibles dans le monde entier. Ensuite, cette opération ne coûtera rien à la ville de Lyon, car tout est financé par Google.
Comment vous allez numériser ces vieux livres ?
D’ici fin 2009, on ouvrira un centre de numérisation dans la région lyonnaise. Tous les ouvrages seront sortis progressivement de la bibliothèque pour être numérisés dans ce centre, page par page. Un travail qui devrait prendre environ 10 ans.
Comment ou pourra accéder à ces livres ?
Il suffira de se connecter sur le site “Google Recherche de livre”, qui compte déjà plus de 1 million d’ouvrages, puis de rentrer un mot-clé dans la barre de recherche. Ou bien le nom de l’auteur, de l’éditeur, la date de parution... Les livres seront alors affichés et l’internaute pourra les feuilleter sur son ordinateur, mais aussi les télécharger pour imprimer les pages qui l’intéressent.
Et les droits d’auteur ?
En France, un ouvrage est protégé pendant 70 ans par le droit d’auteur. Alors que les livres qu’on va numériser ont plus de 100 ans !

 

Commentaire

Livres Anciens

Le problème est, pour les livres anciens (plus de 200ans) l'incapacité de Google de rendre compte correctement des textes dans une typographie ancienne : le logiciel OCR n'a pas été adapté, contrairement au travail effectué sur GALLICA2, seconde version de la bibliothèque numérique de la BNF. D'où un travail inutile qui sera à refaire dans les années prochaines, si le contrat de la Ville de Lyon avec Google nous en laisse le loisir, puisque les droits associés aux livres numérisés sont consentis à Google pour 25 ans !!! Ici un exemple de texte traduit à partir de la numérisation merdique de Google : allez voir l'original en version "texte" pour apprécier l'étendue du désastre : http://fr.blog.360.yahoo.com/blog-FmUS56Y1eqimqNrfxwgRgcY-?cq=1&p=315

kaoetic

Vous omettez de rappeler que Google pourra constituer des banques de données à partir de nos consultations et les revendre à des entreprises.Ce n'est pas que de la publicité qui tombera dans les poches de Google et c'est aussi une atteinte supplémentaire à notre droit à la vie privée ! De même le principe qui consiste à dire çà ne coûte rien à la mairie c'est le degrés zéro de la politique et çà ouvre la voie à des décisions contraire à l'intérêt général. As-t-on étudié d'autres pistes plus conforme à l'usage d'un bien commun ? N'est-ce pas un "trésor" que l'on donne gratuitement (quel rapport entre le coût de la numérisation et les gains escomptés par Google?) à un opérateur privé ?
1
 

Publicité ▼