Leer y escribir en la Red

Leer y escribir en la Red /Novedades,

desafíos, fortalezas, fragilidades

Ponencia presentada a la mesa “Investigación científica y nuevas tecnologías” en el encuentro I Acta Internacional de la Lengua Española

San Millán de la Cogolla, La Rioja, octubre 28 de 2006

En Internet existen por lo menos 8 millones 190 mil alusiones al término quijote. De ellas, 3 millones 250 mil son referencias al nombre “Don Quijote”. La frase “el ingenioso hidalgo” aparece en 335 mil páginas en la Red. Y el nombre “el ingenioso hidalgo don Quijote de La Mancha” se encuentra en 251 mil páginas de Internet.

Eso, en una pesquisa instantánea que realizamos a mediados de este mes de octubre en el buscador más utilizado en Internet. 20 meses antes, en febrero de 2005, cuando indagamos por los mismos términos en el motor de búsqueda de Google, la palabra “quijote” era mencionada en un millón 710 mil páginas; “don Quijote” en 454 mil y “el ingenioso hidalgo” en 44 mil (1).  Es decir, en menos de dos años la presencia del término “quijote” en ese registro del contenido de la Red aumentó un 379%: de más de un millón 700 mil, a casi 8 millones 200 mil páginas. El nombre “Don Quijote” es repetido un 615% más: las menciones que recibe aumentaron de 454 mil a 3 millones 250 mil. Y las páginas en donde se hacen referencias a “el ingenioso hidalgo” aumentaron 661%: de 44 mil, a 335 mil.

La constatación de ese crecimiento puede ser útil para algo más que ocupar nuestro ocio informático si la entendemos como ejemplo de la presencia que alcanzan las palabras en español en medio del torrente de contenidos de toda índole que se encuentra en la Red de redes. La evolución en esos datos puede deberse al aumento en la cantidad de páginas en las que se mencionan los nombres antes aludidos y, también, al incremento en la capacidad de Google y otros motores de búsqueda para rastrear contenidos en Internet. En todo caso aumentos de 4 o 6 veces en tan solo 20 meses parecieran suficientes para considerar que el español se encuentra activo, vigente y creciente en Internet, que es el espacio de propagación de contenidos e ideas más extenso y de mayor expansión global. Por eso cuando nos preguntamos sobre los medios materiales con los cuales los países hispanohablantes compiten y refuerzan las bases de su formidable edificio lingüístico y cultural como indican los términos de referencia de esta mesa de discusión, parece ineludible ocuparnos de la Red de redes.

 

La cuarta lengua en Internet

Mucha presencia en Internet no significa necesariamente presencia de la mejor calidad deseable. Utilizada de manera intensa y constante, nuestra lengua es vehículo para expresar todo tipo de contenidos. Esa es una de las singularidades de Internet, a la que en otro sitio describimos como una suerte de colección de espejos de la humanidad. Internet replica y propaga pensamientos, sentimientos, valores, intereses, en todas las lenguas.

El español es la cuarta lengua más utilizada en la Red de redes y por lo menos desde que terminó el milenio ha tenido un crecimiento constante, aunque en los años más recientes con un desarrollo más pausado. En 1999 el español era la lengua principal de 4.5% de los usuarios regulares de Internet, después de un todavía mayoritario uso del inglés (que era utilizado por el 57% de los internautas), el 9.2% de los que hablaban japonés y el 4.6% de una ascendente presencia del chino. El 6.5% hablaba alemán.

La lengua española se mantuvo varios años en aquel quinto sitio y hacia 2004 el incremento en el uso de la Red en América Latina y España pero sobre todo entre hispanos en Estados Unidos permitió que alcanzara el cuarto sitio, con el 9% de internautas en todo el mundo. El inglés había descendido a menos del 40%, el japonés se mantenía casi igual –9.5%– y el chino había crecido hasta alcanzar el segundo sitio entre las lenguas más utilizadas en la Red, con 14% de los usuarios.

espanol-1-idiomas-en-la-red.GIF

El crecimiento en el uso de otras lenguas ha reducido la presencia relativa del español que actualmente, se calcula, es el idioma principal del 7.5% de los usuarios de Internet. Ese avance de otras lenguas ha dejado al inglés, aun mayoritario, en algo menos del 30% de los usuarios de la Red. También el japonés ha descendido, hasta menos del 8%. Y el chino sigue creciendo, con algo más del 13%. Hoy en día cerca de 322 millones de personas utilizan Internet acudiendo fundamentalmente al inglés; 144 millones lo hacen en chino; 86 millones en japonés y casi 82 millones en español.

 

espanol-2-cinco-lenguas.GIF

 

Es altamente posible que en poco tiempo el español pase a ser la tercera lengua en Internet, especialmente porque tiene un campo más vasto en donde crecer. Actualmente el 67% de quienes hablan japonés ya gozan de acceso regular a la Red de redes. En cambio solamente el 18.7% de quienes hablan español disfrutan de ese beneficio.

Conforme más gente se incorpore al uso de Internet, la variedad lingüística de la Red será más representativa de la variedad de idiomas que hay en el mundo. Esa será una de las expresiones que tendrá el lento aunque constante abatimiento de la brecha digital. Hacia septiembre de 2006, de acuerdo con el servicio Internet World Stats que abreva de varias fuentes estadísticas, de los casi 6 mil 500 millones de habitantes del planeta solamente el 16.7% –mil 86 millones– tenían la posibilidad de utilizar Internet (2).

Insuficientes contenidos en español

Entre los usuarios de la Red hay cada vez más gente que habla, vive y piensa fundamentalmente en español. Pero eso no significa que la presencia de nuestra lengua en Internet sea proporcional a las preferencias idiomáticas de esos usuarios. El cuarto sitio que el español tiene entre las lenguas predominantes entre los usuarios de la Red se modifica drásticamente cuando nos asomamos a los idiomas en los cuales se desarrollan los contenidos en esa vasta colección de espacios digitales.

No hay una estadística completa acerca de las lenguas en las cuales se distribuyen sitios y páginas en Internet aunque todas las estimaciones coinciden en señalar que el inglés sigue siendo el idioma con más presencia en tales contenidos (3). Algunas aproximaciones a las dimensiones de esa y otras lenguas pueden encontrarse en los inventarios que hay acerca de información específica en algunos de los sitios más consultados en la Red. Wikipedia por ejemplo, es la enciclopedia en línea cuyo método de trabajo sustentado en la colaboración anónima –cada quien puede colocar la información que considere pertinente y cada quien puede enmendar cualquier información– ha significado lo mismo una fuerte discusión acerca de la escrupulosidad de sus contenidos que un constante auge tanto en la cantidad de información como en las consultas que recibe cada día.

Hacia comienzos de octubre de 2006, el español ocupaba el décimo sitio entre las 229 lenguas y dialectos en los cuales hay información en Wikipedia. De algo más de 5 millones 300 mil entradas, las que se encontraban redactadas en nuestro idioma alcanzaban apenas 157 mil. Cabe señalar que los internautas de lengua española interesados en colaborar con Wikipedia se han incorporado a ese proyecto más tarde que aquellos que escriben en otras de las lenguas más utilizadas en el mundo. Por eso, de las algo más de 157 mil definiciones que había en español en octubre de 2006 más de la mitad –89 mil– habían sido puestas en línea en el año más reciente.

Las entradas en inglés, en Wikipedia, sumaban algo más de un millón 412 mil y constituían el 26%. Las definiciones en español eran algo menos del 3%.

 

espanol-3-articulos-wikipedia.GIF

 

Ese dato contrasta con el 7.5% que alcanza el español como lengua principal entre los internautas. Sin que pueda establecerse una relación mecánica entre ambos porcentajes, no es aventurado considerar que muchos de quienes exploran Internet y tienen a nuestro idioma como lengua cotidiana buscan información en otras lenguas –con certeza se puede decir que fundamentalmente el inglés– y no encuentran la información o los contenidos que requieren en sitios y páginas en castellano. También se puede considerar que hay una utilización pasiva de la Red por parte de un segmento importante de los internautas de lengua española.

Otra manera de asomarnos a la proporción de contenidos que la Internet ofrece en español, en comparación con distintas lenguas, es la cuantificación de resultados que ofrece la búsqueda de palabras emblemáticas de cada idioma. Por ejemplo, cuando buscamos la palabra amor en la nuestra y otras lenguas encontramos los siguientes resultados (4).

love 1, 380 000 000

amor 153 000 000

amour 94 300 000

amore 53 300 000

Dicho rastreo informal permite constatar que en la Red hay nueve veces más referencias al amor en inglés que en español. Eso no significa que las mil 380 millones de páginas indexadas por Google se encuentren en inglés. Si alguien escribe el término love en una página en cualquier otro idioma esa página formará parte de las que reporte el motor de búsqueda.

El ejemplo anterior es muy simple. A partir de búsquedas como esa pero realizadas de manera sistemática y con un extenso inventario de términos, el grupo Funredes ha realizado desde varios años una evaluación de la presencia de varias lenguas en Internet. Allí se advierte un descenso porcentual en la utilización del español por lo menos en el primer lustro del nuevo siglo (5).

 

espanol-4-idiomas-en-red.GIF

 

En la tabla se aprecia la ya conocida y muy intuida disminución en la presencia del inglés como lengua predominante en la Red. Sin embargo el 45% de contenidos en ese idioma registrados en 2005 es mayor al porcentaje (30%) de usuarios anglófonos de la Red que había un año después. Y el 7.5% de usuarios que tienen al español como lengua materna es inferior al 4.6% de páginas en las cuales pudieron identificarse contenidos en nuestro idioma.

Además, aunque leve, se puede reconocer un descenso en la utilización del español que en 5 años pasó de ocupar algo más del 5% al 4.6% identificable en 2005. También disminuyeron, siempre en términos porcentuales, las páginas en portugués. En cambio lenguas como el francés y especialmente el alemán tuvieron un incremento en los contenidos en la Red aunque el porcentaje de usuarios que hablan esas lenguas se haya mantenido idéntico (alrededor del 4.6% el francés) o incluso haya descendido como sucedió con el alemán (que pasó de ser la lengua del 6.5% al terminar el siglo XX a ser utilizado por el 5.4% un sexenio más tarde, de acuerdo con los datos que presentamos en la primera tabla incluida en este trabajo).

Esas y otras indagaciones permiten considerar que si bien ha consolidado una presencia relevante, el español podría retroceder respecto de otras lenguas en los contenidos que se encuentran disponibles en Internet. Ante esa constatación, o a partir de la para algunos insuficiente cobertura de nuestra lengua en la Red, hay quienes consideran que lo que hace falta es diseñar mejores recursos para que los usuarios de lengua española identifiquen más fácilmente y con mayor rapidez los contenidos en este idioma. Sin embargo la colocación en línea de distintos motores de búsqueda especializados en sitios en español no ha tenido la relevancia que esperaban sus promotores (6). La cobertura de muchos de esos buscadores ha resultado menor a la que alcanzan los servicios más conocidos internacionalmente. Por otra parte, cuando inquieren por alguna información a muchos usuarios no les resulta especialmente relevante que sea en español o en inglés. Por otro lado los buscadores internacionales más conocidos –como Google, Yahoo y Altavista– han habilitado sus propios servicios en castellano.

Pretender que haya servicios de rastreo de contenidos exclusivamente en español puede expresar una concepción fragmentaria de la Red, como si se pudiera delimitar un territorio virtual en nuestra lengua al margen de todos los demás. La naturaleza reticular de Internet es todo lo contrario de esa por lo demás imposible segmentación. Sustentadas en protocolos de hipertexto, las páginas web se enlazan unas con otras, llevan al usuario de un sitio a otro, de uno a otro contenidos, independientemente del idioma en que hayan sido escritos. Por eso, más que pensar en buscadores que al rastrear en una sola lengua ofrecen una dimensión parcelada y empobrecida de Internet, habría que hacer todo lo posible para que en los motores de búsqueda más utilizados esté presente la mayor cantidad posible de sitios en español. Y desde luego, la prioridad para impulsar el uso de nuestra lengua en la Red y de esa manera en el globalizado mundo contemporáneo, tendría que ser la promoción de contenidos de cada vez mayor cantidad y calidad y, desde luego, en castellano.

Paradojas de los traductores automáticos

Otros recursos tecnológicos de reciente desarrollo contribuyen a paliar la desventaja que, para la comprensión y la comunicación entre sus usuarios, significa la diversidad lingüística que hay en Internet. Los servicios de traducción automática han venido perfeccionándose y son cada vez más sensibles a los usos específicos del idioma. La investigación tecnológica para lograr que el español resulte accesible a quienes no dominan nuestra lengua y, viceversa, para que los internautas de habla hispana comprendan contenidos en otros idiomas, se ha desarrollado de manera considerable. Esos avances en ocasiones están relacionados con la utilización de tecnologías para suplir alguna limitación comunicativa en personas discapacitadas. En otro terreno, para la mayoría de los usuarios pueden ser útiles como referencia general especialmente cuando se acude a fuentes de consulta en donde la traducción plenamente literal no es necesaria.

El desarrollo tecnológico sigue progresando en ese campo. Pero hasta ahora no existen traductores capaces de trasladar de una lengua a otra la riqueza de matices, connotaciones y alegorías que puede haber en un idioma como el nuestro. Igual que hemos hecho en alguna otra ocasión, vale la pena comparar qué ocurre con un texto en castellano cuando es sometido a una traducción digital.

Tomemos, solamente como ejemplo, un párrafo de la más reciente novela de Mario Vargas Llosa:

“Cuando vine a vivir en Lavapiés, el barrio había cambiado de tal manera que a ratos me preguntaba si en esa Babel quedaba todavía algún madrileño de cepa o todos los vecinos éramos, como Marcella y yo, madrileños importados. Los españoles del barrio procedían de todos los rincones de España y con sus acentos y su variedad de tipos físicos contribuían a dar a esa mazamorra de razas, lenguas, dejes, costumbres, atuendos y nostalgias de Lavapiés el semblante de un microcosmos. La geografía humana del planeta parecía representada en su puñado de manzanas (7).

Ese mismo texto, sometido a un traductor instantáneo en Internet, aparece así cuando se convierte al inglés:

“When I came to live in Lavapiés, the district had changed in such a way that short whiles some Madrilenian of stock or all the éramos neighbors asked to me if in that Babel still had left, like Marcella and I, Madrilenian concerned. The Spaniards of the district came from all the corners of Spain and with its accents and their variety of physical types they contributed to give that mazamorra of races, languages, you leave, customs, atuendos and nostalgia of Lavapiés the semblante of a microcosm. The human geography of the planet seemed represented in its handful of apples” (8).

La traducción automática ofrece una razonablemente útil conversión de casi todo ese párrafo pero algunas frases resultan incomprensibles. Los madrileños de cepa se transformaron en mercancías de almacén, los personajes importados se convirtieron en preocupados, términos como “éramos”, “mazamorra” y “atuendos” quedaron sin traducir, el deje alusivo al acento quedó como expresión de abandono y las manzanas callejeras fueron tomadas como frutas. La versión es todavía más incomprensible cuando tratamos de convertirla nuevamente al español (9).

Las tecnologías de traducción siguen desarrollándose y serán cada vez más meticulosas. Sin embargo todavía no se ve cercano el momento en el que puedan sustituir la intervención humana. El mundo, ni modo, sigue padeciendo las consecuencias de la maldición de Babel. Para comprender gran parte de los contenidos que abundan en Internet y, de manera más amplia, para comunicarse con eficacia en distintos espacios de la vida contemporánea, la gente tiene que aprender inglés.

Otros recursos tecnológicos colocados en línea pueden ayudar a la comprensión de nuestra lengua y eventualmente ser útiles para esclarecer alguna duda de gramática o vocabulario, pero no sustituyen la necesidad de que el español, sus reglas y los significados de sus palabras, sean enseñados en las escuelas de nuestros países. En Ecuador, por ejemplo, la empresa Signum, que es proveedora de Microsoft, mantiene un silabeador y guionizador en línea (10). En opinión de la Oficina de Español en la Sociedad de la Información del Instituto Cervantes, “se trata de una herramienta que separa las palabras por sílabas o que muestra la posición correcta de los posibles guiones que queramos introducir. Basta con introducir el término en el área correspondiente y pulsar en el botón <Guionizar silabear>. Las dos operaciones estarán listas en pocos segundos” (11).

La misma empresa ofrece también un “conjugador” en línea. Esos recursos pueden ayudar en casos de apuro pero lo más conveniente es que las escuelas básicas enseñen a dividir en sílabas y a conjugar verbos a todos sus alumnos. La empresa catalana Thera, del Centre de Llenguatge i Computació (CLiC) de la Universidad de Barcelona, ofrece un servicio similar (12).

Al mismo tiempo, en la Red hay esfuerzos individuales, o casi, que apoyan a los usuarios que tienen dudas acerca de usos específicos de nuestra lengua. Entre ellos se encuentra el diccionario de términos informáticos inglés – español colocado en línea y actualizado constantemente por José Luis Prieto (13).

 

 

Libros en línea, rezago del español

Con o sin Internet –pero en realidad ese dilema no existe porque la Red, a querer o no, forma parte del mundo contemporáneo de manera irreversible– se puede reconocer que el camino más sólido para propagar y perfeccionar el uso del español se encuentra en la promoción de la lectura. No hay mejor manera para enfatizar el atractivo y la versatilidad de nuestra lengua. Y como es sabido, los buenos lectores suelen ser buenos usuarios del idioma.

La promoción de la lectura requiere de muy variados apoyos y sobre todo de recursos financieros y decisiones políticas que no siempre existen en la medida de las necesidades en ese campo. Cabe decir que, también en ese ámbito, Internet puede ofrecer un respaldo fundamental. La propagación de bibliotecas digitales, ya sea con materiales expresamente digitalizadas para la Red o a partir de la conversión de colecciones que ya existen en tinta y papel, está significando el aprovechamiento, para difundir la cultura escrita, de la hasta ahora ilimitada capacidad de almacenamiento pero, sobre todo, de la casi completa ubicuidad de Internet.

En ese campo el modelo pionero es el Proyecto Gutenberg, creado en 1971 por el especialista informático Michael Hart y que constituye la biblioteca digital más antigua. En el otoño de 2006, ya con varios años en línea, reunía cerca de 20 mil libros en 50 lenguas. Cada mes, de manera gratuita, son descargados más de 2 millones de libros de ese sitio. Entre el 12 de septiembre y el 11 de octubre de 2006 los 25 libros más descargados de ese sitio fueron los siguientes.

 


 

 

Los 25 libros más descargados del Proyecto Gutenberg

 

1. Fifteen Thousand Useful Phrases by Grenville Kleiser (8596)

2. The Adventures of Sherlock Holmes by Sir Arthur Conan Doyle (8528)

3. The Notebooks of Leonardo Da Vinci — Complete by Leonardo da Vinci (5987)

4. Kamasutra by Vatsyayana (5812)

5. Pride and Prejudice by Jane Austen (5541)

6. How to Speak and Write Correctly by Joseph Devlin (5323)

7. Treasure Island by Robert Louis Stevenson (5259)

8. Ulysses by James Joyce (4978)

9. The Hound of the Baskervilles by Sir Arthur Conan Doyle (4354)

10. The Devil’s Dictionary by Ambrose Bierce (4272)

11. The Art of War by 6th cent. B.C. Sunzi (4239)

12. The Time Machine by H. G. Wells (4087)

13. Roget’s Thesaurus of English Words and Phrases by Peter Mark Roget (4070)

14. The Adventures of Sherlock Holmes by Sir Arthur Conan Doyle (3995)

15. The Prince by Niccolò Machiavelli (3379)

16. The Best American Humorous Short Stories (3346)

17. Meyers Konversationslexikon Band 15 by Various (3279)

18. Metamorphosis by Franz Kafka (3256)

19. Aesop’s Fables by Aesop (3239)

20. Modern Spanish Lyrics by Various (3082)

21. Grimm’s Fairy Tales by Jacob Grimm and Wilhelm Grimm (3045)

22. The Adventures of Huckleberry Finn by Mark Twain (3020)

23. The Valley of Fear by Sir Arthur Conan Doyle (2979)

24. Jane Eyre by Charlotte Brontë (2948)

25. Alice’s Adventures in Wonderland by Lewis Carroll (2849)

Las cifras indican la cantidad de veces que fue descargado cada texto.

Fuente: http://www.gutenberg.org/browse/scores/top#books-last30 Consultado el 11 de octubre de 2006.

 

El Proyecto Gutenberg forma parte de la Feria del Libro Electrónico, World eBook Fair, (http://worldebookfair.com) integrada por 112 colecciones nacionales y/o temáticas. En octubre de 2006 esa red aseguraba que reunía más de 500 mil libros en formato PDF en más de 100 idiomas (14). Seguramente algunos de esos volúmenes se encuentran en español pero de las 112 colecciones que los contienen ninguna está dedicada a libros en nuestra lengua. La escasa atención que recibe nuestro idioma en proyectos como ese resulta correlativa al poco interés que ellos suscitan en nuestros países. Allí se encuentra una debilidad de los esfuerzos para propagar y solidificar el uso del español. La ausencia de iniciativas para incrementar la bibliografía en castellano dentro de espacios que promueven la lectura de archivos digitales en diversas lenguas se advierte en la raquítica presencia del español en colecciones como la del Proyecto Gutenberg.


 

 

 

Principales idiomas en los cuales se distribuyen

los libros del Proyecto Gutenberg / Octubre de 2006

Inglés 16910

Francés 939

Alemán 386

Finlandés 327

Holandés 226

Español 133

Portugués 61

Chino 69

Tagalo 51

Latín 41

Sueco 34

Fuente: A partir de información disponible en http://www.gutenberg.org

 

Otros proyectos, en cambio, están específicamente destinados a digitalizar y catalogar libros y documentos en español. Uno de los más exitosos es la Biblioteca Virtual Miguel de Cervantes. Creada en julio de 1999 a iniciativa de la Universidad de Alicante y el Grupo Santander, tiene “más de 21 mil registros bibliográficos” que se encuentran disponibles en línea. Cada día, de los servidores de la Biblioteca son enviadas 126 mil 500 páginas web En el año más reciente esos materiales habían recibido más de 110 millones de consultas con lo cual, en siete años, la Biblioteca había servido más de 300 millones de páginas (15).

De esos más de 300 millones de páginas, más de la tercera parte fueron solicitadas desde dominios de Internet ubicados en España. Más del 23% desde Estados Unidos y más del 10% desde México (16). Cinco países sudamericanos ocupan los siguientes sitios –Argentina, Perú, Chile, Colombia, Venezuela– y, luego, destaca el interés en naciones no hispanohablantes como Francia, Brasil e Italia para requerir textos de esa biblioteca digital en nuestra lengua.

 


 

Los 30 dominios desde donde se solicitan más páginas

a la Biblioteca Virtual Miguel de Cervantes

(cantidad de servicios por dominios y países 1999 – 2006)

País Dominio No. de páginas servidas

1

España

.es

112 795 737

2

Estados Unidos

.us

71 643 534

3

México

.mx

32 594 665

4

Argentina

.ar

16 338 651

5

Perú

.pe

13 882 943

6

Chile

.cl

13 394 625

7

Colombia

.co

8 329 874

8

Venezuela

.ve

6 782 279

9

Dominio desconocido

—-

6 346 955

10

Dominio comercial

.com

5 700 021

11

Francia

.fr

4 209 734

12

Brasil

.br

3 954 036

13

Italia

.it

3 368 920

14

Direcciones numéricas sin resolver

—–

2 755 624

15

Bolivia

.bo

2 068 314

16

Alemania

.de

2 034 965

17

Red

.net

1 787 810

18

Uruguay

.uy

1 583 895

19

Ecuador

.ec

1 571 094

20

Reino Unido

.uk

1 458 316

21

El Salvador

.sv

1 426 679

22

Rep. Dominicana

.do

1 267 431

23

Canadá

.ca

1 260 694

24

China

.cn

1 177 094

25

Portugal

.pt

1 080 387

26

Guatemala

.gt

1 039 773

27

Panamá

.pa

944 444

28

Corea del Sur

.kr

934 407

29

Costa Rica

.cr

913 465

30

Japón

.jp

873 470

Fuente: Cuadro elaborado a partir de Biblioteca Virtual Miguel de Cervantes. Estadísticas. “Páginas web servidas con éxito por dominios”. http://www.cervantesvirtual.com/informacion/estadisticas.jsp. Consultado en octubre de 2006.

 

Y sin duda el proyecto más ambicioso para colocar e inventariar libros en línea es Google Print que, a partir de convenios con editoriales, autores y bibliotecas, está digitalizando y abriendo el acceso a decenas de miles de volúmenes de todos los temas y todos los tiempos. El de Google será seguramente el catálogo bibliográfico más completo de la historia. Anunciado formalmente a fines de 2004, el programa ha establecido acuerdos con las bibliotecas de universidades como las de Michigan, Oxford, Stanford y la Biblioteca Pública de Nueva York cuyas colecciones completas se estima que reúnen más de 15 millones de volúmenes (17). Sin embargo no todas las obras resguardadas en esas colecciones pueden ser digitalizadas. Solamente aquellas cuyos derechos de autor hayan dejado de estar vigentes, o los libros cuyos editores o autores estén de acuerdo en que formen parte del catálogo electrónico, son sometidos al proceso de digitalización. Los libros son localizables a través de Google Book Search (18). que es una extensión del conocido motor de búsqueda que se ha convertido en instrumento indispensable para recorrer Internet.

La principal y nada menor limitación de ese proyecto es que no todas las obras de su catálogo se pueden consultar completas. En muchos casos el interesado solamente tiene acceso a unas cuantas páginas –habitualmente aquellas en donde se encuentra la información específica que requirió a través del Google para libros–. Todo depende del tipo de autorización que hayan extendido el autor o el editor de la obra en cuestión. Si el libro no está disponible para su consulta completa, Google Book Search ofrece enlaces a librerías electrónicas en donde se puede comprar y, en muchas ocasiones, a bibliotecas en las que se encuentran ejemplares de ese volumen.

En septiembre de 2006 la biblioteca de la Universidad Complutense, en Madrid, se adhirió al programa de Google Book Search. Su director, José Antonio Magán, estimó que un 10% de los más de 3 millones de libros que hay en esa institución podrían ser susceptibles de entrar al proceso de digitalización (19). Así que, con todo y la indudable importancia que tiene y acrecentará, es preciso no sobredimensionar al proyecto de Google. No se trata, todavía al menos, de una formidable biblioteca digital sino, fundamentalmente, de un catálogo de los libros asequibles no en línea sino en librerías y bibliotecas de todo el mundo. En parte debido a las taxativas que imponen los derechos de autor y además a causa del afán para ofrecer y obtener un rendimiento económico por la consulta en línea, los libros se encuentran más en un escaparate en donde se pueden conocer sus rasgos principales que en un anaquel de donde se les pueda tomar para hojear o incluso leer a cabalidad.

Proyectos como el que con un crecimiento constante pero pausado mantiene la Biblioteca Virtual Miguel de Cervantes, o el Google Book Search que se desarrolla de manera exponencial, apuntan en la dirección del futuro del libro. Parece inevitable el hecho de que tanto por motivos de producción como de distribución, los libros serán cada vez más editados y leídos en formatos digitales y con una creciente disponibilidad a través de Internet. En proyectos como los antes mencionados se puede identificar el inicio de una nueva manera para la propagación del conocimiento. Por eso es muy importante que, si se quiere que mantenga su vigencia, el idioma español no deje de estar presente en esos y muchos otros esfuerzos similares. Seguramente la incorporación de la biblioteca de la Complutense al Google Book Search es la punta de lanza de la participación de otras colecciones bibliográficas en castellano. Pero aun así, no exageramos si advertimos que en nuestros países se mantiene una importante reticencia a admitir la propagación de la cultura escrita por medios digitales y muy especialmente a considerar que el futuro del libro se encuentra en formatos distintos a los que hasta ahora hemos conocido, aherrojados a la tinta y el papel.

Sería importante que la cultura en español pudiera propagarse de manera intencional e intensa por los laberintos de la red de redes pero no solamente con más libros digitales sino, al mismo tiempo, con mejores obras. La cantidad es relevante, pero la calidad de la oferta bibliográfica en español también será determinante para la existencia y vigencia de nuestra lengua en Internet, que es el espacio de intercambio cultural más extenso que se haya creado jamás. Hasta ahora los libros más requeridos a través de la Búsqueda de Libros de Google son obras de consulta, diccionarios y manuales. No existe un inventario permanente pero en octubre de 2006 los organizadores de ese servicio dieron a conocer la lista de los 10 libros más consultados en inglés en la semana del 17 al 23 de septiembre (20). Entre ellos hay lo mismo un texto de botánica y un manual para construir un robot, que dos diccionarios y una traducción del Corán. Junto a textos clásicos hay algunos de actualidad lo cual, según los responsables del Google Book Search, “refleja la amplia diversidad de intereses de los lectores”.

 

 

 

 

 

Los libros en inglés más consultados en Google Book Search

Semana del 17 al 23 de septiembre de 2006

1. Peter K. Endress, Diversity and Evolutionary Biology of Tropical Flowers. Cambridge University Press, 2003, 525 pp.

2. Merriam Webster’s Dictionary of Synonyms. Merriam Webster’s, 1984, 944 pp.

3. Frank J. Fabozzi, et. al., Measuring and Controlling Interest Rate and Credit Risk. John Wiley and Sons eds., 2003, 533 pp.

4. Ailsa Cameron, editor, et. al., Ultimate Healing: The Power of Compassion. Wisdom Publications, 2001, 271 pp.

5. The Holy Qur’an. Abdullah Yusuf Ali, traductor. Wordsworth Editions, 1999.

6. Peterson’s Study Abroad 2006. Thomas Peterson, ed., 2005. 616 pp.

7. Noam Chomsky, Hegemony Or Survival: America‘s Quest for Global Dominance. Henry Hold and Company, 2003, 302 pp. (*)

8. Merriam-Webster’s Dictionary of English Usage. Merriam Webster, 1994, 978 pp. (*)

9. Greg Johnson y Thomas R. Arp, Perrine‘s Literature: Structure, Sound, and Sense. Thomson Wadsworth, 2005, 1700 pp.

10. Brad Graham y Kathy McGowan, Build Your Own All-Terrain Robot. McGraw-Hill Professional, 2004, 298 pp.

 

(*) Estos libros fueron retirados del catálogo de Google pocos días después.

Fuente: a partir de la lista publicada en

http://booksearch.blogspot.com/ Los datos de cada libro fueron identificados en búsquedas en Internet.

No disponemos de una relación similar con los libros más consultados en nuestra lengua pero sí con un dato en extremo sugerente. Durante la Feria del Libro que se realizó en octubre de 2006 en Francfort, la empresa Google informó que el libro en español que había sido más buscado en el servicio Book Search es Veinte poemas de amor y una canción desesperada de Pablo Neruda (21). No deja de ser significativo que mientras entre los libros digitales más buscados en inglés se encuentren un estudio sobre la morfología de las flores, un diccionario y una guía finanzas personales, el libro más requerido en español sea uno de los más emotivos poemarios en esta lengua.

Mejor y más lectura, mejor y más idioma

Para que nuestra lengua se desarrolle en Internet no basta con que sea utilizada por una cantidad significativa de personas. La capacidad, posibilidad y el interés de esos usuarios para no solamente consultar páginas en otros idiomas sino para hacerlo también en español y colocar sus propios contenidos en esta lengua es la clave de ese desarrollo. De otra manera tendríamos amplias comunidades nacionales de cibernautas anclados, fundamentalmente, en el uso del inglés o de otros idiomas.

En este punto es pertinente guarecernos de un posible chovinismo lingüístico. La defensa del español no debería conducirnos a rechazar, intemperantemente, el uso y aun el predominio del inglés. Por motivos económicos, pero también culturales e incluso políticos, el inglés ha sido adoptado como el idioma común más empleado en intercambios de toda índole. Sería un tanto pueril oponernos a la utilización del inglés y resultaría negligente no estimular su enseñanza para que cada vez más jóvenes y niños, en nuestros países, sean capaces de comunicarse en ese idioma.

Al mismo tiempo, desde luego, necesitamos de una enseñanza y sobre todo de una práctica extensas, intensas, ambiciosa y creativas del idioma español. Ello requiere de una conciencia muy clara acerca de la importancia de nuestra lengua que es parte de la identidad, la cultura y el sustrato común de nuestros países. Y ese reconocimiento tendría que conducir al diseño y sostenimiento, con todos los recursos necesarios, de políticas para impulsar y mejorar el uso del español en los más variados ámbitos del espacio público en nuestros países. Contenido y continente se encuentran estrechamente relacionados en esa utilización. El idioma puede ser el vehículo de los más variados pensamientos y propósitos. Un mensaje elemental no necesita de un lenguaje especialmente rico. Pero la expresión de ideas, sentimientos o mensajes complejos requiere de y tiende a desarrollar una lengua más plena, con términos e inflexiones capaces de comunicar los matices y la diversidad de tales pensamientos. De allí que las políticas para promover una utilización creativa e íntegra del español tengan que reparar en los contenidos y no solamente en el uso, sin más, del idioma.

El continente, sin embargo, a veces resulta propicio para una simplificación casi irremediable del contenido. Algunas de las nuevas tecnologías que facilitan la comunicación entre las personas son utilizadas con ritmos tan rápidos y para enviar mensajes tan breves que, con frecuencia, en ellas se practica, y se recrea incluso, un lenguaje comprimido y empobrecido. El correo electrónico y especialmente los mensajes de texto que se intercambian a través de teléfonos celulares, igual que los salones de chat y el intercambio por servicios de mensajería electrónica, son recursos de enorme utilidad para transmitir avisos cortos pero a menudo con un patente empobrecimiento del idioma. No tiene caso satanizar esos usos que desmejoran la lengua. Lo que resulta preciso es entenderlos y tratar de crear un contexto en donde el idioma pueda florecer e incluso transformarse, de acuerdo con las nuevas necesidades de la sociedad pero sin perder el caudal de tonalidades que tienen las palabras en español.

Auspiciar una utilización extensa e intensa del español en Internet tendría que conducir a medidas prácticas como la creación de portales y la diversificación de sitios en esta lengua, así como el impulso a su utilización en nuestros países. Pero ese propósito también debería favorecer la capacitación para navegar y especialmente colocar contenidos en la Red, el patrocinio directo o indirecto de sitios en nuestra lengua y el estímulo al uso del español a través de muy variados recursos. Por ejemplo, ¿por qué no convocar a concursos en donde sean premiadas las páginas y/o los blogs en donde se manifieste un uso más creativo, o sobresaliente, del idioma español?

Gracias a la Red hoy muchos jóvenes y niños de nuestros países están leyendo más que la generación anterior. El solo hecho de navegar y buscar los lleva a utilizar con más asiduidad los instrumentos de la palabra escrita. El gran problema, allí radica en la a menudo discutible calidad y en la siempre insuficiente oferta de los contenidos, especialmente en castellano, que encuentran en sus recorridos por Internet. El español, como cualquier lengua y para estrujar un adecuado lugar común, se ejercita en la medida en que se le practica. Para fortalecerlo es necesario leerlo y escribirlo. Hay que hacerlo en las escuelas y en muchos otros ámbitos de nuestras sociedades. Y es fundamental crear espacios y solidificar recursos para que cada vez más gente lea y escriba en Internet.

 

Para sintetizar algunos de estos puntos de vista ciñéndonos al esquema sugerido para este encuentro podemos apuntar cuatro consideraciones acerca de la lengua española en la Red.

 

Debilidades: las que plantea una apropiación tecnológica que todavía requiere, esencialmente, del idioma inglés para entender los nuevos dispositivos de comunicación y para aprovechar los contenidos que hoy circulan en la Red y en otros espacios. El escaso interés que suscitan iniciativas internacionales para colocar en línea libros o contenidos de otra índole.

Amenazas: la todavía vigente preponderancia del inglés no resulta especialmente riesgosa. En cambio sí hay una fuente de debilitamiento e incluso de regresión de nuestra lengua en el uso apresurado y descuidado que con frecuencia se hace del idioma en numerosos sitios en la Red e incluso la utilización fragmentaria del idioma en dispositivos o protocolos de comunicación instantánea como los mensajes de texto por teléfono y el correo electrónico. El riesgo principal radica en la escasa exigencia cultural y social respecto del uso cotidiano de nuestra lengua.

Fortalezas: la capacidad expresiva que tiene el español y que no existe en otras lenguas forma parte del patrimonio inherente a este idioma. Quizá su principal riqueza se encuentra en los más de 437 millones de personas que viven y se comunican en español como primera lengua. Proyectos como las bibliotecas digitales que propagan contenidos en español constituyen el cimiento para iniciativas más audaces y que, sobre todo, incluyan la difusión de libros recientes y no solamente de joyas literarias de la antigüedad.

Oportunidades: el desarrollo tecnológico ofrece la posibilidad de propagar, como nunca antes, la cultura, el conocimiento, las propuestas y las singularidades regionales y nacionales en todas las lenguas. Una utilización virtuosa de esos recursos requiere de proyectos, infraestructura y decisiones políticas suficientes. Allí se encuentra la oportunidad central, pero también el reto a menudo incumplido, que tiene el español para un cabal desarrollo.

Octubre de 2006


[1] Búsquedas realizadas en Google durante la última semana de febrero de 2005 y el 19 de octubre de 2006.

[2] Internet World Stats, consultado en: http://www.internetworldstats.com/stats7.htm

[3] Ted Smalley Bowen, “English could snowball on Net”. TRN, The Latest Technology News. Consultado en:

http://www.trnmag.com/Stories/2001/112101/English_could_snowball_on_Net_112101.html

 

[4] Búsquedas en Google realizadas el 20 de octubre de 2006.

[5] Funredes, “Presencia relativa de las lenguas neolatinas, y del alemán, con respecto al inglés en la Red”. 2005. Disponible en:

http://funredes.org/lc/espanol/medidas/sintesis.htm|

 

[6] Algunos servicios de búsqueda en español como www.elindice.com, www.buscopio.net, www.enlaweb.com y www.yoencuentro.com han desaparecido. Otros, como www.sol.es funcionan de manera muy deficiente. Otros más como www.ozu.com y www.ya.com se han desarrollado más como portales temáticos que como motores de búsqueda.

[7] Mario Vargas Llosa, Travesuras de la niña mala. Alfaguara, 2006.

 

[8] Texto convertido por el traductor automático de Google: http://www.google.com/language_tools

[9] El texto traducido del español al inglés, colocado tal cual en el traductor ahora al español, ofreció el siguiente y embrollado resultado: “Cuando vine vivir en Lavapiés, el districto había cambiado de una manera tal que es corto pase algún Madrilenian de la acción o de todos los vecinos de los éramos invitados a mí si en esa Babel todavía se había ido, como Marcella e I, Madrilenian referido. Los españoles del districto vinieron de todas las esquinas de España y con sus acentos y su variedad de tipos físicos contribuyeron a la elasticidad que el mazamorra de las razas, idiomas, tú deja, a los costumbres, a los atuendos y a la nostalgia de Lavapiés el semblante de un microcosm. La geografía humana del planeta se parecía representada en su puñado de manzanas”.

[10] http://www.lenguaje.com/herramientas/silabeador.php

[11] http://oesi.cervantes.es/TLTODOS/tecnologias_del_texto_3.htm

 

[12] http://www.thera-clic.com/

 

[13] http://www.tugurium.com/gti/

[14] http://worldebookfair.com/Collections.htm

 

[15] Biblioteca Virtual Miguel de Cervantes, “21.000 registros bibliográficos de libre acceso”. Disponible en:

http://www.cervantesvirtual.com/noticias/noticias.jsp?anyo=2006&mes=7

[16] Biblioteca Virtual Miguel de Cervantes, “Estadísticas”.

http://www.cervantesvirtual.com/informacion/estadisticas.jsp Consultado en

octubre de 2006.

 

[17] “History of Google Book Search”. Consultado en:

http://books.google.com/googlebooks/newsviews/history.html

 

 

[18] La versión general de ese buscador se encuentra en: http://books.google.com

El buscador para libros en español está en: http://books.google.es

 

[19] M.C. Belaza, “La Complutense ‘volcará’ su biblioteca en la Red de Google”. El País, Madrid, 27 de septiembre de 2006.

[20] Tom Turvey, director de Google Book Search Partnerships, “Top ten books: a Google Book Search zeitgeist”. Viernes 6 de octubre de 2006. Consultado en: http://booksearch.blogspot.com

[21] Yaotzin Botello, “Toma vuelo libro digital”. Reforma, México, 13 de octubre de 2006.

Un comentario en “Leer y escribir en la Red

  1. Excelente información, no tenía conocimiento de el blog, mi nombre es Carlos, soy estudiante de sociología y estoy trabajando el tema de TIC, Open Access y grupos indígenas para mi tesis.

    He leído sus trabajos y me parecen excelentes.
    Un saludo desde la Universidad Autónoma del Estado de México

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s