La Academia Mexicana, popularmente conocida como Academia Mexicana de la Lengua, recibe consultas numerosas de tipo lingüístico. Una categoría de éstas es la de aquellas que se refieren a nombres geográficos.
Para ayudar a los interesados, la Academia preparó hace cuatro años una lista de los nombres en español de los países del mundo, de sus gentilicios y de sus capitales, cada uno en la forma que ella recomienda (Los nombres de los países, 1993). Esta lista tuvo buen éxito editorial. Está ahora en la segunda impresión de su tercera edición (Fondo de Cultura Económica, 1996).
Resolvió entonces la Academia Mexicana ampliar un proyecto que tiene tanta demanda y preparar un Diccionario geográfico universal, que contuviera los nombres no solamente de países, sino, además, de ciudades, ríos, montañas, islas, mares, lagos, cabos, valles, desiertos, golfos, bahías, regiones y otros objetos geográficos, en la forma que ella recomienda para su uso en español.
¿Qué problemas encontró la Academia en la preparación de este diccionario y cuáles fueron las soluciones?
Algunos autores distinguen un nombre geográfico, que se aplica a toda parte de la superficie de la tierra que tiene identidad reconocible, de un topónimo, que se aplica a toda parte de la superficie de cualquier planeta o satélite que tiene identidad reconocible. El diccionario descrito aquí tiene sólo nombres geográficos (no incluye, por ejemplo, los nombres de cráteres de la luna), pero como las palabras geonimia y geónimo no están en el Diccionario de la Lengua Española, de la Real Academia Española (1992), en este libro se usa la palabra topónimo.
Las entidades topográficas que tienen nombre incluyen tanto las naturales (cascadas, cordilleras) como las creadas por seres humanos (aldeas, ciudades, provincias). Este diccionario incluye unos 10.000 topónimos, los de los objetos geográficos más importantes.
Se escogieron las que parecen más usuales en México, teniendo en cuenta también las que se utilizan en otros países de habla española; cuando se da más de una forma, la primera es la que la Academia Mexicana aconseja usar. Cuando el uso parece titubear, se siguieron varios principios generales; por ejemplo, uno de ellos fue el de no aumentar el número de los exónimos.
Un exónimo es el nombre de un lugar cuando es diferente del que tiene en el idioma local; verbigracia, Londres y Córcega son, respectivamente, los exónimos españoles del inglés London y del francés Corse. Estas formas hispanizadas tienen una larga tradición (igual que Tabago, que en inglés se escribe Tobago, o San Cristóbal y Nieves que en inglés es Saint Kitts and Nevis, o Albania [Shqipëria], Alemania [Deutschland], Hungría [Magyarország]; cuando no hay una forma española tradicional de designar un lugar, no se vio la necesidad de crear una nueva (para topónimos que se escriben localmente con el alfabeto latino), de modo que, por ejemplo, se dejaron Djibouti y Ouagadougou como en francés, Canberra y Ghana como en inglés, Liechtenstein como en alemán, Ljubljana como en esloveno, Jakarta como en indonesio, Reykjavík como en islandés, Vilnius como en lituano.
Éste no es el caso de los idiomas que, a diferencia de los mencionados, hubo que transcribir porque se escriben localmente en un alfabeto que no es el latino (árabe [Iraq, Jartuml], cirílico [Jabarovsk, Jár'kov], griego [Lárisa], hebreo [Haifa]) o con un sistema no alfabético (chino [Beijing], japonés [Kyoto]). Esta regla se puede llamar «del alfabeto latino».
Cuando, en el diccionario en cuestión, la ortografía del nombre geográfico y la del adjetivo gentilicio no coinciden, ello se debe a la aplicación de este principio al nombre; el adjetivo, en cambio, sí se hispaniza, ya que no puede seguir la forma local que se basa en otro idioma (ejemplos Kenya/keniano, Rwanda/ruandés).
Dentro de la regla del alfabeto latino hubo que decidir si se incluían signos diacríticos. Se resolvió hacerlo, en la inteligencia de que, si hay dificultades tipográficas, se puede reproducir el topónimo sin ellos. El rumano Iasi, por ejemplo, que se pronuncia /yash/, puede escribirse Iasi, sin la cedilla.
Los nombres geográficos tienen frecuentemente una parte o elemento genérico (desierto, mar, monte, río) y un elemento específico (hondo, largo, negro). En español, la parte genérica generalmente sigue a la genérica (el río Nilo, la Península Ibérica). Los topónimos compuestos por más de una palabra pueden ser bimembres (Río Frío, Puerto Escondido), trimembres (Presa Venustiano Carranza, Valle de Bravo, Sierra Madre Occidental), y aun de cuatro o cinco elementos (Cabo de San Vicente, San Nicolás de los Garza).
Para uniformar el uso de mayúsculas y minúsculas una regla posible es «todos los elementos de un nombre geográfico se escriben con mayúscula, incluyendo los genéricos» (Península Ibérica); otra «úsese el menor número posible de mayúsculas» (península ibérica); tercera: «los accidentes geográficos irán en altas cuando su nombre esté compuesto por el sustantivo que designa el accidente y por un adjetivo» (Península Ibérica, Océano Pacífico, Río Amarillo). El elemento genérico se escribirá en minúsculas cuando el elemento específico sea un sustantivo (río Bravo, río Papaloapan).
¿Qué hacer cuando hay, además, una preposición, en que la frase con de («de Oaxaca» en «valle de Oaxaca» o «de Yucatán» en «península de Yucatán») se siente como adjetivo? ¿con Sierra Madre Occidental en que las tres partes son más o menos genéricas? La decisión fue seguir para este diccionario, en general, la primera de estas posibilidades y, para los ríos, la tercera.
El 27 de abril de 1994, el X Congreso de la Asociación de las Academias de Lengua Española resolvió que la ch y la ll, que desde 1803 eran letras separadas de las demás en los diccionarios, volverían a formar parte, en cuanto a su orden alfabético, de las letras c y l, respectivamente. En este diccionario, por lo tanto, Chaco sigue inmediatamente a Cevenas y Chuzenji precede a Cícero; así mismo, Llamberis sigue inmediatamente a Ljubljana y Llullaillaco precede a Loange.
El sistema de separar la ch del resto de la c, y la ll del resto de la l, que la Real Academia Española presenta en 1803 como una innovación, ya había sido utilizado por Antonio Martínez de Cala, llamado Elio Antonio de Nebrija (o Nebrixa), nacido en 1444, en su Diccionario del romance al latín (cuyo título en latín es Dictionairlum ex hispaniensi inlatinum sermonem; 1495 ó 1493; y segunda edición, revisada por el autor, Sevilla, 1516), en que coloca las palabras por grupos según sus dos primeras letras para resolver ciertos problemas ortográficos y fonéticos del español de su época, de modo que pone primero las palabras de cabal a cutir (con el orden inicial ca-, cl-, co-, cr-, cu-), luego las que empiezan por un sonido /ts/ que se escribía con ç ante a, o, u, pero con c ante e, i (ça-, cc-, ci- ço-, çu-, [çabullir-çavila, cebolla-cezar, ciar-cizercha, çoçobra-çuzon]) y después de chambrana a chapadura. Más adelante, después de poner de la a luzir, coloca de llaga a lluvia, y después de nabo a nuve, pone de ñublado a ñudo. En la introducción dice que el castellano empieza a, b, c, ç, ch, d… l, ll, m, n, ñ, o….
Y Alonso de Molina, en 1555 (y 1571), en su Vocabulario en lengua castellana y mexicana, sigue en esto a Nebrija, colocando las palabras por grupos según sus dos primeras letras, de modo que pone primero las palabras de cabal a caxquillo, luego de clamar a clueca, de coa a cozinero, de crecer a cruzero, de cuaderno a cutír (1571 cuzilla), luego de çabullírse a çatico, de cebolla a cevar, de cibdad a citado (1571 civil), de çongotrear a çopo, de çuecos a çurugía, y después de chamuscar a chupar (1571 chupamiento); más adelante pone las palabras de labio a luzir, seguidas de llaga hasta lluvia. Después de nube de ojo tiene ñublado, hasta ñudos. En 1571, agrega el abecé, siguiendo a Nebrija.
Otra decisión relativa al alfabeto: en el Diccionario geográfico se usó el orden letra por letra, es decir Agua Prieta viene después de Aguadilla (como si estuviese impreso Aguaprieta sin espacio), no antes, como en el sistema palabra por palabra. Para la alfabetización se hizo caso omiso de los artículos (La Habana está en Habana, La, en la h; El Cairo, en Cairo, El, en la c), y de los elementos genéricos (Cabo San Vicente está en la s).
En los casos en que se muestra la pronunciación local de un topónimo (entre las diagonales //) es sólo aproximada. Cuando no se da es porque o se pronuncia el topónimo más o menos como si fuera español o no se puede indicar (sin introducir signos especiales) con las reglas del español de una manera que se asemeje suficientemente a la original (por ejemplo, el sonido francés de la j, como en jour o el sonido inglés de la j, como en job [italiano gi en giorno]).
A pesar de esta dificultad, en la representación fonética se usó a veces la /y/ como equivalente del inglés j en job (excepto en portugués, en que representa el francés j de jour), pero también nos vimos obligados a usarla para indicar la y del español. Por ejemplo, en /aryantcy/, que aquí representa el francés Argenteuil, la primera y se lee como la j francesa o portuguesa, la segunda como la y española. Se usa el grupo /sh/ para indicar el sonido inicial del inglés ship y del francés chat.
Para la grafía de las cifras se escriben con letra las unidades, es decir, del cero al nueve, del 10 en adelante con guarismo. Para separar los millares muchos tipógrafos usan un blanco fino; otros usan coma o punto para ello. Las regiones en que se usa la coma decimal (como en España o Francia) ponen punto entre millares; las que usan punto decimal, como en México o los Estados Unidos, ponen coma entre millares; la Academia Mexicana así lo hace, pero usa, además, un apóstrofo para los millones.
Hubo que decidir si se traducían ciertos elementos genéricos de los nombres geográficos compuestos. Se resolvió decidir esto caso por caso: Nueva York, Nuevo México, pero New Hampshire. El caso de New Jersey fue muy discutido (todas las decisiones mencionadas en este trabajo se tomaron después de debates a veces prolongados). En topónimos como Smoky Hill, que a pesar de significar en inglés ‘colina humeante’ es un río, se indica la traducción literal entre paréntesis.
En los topónimos que tienen nombres nuevos se indican también los nombres anteriores (por ejemplo, Belarús [antes Bielorrusia], Myanmar [antes Birmania]). En algunos nombres de países hubo que decidir si se hacía caso de lo que piden los mismos países (en la ONU, por ejemplo, la Costa de Marfil pidió que en todos los idiomas se la nombrara en francés [Côte d'Ivoire], Libia pidió que se la llame la Jamahiria Árabe Libia, Macedonia tuvo que ser admitida como miembro con el nombre de La ex República Yugoslava de Macedonia, Siria desea que la llamen la República Árabe Siria, Suriname pide una -e al final de su nombre, Tanzania quiere ser en español la República Unida de Tanzanía [con acento]). La Academia resolvió no seguir a la ONU en el caso de todos los nombres de países.
Se usan en el diccionario sólo las de los puntos cardinales (N, S, etc.), y las de unidades de medida para distancias y dimensiones (m, km).
Se indica, cuando el uso lo pide: Canadá (el), India (la), Siberia (la).
Cuando el topónimo tiene en español un nombre tradicional que es diferente del local, se da también éste: Suevia (alemán Schwaben). Suez (árabe As-Suways). Con más razón, los ríos y sierras situados en territorios en que se hablan distintos idiomas se dan en la forma española o hispanizada (el río Tajo [portugués Tejo], el Rin).
Para cada idioma que requiere transcripción por no escribirse localmente con el alfabeto latino se ha seguido el sistema más común en obras modernas escritas en español; por esto la latinización de los nombres escritos en los tres alfabetos siguientes se aparta de la internacional más corriente en los puntos indicados:
Para la latinización del alifato (alfabeto árabe) se utilizó el sistema adoptado por los arabistas españoles y el Diccionario de la Lengua Española de la Real Academia Española (1992), por lo que la quinta consonante se escribe y (dj en francés, j en inglés) y la séptima j (kh en francés e inglés). El signo c indica la decimoctava consonante árabe, por ejemplo la inicial de cAmara, que equivale a la interrupción de la salida del aire durante el habla (por oclusión de la glotis).
En la latinización del alfabeto griego se usó kh para la c (vigésima segunda letra).
En el caso del alfabeto ruso se utilizaron j para transcribir la x (vigésima segunda letra), zh para la séptima letra.
Los nombres chinos se transcribieron según el sistema pinyin, aunque también se indica entre paréntesis el que se usaba antiguamente.
Una raya horizontal arriba de una vocal (en griego, makrón) indica que ésta es larga (en las lenguas en que, como en japonés, la diferencia entre vocales breves y largas es importante). Por ejemplo, Osaka.