lunes, 19 de julio de 2010

IME: cómo escribir en chino en la PC

En este artículo intentaré explicar el proceso para ingresar caracteres chinos en la PC. Si bien me referiré al idioma chino en particular, los conceptos se aplican a cualquier idioma no occidental.
Publicado originalmente el 10/05/2009 Creative Commons License


En esta oportunidad analizaremos específicamente el proceso de ingresar texto chino a la PC en forma general. En el artículo «La PC y los idiomas asiáticos» presento un panorama más amplio de los aspectos a tener en cuenta para usar idioma chino en una PC, conviene que lo leas antes para aclarar y ordenar conceptos.

La nomenclatura correcta para tratar este tema es objeto de debate, por estar el mismo íntimamente relacionado con las tecnologías informáticas y el diseño de software. En este artículo llamo «IME» a lo que muchos llaman «IM», que se traduce literalmente como «método de entrada», lo cual genera confusiones conceptuales. De la nomenclatura utilizada hoy día, adopté la que me pareció más clara para una explicación genérica y simplificada, sin abordar detalles técnicos.


¿Qué es un IME?


Ante la necesidad de escribir en cualquier idioma no occidental en una PC, nos encontramos con un serio problema: el teclado. Las computadoras nacieron en occidente, y los teclados estándares no contemplan otros idiomas. El caso del idioma chino es aún peor: se estima que para el uso cotidiano se necesitan unos 7 000 caracteres, contando sólo los simplificados, de modo que fabricar un teclado especial resulta poco práctico.

Afortunadamente, este problema se solucionó décadas atrás, mucho antes de la invención de la computadora: Con el primer contacto del mundo occidental con el oriental surgió la necesidad de transcribir la fonética del chino con algún sistema de símbolos más acotado. Muchos sistemas se inventaron y utilizaron a lo largo de la historia para estos menesteres, como Wade-Giles (1859, modificado en 1892), Gwoyeu Romatzyh (1928), zhùyīn fúhào (1930), Latinxua Sin Wenz (1931), sólo para nombrar algunos. 1

En 1954, un comité especialmente creado por el gobierno de la República Popular de China comenzó a desarrollar el sistema de romanización (representación de sonidos usando caracteres latinos) para mandarín estándar conocido como Hanyu Pinyin (汉语拼音) o informalmente como Pinyin. El Hanyu Pinyin fue aprobado por el gobierno chino en 1958 como sistema oficial de transcripción fonética, en 1982 fue adoptado como estándar internacional por la Organización Internacional para Estandarización, y desde el 1 de enero de 2009 es también el sistema oficial de romanización de Taiwan. 2

La existencia de estos sistemas de transliteración fonética – especialmente del Pinyin, que usa el abecedario occidental y está oficializado – traslada el problema original de cómo escribir más de 7 000 caracteres chinos con un teclado occidental a cómo interpretar la fonética (en Pinyin o en cualquier otro sistema) y traducirla a caracteres chinos.

Aquí es donde entran en escena los llamados IME. Un IME (Input Method Editor) es un programa que traduce la fonética ingresada con un teclado occidental latino estándar a caracteres no latinos. El IME es un programa intermediario entre el teclado y el Sistema Operativo. Cada sistema operativo cuenta con su propio IME, y algunos, como Linux, tienen varios IMEs para elegir.

Como el IME se comunica directamente con el sistema operativo, sirve para ingresar caracteres no latinos en cualquier programa que se ejecute en la computadora, mientras el programa esté diseñado para aceptar estos caracteres. Es por eso que para escribir en chino en, por ejemplo, un procesador de textos, hay que configurar el sistema operativo para activar su IME y no el procesador de textos. (En el caso de OpenOffice.org, se puede configurarlo para que presente opciones y funciones específicas para idiomas orientales, según explico en el artículo «Cómo configurar OpenOffice.org para idiomas asiáticos», pero esta configuración no tiene nada que ver con la escritura del texto asiático en sí.)

Aunque algunos IMEs se diseñan para un sólo idioma en particular, muchos sirven para escribir en varios idiomas no occidentales (árabe, chino, japonés, coreano, etc.), e incluso para lenguajes computacionales, como LaTeX.

A cada uno de los sistemas de transcripción fonética que un IME es capaz de entender y traducir a caracteres se lo llama método de entrada. Por ejemplo, para el caso del idioma chino, un IME puede contar con un método de entrada para chino simplificado usando pinyin, otro método de entrada para chino tradicional usando pinyin, otro método de entrada para chino tradicional usando zhùyīn, etc. A la hora de escribir en chino, el usuario decide qué método de entrada utilizará, según cómo haya configurado su IME y sus preferencias o necesidades particulares.

Una vez instalado el soporte de idioma chino en nuestro sistema operativo y configurado su IME con nuestros métodos de entrada predilectos, el proceso para poder escribir en chino en nuestra PC es, normalmente, el siguiente:
  1. Se ejecuta el programa en donde se desea escribir en chino (por ejemplo, OpenOffice.org Writer).
  2. Se escribe en español (o en el idioma occidental deseado) si se necesita hacerlo.
  3. En el punto donde se desea introducir texto chino, se activa el IME.
  4. Se elige el método de entrada (lo que equivale a elegir el sistema fonético) preferido, si el mismo no está seleccionado de antemano.
  5. Se ingresa la fonética del texto chino que interesa escribir. Aquí es donde los distintos IMEs y métodos de entrada difieren: mientras algunos sólo pueden interpretar los caracteres chinos de a uno por vez, individualmente, otros pueden reconocer palabras de más de un ideograma de longitud, y otros incluso pueden reconocer sintagmas o frases completas. Por eso no se les llama «sistemas fonéticos» a los métodos de entrada: dos métodos de entrada pueden responder al Pinyin con ideogramas chinos simplificados, por ejemplo, y tener un comportamiento totalmente distinto. «Método de entrada» no es sinónimo de «sistema fonético».
  6. El IME muestra un lista con los caracteres chinos que responden a la fonética ingresada, permitiendo elegir los correctos. Algunos métodos de entrada son capaces de interpretar la fonética incluso cuando cometemos errores en la misma (por ejemplo, pueden detectar cuando nos confundimos la «q» con la «j» o cuando nos equivocamos en los tonos, si usamos Pinyin en una frase razonablemente larga).
  7. Se selecciona él o los caracteres que corresponden, y éstos se integran al programa en uso.
  8. Se repite desde el paso 5 tantas veces como sea necesario.
  9. Cuando se desea seguir escribiendo en español, se desactiva el IME.

Aunque son menos utilizados y conocidos, existen métodos de entrada que no se basan en la fonética. Algunos utilizan códigos (como el estándar UNICODE), donde a cada carácter chino le corresponde un número. Otros se basan en la estructura de los caracteres (combinando radicales con número de trazos, por ejemplo), e incluso existen los que directamente traducen términos en inglés al chino.

Por supuesto, existen otras tecnologías para ingresar texto chino a la computadora sin utilizar el teclado (ni el IME), como el reconocimiento de voz, las tabletas digitalizadoras donde directamente se escriben los ideogramas, los programas de reconocimiento de textos escaneados (OCR) e incluso programas donde se dibujan los caracteres con el ratón.


¿Qué es SCIM?


SCIM (Smart Common Input Method) es uno de los muchos IME que están disponibles para Linux, y es el elegido por muchas distribuciones. Particularmente, SCIM fue el IME oficial de Ubuntu hasta la versión 9.04. Técnicamente, SCIM es más que un IME, según reza en su página oficial: «(SCIM) provee no sólo una interfase de usuario amigable y completa de métodos de entrada para sistemas operativos estilo POSIX (incluyendo Linux, FreeBSD y otros Unix), sino también una plataforma de desarrollo para facilitar el desarrollo de métodos de entrada». SCIM tiene la ventaja adicional de permitirnos usar métodos de entrada desarrollados para otros IME de Linux (como UIM, XIN, etc.), y métodos de entrada para distintos idiomas en el mismo programa.

En el artículo Cómo instalar el soporte para idioma chino en Ubuntu 9.04 puedes aprender a instalar SCIM, y en el artículo «Cómo configurar SCIM (parte 1)», cómo configurarlo.


¿Qué es IBus?


IBus (Intelligent Input Bus) es otro IME para Linux. IBus Reemplazó a SCIM como el IME predeterminado de Ubuntu desde la versión 9.10. Al igual que SCIM, IBus permite usar métodos de entrada desarrollados para otros IME de Linux, y métodos de entrada para distintos idiomas en el mismo programa.

En el artículo Cómo instalar el soporte de idioma chino en Ubuntu 10.04 puedes aprender cómo habilitar IBus, y en el artículo «Cómo configurar IBus (parte 1)» cómo configuralo.


Conclusión


Resumiendo:

Un IME es un programa integrado al sistema operativo de la computadora, capaz de reconocer la fonética del chino o de otro idioma no occidental y transformarla en los caracteres adecuados.

Un método de entrada es una forma de ingresar caracteres no latinos a través de un sistema de fonética dado.

SCIM e IBus son los dos IME más utilizados en Linux, y permiten usar distintos métodos de entrada (o sea, distintos sistemas fonéticos) para escribir caracteres no latinos.


Artículos relacionados


Tal vez te interese leer también:


1 Más información en Wikipedia (en inglés).
2 Según Wikipedia (en inglés); Taipei Times (en inglés); The China Post (en inglés).




Entradas populares