
Hay un viejo dicho en robótica: cualquier cosa que un ser humano aprenda a hacer después de los 5 años es fácil de enseñar a una máquina. Todo lo que aprendemos antes de las 5, no es tan fácil. Esa ley no escrita del aprendizaje automático podría explicar por qué hay computadoras que pueden vencer a los mejores maestros del ajedrez y del Go, pero aún tenemos que construir un robot que pueda caminar como un humano. (No intentes decirme que ASIMO camina como un humano).
Esto también podría explicar por qué el corrector ortográfico de su computadora funciona de manera tan brillante, pero el corrector gramatical no. Aprendemos a deletrear solo cuando tenemos la edad suficiente para ir a la escuela, pero los conceptos básicos del desarrollo del lenguaje pueden comenzar desde el útero .
Inferencia y contexto
La ortografía es una tarea finita con respuestas discretas correctas o incorrectas. La gramática inglesa, por otro lado, contiene un número casi infinito de posibilidades, y si algo es gramaticalmente correcto o incorrecto puede depender en gran medida de pistas sutiles como el contexto y la inferencia.
Es por eso que ciertas oraciones en inglés son un dolor de cabeza para los correctores gramaticales automáticos. Les Perelman, un profesor jubilado del MIT y ex decano asociado de educación de pregrado que dirigía el programa de redacción de la universidad, me dio esta: "John aparcó el coche".
Mi versión ciertamente anticuada de Microsoft Word (Word para Mac 2011) está programada para reconocer y corregir la voz pasiva, un no-no en la mayoría de los círculos gramaticales. Cuando escribo esta oración en Word, el programa la subraya diligentemente en verde y sugiere: "Juan estacionó el auto". Eso estaría bien si John hubiera estacionado el auto, pero ¿y si quisiera decir que el auto estaba físicamente estacionado cerca de John?
Podría decirse un simple error, pero mire lo que sucede cuando cambio la oración a "El auto estaba estacionado junto a la acera". Word lo subraya y sugiere: "La acera aparcó el coche". Eso es francamente ridículo, incluso para una computadora.
"Gran parte de la gramática inglesa implica inferencia y algo llamado creencias contextuales mutuas", dice Perelman. "Cuando hago una declaración, creo que sabes lo que sé sobre esto. Las máquinas no son tan inteligentes. Puedes entrenar la máquina para una situación específica, pero cuando hablas de transacciones en lenguaje humano, en realidad hay una gran cantidad de inferencias como esa ocurriendo todo el tiempo ".
Perelman tiene un problema con los correctores gramaticales, que, según él, simplemente no funcionan. Citando investigaciones anteriores , descubrió que los correctores gramaticales solo identificaban correctamente los errores en los trabajos de los estudiantes el 50 por ciento de las veces. Y lo que es peor, a menudo señalaban la prosa perfectamente buena como un error, conocido como falso positivo.
En un ejercicio, Perelman introdujo 5.000 palabras de un famoso ensayo de Noam Chomsky en el motor de puntuación e-rater de ETS, la empresa que produce (y califica) los exámenes GRE y TOEFL. El corrector gramatical encontró 62 errores, incluidos 14 casos de una oración que comenzaba con una conjunción coordinada ("y", "pero", "o") y nueve comas faltantes, todos menos uno de los cuales Perelman clasificó como "prosa perfectamente gramatical".
Una pequeña historia
El primer corrector ortográfico automatizado se envió con una versión anterior de WordPerfect en 1983, y pronto siguieron los primeros correctores gramaticales computarizados tanto en WordPerfect como en Microsoft Word.
Mar Ginés Marín es directora principal de programas de Microsoft y ha estado jugando con el editor de gramática de Office durante los últimos 17 años. Ella dice que en los primeros días, lo mejor que Word podía hacer era analizar una oración en sus partes componentes del discurso e identificar errores gramaticales simples como la concordancia entre el sustantivo y el verbo. Luego, los ingenieros descubrieron cómo analizar una oración en "fragmentos" más pequeños de dos o tres palabras para apuntar a cosas como "un / un" acuerdo. A esto se le llama procesamiento del lenguaje natural o PNL.
El siguiente paso fue introducir el aprendizaje automático. Susan Hendrich es gerente de programas de grupo en Microsoft a cargo de los equipos de procesamiento del lenguaje natural que trabajan en Office. Con el aprendizaje automático, los ingenieros de Microsoft podrían ir más allá de la programación de todas y cada una de las reglas gramaticales en el software. En cambio, entrenan a la máquina en un enorme conjunto de datos de uso correcto del inglés y dejan que la máquina aprenda de los patrones que descubre.
Hendrich dice que los algoritmos desarrollados por Microsoft a través del aprendizaje automático son los que impulsan las decisiones de Word sobre si una oración necesita o no un signo de interrogación, o qué tipos de cláusulas requieren una coma (cosas bastante complicadas, incluso para nosotros, los escritores humanos).
¿Pero funcionó? Daniel Kies, profesor de inglés en el College of Du Page, en Glen Ellyn, Illinois, una vez realizó una prueba directa de varios correctores gramaticales que van desde WordPerfect 8, lanzado a fines de la década de 1990, hasta Word 2007. Cuando se verificó contra 20 oraciones que contienen los errores de escritura más comunes, todos los correctores gramaticales se desempeñaron bastante mal. Ninguna versión de Word posterior a 2000 detectó ninguno de los errores (curiosamente, Word 97 obtuvo mejores resultados) y WordPerfect solo identificó el 40 por ciento de los errores.
Si bien esos números no representan las últimas versiones de los correctores gramaticales, sí señalan uno de los mayores desafíos en la creación de un motor gramatical potente y preciso integrado en una pieza de software: el espacio.
"Podemos hacer estos hermosos modelos grandes que tienen una precisión de alta precisión, pero son demasiado grandes para enviarlos en la caja con el producto", dice Hendrich de Microsoft. "Así que tenemos que adelgazar nuestro modelo y, a medida que reducimos nuestro modelo, perdemos precisión. Así que tenemos este punto de equilibrio con el que estamos dispuestos a enviar".
Ginés Marín defiende la precisión de Word pero admite que las limitaciones de espacio afectaron el nivel de "cobertura" que proporcionaba el corrector gramatical de Microsoft. Cuando el modelo se adelgazó para encajar en el software, también fue necesario volver a marcarlo en amplitud para que no marcara muchos textos buenos como errores.
El garabato dorado
Lo que ha cambiado desde los días de Word 2007 es el auge de las aplicaciones de software basadas en la web. Ahora los ingenieros no tienen que meter un gran motor gramatical en un paquete lo suficientemente pequeño como para vivir en el disco duro del usuario. Los algoritmos gramaticales pueden vivir en la nube y se puede acceder a ellos a través de Internet en tiempo real.
Hendrich dice que las versiones basadas en web de Office ya se basan en motores gramaticales robustos que están alojados en la nube, y su equipo está actualmente en el proceso de mover todas las críticas y modelos gramaticales incorporados a la nube también. El desafío en el futuro, dice Hendrich, es decidir cuánta funcionalidad mantener "en la caja" y cuánto entregar "a través del servicio", como Hendrich llama al modelo de software como servicio de Microsoft basado en la nube.
El problema es el costo. Cada vez que Word llama a la nube para pedir consejo gramatical, cuesta unas pocas fracciones de centavo.
"Si está escribiendo un documento de 10 páginas, ¿llama al servicio técnico cada vez que pulsa una tecla?" Pregunta Hendrich. "Cuando empiezas a mirar los modelos de costos, puede ser bastante grande".
La última versión del editor gramatical de Microsoft es mucho más sólida que sus predecesoras. Los errores vienen con múltiples sugerencias de corrección además de explicaciones de las reglas gramaticales detrás de ellos. Hay una función de lectura en voz alta incorporada que es particularmente útil para personas con dislexia y para hablantes no nativos. Y hay un nuevo tipo de sugerencia que Hendrich llama el "garabato dorado" que aborda el estilo de escritura más que la gramática básica.
Si escribe que el comité está buscando un nuevo "presidente", por ejemplo, el garabato dorado le sugerirá que utilice un término de género neutro como "presidente". Si está escribiendo un memorando a su jefe que requiere cierto grado de formalidad, el garabato dorado marcará palabras que parecen demasiado casuales como "cómodas".
Una pregunta que es importante hacerse es si los correctores gramaticales realmente necesitan ser perfectos. Si Word sugiere que la oración debería decir "La acera estacionó el automóvil", puede simplemente ignorarla. No es gran cosa, ¿verdad?
Para los hablantes nativos de inglés, un corrector gramatical no tan perfecto es una leve irritación. Incluso si no eres un genio de la gramática, puedes escucharlo cuando algo suena mal. El problema real, dice el ex profesor de escritura del MIT Perelman, ocurre cuando los estudiantes del idioma inglés confían en estas herramientas para corregir su escritura.
"Realmente depende de quién sea el usuario", dice Perelman. "Si el usuario es un hablante nativo, los falsos positivos no son tan peligrosos como lo son para un hablante no nativo".
Si Word le dice a un estudiante de inglés que "la acera estacionó el auto", no solo su escritura no tendrá ningún sentido, sino que aprenderá una mala gramática. Ahora que el inglés se ha convertido en la lengua franca de la ciencia y la tecnología, dice Perelman, las empresas de todo el mundo están desesperadas por un corrector gramatical del inglés verdaderamente confiable y preciso. Es por eso que ve el aumento de herramientas gramaticales de terceros basadas en la web como Grammarly y Ginger, todas tratando de satisfacer esta demanda internacional.
La buena noticia es que la última versión de Word (2016) pasa la prueba de "acera". Grammarly, sin embargo, lo marcó como voz pasiva.
Ahora eso es genial
Perelman, quien ya presionó con éxito para deshacerse del ensayo de 25 minutos en el SAT, demostró que las respuestas largas pero sin sentido obtuvieron la puntuación más alta, ahora tiene la mira puesta en abolir la calificación automática de ensayos en todas las pruebas estandarizadas.