17/1/11

Adquisición de conocimiento por lectura computerizada


En la Universidad Carnegie Mellon se está desarrollando un experimento de adquisición artificial de lenguaje. El programa NELL, acrónimo de Never Ending Language Learner se dedica a “leer” sitios de Internet e intentar, mediante los adecuados algoritmos, formar una representación del conocimiento adquirido en base a técnicas de inteligencia artificial. Es evidente que las aplicaciones futuras pueden ser muchas: búsqueda inteligente de información que nos interese, clasificación bibliotecaria, gestión automática de bases de datos, reconocimiento de textos, etc. NELL no sólo trata de clasificar correctamente los textos encontrados sino de “generar”, a partir de ellos, “hechos conocidos” de manera similar a como funciona el cerebro humano que del maremágnum de información que recibe llega a deducir conocimientos, reglas y conceptos abstractos. Los creadores del programa afirman en este documento que, de momento, NELL ha llegado a deducir casi 250.000 hechos tras 67 días de funcionamiento con un acierto del 74%. NELL llega a clasificar una frase como “hecho” si la encuentra en muchas fuentes de manera similar o la aprende de una fuente de toda confianza.

Para Nell es más sencillo categorizar los datos objetivos y cuantificables. Mucho más complicado le es lidiar con la ironía o con la fantasía. Así, NELL llegó a “creer” que los Klingon de la serie Star Trek existen, dada la proliferación de fuentes que hablan de ellos como si de algo real se tratara. O “piensa” que las metáforas son quizá herramientas u otra forma de denominar a los escritores.