18/12/17

Algoritmos para discernir texto




Los CAPTCHAS (Completely Automated Public Turing test to tell Computers and Humans Apart) son esos textos deformados que nos encontramos muchas veces en una página web para que el sistema pueda discernir si está tratando con una persona o con un robot. Se presupone que sólo un cerebro humano es capaz de leer un texto emborronado o deformado mientras que un sistema de visión artificial no sería capaz de hacerlo.

Un amplio grupo de investigadores liderados por Dileep George y Wolfgang Lehrach han desarrollado un sistema basado en lo que ellos denomina como una red cortical recursiva (RCN) capaz de leer estos Captchas con un acierto equivalente al de los humanos. En concreto, combinan esa RCN con un modelo regenerativo que emula cómo funciona la visión humana con aprendizaje por red neuronal

Al artículo completo, A generative vision model that trains with high data efficiency and breaks text-based CAPTCHAs, puede accederse desde este enlace.

Amén de las implicaciones que este desarrollo puede tener en el ámbito de la seguridad y la criptografía (más bien, la ruptura de la misma), desde el punto de vista de la literatura digital puede atisbarse una potencial aplicación en la lectura de manuscritos antiguos o de textos deterioraros que, aplicando técnicas similares, podrían ser escaneados y restaurados con altas tasas de acierto.


0 comentarios :