Errores en el etiquetado de datos ocasionan que la IA confunda objetos o les dé más importancia a unos sobre otros. Imagina cómo esto podría afectarte a nivel personal o a las empresas.
Si las personas y los procesos en las empresas van a depender cada vez más de la inteligencia artificial (IA), entonces por ahora existe un riesgo enorme: resulta que investigadores del MIT descubrieron que la IA comete errores en el etiquetado de datos, lo que parece no es una buena noticia.
Un grupo de científicos de la citada institución examinaron cientos de miles de conjuntos de datos usados para probar sistemas de machine learning. De esta manera encontraron que el 3.4 % de estos no eran precisos o estaban mal etiquetados.
Te puede interesar: Inteligencia artificial más capaz para debatir con humanos
Entre las fallas destacan, por ejemplo, errores en temas como los reviews de productos en Amazon, los cuales eran identificados como positivos, cuando en realidad eran negativos o viceversa.
Otros detalles incluyen el hecho de que, al analizar imágenes, se mezclan diferentes especies de animales, lo afecta el reconocimiento de estas. Además, la IA tendía a darle preponderancia a objetos menos relevante, como en el caso de una botella de agua con relación a una bicicleta.
Adicionalmente, hubo fallas en aspectos como etiquetar el video de un YouTuber como si fuera “campana de la iglesia”, cuando una de estas solo se escucha durante los últimos 30 segundos del clip.
Con el fin de encontrar errores, los investigadores usaron un marco de referencia denominado confident learning, con el cual se examinan conjuntos de datos para identificar “ruido de etiquetado” (datos irrelevantes o label noise).
De igual forma, para validar las equivocaciones, los científicos usaron el Mechanical Turk, una plataforma de crowdsourcing que usa inteligencia humana para realizar tareas que no pueden realizar las máquinas y descubrieron que el 54 % de los datos que señaló el algoritmo tenían etiquetas incorrectas.
Por otro lado, el equipo del MIT encontró que el set de pruebas QuickDraw tuvo la mayor cantidad de errores, alrededor de cinco millones o el equivalente al 10 % del conjunto de datos. Así mismo, el grupo creo un sitio de internet para que cualquier persona pudiera ingresar con la intención de ver cuáles son los principales errores cometidos por la IA.
Lee también: Inteligencia artificial será más flexible si integra múltiples sentidos
Si bien la mayoría de los detalles descubiertos son menores y no generan gran impacto, esto genera la duda sobre cómo se alimenta con datos a la IA. De lo contrario, se corre el riesgo de que los sistemas cometan equivocaciones en áreas más complejas. ¿Imaginas que detecte un tumor cuando en realidad no lo hay?
La inteligencia artificial comete errores, por lo que su confiabilidad tiene que ser muy alta, por no decir del 100 %, porque inclusive la vida de las personas puede pender de un hilo por una mínima equivocación.