Permitidme que suelte un poco de rollo abuelo cebolleta y me vaya un poco fuera de tema (pero no tanto).
Hace unos años lo que estaba de moda era el "Machine Learning", que podríamos decir que es otro tipo de IA. Éste tiene una cierta naturaleza estadística.
En los 90 estudié Bioquímica (nunca ejercí), y tenía una asignatura en la que se estudiaban las proteínas.
Como un breve resumen: las proteínas son moléculas muy grandes y complejas, que realizan funciones especializadas en el organismo.
La función que realizan viene determinada por su estructura 3D (p.ej: que la proteína "sacarasa" tenga una zona que pueda "capturar" una molécula de sacarosa...)
Las proteínas a su vez se componen de otras moléculas más sencillas llamadas aminoácidos (AA), hay unos 20 AA diferentes que forman proteínas.
Podemos pensar en los AA como en piezas de Lego, pero solo tienen una forma de unirse, que es formando cadenas, secuencias.
Resulta que cuando dos AA se enlazan, interaccionan entre sí y esta unión toma una determinada forma, y es diferente dependiendo de cada AA. P.ej: si dos AA tienen una región con carga negativa, se dispondrán de forma diferente a si se unen dos AA con carga diferente, o neutros, o uno con una tamaño más grande que otro, etc.
El caso es que según vas montando el trenecito de AA, éste se va retorciendo de una manera única para cada secuencia de AA, y no solo interaccionan los AA contiguos, si no todos (ej: el 10º AA de la cadena podría acabar siendo atraído por el 1º de la cadena...)
Predecir la estructura 3D de la cadena resultante es, en la práctica, imposible. Las variaciones aumentan de forma exponencial y no hay algoritmo, ni CPU ni memoria que pueda tratar este problema de forma analítica (es decir, calculando posiciones, interacciones...).
En los 90 nuestro profesor nos contaba que no creía que alguna vez se consiguiese resolver el problema de predecir la estructura 3D de las proteínas conociendo la secuencia de aminoácidos.
Sin embargo, hace unos años Google presentó
AlphaFold, una IA (no generativa) que predecía con mucha exactitud el plegamiento de proteínas. Como comentaba, nunca ejercí lo que estudié y estaba muy desconectado del tema, pero esto salió a los medios generalistas y recordé lo que nos comentaba el profe en su día.
¿Cómo lo hicieron? Simplificando mucho: le dieron al programa un conjunto de datos secuencias de AA y estructuras 3D conocidas y el programa lo que hace es inferir basándose en estos datos, cómo deberían ser las estructuras 3D de otras secuencias que no conoce. La tasa de acierto es muy buena. A mi me dejó todo loco, como habían conseguido resolver algo que parecía irresoluble, con una aproximación totalmente diferente.
Pero AlphaFold no sabe química. No le preguntes porqué una secuencia de AA se pliega de una forma y no de otra, porque no lo sabe. No sabe que este AA interacciona con este otro AA por un tipo de enlace u otro. Sabe el resultado, no la causa.
Pues las IAs de tipo generativo más o menos hacen algo parecido. Juntan un montón de datos de entrada y aplicando ciertos algoritmos para establecer relaciones, nos generan texto, hacen resúmenes, nos sugieren código... pero no tienen la capacidad de análisis o razocinio que se nos supone a los humanos.
Que, por otra parte, muchas veces funcionamos de la misma forma, repitiendo lo que hemos leído/oído