banner

Noticias

Oct 04, 2023

Patrick M. Pilarski, Ph.D. Canada CIFAR AI Chair (Amii)

Por

El Dr. Patrick M. Pilarski es presidente de inteligencia artificial CIFAR de Canadá, ex presidente de investigación de Canadá en inteligencia artificial para rehabilitación y profesor asociado en la División de Medicina Física y Rehabilitación, Departamento de Medicina, Universidad de Alberta.

En 2017, el Dr. Pilarski cofundó la primera oficina de investigación internacional de DeepMind, ubicada en Edmonton, Alberta, donde se desempeñó como codirector de la oficina y científico investigador sénior hasta 2023. Es miembro de la junta directiva y miembro de la Alberta Machine Intelligence Institute (Amii), codirige el Laboratorio de miembros biónicos para el control natural mejorado (BLINC), y es investigador principal del Laboratorio de aprendizaje de refuerzo e inteligencia artificial (RLAI) y la Red de tecnología de rehabilitación adaptativa sensorial motora (SMART) en la Universidad de Alberta.

La Dra. Pilarski es la autora o coautora galardonada de más de 120 artículos revisados ​​por pares, es miembro sénior del IEEE y ha recibido el apoyo de subvenciones de investigación provinciales, nacionales e internacionales.

Nos sentamos para una entrevista en la conferencia anual Upper Bound 2023 sobre IA que se lleva a cabo en Edmonton, AB y está organizada por Amii (Alberta Machine Intelligence Institute).

¿Cómo te encontraste en IA? ¿Qué te atrajo de la industria?

Esas son dos preguntas separadas. En términos de lo que me atrae de la IA, hay algo hermoso en cómo puede surgir la complejidad y cómo la estructura puede surgir de la complejidad. La inteligencia es solo uno de estos sorprendentes ejemplos de eso, así que ya sea que provenga de la biología o de cómo vemos surgir un comportamiento elaborado en las máquinas, creo que hay algo hermoso en eso. Eso siempre me ha fascinado durante mucho tiempo, y mi trayectoria muy larga y sinuosa para trabajar en el área de IA en la que trabajo ahora, que son máquinas que aprenden a través de prueba y error, sistemas de refuerzo que interactúan con humanos mientras ambos están inmersos. en él, la corriente de la experiencia, el flujo del tiempo, atravesó todo tipo de diferentes tipos de mesetas. Estudié cómo las máquinas y los humanos podían interactuar en términos de dispositivos biomecatrónicos y biotecnología, cosas como prótesis y miembros artificiales.

Observé cómo se puede usar la IA para respaldar los diagnósticos médicos, cómo podemos usar la inteligencia artificial para comenzar a comprender los patrones que conducen a la enfermedad o cómo se pueden presentar diferentes enfermedades en términos de grabaciones en una máquina. Pero todo eso es parte de este impulso de largo aliento para realmente comenzar a apreciar cómo podría obtener comportamientos muy complejos a partir de cimientos muy simples. Y eso es lo que realmente me encanta, especialmente sobre el aprendizaje por refuerzo, es la idea de que la máquina puede incrustarse en el flujo del tiempo y aprender de su propia experiencia para exhibir comportamientos muy complejos y capturar tanto el fenómeno complejo, realmente, en el mundo que lo rodea. . Esa ha sido una fuerza impulsora.

La mecánica de esto, en realidad hice mucho entrenamiento en medicina deportiva y cosas así en la escuela secundaria. Estudié medicina deportiva y ahora aquí estoy trabajando en un entorno en el que observo cómo la inteligencia artificial y las tecnologías de rehabilitación se unen para ayudar a las personas en su vida diaria. Es un viaje muy interesante, como la fascinación secundaria por los sistemas complejos y la complejidad, y luego una pragmática muy práctica de cómo empezamos a pensar en cómo los humanos pueden ser mejor apoyados, vivir la vida que quieren vivir.

¿Cómo te llevaron inicialmente los deportes a las prótesis?

Lo realmente interesante de campos como la medicina deportiva es observar el cuerpo humano y cómo las necesidades únicas de una persona, ya sea deportiva o de otro tipo, pueden ser apoyadas por otras personas, mediante procedimientos y procesos. Las extremidades biónicas y las tecnologías protésicas tienen que ver con la construcción de dispositivos, sistemas de construcción, tecnología de construcción que ayude a las personas a vivir la vida que quieren vivir. Estas dos cosas están realmente estrechamente conectadas. De hecho, es realmente emocionante poder cerrar el círculo y que algunos de esos intereses anteriores se hagan realidad, una vez más, codirigiendo un laboratorio en el que analizamos... Y especialmente los sistemas de aprendizaje automático que funcionan de manera estrechamente acoplada, la persona que están diseñados para apoyar.

Anteriormente discutió cómo una prótesis se adapta a la persona en lugar de que la persona se adapte a la prótesis. ¿Podría hablar sobre el aprendizaje automático detrás de esto?

Absolutamente. Como base en la historia del uso de herramientas, los humanos nos hemos adaptado a nuestras herramientas y luego hemos adaptado nuestras herramientas a las necesidades que tenemos. Y entonces, existe este proceso iterativo en el que nos adaptamos a nuestras herramientas. Estamos, en este momento, en un punto de inflexión donde, por primera vez, tal vez me hayas escuchado decir esto antes en charlas si has visto algunas de las charlas que he dado. Pero realmente, estamos en este punto importante de la historia en el que ahora podemos imaginar herramientas de construcción que traigan algunos de esos sellos distintivos de la inteligencia humana. Herramientas que realmente se adaptarán y mejorarán mientras están siendo utilizadas por una persona. Las tecnologías subyacentes respaldan el aprendizaje continuo. Sistemas que pueden aprender continuamente de una experiencia de transmisión en curso. En este caso, el aprendizaje por refuerzo y los mecanismos que lo sustentan, cosas como el aprendizaje por diferencia temporal, son realmente críticos para construir sistemas que puedan adaptarse continuamente mientras interactúan con una persona y mientras están en uso por una persona que los apoya en su vida diaria.

¿Podría definir el aprendizaje por diferencia temporal?

Absolutamente, lo que realmente me gusta de esto es que podemos pensar en las tecnologías centrales, el aprendizaje de diferencia temporal y los algoritmos de aprendizaje de predicción fundamentales que sustentan gran parte de lo que trabajamos en el laboratorio. Tienes un sistema que, al igual que nosotros, está haciendo una predicción sobre cómo será el futuro con respecto a alguna señal, con respecto a algo como la recompensa futura que es lo que solemos ver. Pero cualquier otra señal que puedas imaginar, ¿cuánta fuerza estoy ejerciendo en este momento? ¿Qué tan caliente va a estar? ¿Cuántas donas voy a comer mañana? Estas son las cosas posibles que podrías imaginar predecir. Entonces, el algoritmo central realmente está analizando la diferencia entre mi conjetura sobre lo que sucederá en este momento y mi conjetura sobre lo que sucederá en el futuro junto con cualquier tipo de señal que esté recibiendo actualmente.

¿Cuánta fuerza estoy ejerciendo cuando un brazo robótico levanta una taza de café o una taza de agua? Esto podría ser la diferencia entre la predicción sobre la cantidad de fuerza que ejercerá en este momento o la cantidad que ejercerá durante algún período en el futuro. Y luego comparar eso con sus expectativas sobre el futuro y la fuerza que realmente está ejerciendo. Póngalos todos juntos y obtendrá este error, el error de diferencia temporal. Es esta buena acumulación del pronóstico extendido temporalmente en el futuro y las diferencias entre ellos, que luego puede usar para actualizar la estructura de la propia máquina de aprendizaje.

Y esto, nuevamente, para el aprendizaje por refuerzo convencional basado en la recompensa, esto podría estar buscando actualizar la forma en que la máquina actúa en función de la futura recompensa esperada que podría percibir. Para mucho de lo que hacemos, buscamos otros tipos de señales, usando funciones de valor generalizado, que es la adaptación del proceso de aprendizaje por refuerzo, aprendizaje de diferencia temporal de señales de recompensa a cualquier tipo de señal de interés que pueda ser aplicable a la funcionamiento de la máquina.

A menudo habla de una prótesis llamada Cairo Toe en sus presentaciones. ¿Qué tiene que enseñarnos?

La Universidad Cairo Toe de Basilea, LHTT. Imagen: Matjaž Kačičnik

Me gusta usar el ejemplo del Cairo Toe, una prótesis de 3000 años. Trabajo en el área de las neuroprótesis, ahora vemos sistemas robóticos muy avanzados que pueden, en algunos casos, tener el mismo nivel de control o los mismos grados de control que las partes biológicas del cuerpo. Y sin embargo, vuelvo a una puntera de madera muy estilizada de hace 3000 años. Creo que lo bueno es que es un ejemplo de humanos que se extienden con la tecnología. Eso es lo que estamos viendo en este momento en términos de neuroprótesis y la interacción hombre-máquina no es algo raro, nuevo o loco. Siempre hemos sido usuarios de herramientas, los animales, los animales no humanos también usan herramientas. Hay muchos libros excelentes sobre esto, especialmente de Frans de Waal, "¿Somos lo suficientemente inteligentes como para saber qué tan inteligentes son los animales?".

Esta extensión de nosotros mismos, el aumento y mejora de nosotros mismos a través del uso de herramientas no es algo nuevo, es algo antiguo. Es algo que ha estado sucediendo desde tiempo y memoria en la misma tierra en la que estamos ahora por las personas que vivían aquí. La otra cosa interesante sobre el Cairo Toe es que la evidencia, al menos de los informes académicos sobre él, muestra que se adaptó varias veces en el transcurso de sus interacciones con sus usuarios. De hecho, entraron y lo personalizaron y lo cambiaron, lo modificaron durante su uso.

Según tengo entendido, no era solo una herramienta fija que se adjuntaba a una persona durante su vida, era una herramienta fija que se adjuntaba pero también se modificaba. Es un ejemplo de cómo, nuevamente, la idea de que las herramientas se adaptan durante su período de uso y un período de uso sostenido es en realidad algo que también es bastante antiguo. No es algo nuevo, y hay muchas lecciones que podemos aprender de la coadaptación de personas y herramientas durante muchos, muchos años.

Anteriormente mencionó la vía de retroalimentación entre las prótesis y el ser humano, ¿podría dar más detalles sobre la vía de retroalimentación?

También estamos en un momento especial en cuanto a cómo estamos viendo la relación entre una persona y la máquina que pretende apoyarlos en su vida diaria. Cuando alguien está usando una extremidad artificial, digamos que alguien con una diferencia de extremidades, alguien con una amputación está usando una extremidad artificial. Tradicionalmente, lo usarán como una herramienta, como una extensión de su cuerpo, pero los veremos confiando en gran medida en lo que consideramos la vía de control. Que algún sentido de su rueda o su intención se transmite a ese dispositivo, que luego tiene la tarea de descubrir qué es y luego ejecutar eso, ya sea abriendo y cerrando una mano o doblando un codo o creando un agarre de pellizco. para agarrar una llave. A menudo no vemos personas estudiando o considerando el camino de la retroalimentación.

Por lo tanto, una gran cantidad de extremidades artificiales que se pueden ver desplegadas comercialmente, la vía de información que fluye desde el dispositivo de regreso a la persona podría ser el acoplamiento mecánico, la forma en que realmente sienten las fuerzas de la extremidad y actúan sobre ellas. Puede ser que escuchen la preocupación de los motores o que vean cómo levantan un manguito y lo mueven sobre un escritorio o lo toman de otra parte de su espacio de trabajo. Y entonces, esos caminos son la forma tradicional de hacerlo. Están sucediendo cosas sorprendentes en todo el mundo para ver cómo la información podría transmitirse mejor desde una extremidad artificial a la persona que la usa. Especialmente incluso aquí en Edmonton, hay un montón de trabajo realmente genial usando el recableado del sistema nervioso, la renovación nerviosa específica y otras cosas para apoyar ese camino. Pero todavía es un área de estudio emergente muy candente pensar en cómo el aprendizaje automático respalda las interacciones con respecto a esa vía de retroalimentación.

Cómo el aprendizaje automático puede respaldar un sistema que podría estar percibiendo y prediciendo mucho sobre su mundo realmente transmite, transmitiendo esa información de manera clara y efectiva a la persona que la usa. ¿Cómo puede el aprendizaje automático apoyar eso? Creo que este es un gran tema, porque si tienes esa vía de retroalimentación y esa vía de control, ambas vías se están adaptando y tanto el dispositivo que usa la persona como la persona misma están construyendo modelos entre sí. Puedes hacer algo casi milagroso. Casi se puede transmitir información de forma gratuita. Si tiene estos dos sistemas que en realidad están bien sintonizados entre sí, han construido un modelo muy poderoso el uno del otro y tienen una adaptación para controlar las vías de retroalimentación, pueden formar asociaciones muy estrechas entre humanos y máquinas que pueden pasar una gran cantidad de información con muy poco esfuerzo y muy poco ancho de banda.

Y eso abre nuevos reinos de coordinación hombre-máquina, especialmente en el área de las neuroprótesis. Realmente creo que este es un momento bastante milagroso para que empecemos a estudiar esta área.

¿Crees que se imprimirán en 3D en el futuro o cómo crees que procederá la fabricación?

No siento que sea el mejor lugar para especular sobre cómo podría suceder eso. Sin embargo, puedo decir que estamos viendo un gran aumento en los proveedores comerciales de dispositivos neuroprotésicos que utilizan fabricación aditiva, impresión 3D y otras formas de fabricación aditiva en el lugar para crear sus dispositivos. Esto también es muy bueno de ver, que no es solo un prototipo que usa fabricación aditiva o impresión 3D, es que la impresión 3D se convierte en una parte integral de cómo proporcionamos dispositivos a las personas y cómo optimizamos esos dispositivos para las personas exactas que los usan.

Fabricación aditiva o fabricación a medida, el ajuste de prótesis personalizado se realiza en los hospitales todo el tiempo. Esta es una parte natural de la prestación de atención a las personas con dismetría que necesitan tecnologías asistidas u otro tipo de tecnologías de rehabilitación. Creo que estamos comenzando a ver que gran parte de esa personalización está comenzando a mezclarse con los fabricantes de los dispositivos, y no solo se deja en manos de los proveedores de atención. Y eso también es muy emocionante. Creo que hay una gran oportunidad para los dispositivos que no solo parecen manos o son manos usadas, sino dispositivos que satisfacen con mucha precisión las necesidades de la persona que los usa, que les permite expresarse de la forma en que quieren expresarse. , y les permite vivir la vida que quieren vivir de la manera que quieren vivirla, no solo de la forma en que creemos que se debe usar una mano en la vida diaria.

Has escrito más de 120 artículos. ¿Hay alguno que te llame la atención y que debamos conocer?

Hay un artículo publicado recientemente sobre aplicaciones de computación neuronal, pero representa la punta de un iceberg de pensamiento que hemos presentado durante más de una década, sobre marcos de cómo interactúan los humanos y las máquinas, especialmente cómo interactúan los humanos y los dispositivos protésicos. Es la idea del capital comunicativo. Este es el artículo que publicamos recientemente.

Y este documento presenta nuestra opinión sobre cómo las predicciones que son aprendidas y mantenidas en tiempo real por, digamos, un dispositivo protésico que interactúa con la persona, la persona misma puede formar esencialmente capital, puede formar un recurso en el que ambas partes pueden confiar. . Recuerde, anteriormente dije que podemos hacer algo realmente espectacular cuando tenemos un humano y una máquina que construyen modelos el uno del otro, adaptan el tiempo real en función de la experiencia y comienzan a pasar información en un canal bidireccional. Como barra lateral, porque vivimos en un mundo mágico donde hay grabaciones y puedes cortar cosas de ellas.

Es esencialmente como magia.

Exactamente. Suena como magia. Si nos remontamos a pensadores como Ashby, W. Ross Ashby, en la década de 1960 y su libro "Introducción a la cibernética", habló sobre cómo podríamos amplificar el intelecto humano. Y realmente dijo que todo se reduce a ampliar la capacidad de una persona para elegir entre una de muchas opciones. Y esto es posible gracias a los sistemas en los que una persona interactúa con, por ejemplo, una máquina, donde hay un canal de comunicación abierto entre ellos. Entonces, si tenemos esa comunicación canalizada abierta, si es bidireccional, y si ambos sistemas están acumulando capital en forma de predicciones y otras cosas, entonces puedes comenzar a verlos realmente alinearse y convertirse en más que la suma de sus partes. . Puedes sacar más de lo que están poniendo.

Y creo que es por eso que considero que este es uno de nuestros artículos más emocionantes, porque representa un cambio de pensamiento. Representa un cambio de pensamiento hacia pensar en los dispositivos neuroprotésicos como sistemas con agencia, sistemas a los que no solo podemos describir la agencia, sino en los que podemos confiar para poder coadaptarse con nosotros para construir estos recursos. El capital comunicativo que nos permite multiplicar nuestra capacidad de interacción con el mundo, nos permite sacar más de lo que estamos poniendo y permitir que la gente, voy a decir, desde una lente protésica, deje de pensar en la prótesis en su vida diaria y empezar a pensar en vivir su vida diaria. No es el dispositivo que les ayuda a vivir su vida diaria.

¿Cuáles son algunas de las aplicaciones que vería para las interfaces cerebro-máquina con lo que acaba de discutir?

Uno de mis favoritos es algo que presentamos, nuevamente, durante los últimos casi 10 años, es una tecnología llamada conmutación adaptativa. El cambio adaptativo se basa en el conocimiento de que muchos sistemas con los que interactuamos a diario dependen de que cambiemos entre muchos modos o funciones. Ya sea que esté cambiando entre aplicaciones en mi teléfono o tratando de encontrar la configuración correcta en mi taladro o si estoy adaptando otras herramientas en mi vida, cambiamos entre muchos modos o funciones todo el tiempo, recordando Ashby, nuestra capacidad de elegir entre muchas opciones. Entonces, en el cambio adaptativo, usamos el aprendizaje de diferencia temporal para permitir que una extremidad artificial aprenda qué función motora una persona podría querer usar y cuándo quiere usarla. Entonces, una premisa realmente bastante simple es eso, solo el acto de acercarme a una taza y cerrar mi mano.

Bueno, un sistema debería ser capaz de generar predicciones a través de la experiencia de que, en esta situación, es probable que use la función de apertura manual y cierre. Estaré abriendo y cerrando mi mano. Y luego en el futuro, en situaciones similares, poder predecir eso. Y cuando estoy navegando por la nube arremolinada de modos y funciones, dame más o menos los que quiero sin tener que revisar todas esas opciones. Y este es un ejemplo muy simple de construir ese capital comunicativo. Tienes un sistema que de hecho construye predicciones a través de la interacción, son predicciones sobre esa persona, esa máquina, su relación en esa situación en ese momento. Y ese recurso compartido luego permite que el sistema reconfigure su interfaz de control sobre la marcha, de modo que la persona obtenga lo que quiera y cuando quiera. Y realmente, en una situación en la que el sistema está muy, muy seguro de qué función motora podría querer una persona, de hecho puede seleccionarla para ellos a medida que avanzan.

Y lo bueno es que la persona siempre tiene la capacidad de decir: "Ah, esto es lo que realmente quería" y cambiar a otra función motora. En un brazo robótico, eso podría ser diferentes tipos de agarres manuales, ya sea moldeando el agarre para agarrar el picaporte de una puerta, recoger una llave o estrechar la mano de alguien. Esos son diferentes modos de funciones, diferentes patrones de agarre. Es muy interesante que el sistema pueda comenzar a desarrollar una apreciación de lo que es apropiado en cada situación. Unidades de capital en las que ambas partes pueden confiar para moverse más rápidamente por el mundo y con menos carga cognitiva, especialmente en la parte de la unidad.

Gracias por la increíble entrevista, los lectores que deseen obtener más información deben visitar los siguientes recursos:

Laura Petrich, estudiante de doctorado en robótica y aprendizaje automático - Serie de entrevistas

Prasad Kawthekar, cofundador y director ejecutivo de Dashworks – Serie de entrevistas

Socio fundador de unite.AI y miembro del Consejo de Tecnología de Forbes, Antoine es un futurista apasionado por el futuro de la IA y la robótica. También es el fundador de Securities.io, un sitio web de inversión, la plataforma de IA generativa images.ai, y actualmente está trabajando en el lanzamiento de genius.ai, una plataforma que ofrecerá a los usuarios la capacidad de configurar e implementar agentes autónomos dividiendo las indicaciones en subtareas.

Mara Cairo, Propietaria de Producto de Tecnología Avanzada en Amii – Serie de Entrevistas

Laura Petrich, estudiante de doctorado en robótica y aprendizaje automático - Serie de entrevistas

Prasad Kawthekar, cofundador y director ejecutivo de Dashworks – Serie de entrevistas

Arjun Narayan, Director de Confianza y Seguridad Global de SmartNews – Serie de entrevistas

Razi Raziuddin, cofundador y director ejecutivo de FeatureByte – Serie de entrevistas

Jordan Noone, cofundador de Embedded Ventures – Serie de entrevistas

¿Cómo te encontraste en IA? ¿Qué te atrajo de la industria? ¿Cómo te llevaron inicialmente los deportes a las prótesis? Anteriormente discutió cómo una prótesis se adapta a la persona en lugar de que la persona se adapte a la prótesis. ¿Podría hablar sobre el aprendizaje automático detrás de esto? ¿Podría definir el aprendizaje por diferencia temporal? A menudo habla de una prótesis llamada Cairo Toe en sus presentaciones. ¿Qué tiene que enseñarnos? Anteriormente mencionó la vía de retroalimentación entre las prótesis y el ser humano, ¿podría dar más detalles sobre la vía de retroalimentación? ¿Crees que se imprimirán en 3D en el futuro o cómo crees que procederá la fabricación? Has escrito más de 120 artículos. ¿Hay alguno que te llame la atención y que debamos conocer? Es esencialmente como magia. ¿Cuáles son algunas de las aplicaciones que vería para las interfaces cerebro-máquina con lo que acaba de discutir?
COMPARTIR