Colección de citas famosas - Slogan de motivación - IEEEFellow Li Shipeng: Reflexiones sobre la investigación de vanguardia en inteligencia artificial y robótica

IEEEFellow Li Shipeng: Reflexiones sobre la investigación de vanguardia en inteligencia artificial y robótica

Autor|Victor

Editor|Qing Mu

El 9 de diciembre de 2021, fue organizado por la Inteligencia Artificial del Área de la Gran Bahía de Guangdong-Hong Kong-Macao. y la Federación de Robótica, la sexta Conferencia Mundial de Robótica e Inteligencia Artificial coorganizada por Leifeng.com comenzó oficialmente en Shenzhen. Más de 140 líderes académicos y de la industria y 30 becarios se reunieron para discutir la tecnología, los productos, la industria, las humanidades, la organización y otros temas de IA. dimensiones, y racionalmente Con el análisis y la percepción perceptiva como eje, subiremos juntos a la cima de la ola de inteligencia artificial y digitalización.

En el segundo día de la conferencia, Li Shipeng, director del Laboratorio Sier, ex director ejecutivo del Instituto de Inteligencia Artificial y Robótica de Shenzhen, académico de la Academia Euroasiática Internacional de Ciencias y miembro del IEEE, dio una ponencia sobre “Fronteras de la Inteligencia Artificial y la Robótica” en el congreso GAIR Conferencia sobre “Reflexiones sobre la Investigación”.

Dr. Li Shipeng, miembro del IEEE, académico de la Academia Internacional Euroasiática de Ciencias. Se ha desempeñado sucesivamente como científico jefe y director ejecutivo del Instituto de Inteligencia Artificial y Robótica de Shenzhen, vicepresidente de iFlytek Group y codirector del Instituto de Investigación iFlytek, y miembro fundador y subdirector de Microsoft Research Asia. El académico Li es bastante influyente en los campos de multimedia, IoT e IA. Posee 203 patentes estadounidenses y ha publicado más de 330 artículos citados. Catalogado como uno de los 1.000 mejores científicos informáticos del mundo por Guide2Research. Cultivó cuatro ganadores del Premio a la Innovación MITTR35. Es uno de los fundadores y secretario general adjunto de la Alianza Estratégica de Innovación Tecnológica de la Industria de la Inteligencia Artificial de Nueva Generación.

En su discurso, Li Shipeng presentó y esperaba con interés las direcciones de investigación de vanguardia de la inteligencia artificial y la robótica. Señaló que en el futuro, el aprendizaje automático podría superar el cuello de botella de los datos. El aprendizaje profundo con la ayuda de métodos de ciencia cognitiva, y el paradigma de aprendizaje puede pasar de depender de big data a depender de grandes reglas; la colaboración entre humanos y máquinas también debe evolucionar hacia la colaboración entre humanos y máquinas solo incorporando acoplamiento, interacción, mejora y complementación. y otros objetivos en la dirección de la investigación se puede lograr la conexión perfecta entre humanos y máquinas.

El siguiente es el texto completo del discurso, que ha sido editado por AI Technology Review sin cambiar el significado original:

El discurso de hoy se titula "Reflexiones sobre la investigación de vanguardia en inteligencia artificial". y Robótica” y se divide en tres partes: En esta sección, primero hablaremos de

inteligencia artificial

panorama de la investigación de robots

, y luego

centrarse en la dirección de la investigación

, incluido el aprendizaje automático, la inteligencia de movimiento, la colaboración entre humanos y máquinas y, finalmente, un resumen.

Hay tres elementos clave en la investigación relacionada con la inteligencia artificial:

Personas, robots/Internet de las cosas e IA

. La razón por la que se agrupan la robótica y el Internet de las cosas es porque son la interfaz entre el mundo físico y el mundo virtual. Si se conectan tres elementos en pares, se formará un nuevo sujeto. Por ejemplo, la combinación de robots e IA producirá agentes inteligentes, la combinación de IA y humanos producirá un acoplamiento hombre-máquina y una inteligencia mejorada, y la fusión de robots. y los humanos formarán un cuerpo fortalecido. Con el desarrollo de los campos de la inteligencia artificial y la robótica, el objeto de investigación ya no se limita a un solo agente, sino que cada vez se realizan más investigaciones sobre la colaboración de múltiples agentes. Por ejemplo, ¿cómo pueden integrarse mejor los grupos sociales humanos? ¿Cómo diseñar un enjambre de máquinas que puedan colaborar de manera exquisita?

En general, creo que las direcciones de investigación básicas importantes son:

Aprendizaje automático, inteligencia de movimiento, cooperación hombre-máquina y colaboración grupal.

Centrarse en el aprendizaje automático

El desarrollo del aprendizaje automático es inseparable de la bendición del aprendizaje profundo, que aporta muchos resultados de investigación a la industria y potencia Ha promovido el rápido desarrollo de la industria de la inteligencia artificial en aspectos como el reconocimiento de voz, el reconocimiento facial, el reconocimiento de objetos y la conducción autónoma.

Aunque los resultados han sido fructíferos, tan malo es el éxito como el fracaso. El aprendizaje profundo se basa en big data y su cuello de botella también radica en big data. Por ejemplo, aunque la tecnología de voz inteligente nacional lidera la industria, todavía depende de la acumulación de tecnología y de datos. Ahora bien, si desea que el aprendizaje profundo ejerza su enorme poder, aún necesita el soporte de una gran cantidad de datos. Si desea expandir el aprendizaje profundo de un campo a otro, el soporte de datos también es indispensable.

¿Cómo abrirse paso? Los investigadores han explorado múltiples caminos y una solución es:

Extender el marco de aprendizaje profundo.

Por ejemplo, optimización de algoritmos de aprendizaje profundo, aprendizaje profundo de gráficos de conocimiento, aprendizaje profundo de sistemas expertos, etc. Otro camino es el

razonamiento causal

. Su objetivo es confiar en la capacidad de los seres humanos para sacar inferencias de un caso y explorar la causalidad entre datos para ir más allá de la correlación entre datos. Razonamiento lógico entre datos.

El tercer camino es

computación similar al cerebro

, que explora los elementos y mecanismos cognitivos del cerebro humano desde una perspectiva biológica y reproduce el cerebro humano. con métodos de simulación.

Personalmente, creo que la ciencia cognitiva es el punto de partida para romper con el marco del aprendizaje profundo. La razón es que hay dos puntos en el proceso cognitivo humano de los que debemos aprender: nacemos con conocimiento y aprendemos con conocimiento.

Nacer sabiendo significa que algunas capacidades cognitivas son innatas. Los recién nacidos tienen muchas conexiones innatas en sus nervios craneales. Lo que nos aclara es que la mayoría de los algoritmos de aprendizaje profundo actuales se entrenan desde cero sin hacer un uso completo o eficiente del conocimiento previo o de los modelos existentes. Cómo utilizar el conocimiento existente es la próxima dirección importante del aprendizaje profundo.

Aprender a saber significa que se aprenden la mayoría de las capacidades cognitivas, especialmente el aprendizaje temprano. Se hacen más conexiones mediante el aprendizaje de los nervios craneales. Muchas de las habilidades de los niños, incluida la percepción, el afrontamiento, el lenguaje, la lectura, la escritura y la comprensión, e incluso las ideas y habilidades para analizar y resolver problemas, se han finalizado básicamente a una edad muy temprana en el futuro, básicamente será una acumulación de; conocimiento. Esto significa que las neuronas del cerebro se conectan y finalizan en un metamodelo muy temprano, y el resto es solo usar este metamodelo para resolver problemas en campos específicos. Esto guarda sorprendentes similitudes con los modelos actuales pre-entrenados a gran escala.

Otro nivel de aprendizaje y conocimiento es que el proceso de aprendizaje humano se basa en datos de múltiples fuentes, multisensoriales, multimodales y de múltiples ángulos, como la visión, el oído, el olfato, el tacto y el contexto. y otra información conjunta, y el aprendizaje profundo actual se basa principalmente en un discurso o una fotografía. Por lo tanto, los datos de entrada del futuro modelo de IA pueden no ser solo datos únicos, sino una fusión de múltiples fuentes de señales. Cómo imitar el proceso de aprendizaje humano es otra revelación del aprendizaje profundo de la ciencia cognitiva.

Además, el proceso de aprendizaje humano es un proceso desde ejemplos de muestra hasta la inducción de principios, en lugar de simplemente permanecer en el nivel de muestra, actualmente el aprendizaje profundo solo permanece en el nivel de muestra; Entonces, ¿será posible construir un marco de aprendizaje automático similar al humano en el futuro, de modo que no importa qué tipo de datos se ingresen, siempre que la lógica sea consistente, converja en un modelo consistente?

Para superar el cuello de botella de datos del aprendizaje profundo, puede intentar crear un sistema de reglas de crowdsourcing y dejar que los humanos enseñen el proceso de aprendizaje automático. El propósito no es ingresar datos, sino dejar que la máquina aprenda. las reglas. Dado que tratamos de aprender reglas de las actividades diarias, dichas reglas pueden ser marcadas y enseñadas por la gente común, lo que rompe la limitación anterior de que los expertos requirieran expertos sistemáticamente. Esta transición de big data a la construcción de modelos de grandes reglas está obviamente más en línea con la cognición humana.

Centrarse en la inteligencia del movimiento

Como todos sabemos, en el campo de la robótica, los productos de Boston Dynamics son los más parecidos a los humanos. En la animación anterior, no se puede ver al robot bailando en absoluto. No se siente rígido. Sin embargo, debido a las limitaciones de los recursos informáticos, la energía y el control de movimiento, sólo puede funcionar durante decenas de minutos. De hecho, el modo de funcionamiento de los robots de Boston Dynamics se basa en el accionamiento por motor, que tiene muchas deficiencias, como movimiento rígido, gran peso propio, contradicción entre velocidad de reacción y flexibilidad y alto consumo de energía.

Comparando la forma en que operan los humanos y otros animales, la combinación de músculos, huesos, sensores y nervios puede lograr un funcionamiento flexible con un bajo consumo de energía. La inspiración para los investigadores es que el sistema operativo del robot debe cumplir los mismos requisitos que los humanos: eficiente, flexible, preciso, robusto, rígido y flexible, liviano, adaptable y otros indicadores. La inteligencia deportiva actual puede funcionar bien en cierta dimensión, pero todavía tiene muchas deficiencias cuando se la toma en consideración.

Por lo tanto, una importante dirección de investigación de la inteligencia deportiva es: la biónica. Siguiendo el modelo de la inteligencia de movimiento de los animales, por ejemplo, el control de movimiento adopta retroalimentación de proximidad y el proceso de movimiento se puede ajustar de manera flexible en cualquier momento dependiendo de los cambios.

Si los robots son impulsados por fuerzas internas, los micronano robots médicos son representantes de direcciones de investigación de fuerzas externas. Por ejemplo, basándose en el magnetismo, pequeños robots pueden transportar drogas con precisión de un tubo a otro.

Centrarse en la dirección de la colaboración hombre-máquina

A nivel de colaboración hombre-máquina, es diferente de la colaboración que representa el acoplamiento. , Significa interacción, potenciación, complementariedad, colaboración, armonía, etc. El objetivo de la colaboración hombre-máquina es que la máquina pueda comprender la intención humana sin decírselo al robot, logrando así una conexión perfecta entre el hombre y la máquina.

En el proceso de lograr la armonía entre humanos y máquinas, la atención se centra en el estudio de la interacción, percepción y mejora natural entre humanos y máquinas. Específicamente, puede incluir: detección y reconocimiento biométricos, interfaz persona-computadora, interfaz cerebro-computadora, reconocimiento de voz, reconocimiento de acciones, reconocimiento de expresiones, comprensión del lenguaje, comprensión de intenciones, percepción de la postura corporal, mejora continua y extensión de la realidad extendida y realidad remota, etc. espera.

En términos de inteligencia aumentada hombre-máquina, los marcos de aprendizaje automático actuales son en su mayoría marcos de aprendizaje profundo basados en big data, y definitivamente habrá situaciones que la inteligencia automática no puede manejar. Esto es fatal para ciertas áreas de alto riesgo, como la conducción autónoma y las finanzas.

La solución actual a este problema es la toma de control humana. Esto implicará tres preguntas centrales:

Pregunta central 1: ¿Cómo detecta la inteligencia artificial que no puede manejar algunas situaciones y pide activamente a los humanos que se hagan cargo?

Pregunta central 2: ¿Cuándo podrán los humanos dejarse llevar por completo y dejar que las máquinas completen tareas de forma autónoma?

Pregunta central 3: ¿Qué tipo de diseño de interacción persona-computadora puede aprovechar al máximo las respectivas fortalezas de los humanos y las máquinas sin problemas innecesarios entre sí?

Si los tres problemas centrales no se pueden resolver, conducirán a algunos dilemas. Tomemos como ejemplo la conducción autónoma. En la actualidad, los agentes de seguridad no activan la función automática de una vez por todas, sino que también necesitan controlar las condiciones de la carretera y las rutas en todo momento y no pueden distraerse ni un momento. En realidad, esto aumenta la carga para los responsables de seguridad, porque cuando no hay conducción autónoma, los humanos tienen ciertas predicciones sobre su entorno de conducción, pero no pueden predecir la situación de la conducción de máquinas.

El aumento del cuerpo entre humanos y máquinas también es un campo de colaboración entre humanos y máquinas, que puede ayudar a los humanos a mejorar sus capacidades físicas y completar cosas que los humanos no pueden hacer con su propia fuerza física. Pero las máquinas pueden ser demasiado complejas y requerir capacitación humana para funcionar. El objetivo futuro del aumento hombre-máquina es lograr una coexistencia armoniosa entre humanos y máquinas, y controlarlos con tanta naturalidad como los propios órganos humanos. Entre ellos, los temas centrales de investigación involucrados incluyen: percepción de las intenciones humanas por parte de las máquinas, postura humana, comprensión de los comandos del lenguaje natural humano, lenguaje corporal, etc., para que las máquinas puedan ayudar a los humanos a resolver problemas de la manera más fluida y adecuada para los humanos. aceptación y lo justo.

Centrarse en la colaboración grupal

Actualmente, agentes individuales pueden completar muchas tareas, pero ¿cómo liberar el poder colectivo de cada agente? Se trata de la dirección de investigación de la colaboración grupal. En los escenarios de almacenamiento, hay muchos robots de captura y clasificación, si se pueden enviar de manera efectiva, la eficiencia del trabajo mejorará enormemente.

El método de programación convencional actual es un método de control centralizado, pero frente a decenas de miles de agentes, se necesita un control descentralizado para permitir el comportamiento autónomo entre agentes mientras colaboran entre sí. lo tuyo. Es decir, un único agente inteligente que puede actuar de forma independiente logra una inteligencia y un comportamiento de grupo/sistema más eficiente a través de la colaboración.

Las reglas actualmente involucradas en la colaboración de grupos de agentes inteligentes incluyen modelos de comportamiento grupal y mecanismos de incentivos, y toma de decisiones colaborativas inteligentes en grupo. En este sentido, las hormigas son nuestros objetos de aprendizaje. Además, en términos de conducción autónoma, están apareciendo cada vez más robots de conducción autónoma, y cómo lograr la detección y el control colaborativos entre ellos también es un tema candente en la actualidad.

Los cuatro aspectos anteriores son investigación básica. Un avance en cualquier campo será un avance revolucionario para su campo y sus aplicaciones posteriores, y también traerá inteligencia digital industrial original que nos ayudará a ocupar una posición ventajosa. ¡Posición en la competencia!

Leifeng.com Leifeng.com

上篇: conexión bosel1compact y t1 下篇: ¿De dónde viene la frase “plantar flores intencionalmente pero no dejarlas crecer”?