¿Cuál es la prueba de Turing y sigue siendo relevante?

“¿Pueden pensar las máquinas?” Esa es la pregunta principal matemático legendario e informático Alan Turing posó En octubre de 1950. Turing quería evaluar si las máquinas podían imitar o exhibir un comportamiento inteligente de nivel humano, por lo que se le ocurrió una prueba llamada “juego de imitación”. Esto luego se conoció como la prueba de Turing, que se usa comúnmente para evaluar qué tan bien una máquina puede imitar el comportamiento humano.

La génesis de la prueba de Turing provino de la dificultad inherente para establecer criterios objetivos que distinguen el pensamiento original de la imitación de la misma. El desafío es que se podría negar evidencia de pensamiento original con el argumento de que una máquina simplemente estaba programada para parecer inteligente. Esencialmente, el quid de probar si las máquinas pueden pensar es definir qué es el pensamiento.

Puede que te guste

Turing quería desafiar la idea Que la naturaleza mecánica de las computadoras significa que no pueden, en principio, pensar. El matemático estaba postulando que, si una computadora parece indistinguible de un humano, ¿por qué no debería considerarse una entidad pensante?

¿Cómo funciona la prueba de Turing?

Turing propuso un juego de tres partes. Primero describió una prueba en la que un hombre y una mujer entran en habitaciones separadas y los invitados a la fiesta usan respuestas mecanografiadas para tratar de determinar qué persona es cuál, mientras el hombre y la mujer intentan convencerlos de que son el sexo opuesto.

A partir de ahí, Turing propuso una prueba por la cual un interrogador remoto tiene la tarea de hacer preguntas a una computadora y un sujeto humano, ambos invisibles, durante cinco minutos para determinar cuál es sensible. El éxito de una computadora en el “pensamiento” podría medirse por la probabilidad de ser identificado erróneamente como humano.

Una iteración posterior del juego de imitación, propuesta por Turing en 1952 en una transmisión de la BBC, vería a una computadora tratar de convencer a un jurado de personas de que era humano.

La prueba de Turing se creó como un experimento de pensamiento más filosófico que un medio práctico para definir la inteligencia de la máquina. Sin embargo, creció para ser visto como un objetivo final para los sistemas de aprendizaje automático e inteligencia artificial (IA) para demostrar la inteligencia general artificial.

Turing predicho que a principios de la década de 2000, una computadora programada podría “jugar el juego de imitación tan bien que un interrogador promedio no tendrá más del 70 por ciento de posibilidades de hacer la identificación correcta después de cinco minutos de preguntas”.

Pero eso no salió a pasar. Sin embargo, el aumento de ChatGPT y otros sistemas de inteligencia artificial y los grandes modelos de idiomas (LLM) ha reavivado la conversación en torno a la prueba de Turing.

En junio de 2024, los investigadores afirmaron que el LLM GPT-4 se consideró humano el 54% del tiempo en la prueba de Turing dentro de los cinco minutos posteriores a la cuestionamiento. Eso supera rotundamente la predicción de Turing del 30%, a pesar de estar dos décadas después de la fecha predicha del matemático. Pero esto Investigación de la Universidad de San Diego Solo involucró a dos jugadores en la prueba en lugar del juego original de tres jugadores de Turing, por lo que GPT-4 no pasó la prueba de Turing en las condiciones específicas que definió.

Sin embargo, esta investigación todavía muestra cómo tal AIS puede al menos imitar a los humanos con cierto éxito.

Desafíos y limitaciones de la prueba de Turing

Si bien pasar la prueba de Turing podría ser el gran objetivo de demostrar pensar en los sistemas de IA, la prueba tiene sus limitaciones y oponentes.

Turing mismo detalló y abordó nueve objeciones a su prueba y teoría al probar las máquinas podría pensar; Estos van desde el concepto teológico de pensamiento y la idea de que las máquinas no pueden sentir emociones, o tienen sentido del humor, hasta limitación matemática lógica que simplemente evitará que una máquina responda una pregunta o la haga correcta.

(Crédito de la imagen: Jesussanz/Getty Images)

Pero quizás la objeción más relevante proviene del matemático Ada Lovelace, quien cuando comentario En el motor analítico del pionero de la computación Charles Babbage, sugirió que una máquina no puede “originar nada” y solo puede hacer lo que ordenemos que realice. La réplica de Turing en su artículo era preguntar si los humanos pueden hacer algo realmente nuevo en un mundo determinista vinculado por las leyes de la naturaleza y los límites del universo. Turing también señaló que las computadoras pueden estar restringidas, pero aún podrían hacer cosas inesperadas, de la misma manera que los humanos pueden estar limitados por nuestra composición genética y biología.

Más allá de esto está el hecho de que la prueba de Turing no, per se, no indica conciencia o inteligencia; Más bien funciona para criticar lo que se entiende como pensamiento y lo que podría constituir máquinas de pensamiento. La prueba también depende del juicio del interrogador, una comparación con los humanos y el juicio de los comportamientos solamente.

Luego está el argumento de que la prueba de Turing está diseñada en torno a cómo actúa un sujeto, lo que significa que una máquina puede simplemente simular la conciencia humana o el pensamiento en lugar de tener activamente su propio equivalente. Esto puede conducir al Trampa turing – en el que los sistemas de IA se centran excesivamente en imitar a los humanos en lugar de estar diseñados para tener funciones que permitan a los humanos hacer más o aumentar su cognición más allá de las posibilidades de la mente humana.

¿La prueba de Turing sigue siendo relevante?

Si bien la prueba de Turing podría mantenerse como un punto de referencia para que los sistemas de IA superen Eleanor WatsonUn experto en ética de IA y miembro del Instituto de Ingenieros de Electricidad y Electrónica (IEEE), dijo a Espanol.news que “la prueba de Turing se está volviendo cada vez más obsoleta como un punto de referencia significativo para la capacidad de inteligencia artificial (IA)”.

Watson explicó que los LLM están evolucionando de simplemente imitar a los humanos a ser sistemas de agente que pueden perseguir de forma autónoma a través de la programación de “andamios”, similar a la forma en que los cerebros humanos construyen nuevas funciones a medida que la información fluye a través de capas de neuronas.

“Estos sistemas pueden participar en un razonamiento complejo, generar creación de contenido y ayudar en el descubrimiento científico. Sin embargo, el verdadero desafío no es si la IA puede engañar a los humanos en la conversación, sino si puede desarrollar un sentido común genuino, razonamiento y alineación de objetivos que coincidan con los valores e intenciones humanos”, dijo Watson. “Sin esta alineación más profunda, pasar la prueba de Turing se convierte simplemente en una forma sofisticada de mimetismo en lugar de la verdadera inteligencia”.

Esencialmente, la prueba de Turing puede estar evaluando las cosas incorrectas para los sistemas de IA modernos.

Como tal, los científicos “necesitan desarrollar nuevos marcos para evaluar la IA que va más allá de la simple imitación humana para evaluar las capacidades, las limitaciones, los riesgos potenciales y, lo más importante, alineación con valores y objetivos humanos“, Dijo Watson.

A diferencia de la prueba de Turing, estos marcos deberán explicar las fortalezas de los sistemas de IA y sus diferencias fundamentales con respecto a la inteligencia humana, con el objetivo de garantizar que AIS “mejore, en lugar de disminuir, la agencia humana y el bienestar”, agregó Watson.

“La verdadera medida de la IA no será qué tan bien puede actuar humano”, concluye Watson, “pero qué tan bien puede complementar y aumentar la humanidad, elevándonos a mayores alturas”.


Comments

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.