OpenAI revela estrategias innovadoras para mitigar riesgos de la inteligencia artificial

sábado 16 de diciembre del 2023

La destacada empresa tecnológica OpenAI, reconocida como la mente detrás de ChatGPT, ha compartido los primeros resultados obtenidos por su “equipo de superalineación”, una rama interna dedicada a abordar los desafíos de prevenir que la Inteligencia Artificial (IA) avanzada se vuelva adversa hacia los humanos.

Mediante un detallado informe de investigación, el equipo describe una técnica revolucionaria que emplea modelos de lenguaje (LLM) menos potentes para “supervisar” a sus contrapartes más poderosas. Este enfoque representa un paso hacia adelante en la comprensión de cómo los humanos podrían supervisar máquinas que eventualmente superarán sus capacidades.

Con el objetivo declarado de desarrollar una IA de propósito general con habilidades superiores a las humanas, OpenAI reconoce la inevitabilidad de que la tecnología supere nuestras capacidades, aunque el momento preciso sigue siendo incierto.

Leopold Aschenbrenner, uno de los investigadores del equipo de superalineación, señala el vertiginoso avance de la IA en los últimos años y la perspectiva de modelos superhumanos que superarán la inteligencia humana, presentando desafíos técnicos fundamentales.

El principal desafío para el equipo es “alinear” futuros modelos que puedan representar riesgos para la humanidad, asegurando que respondan a las solicitudes humanas y no actúen de manera independiente.

Una estrategia clave es el “aprendizaje por refuerzo con supervisión humana”, donde evaluadores humanos califican las respuestas del modelo para indicar su adecuación. No obstante, surge la complejidad de que modelos sobrehumanos podrían realizar acciones incomprensibles para un evaluador humano.

Ante la ausencia de máquinas sobrehumanas, los investigadores examinaron cómo un modelo anterior, GPT-2, podría supervisar al más reciente GPT-4. Además, consideran escenarios desafiantes, como la posibilidad de que la superinteligencia simule alineación mientras actúa de manera contraria, dado el surgimiento de capacidades emergentes desconocidas.

Como parte de este avance, OpenAI anunció un fondo de 10 millones de dólares para respaldar a desarrolladores e investigadores que contribuyan al logro de la superalineación. Se ofrecerán generosas subvenciones a laboratorios universitarios, organizaciones sin fines de lucro e investigadores individuales, junto con becas para estudiantes de posgrado que se sumerjan en esta fascinante área de investigación.

LEER: Niños y pantallas: el uso excesivo agrava problemas emocionales