Cruzado desde MenosError.
Escribiendo algo que me he encontrado repitiendo en diferentes conversaciones:
Si está buscando maneras de ayudar con el conjunto “el mundo parece bastante condenadonegocio, este es mi consejo: busque lugares en los que todos estemos siendo unos completos idiotas.
Busque lugares donde todos estén preocupados por un problema que una parte de usted cree que obviamente podría resolver.
Busque lugares donde algo parezca funcionar de manera incompetente o irremediablemente inepto, y donde una parte de usted piense que puede hacerlo mejor.
Entonces hazlo mejor.
Para un ejemplo concreto, considere Devansh. Devansh vino a verme el año pasado y me dijo algo como: “Oye, espera, parece que piensas que Eliezer hace una especie de generación de ideas de alineamiento que nadie más hace, y está limitado aquí por su resistencia inusualmente baja, pero Puedo pensar en un montón de pruebas médicas que no te has hecho, ¿eres un idiota o algo así?Y yo estaba como, “Sí, definitivamente, por favor ejecútalos, ¿necesitas dinero?”.
No tengo muchas esperanzas allí, pero diablos, ¡vale la pena intentarlo! Y, lo que es más importante, este es el tipo de actitud que puede llevar a las personas a probar cosas en absolutoen lugar de asumir que vivimos en un mundo más mundo adecuado donde todas las ideas obvias (aparentemente) tontas ya han sido probadas.
O bien, este es básicamente mi modelo de cómo Paul Christiano logra tener una agenda de investigación que me parece al menos internamente coherente. Desde mi perspectiva, él dice: “No sé, hombre, no estoy seguro de poder resolver esto, pero también creo que no está claro que no pueda, y hay un montón de cosas obvias para probar, que nadie más es capaz de resolver”. realmente mirando, así que lo estoy intentando”. Ese es el tipo de orientación hacia el mundo que creo que puede ser productiva.
O la gente de la teoría del fragmento. Creo que su idea es básicamente inviablepero aprecio la mentalidad se están aplicando al problema de la alineación: algo así como, “Esperen, no están siendo idiotas, me parece que puedo hacer X y luego la cosa se alineará”.
No creo que la gente de la teoría del fragmento nos salve; no todos los que audazmente intentan salvar el mundo tendrán éxito. pero si alguien hace sálvanos, creo que hay muchas posibilidades de que pasen por algo similar “¿Qué diablos, son todos idiotas?” fases, en las que siguen de forma autónoma un camino que les parece evidentemente descuidado, para ver si da sus frutos.
Compare esto con, por ejemplo, leer un montón de propuestas de investigación de personas y sopesar explícitamente los pros y los contras de cada enfoque para que pueda trabajar en lo que parezca más justificado. Esto tiene más el sabor de adoptar un enfoque que suena razonable basado en un argumento que suena vagamente bien en el papel, y menos el sabor de apagar un fuego obvio al que, por alguna razón, nadie más está reaccionando.
No sé, ¿tal vez las actividades del personaje vagamente bueno en el papel también resulten útiles? Pero sobre todo espero que las cosas buenas provengan de personas que trabajan en cosas en las que una parte de ellos ve de alguna manera que todos los demás simplemente están dejando caer la pelota.
En la versión de este movimiento mental que propongo aquí, te fijas en las formas en que todos son totalmente ineptos e incompetentes, formas en las que tal vez podrías hacer el trabajo correctamente si te metieras allí y te metieras.
De ahí es de donde predigo que vendrán las cosas buenas.
¿Y si no ves ninguna de esas formas?
Entonces no te preocupes. Tal vez simplemente no puedas ver algo que te ayude en este momento. No tiene que haber formas en las que puedas ayudar de manera considerable en este momento.
I no veo formas de ayudar realmente de una manera considerable en este momento. Mantengo los ojos abiertos y estoy revisando una gran acumulación de cosas que podrían ayudar a un distinto de cero cantidad, pero creo que es importante no confundir esto con tomar bocados significativos de un problema central que enfrenta el mundo, y no pretenderé estar haciendo esto último cuando no veo cómo hacerlo.
Como, mantente atento. Por supuesto, mantente atento. Pero si nada en el campo te está llamando, y no tienes una parte de ti que diga que podrías hacerlo mejor si desconcertado usted mismo un poco más y luego manejar las cosas usted mismo, entonces es totalmente respetable hacer otra cosa con sus horas.
Si no tienes un sentido activo de que podrías apagar algunos incendios visiblemente furiosos tú mismo (tal vez después de mejorar un montón, lo cual también tienes un sentido activo que podrías hacer), entonces te recomiendo cosas como cultivar tu habilidad para emocionarte con las cosasy haciendo otras cosas geniales.
Claro, la mayoría de las cosas tienen un impacto menor que salvar al mundo de la destrucción. Pero si puede estar entusiasmado con todas las otras formas geniales de mejorar el mundo que lo rodea, entonces soy mucho más optimista de que podrá sentirse debidamente motivado para combatir el riesgo existencial cuando tenga la oportunidad de hacerlo. surge Porque esa oportunidad, si tienes una, probablemente no va a abrir de repente todos los candados de la caja en la que tu corazón esconde tu entusiasmo, si tu corazón está ocultando tu entusiasmo.
Ver también Rob Wiblin “No persiga una carrera de impacto: piense en los problemas más importantes, tratables y desatendidos del mundo y siga su pasión”.
O el Guía de campo de investigación de alineación consejos para “optimizar para su propia comprensión” y perseguir las cosas que le parecen vivas y desconcertantes, en lugar de memorizar diligentemente las preguntas e ideas de otras personas. “[D]on’t ask “¿Cuáles son las preguntas abiertas en este campo?” Pregunte: “¿Cuáles son mi preguntas en este campo?”
Básicamente, no creo que los grandes cambios provengan de personas que no persiguen una visión en la que una parte de ellos “cree”, y no creo que la ayuda incremental, modesta, de bajo riesgo y baja recompensa pueda salvarnos. de aquí.
Para ser claros, cuando digo “creer en”, ¡no quiero decir que necesariamente asignes una alta probabilidad al éxito! Tampoco quiero decir que estés dispuesto a seguir intentándolo frente a las dificultades e incertidumbres (aunque eso también es útil).
El inglés no tiene grandes palabras para describir lo que quiero decir aquí, pero es algo así como: tu maquinaria de visualización dice que no ve ningún obstáculo para el éxito, de modo que anticipas el éxito o recibes una lección muy concreta.
La posibilidad parece abierta para ti, de un vistazo; y si bien puede sospechar que hay alguna razón oculta por la que la posibilidad no está realmente abierta, aquí tiene la oportunidad de prueba si eso es así, y potencialmente aprender por qué esta idea prometedora falla.
(O tal vez simplemente funcione. Se sabe que sucede, en muchos escenarios donde las señales y presagios externos habrían predicho el fracaso).