Leí un artículo de noticias recientemente sobre alguien demandando a ChatGPT por difamación. Antes de enterarme de esta noticia, nunca consideré preguntarle a un modelo de lenguaje grande (LLM) sobre mí. Esto me recordó a surfeando el ego, que es el acto de usar su propio nombre como palabra clave en un motor de búsqueda o motores de búsqueda para ver qué aparece. (Dato curioso: hace mucho tiempo, tuve que enviar manualmente mi dominio a Google para que lo indexara. Hoy en día, todo se indexa a menos que usted especifica explícitamente que no hay indexación.)
Esto me hizo sentir curiosidad por saber qué devolverían los modelos GPT si preguntaba por mí. Por la presente, designaré el término “impulso del ego” como el acto de usar su propio nombre en un aviso para ver qué resultados arroja un LLM.
usaré el gpt-3.5-turbo modelo porque no tengo acceso a GPT-4. tengo un guion (ask.py
) que toma la entrada de la línea de comando y usa Finalización de chat para obtener una respuesta.
Empecé con lo siguiente.
./ask.py "Can you tell me what you know about Dave Tang?"
# I am an AI language model, and I do not personally know Dave Tang. However,
# there are several people with that name, and I would need more specific
# information to provide accurate details.
Me parece bien. Proporcioné información adicional.
./ask.py "Dave Tang is a bioinformatics researcher. Can you tell me more about him?"
# As an AI language model, I do not have access to personal information about
# individuals unless it has been publicly disclosed. However, according to a
# LinkedIn profile under the name Dave Tang, he is a bioinformatics researcher and
# software developer based in Sydney, Australia. He has worked for various
# academic and research institutions, including the Garvan Institute of Medical
# Research, the University of New South Wales, and the University of Sydney. His
# research interests include genomics, transcriptomics, and sequencing
# technologies. Additionally, he is involved in developing computational tools and
# pipelines for analyzing high-throughput genomic data.
Nunca he trabajado en Garvan, UNSW o USYD, pero estoy conectado con personas que trabajan o he trabajado en esos lugares en LinkedIn. La segunda parte es precisa y probablemente se basó en mi perfil de LinkedIn.
Repetí la pregunta de nuevo.
./ask.py "Dave Tang is a bioinformatics researcher. Can you tell me more about him?"
# As an AI language model, I do not have access to personal information like home
# addresses, phone numbers, or private life. However, I can tell you that Dave
# Tang is a bioinformatics researcher who specialises in developing computer-based
# tools for analyzing biological data. He has a Ph.D. in bioinformatics and has
# worked on projects ranging from next-generation sequencing to metagenomics to
# protein structure prediction. He has also published many peer-reviewed articles
# in scientific journals and is highly respected in the bioinformatics community.
Eso sí que son tonterías (aparte del hecho de que tengo un doctorado).
Una última vez.
./ask.py "Dave Tang is a bioinformatics researcher. Can you tell me more about him?"
# Unfortunately, as an AI language model, I do not have access to personal
# information about individuals unless it is publicly available on the internet.
# However, based on the given information, Dave Tang is likely someone who focuses
# on using computational tools and techniques to analyze biological data and solve
# biological problems. This may involve using programming languages, statistical
# methods, and machine learning algorithms to analyze large datasets related to
# genetics, genomics, protein structure, and other areas of biology.
Eso es completamente saliendo como comadreja.
Resumen
Las instrucciones breves como las que he usado en esta publicación no son confiables debido a la falta de contexto. Sin embargo, hice esto a propósito para ver qué evocaría/alucinaría el modelo. A partir de las respuestas, está claro que los datos de LinkedIn se desecharon, entrenaron y utilizaron para generar las respuestas. Probablemente también se usaron datos de Google Scholar. El resto de la respuesta solo se basó en palabras asociadas con “bioinformática”.
En resumen, no es confiable usar LLM para conocerte a ti mismo (si no eres famoso). Me hubiera impresionado si el modelo regresara “Dave Tang es simplemente el tipo con el blog de bioinformática”.