Profesor de matemáticas de Williams que investiga fraude electoral en Pensilvania no encuentra evidencia

Steven Miller es profesor de matemáticas en colegio williams que se especializa en teoría de números y teoría de probabilidad teórica. Hace unos días publicó un “declaración” en el que realiza un “análisis” de datos de bancos telefónicos de republicanos registrados en Pensilvania. Los datos le fueron proporcionados por Matt Braynyard, quien dirigió el equipo de datos de Trump durante el 2016. Miller enmarca su «análisis» como un intento de «estimar la cantidad de boletas electorales fraudulentas en Pensilvania», y su análisis de los datos lo lleva a concluir que

“casi con seguridad… la cantidad de boletas solicitadas por alguien que no sea el republicano registrado está entre 37,001 y 58,914, y casi con seguridad la cantidad de boletas solicitadas por republicanos registrados y devueltas pero no contadas está en el rango de 38,910 a 56,483”.

Una revisión del “análisis” de Miller me lleva a concluir que sus estimaciones son fundamentalmente erróneas y que los datos presentados no proporcionan evidencia de fraude electoral.

A esta conclusión es fácil llegar. La declaración afirma (sin referencia) que había 165,412 boletas por correo solicitadas por republicanos registrados en Pensilvania, pero que «no habían llegado para ser contadas» hasta el 16 de noviembre de 2020. Los datos que analizó Miller se basaron en un intento de llamar a algunos de estos republicanos registrados por teléfono para evaluar qué sucedió con sus boletas. El número de llamadas telefónicas realizadas, según la declaración, es 23.184 = 17.000 + 3.500 + 2.684. El número 17.000 consiste en llamadas telefónicas que no dieron información, ya sea porque contestaba un contestador en lugar de una persona, o contestaba una persona y colgaba sumariamente. 3.500 números se caracterizaron como “malos números / barrera del idioma”, y 2.684 personas contestaron el teléfono. Curiosamente, Miller escribe que “se llamó a casi 20.000 personas”, cuando De hecho 23.184 > 20.000.

En cualquier caso, claramente muchos de los números de teléfono marcados eran simplemente números equivocados, como lo demuestra el número de llamadas “malas”: 3.500. Es fácil imaginar cómo puede suceder esto: confusión porque algunas personas comparten un nombre, los números de teléfono han cambiado, las personas se mudan, el banco de llamadas comete un error al marcar, etc. b Sea la fracción de números de teléfono de los 23.184 que fueron «malos», es decir, incorrectos. Podemos estimar b al señalar que tenemos alguna información al respecto: sabemos que los 3.500 “números malos” eran malos (por definición). Además, se informa en la declaración que 556 personas dijeron literalmente que no solicitaron una boleta, y no hay razón para no tomarles la palabra. No sabemos qué fracción de las 17.000 personas que llamaron y no descolgaron o colgaron eran números equivocados, pero sí sabemos que la fracción del total debe ser igual a la fracción de los 17.000 + los que sabemos con certeza fueron números malos, es decir

23184 cdot b = 17 000 cdot b + 556 + 3500.

Resolviendo para b encontramos eso b aproximado frac. Me sorprende que el número sea tan bajo. Uno esperaría que las personas que solicitaron boletas, pero luego no las enviaron, se beneficiarían de las personas que se mudaron recientemente o están en proceso de mudarse, o tienen otros problemas que dificultan o imposibilitan llegar a ellos. en absoluto.

La fracción de llamadas incorrectas derivadas se traduce en alrededor de 1700 números incorrectos de las 2684 personas a las que se llegó. Esto explica fácilmente no solo las 556 personas que dijeron que no solicitaron una boleta, sino también las 463 personas que dijeron que enviaron sus boletas por correo. En el caso de este último no hay irregularidad; la cantidad de malas llamadas sugiere que todas esas personas fueron contactadas por error y sus votos fueron contados legítimamente para que no formaran parte de los 165,412. También explica las 544 personas que dijeron que votaron en persona.

Eso es todo. Los datos no apuntan a ningún fraude o irregularidad, solo una encuesta mal diseñada con bajas tasas de respuesta y mucha información errónea debido a números de teléfono incorrectos. No hay nada que explicar. Miller, por otro lado, tiene algunas cosas que explicar.

Primero, noto que su declaración comienza con una página firmada que afirma varios hechos sobre Steven Miller y el análisis que realizó. Notablemente ausente de la página, o en cualquier otra parte del documento, está la divulgación de la fuente de financiación del trabajo y de los conflictos de intereses. Sobre su página web de trabajoMiller establece específicamente que uno debe reconocer siempre el apoyo financiero.

En segundo lugar, si Miller De Verdad quería entender la razón por la cual se solicitaron algunas boletas por correo, pero aún no habían llegado para ser contadas, también obtendría datos de los demócratas. Eso proporcionaría un control sobre varios aspectos del análisis y ayudaría a establecer si las irregularidades, si se detectaran, eran de carácter partidista. ¿Por qué Miller no incluyó un análisis de tales datos?

En tercer lugar, uno podría preguntarse por qué Steven Miller eligió publicar esta «declaración». Seguramente un profesor que ha enseñado probabilidad y estadística durante 15 años (como afirma Miller) debe entender que su propio «análisis» es fundamentalmente defectuoso, ¿verdad? Por otra parte, anteriormente descubrí que los matemáticos puros excelentes son propensos a caer en una trampa de análisis de datos, es decir, una situación en la que su falta de experiencia en el análisis de conjuntos de datos del mundo real los lleva a creer en análisis ingenuos que son profundamente defectuosos. Para comprender mejor si este podría ser el caso de Miller, examiné su registro de publicación, que ha compartido públicamente a través de Google Becario, para ver si ha trabajado con datos. Lo primero que noté fue que ha publicado más de 700 artículos (!) y tiene un índice h de 47 para un total de 8.634 citas… un récord increíble para cualquier profesor, y especialmente para un matemático. Una búsqueda en Google de su nombre muestra esta impresionante cantidad de citas:

Resulta que su impresionante récord de publicaciones es un espejismo. Cuando eché un vistazo más de cerca y descubrí que muchos de los artículos que enumera en su página de Google Scholar no son suyos, sino artículos publicados por otros autores con el nombre de S Miller. “Su” artículo más citado se publicó en 1955, un año que transcurrió mucho antes de que él naciera. El artículo más citado de Miller es un breve tutorial inédito sobre mínimos cuadrados (tenía curiosidad y lo revisé también solo para encontrar algunas inexactitudes, pero bueno, no trabajo para este tipo).

Notaré que al crear su página de Google Scholar, Miller no solo ingresó su nombre y dirección de correo electrónico (obligatorio). Hizo el esfuerzo de personalizar la página, incluida la adición de palabras clave y un enlace a su página de inicio, y al hacerlo siguió su propio consejos generales para curar el CV de uno (curiosamente, también da consejos sobre entrevistas de trabajo, incluso sobre el afeitado, ¿supongo que solo las mujeres se entrevistan para trabajos?). Pero estoy divagando: la pregunta es, ¿por qué su página de Google Scholar muestra estadísticas de publicación masivamente infladas basadas en artículos que no son suyos? He visto esto antes, y en un caso en el que tenía pruebas sólidas de que se hizo deliberadamente para engañar, lo denuncié como fraude. Independientemente de las motivaciones de Miller, al observar sus publicaciones reales confirmé lo que sospechaba, a saber, que apenas tiene experiencia en el análisis de datos del mundo real. Estoy dispuesto a atribuir su vergonzosa «declaración» al analfabetismo estadístico y la ingenuidad.

En resumen, la declaración de Steven Miller no proporciona evidencia alguna de fraude electoral en Pensilvania.

Fuente del artículo

Deja un comentario