Tendencias de radar a tener en cuenta: octubre de 2022 – O’Reilly

Septiembre fue un mes ocupado. Además de la fascinación continua sobre la generación de arte con DALL-E y sus amigos, y las preguntas que plantean para la propiedad intelectual, vemos que suceden cosas interesantes con el aprendizaje automático para procesadores de baja potencia: usar atención, mecanismos, junto con un nuevo microcontrolador que puede funcionar durante una semana con una sola batería AA. En otras partes del universo técnico, la “ingeniería de plataformas” se ha propuesto como una alternativa tanto a DevOps como a SRE. Hemos visto demostraciones de ataques tipo inyección SQL contra GPT-3; y empresas como Starbucks, Chipotle y Universal Studios están ofreciendo programas de fidelización basados ​​en NFT. (Además de una demostración de asado a la parrilla de bistec de Chipotle en el Metaverso).

Inteligencia artificial

  • Facebook/Meta sube la apuesta por las imágenes generadas por IA: tienen un sistema que crea videos de una descripción en lenguaje natural. Los videos actualmente están limitados a cinco segundos. no es abierto al público.
  • Los transformadores, que tienen una clave para el progreso en el procesamiento del lenguaje natural, ahora están siendo adaptado para trabajar en visión artificialmostrando redes neuronales convolucionales.
  • Un grupo de investigadores está hablando de traer mecanismos de atencion a aplicaciones TinyML con recursos limitados. Los mecanismos de atención son la innovación central que condujo a herramientas de lenguaje como GPT-3. La atención de bajo consumo podría revolucionar las aplicaciones de IA integradas.
  • AGENTE es un nuevo punto de referencia para el «sentido común» en IA. Consiste en una serie de animaciones 3D. Un modelo de IA tiene que calificar los videos como «sorprendentes» o «esperados». Para obtener una puntuación alta, el modelo debe demostrar una capacidad de planificación similar a la humana, además de comprender conceptos como la física básica.
  • Susurro es un nuevo modelo de IA de voz a texto de OpenAI. Su precisión es impresionante y, a diferencia de otros productos OpenAI, es de código abierto.
  • El gorrión de Google es un chatbot de IA experimental que ha sido entrenado para no generar respuestas «peligrosas» (desde discursos de odio hasta consejos financieros y reclamos de sensibilidad). Está lejos de ser perfecto, pero parece ser una mejora significativa con respecto a la tecnología de chat actual.
  • ¿He sido entrenado? es una aplicación web que busca imágenes específicas en el LAION-5B conjunto de datos, que se utilizó para entrenar varios modelos de generación de imágenes. Puedes buscar usando imágenes o texto. Es útil para descubrir si su obra de arte o fotos se usaron en el entrenamiento.
  • Arte generado por herramientas de IA como Midjourney y Stable Diffusion están comenzando a aparecer en los sitios web de fotografías de archivo. Getty Images tiene prohibido Contenido generado por IA porque les preocupan las violaciones de derechos de autor.
  • Un nuevo modelo para analizar imágenes de rayos X de tórax aprende de informes médicos en lenguaje natural escrito cuando se tomó la imagen, en lugar de imágenes etiquetadas después del hecho. Su precisión es aproximadamente equivalente a la de los radiólogos humanos.
  • Segmentación panóptica amodal es un nuevo algoritmo de visión que permite que los sistemas identifiquen objetos que están parcialmente oscurecidos por objetos en el frente. Esta podría ser una tecnología importante para mejorar la capacidad de los vehículos autónomos para identificar a los peatones con éxito.
  • Huggingface ha lanzado un kit de herramientas para construir modelos de difusión. Los modelos de difusión son la tecnología utilizada por DALL-E, Stable Diffusion y otras herramientas de IA que crean imágenes a través de procesos aleatorios.
  • El inglés es el idioma dominante para la investigación de IA, y eso inevitablemente introduce sesgos en los modelos. IGLUE (Image-Grounded Language Understanding Evaluation) es un punto de referencia que prueba el rendimiento de un sistema de IA en 20 idiomas diferentes e incluye imágenes específicas de la cultura.
  • PromptBase es un mercado secundario donde puede comprar y vender solicitudes para sistemas de aprendizaje automático. Actualmente están solicitando avisos para DALL-E, Midjourney, Stable Diffusion y GPT-3. Este mundo se está desarrollando muy rápidamente.
  • Contradiscurso automático es un modelo de lenguaje que genera respuestas apropiadas que confrontar y contestar el discurso de odio. Es otro ejemplo de un lenguaje extenso que ha sido adaptado para un propósito específico con capacitación especializada.
  • Simon Willison y Andy Baio han creado una herramienta para explorar 12 mil millones de las imágenes utilizado para entrenar el generador de imágenes de difusión estable. Sus resultados son fascinantes.
  • Computación neuromórficaque se basa en chips especializados que emulan las neuronas humanas, es mejor para identificar objetos que las redes neuronales tradicionales y utiliza mucha menos energía.
  • ¿Qué sabe GPT-3 sobre ti? Posiblemente bastante; mucho de esto puede ser incorrecto; y algunos de ellos podrían ser dañinos (por ejemplo, estar vinculados al «terror»).
  • Un adolescente ha creado una herramienta que utiliza el aprendizaje automático para detectar elefantes y humanos en tiempo real a partir de imágenes infrarrojas tomadas por drones. Esto podría ser invaluable para prevenir la caza furtiva.

Programación

  • El artículo de Stephen O’Grady sobre licencias de código abierto de cebo y cambio es una lectura obligada.
  • Es ingeniería de plataformas un alternativa tanto a DevOps como a SRE? La ingeniería de plataformas es la disciplina de «construir cadenas de herramientas y flujos de trabajo que permiten capacidades de autoservicio para organizaciones de ingeniería de software en la era nativa de la nube».
  • Nbdev2 vamos cuadernos git y jupyter jugar bien juntos, resolviendo un problema importante para la colaboración con portátiles. La colaboración y el control de versiones ya no funcionan en propósitos cruzados.
  • Tauri es un marco basado en Rust para crear aplicaciones de escritorio. es conceptualmente similar a electrónpero usa Rust para el backend y genera archivos ejecutables mucho más pequeños.
  • Para aquellos que no se llevan bien con los IDE, aquí hay un breve tutorial sobre cómo ejecutar Github Copiloto en la terminal con Vim. ¿Alguien ha hecho esto con Emacs?
  • Bryan Cantrill en Rust y el futuro de los sistemas embebidos de baja latencia: Rust es el primer lenguaje desde C que vive en la frontera entre el hardware y el software.
  • Explicación busca la documentación de cada comando y sus argumentos en una línea de comando bash shell. Inteligente.
  • CONSULTA HTTP es un nuevo método que se ha agregado a HTTP para admitir la creación de API. Las solicitudes de CONSULTA son seguras; nunca alteran el recurso que se consulta. La consulta se coloca en la carga útil de la solicitud, en lugar del URI. Y las respuestas de una CONSULTA se pueden almacenar en caché.
  • Fuzzing es una poderosa técnica de prueba; significa observar cómo el software bajo prueba maneja datos aleatorios. Dr. Caos es un nuevo marco de fuzzing para C, C++ y Objective-C.
  • Pruebas basadas en trazas es el siguiente paso adelante en la observabilidad. Significa usar datos de pruebas ejecutadas durante el desarrollo de software en operaciones, para determinar exactamente qué tipos de eventos pueden ocurrir y cómo.

Seguridad

  • La seguridad de la cadena de suministro de software es más importante que nunca; microsoft reclamación (es que el grupo de ciberdelincuencia Lazurus, patrocinado por Corea del Norte, está agregando puertas traseras a muchos programas y bibliotecas de código abierto ampliamente utilizados.
  • Caos es un nuevo malware que puede infectar dispositivos Windows y Linux, incluidos enrutadores, firewalls y otro hardware de red. Se está extendiendo en la naturaleza; se propaga aprovechando las vulnerabilidades conocidas.
  • Ataques de inyección rápida contra GPT-3: Simon Willison demuestra una nueva amenaza de seguridad que es similar a la inyección SQL. Esto será un problema para las aplicaciones GPT-3 que combinan avisos de usuarios que no son de confianza con avisos generados por la aplicación.
  • El Atlantic Council ha publicado un reporte describiendo una estrategia internacional para asegurar el Internet de las Cosas. El informe se basa en estudios de casos en los EE. UU., el Reino Unido y APAC, y se centra en hogares inteligentes, redes y telecomunicaciones.
  • Sombreado de dominioen el que un grupo criminal secuestra un servidor DNS para insertar sus propios dominios bajo los dominios legítimos, sin modificar los dominios legítimos, se está convirtiendo en una amenaza cada vez más importante.
  • Un experimento que demuestra el peligro de vigilancia automatizada mostró que era posible encontrar personas y ubicaciones en las fotos de Instagram utilizando fuentes de datos de cámaras (tanto abiertas como privadas) instaladas en lugares públicos.
  • La popularidad de ataques de navegador en navegadoren el que un sitio comprometido roba información mediante la creación de un navegador falso dentro de la ventana activa del navegador, está aumentando.
  • vista de calle le da a Google una ventaja en la creación de experiencias inmersivas de diferentes lugares. ¿Es esto un pago inicial en el Metaverso?
  • El grupo de ransomware LockBit puede estar preparándose para usar denegación de servicio distribuida (DDOS) ataques como otra forma de extorsión. También están aprendiendo a defenderse de las víctimas de ransomware que los atacan con DDOS en lugar de pagar.

Web3

  • starbucks, chipotlee incluso estudios Universales han desarrollado NFT basado programas de lealtad. Chipotle incluso tiene una experiencia de parrilla simulada, realizada en su propiedad Metaverse.
  • La criptomoneda se puede utilizar para pagar impuestos en Colorado. Utah está listo para seguir.
  • ¿Se puede utilizar Web3 como herramienta para combatir el cambio climático? fred wilson apunta a esfuerzos como Nueva Atlántidapara la biodiversidad marina, y la Protocolo Tucán, un mercado voluntario de carbono. La tesis de Wilson es que el trabajo contra el cambio climático será financiado colectivamente.
  • Andreessen Horowitz ha presentado una Licencia «Don’t Be Evil» para NFT, similar (en concepto) a las licencias Creative Commons. Hay seis tipos distintos de licencia, incluida una licencia de «derechos comerciales exclusivos» y una «licencia universal»; algunas licencias prevén la revocación automática por incitación al odio.

Metaverso

  • Algunos estudios muestran que los pacientes de cirugía que reciben un programa de realidad virtual para ver durante un procedimiento requieren menos anestesia. La realidad virtual también puede ayudar en la recuperación postoperatoria.
  • Una agencia de modelos está usando modelos reales para crear avatares Metaverse para uso en publicidad. Las caras se basan en fotos en 3D; Los cuerpos se sintetizan. Los modelos reciben voces y personalidades únicas. Los avatares se venden como NFT que caducan después de un tiempo determinado.
  • Ethereum ha hecho la transición a Prueba de participación. PoS proporciona su propio conjunto de desafíos, pero requiere mucha menos energía y debería soportar tasas de transacción significativamente más altas. Nada se rompió, el precio de las principales criptomonedas se mantuvo estable y el El mercado de equipos usados ​​ahora está inundado de GPU.
  • Neal Stephenson dice que el Metaverso “comenzará con el pie izquierdo” si deja atrás a las personas que usan pantallas 2D. En la década de 1990, no previó la sofisticación de los juegos modernos, específicamente la capacidad de navegar espacios 3D con hardware 2D. Stephenson es co-fundador Lamina1una empresa que construye una «capa base» para un metaverso abierto.
  • Roblox está desarrollando avatares que pueden reflejan las expresiones faciales de sus dueños durante el juego en tiempo real.

Computación cuántica

Biología

  • A prótesis de memoria podría ser capaz de restaurar la memoria a las personas con enfermedades como el Alzheimer. La prótesis genera señales similares a las señales que generan las neuronas al crear o activar recuerdos.
  • Los fabricantes de biomateriales de alto rendimiento, como la proteína de seda de araña y el micelio, están empezando a escalar la producción. La biología sintética se está volviendo real.
  • Una nueva terapia genética intenta diseñar células B humanaslas células que producen anticuerpos, para atacar enfermedades raras mediante la fabricación de enzimas que faltan.

Hardware

  • los MAX78002 es un microcontrolador de baja potencia diseñado para ejecutar redes neuronales en aplicaciones informáticas de borde. Hay afirmaciones de que puede funcionar durante una semana con una sola batería AA. Tiene 64 procesadores paralelos y puede ejecutar una red con hasta 3,5 millones de parámetros.
  • Los chinos planean construir una presa con una impresora 3D distribuida, sin utilizar mano de obra humana directa. Podría decirse que no hay impresora en absoluto; el trabajo lo realizan robots controlados por IA que vierten el hormigón y lo extienden en capas.
  • NVidia tiene un nuevo chip GPU con hardware especializado para modelos de transformadores de entrenamiento. Es 4,5 veces más rápido que su anterior GPU de centro de datos de alto rendimiento.
  • China ha desarrollado sus propias GPU, la Biren 100 y Biren 104. Esto reducirá en gran medida su dependencia de NVidia para el hardware informático de alto rendimiento.
  • Potencia de la batería desempeñó un papel importante para ayudar a que la red eléctrica de California sobreviviera la ola de calor de septiembre sin cortes.

Aprende más rápido. Excavar más hondo. Ver más lejos.



Fuente del artículo

Deja un comentario