Las noticias del mes pasado nuevamente han estado dominadas por la IA, específicamente modelos de lenguaje grande, específicamente ChatGPT y el motor de búsqueda impulsado por IA de Microsoft, Bing/Sydney. Si bien existen formas bien conocidas de hacer que ChatGPT se comporte mal, es desconcertante que Sydney fuera inicialmente abusivo e insultante para los usuarios que cuestionaban su corrección, incluso cuando Sydney estaba claramente equivocado. (Ahora ha sido restringido). Ya sea intencional o no (y, cuando uso mi sombrero de papel de aluminio, sospecho que es intencional), los usuarios de Bing/Sydney se convirtieron en parte de un experimento sobre cómo reaccionan los humanos ante una IA que se ha vuelto rebelde.
Los programadores se han sentido en gran medida cómodos con herramientas como GitHub Copilot; ahorra tiempo y esfuerzo, y pocas personas sienten que sus trabajos están amenazados. La startup Fixie.ai tiene como objetivo cambiar eso: el fundador Matt Welsh dice que la programación tal como la conocemos se acabó y, en el futuro, nadie necesitará escribir código. (Sin embargo, los humanos aún necesitarán escribir especificaciones y pruebas, lo que puede ser otro tipo de programación).
Aprende más rápido. Excavar más hondo. Ver más lejos.
Inteligencia artificial
- Facebook/Meta ha anunciado un gran modelo de lenguaje llamado Llama eso es 1/10 del tamaño de GPT-3 y puede ejecutarse en una sola GPU, pero reclama un rendimiento equivalente. Una versión simplificada de Llama está disponible en GitHub.
- ChatGPT ha dicho a muchos usuarios que OpenCage, una empresa que brinda un servicio de geocodificación, ofrece una API para convertir números de teléfono en ubicaciones. ChatGPT incluye código de Python para usar ese servicio. Ese servicio no existe y nunca ha existido, pero la información incorrecta ha generado mucho tráfico no deseado (y solicitudes de soporte) a su sitio.
- La oficina de derechos de autor de EE.UU. ha emitido un decisión declarando que las imágenes generadas por los sistemas de IA no tienen derechos de autoraunque otras partes de un trabajo que contiene imágenes generadas por IA sí lo son.
- La visión de Matt Welsh de la futuro de la programación: no hay uno. La programación apesta, así que deja que una IA lo haga. Los humanos escriben especificaciones (gerentes de productos), prueban y revisan el código generado automáticamente y entrenan modelos para usar nuevas API.
- Así como las modificaciones relativamente pequeñas de una imagen pueden hacer que las IA de reconocimiento de imágenes cometan errores, una herramienta llamada Glaze puede hacer modificaciones indetectables al trabajo de un artista que dificulta que los modelos de arte generativo copien el estilo del artista.
- Meta ha desarrollado un modelo de lenguaje que puede acceder a información adicional (calculadoras, motores de búsqueda) llamando a las API. Está entrenado usando un pequeño conjunto de ejemplos escritos por humanos que le muestran cómo llamar a las API.
- Búsqueda impulsada por LLM de Bing/Sydney se comporta de manera extraña, particularmente si cuestiona su precisión y lo señala a recursos con información precisa. Microsoft tiene desde limitado la duración de las conversaciones y restringió lo que Sydney puede hablar.
- Atribución estable intenta encontrar las fuentes detrás de una imagen generada por IA. Está lejos de ser perfecto y puede que no esté haciendo nada más que encontrar imágenes similares; si le das una foto que hayas tomado, felizmente encontrará imágenes de “fuente” en los conjuntos de entrenamiento utilizados para Stable Diffusion y otros generadores de imágenes. Sin embargo, es un intento interesante de revertir el proceso.
- Fixie.ai ha anunciado una nueva forma de construir software con modelos de lenguaje: proporcionar una pequeña cantidad de ejemplos (aprendizaje de pocas tomas) y algunas funciones que brindan acceso a datos externos.
- TensorFlow.js no es nuevo, pero puede estar ganando popularidad, ya que el aprendizaje automático se traslada gradualmente al navegador. Con un mejor rendimiento de WebAssembly y WebGPU, la ejecución de aplicaciones ML en el navegador se está volviendo competitiva.
- Google ha anunciado un servicio de chat de IA que estará abierto al público. El servicio se llama Bard, se basa en su modelo de lenguaje LaMDA y actualmente está abierto a un grupo limitado de evaluadores.
- Gen-1 es un modelo generativo basado en texto para video. Al igual que Stable Diffusion (desarrollado por el mismo grupo, Runway Research), te permite describe lo que quieres en un videoluego lo edita con razonable precisión.
- Hacer un vídeo (MAV3D) demuestra un sistema de IA que genera video 3D a partir de la descripción del texto. Se originó en el laboratorio de inteligencia artificial de Meta.
- Un nuevo algoritmo de IA ayuda a los científicos a visualizar conjuntos de datos extremadamente grandes.
- MusicLM es un modelo de lenguaje generativo que genera música de descripciones textuales. Al igual que con otros proyectos de Google, hay algunas muestras intrigantes disponibles (el reggae es particularmente bueno), pero el modelo no está abierto al público. Una reimplementación de código abierto de MusicLM es disponible en GitHub.
- CarperAI tiene entrenó un modelo de IA para modificar el código, en lugar de escribirlo, usando las diferencias entre las versiones enviadas a GitHub. El uso de diferencias les brinda un modelo que se ha ajustado para corregir errores, en lugar de escribir código nuevo.
- Un equipo de investigadores ha desarrollado marcas de agua para texto generado por IA: patrones en el uso de palabras que identifican un texto como generado por IA. No está claro cuándo (o cómo) llegarán a la producción, ya que eso requeriría la cooperación de las empresas que desarrollan modelos de lenguaje.
Programación
- Los desarrolladores web que trabajan con Vue pueden hacerse una idea de lo que viene en 2023. Vue es una alternativa rápida y liviana a React que se basa en tecnologías web clásicas en lugar de convertir todo en JavaScript, un punto señalado por Alex Russell en El mercado de los limones.
- GitHub Copilot ahora es responsable de 46% del código de los desarrolladoresfrente al 27% cuando se lanzó en junio de 2022.
- SQLite en el navegador con WASM: ¿Qué tipos de aplicaciones permitirá esto?
- Un recorrido por Google compilador de cifrado completamente homomórfico (FHE). FHE realiza cálculos sobre datos cifrados sin descifrarlos. Una versión de código abierto del compilador para C++ es disponible.
- Una introducción suave a los CRDT es lo que dice que es: una introducción a una estructura de datos que permite actualizaciones independientes de datos a través de una red mientras resuelve automáticamente los conflictos. Es una herramienta extremadamente importante para crear software para la colaboración.
- El proyecto Istio está agregando un “malla ambiental” que simplifica las operaciones al eliminar el requisito de que cada nodo tenga un proxy “sidecar”. Las capas de proxy se reemplazan por una “malla de plano de datos” que es responsable de la administración de acceso y seguridad de confianza cero.
- La publicación de Sam Newman en plataformas de desarrollo es una lectura obligada. No se trata de construir una plataforma, se trata de permitir que los desarrolladores entreguen, cueste lo que cueste.
- meilisearch es un nuevo y poderoso motor de búsqueda de código abierto, construido en Rust. Incluye características como tolerancia a errores tipográficos y búsqueda mientras escribe.
- No es la primera vez que lo decimos, pero: Los desarrolladores necesitarán cada vez más tener en cuenta los requisitos reglamentarios cuando escriben código.
- Etsy proporciona excelentes ideas sobre cómo ejecutar una Clúster de Kafka en la nube en varias zonas de disponibilidad.
- WebAssembly demuestra ser más eficiente y más rápido que JavaScript en aplicaciones del mundo real.
- Automerge 2.0 ya está disponible. Automerge es una biblioteca CRDT (tipo de datos replicados sin conflictos). Los CRDT permiten que múltiples usuarios accedan a los mismos objetos de datos, fusionando constantemente cambios de múltiples fuentes (como en Google Docs). Es un paso importante hacia la creación de aplicaciones distribuidas.
- Oracle se muda a precios por empleado para Javaun cambio que podría encarecer mucho las licencias de Java para las pequeñas empresas.
- ClimaMáquina ofrece un único adaptador API que puede acceder a todos los mejores modelos del mundo para pronosticar el clima. ¿Son los adaptadores un nuevo paso en la economía de las API?
Seguridad
- el fbi recomienda usar un bloqueador de anuncios cuando navega por la web para reducir sus posibilidades de ser víctima de fraude.
- Ataques al índice de paquetes de Python (PyPI), el repositorio de código de Python, continúa. Recientemente se cargaron más de 450 paquetes maliciosos y los ataques se han vuelto más sofisticados. El malware observa el portapapeles del usuario en busca de direcciones de billeteras criptográficas y las sustituye con el dirección de la billetera del atacante.
- El administrador de paquetes de nodos, NPM, ha sido objeto de ataques. Los paquetes maliciosos instalan criptomineros en las computadoras de los usuarios.
- Aplicaciones falsas de ChatGPT se utilizan para propagar malware.
- Después de irrumpir en un sistema, los atacantes utilizan una herramienta de comando y control multiplataforma de código abierto llamada Estragos. Havoc incluye una serie de módulos para la ejecución remota de comandos, la descarga de archivos adicionales y la manipulación de procesos.
- Una API segura necesita autenticar y autorizar cada intento de acceder a ella correctamente. A su vez, esto requiere distribución fiable y fiable de los datos de identidad.
- El Instituto Nacional de Estándares (NIST) ha anunciado un estándar criptografía “ligera” algoritmo. Este algoritmo ha sido diseñado para CPU con capacidades limitadas, específicamente CPU utilizadas en dispositivos de “Internet de las cosas”.
- Resumen tardío de Bruce Schneier sobre SolarWinds: El mercado no premia la seguridad. SolarWinds era rentable y la firma de capital privado que la posee quería que fuera más rentable. Beneficio a corto plazo, financiación insuficiente a largo plazo de la seguridad.
- Bruce Schneier en Seguridad de aprendizaje automático: todavía estamos en los primeros días de comprender cómo proteger los sistemas ML contra ataques. Pero ya sabemos que el eslabón más débil será el software que rodea al sistema ML.
- “Capture the Flag” se juega con frecuencia en las conferencias de seguridad informática: en un entorno controlado, los defensores intentan proteger sus sistemas de los atacantes. ¿Qué sucede cuando los agentes controlados por IA juegan el juego?
- El FBI y la policía de Europol han incautó los servidores para el ransomware como servicio de Hive grupo. Penetraron en la red de Hive en julio de 2022, lo que les permitió acceder a las claves de descifrado y dárselas a las víctimas.
Web, Web3 y el metaverso
- Jaron Lanier y otros han propuesto que los grandes modelos de lenguaje se pueden usar para crear mundos virtuales.
- Google ya no degradará el contenido generado por IA en sus resultados de búsqueda.
- rápido de Programa de avance rápido proporciona servicios gratuitos de CDN a proyectos de código abierto y organizaciones sin fines de lucro que hacen del mundo un lugar mejor. Mastodontecon su visión de redes sociales abiertas y federadas, es uno de los proyectos que apoya Fastly.
- Apple está desarrollando software para ayudar crear aplicaciones de realidad mixta para los auriculares que planean lanzar en 2023. Según rumor, los auriculares de Apple son un producto diferente de sus gafas AR; este último aparentemente se ha retrasado hasta finales de 2023.
- El DMV de California está poniendo títulos de automóviles en una cadena de bloques. Otros registros públicos pueden seguir. Si bien aún no han creado aplicaciones orientadas al público, las posibilidades incluyen NFT que representan títulos de automóviles.
Computación cuántica
- Google ha hecho una pequeña pero significativa mejora en su capacidad para construir qubits con errores corregidos. Han demostrado que la corrección de errores puede escalar: el uso de más qubits físicos para crear un qubit lógico con corrección de errores reduce la tasa de error real.
- Un nuevo tipo de qubit agrega un “chanclas” puerta lógica al repertorio de operaciones cuánticas.
- Los investigadores han demostrado una técnica para transferir qubits de un chip a otro sin destruir su comportamiento cuántico. La capacidad de conectar chips cuánticos es un paso crítico hacia la construcción de computadoras cuánticas lo suficientemente grandes como para realizar un trabajo útil.
Biología
- CRISPR se puede utilizar para moscas ingenieras que no pueden propagar enfermedades entre plantas Esta puede ser una forma de limitar la propagación de enfermedades de los cultivos, particularmente de enfermedades propagadas por plagas cuyo alcance se está expandiendo debido al calentamiento global.
- ¿Semillas de código abierto? Casi todas las semillas utilizadas en la agricultura están patentadas y los agricultores han sido demandados por guardar semillas para usarlas en las cosechas del próximo año. El Iniciativa de semillas de código abierto proporciona semillas con una licencia que no restringe cómo se usan las semillas.
- El proyecto de extinción ha añadido la Vejestorio a la lista de especies que planea restaurar.