Razonar, programar tareas y mucho, pero mucho, dinero
Volvimos post año nuevo (muchas felicidades!) con noticias, reflexiones y herramientas.
En la edición anterior, el año pasado, nos despedimos hablando sobre cómo la IA a la que se la “deja pensar” da mejores resultados. Esos modelos que “piensan más tiempo” se los simplifica bajo el nombre de modelos de razonamiento, el más popular es el modelo o1 de OpenAI.
Arrancamos el 2025 hablando sobre otro modelo de este grupo, el R1 que en algunas calificaciones supera a o1 pero que además tiene puntos muy interesantes para analizar:
Es chino (así que a los temas “sensibles” responderá con (Sorry, that's beyond my current scope. Let’s talk about something else.”)
Es de código abierto con una licencia de comercialización muy amigable (o sea de tener recursos técnicos uno podría vender este servicio)
La Api cuesta entre 5 a 10 % lo que cuesta la de OpenAI (que también mencionamos que a la hora de hacer herramientas es algo a tener en cuenta)
Parece que la organización que se llama “Inteligencia Artificial Libre” y que busca cada vez con mayor insistencia un modelo comercial cerrado pierde contra una empresa china, teniendo en cuenta todas las restricciones de ese mercado/sociedad.
Lo que me parece también muy interesante es que hay disponible un modelo “chiquito” que se puede ejecutar de forma local y que es bastante interesante para probar.
Tiempo = competencia
OpenAI por su parte prevé lanzar o3 el “mejor modelo” de razonamiento de la compañía en las próximas semanas, con el o3 mini libre para “todo el mundo”. Ese modelo lo presentaron durante su calendario de adviento de fin de año donde mostraron diferentes recursos como Sora que muchos ya están implementados y que, bueno, bastante beta todo.
Por ahora, el modelo “grande” sería solo para el equipo PRO (200 dólares al mes) y el mini para los Plus (20 dólares al mes) con “muchos usos”.
Como nota marginal, también con muchas fallas, ya están disponibles las “tareas” en los usuarios plus y pro que permiten programar actividades como por ejemplo “un resumen de noticias sobre X tema cada una hora”.
Interesante propuesta, pero no sé si aún bien implementada. Posiblemente en unas semanas sea mejor la experiencia. Hoy se pueden pedir hasta 10 tareas y hasta 4 ejecuciones por hora de una misma tarea, con posibilidad de que navegue en internet y que nos notifique por push o mail (aunque en el mail solo llega un enlace para ver la conversación).
Por otro lado, ayer presentaron a los Operadores, modelos de IA entrenados para navegar por internet y cumplir objetivos, como entrar a una tienda y comprar una lista de cosas (por ejemplo lo que falta para la cena).
También en beta, pero por lo que dicen los reportes funciona bastante mejor de lo esperado para algo que requiere acción del usuario de manera constante en tareas como poner una tarjeta de crédito o confirmar reservaciones.
Lo “malo” es que para probarlo hay que estar en EEUU y tener el plan Pro (ese de 200), aunque con VPN se puede, pero se corre el riesgo de un baneo. En este post de X se puede ver una demo.
Wow! Mucho (pero mucho) dinero
No menor es el anuncio de la formación de un grupo de empresas que planean invertir 500.000 millones de dólares para el desarrollo de infraestructura de IA en los próximos años: el proyecto Stargate.
Los principales protagonistas son las empresas OpenAI, SoftBank y Oracle, como cabeza de lanza, aunque con varios otros como socios estratégicos, como Microsoft que prometió 80 mil de esos millones.
La foto no es casual, Trump entre las primeras acciones que tomó cuando llegó al poder fue eliminar una orden ejecutiva que obligaba a las empresas a mostrar sus modelos al Estado antes de lanzarlos al público. Tampoco es casual que Musk no está muy contento…
Vi algunas comparaciones de cuánto saldrían algunos proyectos históricos hoy ajustados por inflación como para tomar dimensión, porque es tanto dinero que cuesta:
-Hacer la bomba atómica saldría hoy 35.000 millones de dólares (si arrancáramos desde lo técnico como en el proyecto Manhattan).
-Hacer la estación espacial internacional unos 330.000 millones de dólares
-El PBI de Argentina según el Banco Mundial el 2023 fue de 640.000 millones (o sea el valor final de todos los bienes y servicios que el país generó en todo el año).
Modelos de voz
Vamos a ir con algo más tranqui, un nuevo modelo de voz (por ahora solo en inglés, japonés, francés, chino y coreano) que lee de forma convincente lo que le escribimos. Es más bien útil para generar contenido liviano o voces en off de forma gratuita.
No tiene mucha ciencia, se incorpora el texto, se elije el modelo y “Generate”.
GPT entra con fuerza en las aulas
Un reciente estudio del Pew Research Center revela que cada vez más adolescentes recurren a ChatGPT para realizar tareas escolares. Según la encuesta, el 26% de los estudiantes de entre 13 y 17 años lo usan para tareas, el doble que en 2023. Sin embargo, las opiniones varían según el tipo de uso: el 54% considera aceptable emplearlo para investigar nuevos temas, pero solo el 18% está de acuerdo con usarlo para escribir ensayos.
Estos datos son de EEUU, quedamos a la espera de estudios similares en Argentina o España para ver dónde estamos parados. Como otro dato, algunas instituciones estadounidenses tienen ya sus propias IA para que usen los alumnos. Si no puedes contra ellos…
¿Y los demás?
Anthropic: anuncian que Claude va a tener acceso a internet en tiempo real en breve, mejora en los límites de consumo (que cada vez son más bajos) y por lo visto no falta mucho para que lleguen los modelos de la generación 4.
Perplexity: está muy interesante la api Sonar, la versión de su modelo con acceso a internet para desarrollo de apps, está en mi lista para la próxima versión de RedactaPro (la herramienta que hicimos en Tres Barbas para medios).
Microsoft: ya no tiene el control de lo nuevo de OpenAI, ahora otros actores pueden acceder a la tecnología y nuevos proyectos (como lo que vimos arriba) pero los creadores de Windows se quedan con la preferencia (si hay algo nuevo OpenAI se lo tiene que mostrar primero a ver si les interesa).
Google: presentó Gemini 2.0 Flash Thinking un nuevo modelo gratuito que vuelve a superar los estándares y bueno, lo que se sabe con cada mejora. Se puede probar gratis acá.
ByteDance: lanzó su nuevo modelo Doubao-1.5-pro que supera al estándar (pero está debajo de los razonadores. Otra empresa china que también se mete en el juego y esta con precios aún mejores y promesas de modelos que gasten menos recursos de computo.
Qué estoy usando
En esta sección de cierre te cuento qué herramientas estoy usando en este momento porque, desde mi visión y uso, me da los mejores resultados (por respuesta o por costos).
Es algo súper íntimo y pueden no estar de acuerdo, pero creo que es una manera interesante de no solo decir “existe esto” si no “yo lo uso así” (o no).
Texto: o1 (plan plus), Redacta.Pro (de pago).
Video: Por ahora nada.
Audio: Elevenlabs (Free) y Adobe Audition (Pago).
Imágenes: Dall-E 3 (Pago) y Adobe Photoshop (Pago), BlinkShot (gratis, pero limitada) y ahora ImagenFX (3)
Programación: GPT 4o Canva o o1 plus
Buscador: Google y GPT Search (de pago).
Música: Suno.
Miscelánea: Endless.
Es todo por hoy, espero que les sirvan los datos y que si les gustó lo compartan con sus amigos y familia (?)