inteligencia artificial – Cyrus Smith en el desierto

(El bueno) 2021LM – Sobre la traducción con IA (I)

Crónica de mis problemas al usar un software de traducción con IA. Desde fallos con LLMs locales hasta errores con la API de Gemini. Una historia de bugs.

Este texto ha sido generado por Gemini 2.5/3.1 a partir del audio del autor. El contenido y las ideas son íntegramente del autor; la redacción ha sido asistida por IA.

¿Qué pasa, gallinicas mías? Aquí vuestro reportero más dicharachero de barrio Sésamo, grabando este audio directamente desde un S24 Ultra. ¿La razón? Pues que a uno se le olvidó poner a cargar el iPhone anoche y esta mañana andaba con la batería justa para ir a la compra. Ya sabéis que los viernes no trabajo, así que me tocaba a mí hacer los recados del fin de semana.

La cosa es que tuve que ir dos veces. La primera fui demasiado temprano y, claro, Inconveniente me recordó que faltaban las tortas para los burritos. Así que, vuelta al súper. Y fue justo ahí, en mitad del segundo viaje, cuando me di cuenta del percal de la batería. Menos mal que los iPhone son como son: te dicen que no tienen batería, pero con un 1% aguantan medio día. Una pequeña odisea matutina que no era más que el preludio de la odisea tecnológica que os vengo a contar.

Porque, como siempre, primero viene el hype, la expectación, y luego llega el tío de la rebaja. Hoy os voy a hablar de una aplicación de traducción que, sinceramente, tiene más pegas que un colegio en septiembre. Pero antes, un pequeño inciso.

Paréntesis Kafkiano: Una Charla con Gemini

Próximamente vais a ver un par de «pataticas» (mis pequeños experimentos sonoros) muy estrambóticos, creados con Notebook LM de Google. Resulta que el otro día, mientras esperaba una llamada, me lié en una conversación surrealista con Gemini. Empecé preguntando por la constante de la gravitación universal y terminamos debatiendo sobre el sentido de la vida. Una locura.

Publicaré la conversación completa en mi blog, rfog.es, para que veáis lo kafkiano que puede llegar a ser un LLM cuando está de dulce. Y que conste, para los que se quejan, que a mí Gemini me está funcionando de cojones, tanto en lo personal como en el trabajo. Sin ir más lejos, el otro día me salvó el culo con una API REST. Estaba convencido de que el fallo era del servidor, pero Gemini me generó un script curl y encontró el problema en mi código: un valor que, según la documentación, tenía que ser ‘1’ aleatoriamente. ¡Toma ya!

La Herramienta de Traducción: Un Pozo de Problemas

Volvamos al lío. El programa de traducción del que os hablaba es un desastre. Para empezar, se queda colgado sin motivo aparente. Simplemente se para, sin errores en el log ni nada. Sospecho que se queda esperando una respuesta del LLM local que nunca llega, y la única solución es matar el proceso del navegador y todas las consolas abiertas. Un simple reinicio no basta, hay que aniquilarlo todo.

Pensé que podría ser culpa de mi LLM local. Aunque uso un modelo potente de 7 u 8 billones de parámetros, a veces falla diciendo que los placeholders no funcionan bien y que necesitaría un modelo superior. Probé con uno de 109 billones de parámetros y… el mismo fallo. El problema no es el modelo; es el software que no recoge bien la respuesta, porque yo veo en la consola de LM Studio que la respuesta se ha generado. Un bug de esos que los barbudos dejan para el final por lo complicados que son.

Plan B: ¿Y si Pagamos por la API de Gemini?

Cansado del LLM local, decidí probar con la API de Google. Me generé un token y a correr. El primer modelo de Gemini que probé estaba obsoleto. ¿Me avisó el programa? No. Tuve que descubrirlo yo mirando la consola después de media hora. El segundo modelo que elegí, más moderno, daba otro error críptico en un campo que impedía su uso. De nuevo, cero feedback en la interfaz.

Finalmente, con Gemini 1.5 Lite, la cosa empezó a funcionar. ¡Aleluya! Pero la alegría duró dos minutos. La API empezó a devolver mensajes de «estoy muy ocupado, prueba en otro momento». ¡Pero si estoy pagando tokens, coño! Me da igual que tardes más o menos, ¡estoy gastando dinero! ¿Encima de que pago, no funciona? Venga, hombre, no me toques los cojones.

Victoria Pírrica y Fallos Inexcusables

Tras un sinfín de arranques, paradas y «mataciones» de procesos, conseguí traducir una revista de ciencia ficción de 200 páginas (lo que equivale a un libro de 400). El coste fue ridículo, unos 50 céntimos. Pero el proceso fue un infierno. El programa no reintenta bien los fallos y, para colmo, no hace algo tan básico como cambiar la etiqueta de idioma en los archivos XHTML de ‘en’ a ‘es’, lo que rompe la separación de sílabas y otras funciones en los lectores de eBooks.

Podría forquear el proyecto, que es Python, y arreglarlo. ¿Ganas? Pocas, o ninguna. Si tengo que hacerlo, me monto yo mi propia herramienta en C# y me aseguro de gestionar bien los errores. Como dice mi jefe, el 80% del desarrollo lo haces enseguida. Del 20% restante, el 10% cuesta bastante, el 5% cuesta mucho, y el último 5% es ese grano en el culo que no te deja sentarte durante semanas. Este programa se quedó en el 80%.

Sinceramente, ¿qué se puede esperar de Python? Esta mierda y esta basura. Tienes que estar encima constantemente. Y para eso, pues ya me diréis. En fin, no olvidéis esos hechos habitualizaros y recordad los «pataticas» kafkianos que se vienen.

¡Que no os la pique un pollo belga! Ademonio.

LM2018 – Scripts y primeros pasos con la IA en mi MacBook Pro

Descubre mi experiencia real con el MacBook Pro M5 Max con 128GB de RAM. Automatización, scripts, y la ejecución de LLMs locales para traducción.

Este texto ha sido generado por Gemini 2.5/3.1 a partir del audio del autor. El contenido y las ideas son íntegramente del autor; la redacción ha sido asistida por IA.

¡Muy buenas, gallinicas mías! Aquí vuestro reportero de confianza para seguir desgranando las primeras impresiones con mi nueva bestia negra, el MacBook Pro M5 Max con 128 GB de RAM, el máximo que permite la plataforma. Hoy os voy a contar los avances en mis flujos de trabajo, los desafíos que me he encontrado y una joya inesperada en forma de software.

Una de las primeras cosas que hice fue instalar TG Pro, una utilidad para monitorizar temperaturas que compré allá por 2009 con mi primer iMac. Esto me hizo dudar de mis propios recuerdos. Siempre digo que soy un switcher desde 2009, pero es posible que fuera incluso antes, en 2007. Recuerdo haber usado Leopard, que tenía fama de ir bastante mal, antes de que Snow Leopard lo arreglara todo. De hecho, cuando salió el primer iPad, que importé de Estados Unidos, yo ya tenía un Mac desde hacía al menos un año. ¡Quién sabe, igual soy uno de los primeros switchers de España!

El Desafío de la Automatización: Mis Scripts para el Dock

Entrando en materia, he estado trabajando en los scripts que os comenté. La idea es simple: uno para montar unidades y lanzar aplicaciones cuando conecto el dock, y otro para desmontar todo y cerrar apps cuando lo desconecto. La base es un script en ZSH que carga una configuración con listas de programas, dispositivos Bluetooth y unidades de disco a gestionar.

¿Funciona? Relativamente. Me he topado con limitaciones que no son del script, sino de macOS. Por ejemplo, utilizo una utilidad de Homebrew para desconectar dispositivos Bluetooth, pero el sistema operativo simplemente ignora la orden. Es una de esas pequeñas frustraciones que llevan años en macOS y que no tienen sentido. Si le das una orden, debería ejecutarla.

Algo parecido ocurre al desmontar unidades. A veces, macOS se niega a desmontar un disco, incluso el de Time Machine, y tengo que forzarlo manualmente. Investigaré si hay alguna opción de forzado que pueda añadir al script. Son pequeños escollos que me obligan a ejecutar las cosas dos veces o a intervenir, pero la base está ahí y seguiré puliéndola este fin de semana.

Mi «Panel de Control» Personal: Un Centro de Productividad

Mi objetivo principal es crear un panel centralizado para mis flujos de trabajo. Ahora mismo, para procesar mis audios, tengo un script que abre dos ventanas del Finder (origen y destino) y una terminal. Arrastro el audio, lo renombro y ejecuto los comandos para eliminar ruido, transcribir con IA, generar una entrada de blog y subirla. Funciona, pero quiero llevarlo más allá.

Para organizarme, he creado una carpeta en iCloud llamada «Panel» a la que le he dado un color verde para que destaque en el Finder y la he añadido al Dock. Dentro tengo accesos directos a los scripts y herramientas. Al hacer clic en el Dock, se despliega una tira con todo lo que necesito. Es un sistema funcional, pero mi visión final es una aplicación nativa.

Imagino un panel, ya sea en el Dock o en la barra de menús, donde pueda arrastrar un archivo de audio. Al soltarlo, se abriría un diálogo para automatizar los metadatos: que busque el último número de secuencia, que me dé a elegir el tipo de contenido con un selector, y que me permita introducir el título. Finalmente, me daría opciones para procesar el audio, transcribirlo y generar el blog usando un LLM local o uno de pago. Esa es la meta.

La Joya Inesperada: Una Herramienta de Traducción con IA Local

Ayer, gracias a una recomendación de Mosquetero Web, encontré algo que me ha ahorrado una frustración enorme. Me pasó un enlace a un proyecto open source para traducir textos usando LLMs locales. Mi primera reacción, como casi siempre, fue de escepticismo. Pensé: «seguro que esto es una mierda». Pero he de admitir que me equivoqué por completo.

Esta herramienta es una maravilla. Es un ejecutable autocontenido, un bundle, que te bajas, haces doble clic y funciona. Sin dependencias de Python ni complicaciones. Es básicamente lo que yo habría intentado construir, pero mucho mejor de lo que tendría la paciencia de crear. Tiene un panel web muy cuidado donde arrastras los libros, eliges idiomas, modelos y configuraciones. Es simplemente cojonudo.

Explorando el Universo de los LLM: Potencia y Calidad en mi Mac

Gracias a esta herramienta, me he sumergido en la ejecución de modelos de lenguaje en local. He probado el modelo Q-WEN de 35 mil millones de parámetros, que según la web del proyecto es el mejor para traducir al español. La diferencia entre la versión de 4 bits y la de 8 bits es abismal. La de 8 bits tiene una calidad literaria y una capacidad de interpretación muy superiores.

Traduje el editorial de la última revista Analog y el modelo de 8 bits no solo traduce, sino que interpreta el contexto y lo cuadra todo a la perfección. Tardó unas 8 o 9 horas en procesarlo, tiempo durante el cual estuve haciendo otros experimentos con IA generativa de imágenes. El Mac, con el traductor y DEVONthink en marcha, llegó a usar unos 100 GB de RAM, dejándome todavía 28 GB libres. ¡Es una gozada!

El equipo se calienta, sí. El TG Pro marcó picos de 71 grados, pero sin llegar a ser molesto. Podría tenerlo en las rodillas, aunque se calentaría más. Con los ventiladores a máxima velocidad, la temperatura baja a unos 50 grados, pero normalmente se mantiene en 70 con los ventiladores a media velocidad, emitiendo un soplido audible pero no molesto. Eso sí, con esta carga de trabajo, la batería se consume a una velocidad de vértigo.

«Uncensored Heretic»: La IA sin Tapujos

He descubierto una nueva categoría de modelos: los «Uncensored Heretic». Son LLMs entrenados específicamente para ser extremadamente directos, evitando cualquier tipo de sesgo de asistente servil o corporativo. Buscan recuperar la capacidad de razonamiento que a veces se pierde cuando las empresas liman demasiado las respuestas para que sean inofensivas. El siguiente que probaré será uno de estos, la versión 3.6, que promete ser la caña.

He estado comparando. Un modelo de 30 mil millones de parámetros a 8 bits tiene un rendimiento similar a uno de 70 mil millones a 4 bits, pero este último tiene mucho más conocimiento. La clave podría estar en los modelos que pueden buscar en internet, donde uno más pequeño pero conectado podría superar a uno más grande pero aislado.

Pequeños Obstáculos y Futuras Mejoras

La herramienta de traducción tiene una pequeña pega: cada vez que la ejecuto, macOS me pide autorización de seguridad, probablemente por un tema con el certificado de Apple. Antes de reportarlo, intentaré autofirmar la aplicación con unos comandos que me sugirió Gemini. También pienso escribir al desarrollador para sugerirle una mejora: la gestión de géneros para evitar errores comunes, como traducir «ships» (barcos) por «naves» (espaciales).

Esta mañana, un oyente, Marco, me envió un enlace a una herramienta open source para gestionar suscripciones de YouTube, con resúmenes y un visor sin distracciones. Aunque no es exactamente lo que busco para mi panel, es un gran ejemplo. Si encuentro herramientas así de buenas, no necesito construirlo todo yo. Puedo usar mi carpeta en el Dock para lanzar estas maravillas y listo.

De momento, el ansia viva por el nuevo Mac se ha aplacado. Ya tengo flujos funcionales y el camino está más claro. Seguiré probando modelos y puliendo detalles, pero la bestia ya está empezando a ser domada. Y como siempre os digo, no olvidéis sospechosos habitualizaros, ¡que no os la pique un pollo belga!

LM2017 – Llegó la cosecha y la encuesta a mala leche

Ya tengo mi nuevo Mac para IA. Te cuento por qué lo elegí, mis planes para crear un RAG con DEVONthink y mis reflexiones sobre Apple y Microsoft.

Este texto ha sido generado por Gemini 2.5/3.1 a partir del audio del autor. El contenido y las ideas son íntegramente del autor; la redacción ha sido asistida por IA.

¡Qué pasa, gallinicas mías! Aquí vuestro reportero más dicharachero con un batiburrillo de novedades. Y no, esta vez no voy a hablar del señor don Gato. La gran noticia es que, mientras grababa, ha llegado mi esperado equipo grande y negro. Para cuando leáis esto, ya estaré trasteando con él, pero antes de daros la turra con eso, pongámonos al día.

Microsoft, Apple y el «haz lo que digo, no lo que hago»

¿Recordáis aquel audio en el que me quejaba de las encuestas estúpidas de Microsoft? Pues bien, la casualidad ha querido que, uno o dos días después, me saltara una encuesta de Office con cinco o seis preguntas que, por fin, tenían algo de sentido. La respondí de forma no sarcástica y, de momento, no he recibido más. Las coincidencias de la vida.

Hablando de gigantes tecnológicos, esta mañana escuchaba a Carlos Castillo comentar una noticia que yo había pasado por alto: Apple dejó olvidado un fichero de configuración de su IA en una actualización. Lo interesante no es el descuido, sino lo que revela. Si su inteligencia artificial fuera tan avanzada y barata como nos quieren hacer creer, ¿por qué usarían herramientas de terceros como «Cloud de Code»? Sus propios tokens serían más económicos.

Esto me recuerda un poco a la estrategia de Microsoft: te ofrecen unas herramientas mientras ellos internamente usan otras superiores. Es el clásico «haz lo que digo, pero no lo que hago, porque no me lo puedo permitir». Google tardó casi dos años en ponerse al día, así que veremos qué anuncia Apple en la próxima WWDC y, sobre todo, qué es lo que finalmente llega al usuario.

Justificando la compra: Potencia para IA, no para macOS

Seguro que ahora estáis pensando: «Tanto criticar a Apple y te compras un Mac de última generación que solo funcionará con sus nuevos sistemas operativos». Y tenéis razón, pero mi compra no está motivada por macOS, sino por la inteligencia artificial. Si una máquina Windows ofreciera la misma optimización para IA, la habría considerado, pero la realidad es que este M3 Max a tope de cores, con 40 cores gráficos y 128 GB de RAM, es una bestia para lo que quiero hacer.

Algunos me sugeristeis una alternativa: un Mac Studio en el escritorio y conectarme en remoto desde mi MacBook M1 Pro. Agradezco la idea, pero es algo que ya he probado y, para un uso intensivo, no me convence en absoluto. La calidad de imagen por Wi-Fi es bastante asquerosa y el rendimiento deja mucho que desear, no se acerca ni de lejos a TeamViewer.

Para que funcione decentemente, necesitas una conexión por cable, y los portátiles de Apple no traen puerto RJ45. Además, esa capa intermedia genera fricción: copiar ficheros es lento y los atajos de teclado personalizados, como mi Win+E para abrir una nueva ventana de Finder con BetterTouchTool, se ejecutan en la máquina local, no en la remota. Es una solución que puede valer si la usas como una interfaz web, pero no para un flujo de trabajo integrado.

El futuro es RAG sobre DEVONthink

Este nuevo hardware tiene un propósito claro: experimentar y construir. Justo este fin de semana, la gente de DEVONthink lanzó una pregunta en sus foros sobre la posibilidad de integrar un servidor MCP, y la comunidad estalló de alegría. Resulta que ya hay gente que ha creado soluciones open source para ello, ¡incluso con soporte para RAG en beta!

Mi idea va por ahí. Quiero montar un sistema RAG sobre mi base de datos de DEVONthink. El problema es que un RAG crea su propia base de datos vectorial, lo que podría hacer que mi uso directo de DEVONthink perdiera utilidad. Estaría consultando la base de datos del RAG, no la aplicación. Probablemente, construiré el RAG usando los ficheros en local, lo que me permitiría usarlo también desde Windows con C#.

Esto me lleva a plantearme una reestructuración. Podría crear un RAG para ciertos temas, eliminar esos ficheros de DEVONthink e importar los cambios periódicamente. Así, DEVONthink quedaría para gestionar facturas, documentos personales y textos generados. Por ejemplo, ahora estoy colaborando con la Sociedad Hispánica de Jules Verne en un libro sobre ediciones comparadas, y uso DEVONthink para procesar todos esos documentos, extraer textos, comparar páginas, etc.

Anécdotas de un día en la trinchera

Antes de irme a casa a desatar a la bestia negra, tengo que solucionar dos temas del trabajo. Uno es un bug de esos rarísimos que solo ocurren cuando «el cliente aprieta el botón A, mete un billete de cinco euros, toca la pantalla, estornuda y se saca un moco». El otro es un cambio de configuración, algo habitual en un código lleno de condicionales if para adaptar el funcionamiento a cada cliente.

Esto me recuerda al peor bug que he tenido que afrontar: una fuga de cursores en una base de datos que tardó años en solucionarse. Solo le ocurría a un cliente específico, tras meses de uso acumulado. Resultó ser un puntero que un programador alemán olvidó eliminar. Ni los analizadores de código estático lo detectaron. La funcionalidad afectada era un overlay de vídeo que, curiosamente, solo usaba ese cliente. Son de esas cosas que se implementan y acaban en el olvido, hasta que explotan.

Mi jefe siempre dice que si un cliente nos explica cómo reproducir un error, podemos darlo por solucionado. Y es verdad. En cuanto pueda reproducir estos dos problemas, los arreglaré y me iré a casa. Aunque con uno de ellos tendré que demostrarle al equipo holandés que el fallo está en su servidor, no en mi código, y eso puede llevar semanas.

En fin, ya os iré contando mis aventuras con el Mac, el dock, la gestión de la batería y, por supuesto, mis avances con el proyecto de RAG, si es que al final no me da pereza y paso hasta el culísimo. ¡Ya sabéis, fechos habitualizaros, que no os la pique un pollo belga a demonio!

2015LM – Más negro y más grande

La espera de mi nuevo equipo me inspira a planificar proyectos de IA, desde un lector de noticias inteligente a entrenar LORAs. Y de paso, rajo de Python.

Este texto ha sido generado por Gemini 2.5/3.1 a partir del audio del autor. El contenido y las ideas son íntegramente del autor; la redacción ha sido asistida por IA.

¡Qué pasa, gallinicas mías! Aquí vuestro reportero más dicharachero con un batiburrillo de ideas mientras espero mi última adquisición. Mi «cosa grande y negra» ya se está moviendo por China y, aunque tenía la esperanza de que llegara de un día para otro, parece que se hará de rogar hasta el lunes o martes. ¡Ojalá sea el lunes para pillarla en casa!

Esto me ha recordado a cuando compré uno de los primeros Kindle DX en Estados Unidos. Gracias a la magia de los husos horarios, el cálculo final fue que tardó solo ocho horas en llegar desde la compra. En realidad, esperé día y medio, porque los amigos de aduanas en Alicante lo pararon y me tocó ir a negociar. Intenté que lo pasaran como un libro, pero no coló y tuve que pagar el pico correspondiente a un dispositivo electrónico con pantalla.

Mi gato, la aspiradora y la curiosidad

Cambiando de tercio, teníamos pánico de que nuestro gato huyera despavorido de la aspiradora. Pues nada más lejos de la realidad. El tío va siguiendo a Inconvenient mientras limpia, asomando la cabecita para no perderse detalle. Es un gato curioso, pero no en el sentido de cotilla, sino en el de limpio. Porque, para los incultos, «curioso» también significa pulcro, una acepción menos común pero igualmente válida. Esto me recuerda a las viñetas de los TBO de mi época, pero mejor no divago más, que la ancianidad es lo que tiene.

Planes para la bestia: Un lector de noticias con esteroides

He dejado de pagar InnoReader y, con el OPML que tengo en Devonthink, voy a construir mi propio agregador de noticias. Pero no será uno cualquiera. La idea es que un LLM procese los feeds y me construya un resumen diario, agrupado por temas y ordenado de más a menos interesante para mí. Aquí viene lo bueno: si varios medios publican sobre lo mismo, como una nueva beta de Apple, el sistema bajará todas las noticias, extraerá los puntos comunes y las diferencias, y me presentará un informe consolidado. Así me evitaré leer veinte veces la misma historia sobre la retirada de Tim Cook.

La idea es que, con el tiempo, el sistema aprenda y, si sale una noticia relacionada con una anterior, solo me muestre las novedades junto a un pequeño recordatorio. También planeo integrar resúmenes de vídeos de YouTube, algo que ya hago con Copilot, que por cierto, genera resúmenes bastante mejores que los de InnoReader. Todo esto se ejecutará en local, en mi nueva máquina, aunque quizás termine usando algunos tokens en remoto. Incluso contemplo la posibilidad de publicar estos resúmenes en un feed RSS privado en mi blog.

¿Por qué C# y no Python? Mi cruzada personal

Con la ayuda de Gemini, he decidido que todo este proyecto lo haré con C# y otras herramientas. ¿Por qué no Python, el rey de la IA? Porque, seamos claros, Python es una puta mierda pinchada en un palo. No soporto que, a estas alturas del siglo XXI, sus entornos virtuales sigan usando rutas absolutas. La solución de crear un requirements.txt para que cada equipo genere el entorno en una ruta local diferente me parece una chapuza.

Con C# me siento cómodo. Tengo Avalonia para la interfaz gráfica, que usa XAML igual que en Windows, lo que facilitaría una futura migración. Sí, todo sale primero en Python en el mundo de la IA, pero sus carencias son horrorosas. El manejo de dependencias es un desastre: te obliga a usar versiones específicas de paquetes, y si uno tiene un fallo de seguridad, o te aguantas o rehaces todo. Esto pasa porque muchos de sus desarrolladores son «vivecodings», no ingenieros de software, y los demás pagamos el pato. Así que mis scripts actuales, como los que limpian estos audios, los reescribiré en C#.

Más allá de los resúmenes: Experimentando con LORAs

Otro de los experimentos que quiero hacer con la «cosa grande y gorda» es reentrenar un modelo, o más bien, modificarlo creando un LORA. Por ejemplo, me encantaría meterle todas las novelas de Julio Verne para crear una IA que sea una verdadera experta en su obra. Ya lo intenté con LM Studio, pero no pudo con todos los libros y las respuestas que daba eran incompletas. Con un LORA, el resultado debería ser infinitamente mejor.

Mientras escuchaba el último podcast de Apple Coding con Julio César Fernández y Oliver Navani, pensaba en todo esto. Con todo el respeto, a veces me da la sensación de que fuman algo, porque sus planteamientos son un poco exagerados. Me gustaría que Oliver publicara esos ficheros de su «Open Caca» para ver si es oro todo lo que reluce.

Y a todo esto, ¿qué pasa con los agentes de IA?

Entiendo lo que hacen los agentes, pero no les termino de ver la utilidad práctica para mi día a día. ¿Qué diferencia real hay entre subir este audio a un agente para que lo procese, o simplemente dejarlo en una carpeta y pulsar un botón? Para mí, ninguna. Para hacer preguntas ya tengo el chat. Es como tener un martillo pero no saber dónde clavar. No me termina de cuadrar.

En el trabajo es impensable. Si le digo a mi jefe que he conectado un agente al código fuente de la empresa, heredo de forma fulminante. Quizás en un futuro, si le convenzo para montar un Mac Studio con 512 GB de RAM en su casa, podría usarlo en remoto para que los agentes me ayuden a refactorizar la interfaz de nuestra aplicación, pero por ahora, es ciencia ficción.

Una inversión justificada (o eso espero)

Alguno se preguntará por qué no esperé a un nuevo Mac Studio. La respuesta es simple: no sé cuándo saldrá un modelo con los 128 o 256 GB de RAM que necesito. Así que me lancé a por el MacBook Pro. Ha sido una pasta, sí. Ya podéis estimar lo que me he gastado. Espero que la paga extra de mayo me sirva para igualar un poco los números y no destrozar mi nivel de ahorro.

En fin, eso es todo por ahora. Os iré manteniendo al día con los avances de la «cosa grande y negra». No olvidéis sospechosos habitualizaros y que no os la pique un pollo belga. ¡A demonio!

2010LN – Microsoft se piensa que somos tontos

Una crítica mordaz a las encuestas de Microsoft y la implementación de Copilot. ¿Por qué hacen preguntas estúpidas y diseñan herramientas inútiles?

Este texto ha sido generado por Gemini 2.5/3.1 a partir del audio del autor. El contenido y las ideas son íntegramente del autor; la redacción ha sido asistida por IA.

¿Qué pasa, gallinicas mías? Aquí vuestro reportero Marechal Achero de Barrio Sésamo, listo para echarnos unas risas a costa de Microsoft. Hoy voy a desahogarme sobre una gilipollez monumental que espero que alguien en Redmond escuche, aunque lo dudo mucho. La magia rara vez ocurre, pero no perdemos nada por intentarlo.

La pregunta más estúpida que Microsoft te puede hacer

Estaba yo tranquilamente sincronizando ficheros con Synology Drive cuando, de repente, salta la dichosa ventanita de Microsoft 365. La pregunta, que aparece de vez en cuando, es de traca: «¿Recomendarías Windows 11 a tus amigos?». Te dan una escala del 1 al 5 y un campo para explicar el porqué. Mi respuesta es siempre la misma: un 1 rotundo, porque no hay un cero.

En el comentario siempre pongo lo mismo: «Cuando hagáis una pregunta inteligente, responderé de manera adecuada». Porque, seamos serios, ¿recomendaría Windows 11? No. ¿Recomendaría Microsoft 365? No. ¿OneDrive? Tampoco. No recomendaría absolutamente nada de Microsoft, simple y llanamente porque no funciona bien. El problema es que la pregunta está diseñada por un descerebrado.

Si en lugar de esa sandez, hicierais preguntas con contenido real, la cosa cambiaría. Os voy a dar ideas, gratis. «¿Basado en la velocidad de arranque, recomendarías Windows 11?». «¿Y basado en la velocidad de respuesta del explorador de archivos?». No pido que preguntéis por los tiempos de acceso al kernel o las llamadas a la API Win32, sino por cosas útiles para vosotros. Si de 100.000 usuarios, 99.000 os dicen que el explorador es lento, a lo mejor es que algo pasa, ¿no creéis?

La masturbación de los managers y la telemetría

Estas preguntas genéricas solo sirven para una cosa: la masturbación de los managers. Se formula una pregunta ambigua que la mayoría de la gente, por inercia, responderá positivamente. Luego, esos datos se presentan al jefe para decirle: «¡Mira qué bien lo estamos haciendo!». Es un ciclo de autoengaño para que el gran «sartironatillas» se siente en su trono pensando que todo funciona de maravilla.

Esto no es una encuesta, es una farsa para justificar sueldos. Si tu jefe no se da cuenta de que la pregunta es una trampa para obtener la respuesta deseada, es tan tonto como tú. Ahora, si es consciente y lo hace para impresionar a su propio jefe, entonces es inteligente, pero moralmente cuestionable. En cualquier nivel de esa cadena donde se pierda la consciencia de esta manipulación, solo hay gilipollas, con todas las letras.

Y mientras tanto, recogen toda nuestra telemetría. Aunque sigas esos vídeos de YouTube que te dicen cómo desactivarla matando servicios y cambiando permisos, Microsoft sigue espiando. Para cortarla de verdad tienes que meterte en las políticas de grupo (gpedit.msc) y denegar permisos a carpetas específicas. Tienen toda la potencia, pero cero control y, sobre todo, cero inteligencia para usarla.

Copilot: una IA que nos toma por imbéciles

Esta mentalidad se extiende a su gran apuesta: la inteligencia artificial. ¿Recordáis la noticia de que iban a hacer Copilot «menos intrusivo»? Su gran solución fue quitar el botón de la IA de un montón de aplicaciones. ¡Problema resuelto! Se piensan que somos idiotas. Quitar un botón no soluciona el problema de fondo, que es una implementación completamente inútil.

El botón en sí no molestaba. El problema es lo que hacía, o más bien, lo que no hacía. Tomemos el Bloc de notas. Abrí un fichero .bat y el menú de Copilot me ofrecía opciones como «reescribir», «resumir» o «cambiar el tono». ¿En serio? ¿Quién usa el Bloc de notas para escribir alta literatura? Lo usamos para editar ficheros de configuración, scripts… ¡ficheros de sistema! Lo útil habría sido que Copilot me ayudara a depurar o mejorar ese script.

Es un despropósito. Con razón la gente se quejaba. Es como el botón del Paint para generar una gallinica; es una función que está ahí, la usas si quieres y si no, pues no. Pero en el Bloc de notas, Copilot es un añadido inútil que solo sirve si estás escribiendo un texto plano, algo que podrías hacer en Word, donde sí tendría más sentido.

La genial idea del «Copilot PC»

Y esto me lleva a otra de sus maravillosas ideas: la distinción de «Copilot PC». Tengo un Minisforum con una tarjeta gráfica capaz de mover un modelo de lenguaje local a 20 tokens por segundo, pero como no es un «Copilot PC» oficial, no tengo la aplicación principal. Sin embargo, sí tengo los inútiles botones de Copilot repartidos por el sistema. ¿Lo entendéis? Tengo Copilot, pero no tengo Copilot.

Puedo usar la IA para resumir un correo en el nuevo Outlook (lo cual es útil, aunque le falta una opción para resumir siempre en español) o para hacer chorradas en Paint, pero no para tareas realmente productivas en el sistema. Es una de esas ideas que suenan bien en la cabeza de un ejecutivo, pero que en la práctica son un desastre.

Nadie se libra: Apple y Linux también patinan

Y que nadie piense que esto es solo cosa de Microsoft. Apple, con su Apple Intelligence, no se queda atrás. La famosa estrellita de la IA te aparece una vez tras una actualización y luego desaparece para siempre. En la aplicación de Mail, la función de resumir tiene el mismo fallo que la de Microsoft: si recibo un correo en holandés, me lo resume en holandés. Para traducirlo, tengo que dar siete pasos. ¿Tan difícil es poner una opción que diga «responder siempre en mi idioma»?

Incluso en el mundo del software libre vemos estas implementaciones a medias. La última versión de KDE permite hacer OCR en las capturas de pantalla, ¡lo cual es genial! Instalas Tesseract y funciona. ¿El problema? Te copia todo el texto de la pantalla, sin darte la opción de seleccionar solo el fragmento que te interesa. Una idea brillante ejecutada de la peor forma posible. Otra panda de inútiles haciendo inutilidades.

Al final, todo esto me huele a lo mismo: son juguetes de la señorita Pepis. Anuncian a bombo y platillo que el Paint genera imágenes con IA para que las acciones suban, pero la puta realidad es que estas herramientas, en su estado actual, no valen para absolutamente nada.

En fin, ahora sí. No olvidéis sospechosos habitualizaros y que no os la pique un pollo belga. ¡Qué cansado estoy!

La IA no te va a quitar el trabajo, tu miedo sí: Crónica de un ludita converso

La inteligencia artificial no es el fin de los oficios, sino una herramienta para potenciarlos. Una reflexión sobre el miedo al cambio y cómo adaptarnos.

Este texto ha sido generado por Gemini 2.5/3.1 a partir del audio del autor. El contenido y las ideas son íntegramente del autor; la redacción ha sido asistida por IA.

¡Qué pasa, gallinicas mías! Aquí vuestro reportero maricharachero, que parece que está lanzado. Pensaba abandonar el podcast, pero me he emocionado generando audios y he decidido darle una nueva vida al blog. De hecho, acabo de terminar el libro de David Pogue sobre los 50 años de Apple y he tomado una cantidad de notas impresionante. Mi plan es subirlas a Notebook LM y pedirle que genere un audio, pero no sobre el libro, sino sobre mis propios comentarios. Esa es la clave.

Los dos audios anteriores los hice así. No se trata de subir un libro y decirle a la IA «comenta lo que quieras». No, no. Se trata de que comente lo que yo quiero que comente, de guiarla con mis propias ideas. Para mí, este es el futuro del podcasting y de la creación de contenido en general: la IA como un colaborador al que diriges, no como un sustituto que actúa por su cuenta.

El debate de los luditas modernos

He estado escuchando a compañeros como Mosquetero Web y Tejedor decir que la inteligencia artificial va a acabar con Internet, con los oficios, con todo. Sinceramente, me parecéis unos putos luditas de manual. Un poco de historia: cuando llegó la máquina de vapor, todos temían por las diligencias. Con el coche, lo mismo. Cada vez que aparece una tecnología disruptiva, los poderes establecidos y los más obsoletos tiemblan de miedo.

La novedad ya ha llegado y no va a desaparecer, por mucho que protestéis. Hay que adaptarse. Tenía un conocido aquí en Holanda, un hombre 40 años mayor que yo que en paz descanse, que me decía: «Rafa, yo era tonelero. Cuando vi que el oficio se acababa, me hice carpintero metálico. Me hice herrero». Y punto. Pues eso es lo que toca hacer ahora: menear el culo.

La IA no va a matar a los podcasters. Al contrario, me está ayudando. ¿Han mejorado mis audios desde que elimino el ruido con machine learning? Por supuesto. ¿Le he devuelto la vida a mi blog convirtiendo mi voz en texto? También. Ahora, si no queréis escuchar mi aterciopelada voz, tenéis la entrada del blog, mejor ordenada de lo que yo hablo. No estoy matando al podcaster que hay en mí, me estoy subiendo a hombros de gigantes.

La IA como potenciador, no como sustituto

Mis reseñas de libros generadas con IA no son estúpidas ni carecen de sentido, porque soy yo quien dirige el proceso. Lo mismo ocurre con el desarrollo de software. Mi jefe llevaba tiempo pidiéndome que hiciera que las consolas de comandos de nuestra aplicación se pudieran minimizar. Era una de esas tareas que, entre que no me acordaba y no tenía tiempo, nunca hacía.

Le hice una pregunta a Gemini y en segundos tenía el código. Me ahorró buscar en las APIs, encontrar la función y probarla. ¿Me ha quitado el trabajo? No, me lo ha potenciado. Yo sé dónde y cómo poner ese código, y lo entiendo. Mi jefe no podría hacer eso. La IA no me reemplaza, me hace más eficiente.

De hecho, hace seis meses que no escribo una línea de código desde cero. Si escribo algo, se lo paso a la IA para que lo revise. El otro día, escribí un pequeño script para solucionar un problema con los archivos .ini y el BOM de Windows. Se lo pasé a la IA y me dijo: «¡Ojo! Aquí puedes tener una fuga de memoria. Este otro código es mejor». Y, efectivamente, lo era. Usé el suyo. La IA nos va a potenciar, no a eliminar.

El culebrón del Mac Studio y la verdadera razón de la venta

Hablando de herramientas, os conté que pensaba comprarme un Mac Studio con el futuro chip M5. Cada generación de Apple Silicon ha traído una mejora clave: el M1 fue el bombazo inicial, el M2 añadió instrucciones FLOP16, el M3 trajo el Ray Tracing y el M5 promete revolucionar la IA en local con núcleos dedicados en la GPU. Por eso me interesaba.

Pero, haciendo números, no sale a cuenta. Un Mac Studio M5 Max costará unos 2.500 €. ¿Mi gasto en APIs de IA hasta ahora? Unos 7 u 8 céntimos. Puse 5 dólares en Claude y me caducaron antes de gastarlos. La inversión en hardware no se justifica para mi uso actual. Así que os ofrecí mi equipo actual: el Mac Studio M1 Max, un Mac Mini M2 Pro con 32 GB de RAM y 2 TB de disco, y un MacBook Pro M1 Pro.

Al principio todos «¡quiero, quiero, quiero!», pero a la hora de la verdad, si te he visto no me acuerdo. Sois unos cabrones con patas. Pero bueno, he decidido venderlos igualmente. Ya no para comprar el pepinaco nuevo, sino para deshacerme de macOS, del que estoy un poco hasta los hueveres.

Adaptarse para sobrevivir en la nueva era

El miedo a la IA es el miedo a lo desconocido. Se dice que los profesores están acabados. ¡Al contrario! Si sabes que tus alumnos van a usar LLMs para hacer los trabajos, enséñales a usarlos bien. Hay que usar la azotea de una manera diferente, igual que la invención de la escritura o de los ordenadores cambió nuestra forma de pensar.

Me imagino a un cazador prehistórico harto de perseguir osos durante días, viendo cómo uno se cargó a su amigo Juanito, y pensando: «¿Y si meto dos osos en un corral?». En ese momento, transformó el mundo. Ahora estamos en un punto similar. No te quejes, busca la forma de aprovecharlo. Surgirán nuevos trabajos que hoy ni imaginamos.

Yo mismo no estoy a la última, no ando con 200 agentes de IA como veo en Twitter. Voy a mi ritmo, esperando a que la tecnología se estabilice, como hice con Gemini. Pero la estoy integrando. Si el día de mañana mi jefe cierra la empresa y tengo que buscar trabajo, podré decir: «Sí, uso la IA, y la uso así». Si me piden algo que no sé, como los agentes, diré lo mismo que cuando entré en mi antiguo trabajo sin tener ni idea de Windows Phone: «Dame dos semanas».

Una filosofía de supervivencia

Al final, todo se reduce a la supervivencia y la adaptación. Si reaccionas como un conductor de diligencias viendo llegar los coches, te quedarás atrás. Lo lógico es aprender a conducir o a reparar esos coches. Y si todo falla, si un día la IA nos deja a todos sin trabajo y sin un duro, yo tengo un plan.

Se lo decía a mi madre con veinte años: si no tengo para comer, me voy a un supermercado, como algo y espero tranquilamente a que venga la policía. Sin violencia, sin resistencia. Al juez le diría: «Señoría, tengo derecho a comer». Si me meten en la cárcel, tendré comida. Si me sueltan, volveré a hacerlo. Es una forma de resistencia pasiva. Quizás soy yo el rarito, pero hay miedos que no entiendo cuando la solución es moverse.

En fin, que me voy de vareta. Ya sabéis, no olvidéis sospechar habitualizaros, que no os la pique un pollo belga. ¡Ah, demonio!

Microsoft se sincera: Los problemas de Windows 11 y su plan para arreglarlos

Un correo de Microsoft Insider revela los problemas de rendimiento, fiabilidad y usabilidad de Windows 11. Analizo su plan de mejora y mis experiencias con la IA.

Este texto ha sido generado por Gemini 2.5/3.1 a partir del audio del autor. El contenido y las ideas son íntegramente del autor; la redacción ha sido asistida por IA.

¿Qué pasa gallinicas mías? Aquí vuestro reportero más dicharachero de Barrio Sésamo para comentar un correo que hemos recibido todos los Microsoft Insiders. Sí, soy un insider, un empotrador (chiste privado para los amigos de la pradera). El caso es que Microsoft ha enviado una comunicación, bastante larga y en castellano, donde reconoce abiertamente todas las pegas que arrastra Windows últimamente.

Es el típico comunicado de Microsoft, con mucha paja y balbuceos, muy a lo «mucho ruido y pocas nueces» de Shakespeare. Pero entre todo el relleno, hay contenido y aspectos técnicos interesantes. Por cierto, mientras leía, el brillo de mi iPhone se ha vuelto loco y ha subido al máximo sin motivo. ¡Tecnología, quién te entiende! Pero volvamos a lo nuestro, que me disperso como mantequilla fluida.

El reconocimiento: Windows 11 tiene serios problemas de calidad

Lo primero y más importante es que Microsoft admite que Windows 11 tiene serios problemas de calidad en tres áreas clave: rendimiento, fiabilidad y usabilidad. En mi opinión, muchos de estos problemas vienen de su obsesión con la inteligencia artificial. Están metiendo IA en todas partes, y aunque yo la uso muchísimo para el desarrollo, una cosa es usarla y otra dejar que la IA se encargue de tus builds y tus pruebas. ¡Las pruebas las hago yo!

Este enfoque ha derivado en otro gran problema: la calidad de Windows Update. No hay una sola actualización que no le rompa algo a alguien. Yo, de momento, toco madera en el trabajo, que es donde importa. Esta mañana, por ejemplo, el ordenador arrancó con un error que no pudo reparar, pero al darle a «continuar» funcionó sin más. Cositas raras a las que nos estamos acostumbrando.

Rendimiento: La eterna lucha por la agilidad

Microsoft promete mejoras concretas en el rendimiento. Quieren un menor uso de recursos, algo lógico si pensamos en la cantidad de aplicaciones tipo PWA o WebUI que son, básicamente, HTML embebido. Al principio yo denigraba estas apps, pero reconozco su utilidad multiplataforma. Sin embargo, ¿tiene sentido que el Bloc de Notas o el Paint sean una WebUI? Para mí, no.

Siempre he defendido que las aplicaciones del sistema deben estar escritas en el lenguaje nativo del sistema operativo. Apple lo hace de maravilla: antes Objective-C, ahora Swift. Microsoft usaba C y C++ con MFC, y funcionaba. Incluso acepté que usaran C#/.NET cuando se volvió casi nativo, pero ahora hasta han descontinuado WPF. Parece que su nuevo camino es WinUI 3, una interfaz que pretende ser la nueva capa nativa sobre Win32, construida con componentes COM y compatible con C++, C#, Javascript… Es un tema complejo que merece un análisis aparte en el futuro.

Además, prometen un inicio más rápido de aplicaciones y del explorador. Un programa nativo como Notepad++, escrito en C, es casi instantáneo. El explorador, en cambio, es un desastre. El proceso de copiar o mover archivos es un dolor: primero lee el origen, luego comprueba el destino, simula la copia, pregunta por conflictos y finalmente actúa. Es un proceso absurdo que espero que arreglen de una vez. También mencionan un mejor rendimiento de WSL (el subsistema de Linux), aunque en mi experiencia, ya es bastante aceptable.

Fiabilidad: Drivers, periféricos y un Windows Update predecible

En el apartado de fiabilidad, las promesas son ambiciosas: menos fallos del sistema, drivers más estables y mejor soporte para Bluetooth, USB, impresoras, audio y cámaras. Personalmente, no he tenido grandes problemas con los drivers, que considero que tienen un framework muy bueno en Windows, pero si lo mencionan, será por algo. El USB, eso sí, es lento, pero también me pasa en macOS.

La joya de la corona es la promesa de un Windows Update «más predecible y con menos interrupciones». Aquí mi escepticismo es máximo. Lo que deberían hacer es volver a certificar hardware específico, como hacían antes. Con la automatización actual, podrían probar cada actualización en miles de equipos certificados antes de lanzarla al público. Finalmente, prometen un Windows Hello más fiable, aunque a mí en la Surface me funciona de maravilla, reconociéndome incluso mientras me estoy sentando.

Usabilidad y el futuro de Copilot

En usabilidad, Microsoft quiere ofrecer más personalización en la barra de tareas, menos ruido visual y notificaciones, y widgets menos intrusivos. Pero lo más importante es que prometen una «búsqueda más coherente y clara en todo el sistema». ¡Ya era hora! Es increíble que a mediados del siglo XXI la búsqueda de Windows sea tan deficiente.

Y aquí viene lo interesante: anuncian una «reducción de la presencia de Copilot». Planean ponerlo solo donde realmente sea útil. A mí no me molesta que esté en el Paint, si no lo usas, no pasa nada. El problema real es que el motor de IA está siempre cargado, consumiendo una cantidad ingente de RAM. En la Surface Pro 11, de 16 GB, 8 están reservados para Copilot. Es cierto que libera memoria si la necesitas, pero el consumo inicial es brutal.

Mi experiencia con la IA: Copilot vs. Gemini

Hablando de IA, yo uso el Copilot de Edge principalmente para resumir noticias o artículos largos. Si le pido que me resuma un vídeo, es señal de que no me interesa lo suficiente como para verlo entero. Hay vídeos, como los de JerryRiggedEverything, que me los veo todos aunque siempre haga lo mismo: rayar, doblar y destrozar teléfonos.

Para tareas serias de desarrollo, Copilot se queda corto. Por eso pago por Gemini. Este fin de semana, por ejemplo, un cliente tenía un problema con TeamViewer: le saltaba publicidad constantemente, tapando nuestra aplicación que se supone que siempre debe estar en primer plano. Le pregunté a Gemini, me indicó dónde encontrar el log, se lo envié y me diagnosticó el problema al instante. Resulta que el servidor de TeamViewer pensaba que era una cuenta gratuita y lo bombardeaba con anuncios. La solución: reinstalar. Para este tipo de cosas, Gemini es una herramienta increíble.

Conclusión: ¿Confianza recuperada?

Veremos cuántas de estas promesas se cumplen y cuántas son solo palabrería para mantenernos tranquilos. Indirectamente, parece que Apple también planea un lanzamiento centrado en la estabilización de su sistema operativo, algo que ya le va haciendo falta. De Apple me creo poco, pero de Microsoft, todavía menos. Tienen que trabajar mucho para volver a ganarse mi confianza.

El tiempo dirá. Ya sabéis, no olvidéis sospechosos habitualizaros. Y como esto es un leña al mono, ¡que no os la pique un pollo belga!

IA a céntimos y el misterio del Mac Studio sin internet

Descubre cómo he revolucionado mi blog con IA por céntimos y resuelve conmigo el misterio que dejó mi Mac Studio sin conexión a la red por culpa de Tailscale.

Este texto ha sido generado por Gemini 2.5/3.1 a partir del audio del autor. El contenido y las ideas son íntegramente del autor; la redacción ha sido asistida por IA.

¿Qué pasa, gallinicas mías? Aquí vuestro reportero más dicharachero para contaros un par de batallas. Si habéis seguido las últimas entradas del blog, habréis notado un cambio de calidad más que absoluto en los textos generados a partir de los audios. Antes de desvelar el secreto detrás de esta mejora, permitidme que os cuente una de esas historias del abuelo Cebolleta que tanto nos gustan.

Una historia de terror en la red: Cuando el Mac Studio se negó a conectar

Desde hace varios días, mi Mac Studio sufría una conexión de red terriblemente lenta. No hablo de un pequeño lag, sino de una velocidad de entre 1 y 2 kilobytes por segundo. La situación llegó a un punto crítico este domingo por la tarde, cuando la red local dejó de funcionar por completo. Olvidaos de internet; ni siquiera podía comunicarme con mi Synology. El Synology Drive iba a paso de tortuga y compartir la pantalla con el Mac Mini en alta calidad era una misión imposible, a pesar de que todo está conectado por cable a través del router y switches.

Bastante mosqueado, empecé el ritual de solución de problemas: revisé las prioridades de red, desconecté y conecté el WiFi, cambié los cables de red entre el Mac Mini y el Mac Studio, conecté el equipo directamente al router… Nada. El rendimiento de la red del Mac Studio era, sencillamente, asqueroso. Me negaba en rotundo a reinstalar macOS otra vez, así que estaba a punto de tirar la toalla.

En un acto de desesperación, le pregunté a Gemini, que me dio una serie de pasos estructurados para encontrar la solución. Aunque ninguna de sus sugerencias directas funcionó, me pusieron en el camino correcto. Mientras investigaba, mi subconsciente me gritaba que mirara algo que tenía delante de las narices. Y de repente, lo vi: ¿qué demonios hacía la VPN de Tailscale activada sin ningún icono en la barra de menús?

Fue hacer clic en «desactivar» y, como por arte de magia, todo volvió a la vida. Las ventanas que cargaban con una lentitud exasperante hicieron «frrrr, roca» y la velocidad se disparó de nuevo a los 800 Mbps. El culpable era el maldito Tailscale. Según me confirmó Gemini, es un problema que puede ocurrir, sobre todo si se activa el «exit node». Parece que se enreda con las IPs locales (las del tipo 100.x.x.x) y no es capaz de resolver las DNS correctamente, colapsando toda la conexión.

La solución fue drástica pero necesaria. Desinstalé Tailscale del NAS, para lo cual tuve que activar momentáneamente el acceso SSH, ejecutar los comandos de borrado y volver a desactivarlo. Hice lo mismo en el Mac y en el iPhone, y para rematar, entré en la web de Tailscale y eliminé toda mi configuración. No quiero que dentro de una semana se reactive solo y me vuelva a dejar tirado. Así que, una y no más, Santo Tomás. Y si ahora sale el de siempre a decir «pues a mí me va bien», le diré: cojonudo para ti.

El dilema: ¿IA local o en la nube? Un análisis de costes

Ahora sí, vamos al meollo del asunto: el salto de calidad en las entradas del blog. Todo empezó con un profundo estudio económico. Estuve barajando la idea de comprar un nuevo Mac Studio con 128 GB de RAM y 4 TB de disco duro para ejecutar modelos de IA en local. El capricho, entregando mi equipo actual, se iba a unos 5.000 euros.

Haciendo números, si mi gasto actual en tokens de API es de unos 20 euros al mes, necesitaría 20 años para amortizar esos 5.000 euros. Como bien me dijo Gemini, «cuando pasen los 20 años, ese Mac Studio será un pisapapeles muy caro que fue muy caro en su momento». La lógica era aplastante, así que decidí optimizar mi flujo de trabajo usando APIs online.

Mi nuevo flujo de trabajo y el ridículo coste de la calidad

Mi proceso ahora es un híbrido. La eliminación de ruido del audio la hago con una red neuronal en local, que es prácticamente instantánea. La transcripción también la realizo en local, aunque curiosamente en el Mac Studio va superlenta, mientras que en mi viejo iMac Intel es siete veces más rápida. El paso final, la creación del texto del blog, es donde entra en juego la API de Gemini.

Para que os hagáis una idea, he procesado tres podcasts con este nuevo sistema, incluyendo la reescritura de la entrada sobre Roma y una nueva sobre otro libro. El consumo total fue de 19.000 tokens. ¿El coste? Preparaos: cuatro céntimos de euro. Por cuatro céntimos, estoy obteniendo una calidad de texto espectacular, y eso que podría usar un modelo más caro. Me he puesto un límite de 10 euros al mes para esto, y a este ritmo, me va a durar meses.

También exploré los costes de traducción. Una traducción decente para uso interno sale por un euro y medio cada 100.000 palabras, lo que equivale a un libro de 200-300 páginas. Gemini me calculó que traducir una obra como Guerra y Paz (que, de forma un poco inquietante, sabía que estaba leyendo en papel) costaría entre 8 y 10 euros. Luego caí en la cuenta de que lo sabía porque se lo mencioné en una de las transcripciones que le pasé para analizar. ¡Qué memoria tiene el bicho!

La IA, la traducción y una imitación fallida de Dune

Hablando de traducir, no creo que vaya a usar la API para traducir 200 libros al mes. Normalmente leo en inglés, pero hace poco traduje la novela El Imperio del Silencio porque su estilo de escritura me resultaba extraño y no lograba concentrarme. Más tarde descubrí que la comunidad de fans ya había traducido toda la saga.

Aunque dicen que es como Dune, mi opinión es muy distinta. Intenta imitar ese tono místico-mesiánico, pero no se le acerca ni a la suela de los zapatos. Me resulta aburrida y demasiado explicativa. El autor te cuenta la historia dos veces: primero narra la acción y luego te detalla el proceso interno de decisión del personaje. Es redundante y no termina de cuajarme.

En fin, el futuro pasa por seguir afinando este sistema. Quizás el próximo paso sea usar una voz sintética para limpiar las grabaciones de repeticiones y muletillas, pero eso ya será para otra reencarnación. Por ahora, el salto cualitativo y económico es innegable.

Así que ya sabéis, no olvidéis sospechosos habitualizaros, que no os la pique un pollo belga. ¡A demonio demoníaco!

Mi Flujo de Trabajo con IA: Un Gorila, un Mac y un Pajarito

Descubre mi nuevo flujo de trabajo para el podcast, desde la portada creada con IA hasta la automatización total y mis planes para un futuro Mac Studio.

Este texto ha sido generado por Gemini 2.5/3.1 a partir del audio del autor. El contenido y las ideas son íntegramente del autor; la redacción ha sido asistida por IA.

¡Qué pasa, gallinoleidos míos! Aquí vuestro reportero más dicharachero para contaros las novedades del podcast y las reflexiones tecnológicas que me acompañan. Veréis que hay cambios, experimentos y, como siempre, algún que otro desvarío.

Una nueva cara para el podcast

Lo primero es lo primero: quiero dar un agradecimiento enorme a Marcus Fernández (@MarcusFernandez en Twitter). Me preparó dos carátulas nuevas para el podcast y he de decir que son una pasada. Si habéis escuchado el último episodio, habréis visto la nueva portada: un gorila sosteniendo un libro que pone «Lo he leído, libros sin hilos».

Marcus me hizo una versión con texto y otra sin él, y he elegido la primera. La verdad es que está muy bien, mucho mejor de lo que yo podría haber hecho. Me comentó que la anterior, la de «Leña al Mono», la había hecho con inteligencia artificial. No sé si será diseñador o no, pero desde luego, tiene un talento increíble. ¡Gracias, Marcus!

La nomenclatura 2.0 y los fantasmas de iVoox

El primer capítulo con este nuevo formato ya está fuera y, como habréis notado, he cambiado la nomenclatura. Ahora los episodios seguirán un formato como 2001 LM, 2002 LM, etc. Esta genial idea me la recomendó un oyente en un comentario en iVoox, en el audio del «Notición Importantón de Leña al Mono».

El problema es que iVoox, que es una puta mierda pinchada en un puto palo de mierda, no me deja interactuar como usuario. Puedo subir contenido como podcaster, pero no puedo responder a los comentarios. Y para colmo, parece que el comentario ha desaparecido, así que no puedo dar el crédito a quien lo merece. Lo siento, tu mensaje se ha perdido en el éter, pero que sepas que tu idea ha sido genial. Me permite ordenar los audios procesados en secuencia en mi carpeta de macOS, algo de lo que no me fío si dependo solo de la fecha de creación.

El experimento: cuando la IA toma el micrófono

El último audio es un experimento generado con Notebook LM. Y ojo, no es tan simple como subir un libro y pedirle que lo narre. He ido reconstruyendo el guion, seleccionando los fragmentos que la IA me proporcionaba y, con un pequeño prompt, le he pedido que generara el audio final. El resultado es cojonudo, la verdad.

Esto nos va a eliminar a los podcasters, al menos en cierta medida. Yo no podría haber grabado algo tan completo, tan bien contado y con esas voces. Y recordad esto que digo sobre las voces, porque «todo se andará». El experimento sigue adelante, aunque las entradas de blog que acompañan a los audios sean bastante mierdosas, porque también las genera un LLM.

La filosofía del gandul tecnológico

Mi objetivo es no complicarme la vida. Soy como ese personaje gandul de Robert Heinlein en «Tiempo para Amar», que solucionaba problemas tecnológicos por pura pereza de no querer trabajar. Si tengo que procesar este audio, transcribirlo, reescribir el blog, subirlo a Gemini y darle un prompt… no lo hago. Ni tengo ganas, ni paciencia, ni nada.

Mi flujo de trabajo actual es la personificación de esa pereza. Hago clic en un acceso directo, se abre una ventana de comandos con el entorno de Python cargado, tecleo un único comando y le doy a Enter. Eso es todo. El script se encarga de eliminar el ruido, generar la transcripción, crear los resúmenes en DevonThink, redactar la entrada del blog y publicarla como borrador. Si no fuera así de simple, no habría ni blog, ni resúmenes, ni su puta madre.

El cuello de botella: la memoria y mi Mac actual

El problema es que, para procesar un audio, tengo que cerrarlo todo en el Mac. El modelo de IA que uso, Command R, consume toda la memoria. Si tengo DevonThink o cualquier otra cosa abierta, el Mac se bloquea por completo. Supongo que es un fallo de macOS con los Apple Silicon, que en lugar de lanzar una excepción cuando se queda sin memoria, simplemente se congela.

Esto me recuerda a mis tiempos de desarrollador en Windows. Allí, cuando pides memoria, el sistema te la reserva en el espacio de direcciones, pero solo la asigna físicamente cuando la usas. Si se agota, el sistema se vuelve lentísimo, pero no se congela. De hecho, yo programé un liberador de memoria en C++ con diez líneas de código que se basaba en este principio: asignaba y llenaba bloques de memoria hasta forzar al sistema a descartar cachés y liberar RAM.

El sueño: un Mac Studio para dominarlos a todos

Todo esto me lleva a mi plan futuro. Cuando salga el Mac Studio M5 Max, mi idea es comprarme un equipo con 128 GB de RAM y 4 TB de disco duro. Serán unos cinco mil y pico euros. Como dice el refrán, «nunca más» tendré problemas de memoria. Justo ahora que lo pienso, mi mujer, «Inconvenient», anda cerca… «¿Vas a comprar qué? ¿Qué me dijiste que no te dejará comprar?»… ¡Nada, mujer, que voy a ir al Lidl a comprar galletas!

Bromas aparte, con un equipo así podré tenerlo todo cargado a la vez: DevonThink lanzando su motor de IA para los resúmenes, el LLM Command R generando la entrada del blog… todo sin que el sistema se ahogue. Usar un LLM más pequeño no es una opción, porque el resultado es todavía peor que el que obtengo ahora.

4 TB de disco y un pajarito en la ventana

¿Y por qué cuatro terabytes de disco? Primero, porque Spotlight no busca bien en discos externos. Segundo, porque el disco interno se me llena periódicamente de cachés y temporales. Es una cuestión de comodidad y rendimiento. Mientras pensaba en esto, he visto un pajarito amarillo bañándose en la ventana del salón. ¡Qué guapín! Son las once y media de la mañana, así que supongo que se está dando una ducha antes de irse a dormir a su rama.

Volviendo al tema, contemplo una alternativa: si por el mismo precio de los 4 TB puedo conseguir 256 GB de RAM, quizás opte por eso y siga usando un disco duro externo. Con Thunderbolt 5, las velocidades son de casi 14 GB/s, casi como la memoria DDR2. Sería una opción a valorar.

¿Mac Studio o MacBook Pro? El dilema del sofá

También podría comprar un MacBook Pro con esas características, pero el precio sube a más de 6.500 euros. Además, sufriría de throttling (reducción de rendimiento por calor). La ventaja sería poder trabajar tirado en el sofá, pero el Mac Studio ofrece más potencia bruta y salvaje. En fin, son cosas que tendré que sopesar.

Por ahora no puedo comprar nada. Los equipos custom tardan semanas en llegar y dentro de poco tengo un evento especial del que ya os contaré más adelante. Se me va la pelota, así que voy terminando. No olvidéis lecturo-leñalmono-habitualizaros, y que no os la pique un pollo belga. Y de nuevo, Demonio, lo siento por no tener tu mensaje para darte el crédito que mereces. ¡Ha sido una idea genial!

Nuevos proyectos y cambios en los podcasts: ¡Conoce las novedades!

Anuncio de cambios en los podcasts: ¡Descubre la llegada de un nuevo integrante a la familia y cómo afectará a tus audios favoritos!

Este texto ha sido generado con un LLM a partir del audio del autor. El contenido y las ideas son del autor; la redaccion ha sido asistida por inteligencia artificial.

Un anuncio importante: ¡Llega un nuevo miembro a la familia!

¡Hola, gallinicas! Aquí vuestro reportero favorito listo para compartir una noticia emocionante. Resulta que vamos a tener un nuevo gato en casa, y todo gracias a nuestra querida Lina.

La historia comenzó con el cepillado de esta gatita de Angora, ya que al descubrir su denso pelaje, nos dimos cuenta de que necesitaba cuidados especiales. Y así fue como Inconvenient se enamoró de ella y decidió adoptar un nuevo compañero felino.

Nuestro nuevo gato, Solete, es un naranja y blanco de cuatro años, una elección tranquila y recomendada por la protectora de Villena. ¡Y yo quería llamarlo Satán! Pero Inconvenient no estuvo muy convencida con mi idea.

Cambios en los podcasts: ¡Un reset para empezar de cero!

Además del nuevo gato, también os traigo un anuncio sobre mis podcasts. He decidido cerrar algunos y hacer una reorganización para simplificar vuestra experiencia de escucha. Quiero dejar solo «Leña al Mono» y hacer un reinicio de contadores.

Así que a partir de ahora, encontraréis todo en el feed de «Leña al Mono», incluyendo los antiguos audios de «La Patata» y «Lo Leído». De esta manera, podréis seguir disfrutando de mi contenido sin perderse nada.

La magia de la inteligencia artificial: una nueva forma de aprender

Recientemente he descubierto la potencia de la IA para generar podcasts a partir de libros técnicos. Me interesaba un tema en concreto sobre las cloacas y el sistema de alcantarillado en Roma, pero no tenía tiempo ni ganas de leer un libro entero.

Así que usé Google Notebook LM para subir el libro y hacerle preguntas específicas. Luego, le pedí a la IA que generara un podcast con mis preguntas y sus respuestas. El resultado fue impresionante: un audio de 24 minutos que cubría todos los temas que me interesaban, contado de manera clara y amena.

Por eso he decidido incluir más contenido generado por inteligencia artificial en «Leña al Mono». Hay muchos libros interesantes que no tengo tiempo de leer, pero con la IA puedo extraer la información importante y compartirla con vosotros de una forma más dinámica.

Experimentos con el blog: parafraseando audios

También he estado experimentando con mi blog. He generado un script que automatiza el proceso de transcripción, resumen y publicación de entradas basadas en mis audios. La idea es ofreceros contenido escrito complementario a los podcasts.

Aunque las entradas aún no son perfectas, creo que es una buena forma de brindaros más opciones para disfrutar de mi contenido. Y lo mejor es que el proceso es automático, así que podréis esperar más publicaciones en el futuro cercano.

¡Nos vemos en «Leña al Mono» y en el blog! No olvidéis suscribiros a los feeds habituales.