El éxito fenomenal de
#OPENCLAW indica que la clase Agente ha alcanzado un punto de inflexión; el consumo de tokens no disminuirá, sino que aumentará.
El factor más importante este año es comprobar si la IA es una burbuja y si las valoraciones de las acciones estadounidenses son demasiado altas.
He recopilado algunos datos e informes.
Basándome únicamente en la API de OpenAI, en 2025 se procesaron aproximadamente entre 1,8 y 2,2 billones de tokens.
Volumen estimado para los dos primeros meses de 2026 (API de OpenAI): Aproximadamente 520 billones de tokens.
Eso representa aproximadamente una cuarta parte del volumen total de 2025 en tan solo dos meses.
Estos datos solo incluyen OpenAI y no representan toda la industria. Los modelos nacionales consumen aún más tokens, pero ofrecen la mejor relación calidad-precio.
La tasa de consumo actual significa que es muy probable que el consumo total de tokens en 2026 supere el consumo total de todos los años anteriores de la civilización humana.
La demanda en 2026 es varias veces mayor que la de 2025; ¿qué ocurrirá en 2027? Algunos proveedores ya han subido los precios e implementado limitaciones de velocidad de API, y experimentan una escasez persistente de GPU, energía y tokens.
Según los informes financieros de la industria desde finales de 2025 hasta principios de 2026 (como datos internos filtrados de OpenAI y la declaración de financiación de la Serie G de Anthropic):
Margen de cómputo: Aproximadamente entre el 60 % y el 75 %.
Definición: Solo se deducen los costos de potencia de cómputo necesarios para la inferencia (GPU, electricidad, mantenimiento del centro de datos).
Estado actual: Tomando como ejemplo a OpenAI, su margen de cómputo alcanzó el 70 % en octubre de 2025 (en comparación con solo el 35 % a principios de 2024). Esto significa que por cada 100 yuanes que paga un usuario, el costo de potencia de cómputo puro es de aproximadamente 30 yuanes.
Margen bruto: Aproximadamente 30% - 50%
Definición: Basado en el margen computacional, deduciendo gastos como el entrenamiento de modelos (amortización de la potencia computacional), los salarios del personal técnico y la moderación de contenido.
Estado actual: Esta es una métrica relativamente difícil de alcanzar. El margen bruto de OpenAI para 2025 fue de aproximadamente el 33%, debido a que la importante inversión en I+D y la competencia por el talento diluyeron las ganancias por token.
Cambio clave: Con la adopción generalizada de NVIDIA B200 (Blackwell) en 2026, el rendimiento de inferencia por token casi se quintuplicó, lo que condujo directamente a un aumento del margen bruto computacional, pasando del punto de equilibrio el año pasado al margen alto actual.
#ai