Standpunkt: Der Markt für KI-Inferenz könnte den Ölsektor übertreffen und zu einem der größten Märkte der Welt werden
Kürzlich sagte Dylan Patel, Mitbegründer von SemiAnalysis, in einem Podcast-Interview voraus, dass die KI-Inferenz zu einem der größten Märkte der Welt werden könnte. Ihr Umfang könnte Öl übertreffen und einige Prozentpunkte des weltweiten BIP ausmachen.
Patel ist der Ansicht, dass mit jeder Iteration der Modelle die Zahl und der Wert der Aufgaben, die bewältigt werden können, schneller wachsen als die Rechenleistung. Daher dürfte ein Mangel an Rechenleistung langfristig bestehen.
In Bezug auf Prognosen für den Bedarf an Rechenleistung erwartet Patel, dass bis 2030 der kombinierte Rechenleistungsbedarf allein von OpenAI und Anthropic 100 Gigawatt überschreiten wird.
Zum Entwicklungspotenzial von Datencentern im Weltraum meint er, dass deren Einfluss in den nächsten 3 bis 5 Jahren noch vernachlässigbar sein dürfte, aber bis 2040 könnte mehr als die Hälfte der neu hinzugefügten Rechenleistung in den Weltraum verlagert werden.
Patel nennt als zentrale Engpässe die Energiekosten am Boden und die Kapazität, neue Rechenzentren zu bauen. Sobald die Wirtschaftlichkeit einer Verlagerung in den Weltraum diejenige am Boden übersteigt, werde die Verlagerung von Rechenleistung in den Weltraum unvermeidlich.
Beim Co-Design von Hardware und Software betont Patel, dass die Effizienzsteigerungen in den vergangenen drei Jahren nicht hauptsächlich aus der Hardware kamen, sondern aus dem Modell-Stack und der Optimierung über Ebenen hinweg.
Beispielsweise hat DeepSeek eine gezielte Optimierung für die Hopper-Architektur von Nvidia vorgenommen. Daher ist die Architekturleistung auf diesem Chip besonders gut, auf TPU hingegen fällt sie deutlich schlechter aus.
Im Gegensatz dazu sind Anthropic-Modelle besser auf TPU abgestimmt, während OpenAI-Modelle eher auf die GPU-Architektur ausgerichtet sind.
Patel meint außerdem, dass der sogenannte Nvidia-CUDA-Bollwerk-„Moat“ im Kern nicht nur CUDA selbst ist, sondern das Ergebnis einer weit verbreiteten, offenen Modell-Ökosystem-Optimierung, die typischerweise in Richtung GPU-Co-Optimierung ausgerichtet ist.
Darüber hinaus hat Huang Renxun (Jensen Huang) die aufstrebenden Cloud-Computing-Anbieter seit langem stark unterstützt, um zu verhindern, dass der Markt für Rechenleistung von wenigen Großkonzernen dominiert wird. Ziel ist es, die gesunde Entwicklung der gesamten Branche und ihre Innovationskraft zu fördern.
#AI推理市场规模
Kürzlich sagte Dylan Patel, Mitbegründer von SemiAnalysis, in einem Podcast-Interview voraus, dass die KI-Inferenz zu einem der größten Märkte der Welt werden könnte. Ihr Umfang könnte Öl übertreffen und einige Prozentpunkte des weltweiten BIP ausmachen.
Patel ist der Ansicht, dass mit jeder Iteration der Modelle die Zahl und der Wert der Aufgaben, die bewältigt werden können, schneller wachsen als die Rechenleistung. Daher dürfte ein Mangel an Rechenleistung langfristig bestehen.
In Bezug auf Prognosen für den Bedarf an Rechenleistung erwartet Patel, dass bis 2030 der kombinierte Rechenleistungsbedarf allein von OpenAI und Anthropic 100 Gigawatt überschreiten wird.
Zum Entwicklungspotenzial von Datencentern im Weltraum meint er, dass deren Einfluss in den nächsten 3 bis 5 Jahren noch vernachlässigbar sein dürfte, aber bis 2040 könnte mehr als die Hälfte der neu hinzugefügten Rechenleistung in den Weltraum verlagert werden.
Patel nennt als zentrale Engpässe die Energiekosten am Boden und die Kapazität, neue Rechenzentren zu bauen. Sobald die Wirtschaftlichkeit einer Verlagerung in den Weltraum diejenige am Boden übersteigt, werde die Verlagerung von Rechenleistung in den Weltraum unvermeidlich.
Beim Co-Design von Hardware und Software betont Patel, dass die Effizienzsteigerungen in den vergangenen drei Jahren nicht hauptsächlich aus der Hardware kamen, sondern aus dem Modell-Stack und der Optimierung über Ebenen hinweg.
Beispielsweise hat DeepSeek eine gezielte Optimierung für die Hopper-Architektur von Nvidia vorgenommen. Daher ist die Architekturleistung auf diesem Chip besonders gut, auf TPU hingegen fällt sie deutlich schlechter aus.
Im Gegensatz dazu sind Anthropic-Modelle besser auf TPU abgestimmt, während OpenAI-Modelle eher auf die GPU-Architektur ausgerichtet sind.
Patel meint außerdem, dass der sogenannte Nvidia-CUDA-Bollwerk-„Moat“ im Kern nicht nur CUDA selbst ist, sondern das Ergebnis einer weit verbreiteten, offenen Modell-Ökosystem-Optimierung, die typischerweise in Richtung GPU-Co-Optimierung ausgerichtet ist.
Darüber hinaus hat Huang Renxun (Jensen Huang) die aufstrebenden Cloud-Computing-Anbieter seit langem stark unterstützt, um zu verhindern, dass der Markt für Rechenleistung von wenigen Großkonzernen dominiert wird. Ziel ist es, die gesunde Entwicklung der gesamten Branche und ihre Innovationskraft zu fördern.
#AI推理市场规模
