Cloud TPU-Kontingente

In diesem Dokument sind die Kontingente für Cloud TPU aufgeführt. Weitere Informationen Informationen zu Cloud TPU-Preisen finden Sie unter Cloud TPU-Preise.

Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Google Cloud-Ressource Ihr Google Cloud-Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Google Cloud-Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud-Ressourcen.

Das Cloud-Kontingentsystem ermöglicht Folgendes:

  • Ihren Verbrauch von Google Cloud-Produkten und -Diensten überwachen
  • Ihren Verbrauch dieser Ressourcen einschränken
  • Eine Möglichkeit bieten, Änderungen am Kontingentwert anzufordern

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.

Kontingente gelten in der Regel auf Google Cloud-Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud-Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

TPU-Kontingent

Für jede TPU-Version gelten unterschiedliche Kontingente. Zum Beispiel gibt es verschiedene Kontingente für TPU v2, v3 usw. Für jede TPU-Version gibt es verschiedene Kontingenttypen: On-Demand- und auf Abruf (Speicherplatz-VMs). In der folgenden Tabelle werden die verschiedenen Kontingentarten beschrieben.

Kontingenttyp Beschreibung Standardwert So stellen Sie einen Antrag Flags für die TPU-Erstellung
On demand Die Anzahl der On-Demand-Ressourcen, auf die Sie Zugriff haben. On demand Ressourcen werden nicht vorzeitig beendet, aber das On-Demand-Kontingent garantiert dies nicht. genügend Cloud TPU-Ressourcen zur Verfügung, um Ihre Anfrage zu erfüllen. v3-8 und v2-8: 16 TensorCores
Alle anderen: 0
Weitere Informationen finden Sie unter Weitere Kontingente anfordern. Keine Markierungen erforderlich, standardmäßig ausgewählt.
Auf Abruf Die Anzahl der Cloud TPU-Ressourcen auf Abruf, auf die Sie Zugriff haben. Dieses Kontingent gilt sowohl für TPUs auf Abruf als auch für TPU-Spot-VMs. Vorwegnehmbare Ressourcen können vorweggenommen werden, um Platz für Jobs mit höherer Priorität zu schaffen. Ein Kontingent auf Abruf ist keine Garantie dafür, dass genügend Cloud TPU-Ressourcen verfügbar sind, um Ihre Anfrage zu erfüllen. Weitere Informationen finden Sie unter Präemptive TPUs und TPU Spot-VMs verwalten. v3-8 und v2-8: 48 TensorCores
Alle anderen: 0
Weitere Informationen finden Sie unter Weitere Kontingente anfordern.
  • Spot-VMs: Verwenden Sie das Flag --spot.
  • Präemptive TPUs: Verwenden Sie die Methode --preemptible. Das --preemptible Flag wird nicht unterstützt für queued Ressourcen. Verwenden Sie stattdessen das Flag --spot.

TPU-Kontingente werden in TPU-Kernen pro Projekt und Zone oder TPU-Kernen pro Projekt und Region angegeben.

TPU v5p-Kontingente

Sie können Ihr TPU-v5p-Kontingent in einer beliebigen Kombination von Kernen verwenden. Wenn Sie beispielsweise ein Kontingent von 32 Kernen haben, können Sie mit diesem Kontingent jeweils vier TPU-Slices erstellen. mit 8 Kernen.

Kontingente auf Abruf:

  • TPU v5p-Kerne auf Abruf pro Projekt und Region
  • Auf Abruf verfügbare TPU v5p-Kerne pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v5p-Kerne pro Projekt und Region
  • TPU v5p-Kerne pro Projekt und Zone

TPU v5e-Kontingente

TPU v5e kann für Training und Bereitstellung verwendet werden. Es gibt separate Kontingente für Training und Bereitstellung sowie für einzelne Hosts (Lite-Cores) und mehrere Hosts (Lite-Pod-Cores).

Auslieferungskontingente

Kontingente für die Bereitstellung auf Abruf:

  • TPU v5 Lite-Pod-Kerne auf Abruf für die Bereitstellung pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne auf Abruf für die Bereitstellung pro Projekt und Zone

Kontingente für die Auslieferung on demand:

  • TPU v5 Lite-Pod-Kerne für die Bereitstellung pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne für die Bereitstellung pro Projekt und Zone

Trainingskontingente

Präemptive Trainingskontingente:

  • TPU v5 Lite-Kerne auf Abruf pro Projekt und Region
  • TPU v5 Lite-Kerne auf Abruf pro Projekt und Zone
  • Pod-Kerne der auf Abruf verfügbaren TPU v5 Lite pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Trainingskontingente:

  • TPU v5 Lite-Kerne pro Projekt und Region
  • TPU v5 Lite-Kerne pro Projekt und Zone
  • TPU v5 Lite-Pod-Kerne pro Projekt und Region
  • TPU v5 Lite-Pod-Kerne pro Projekt und Zone

TPU v4-Kontingente

Sie können Ihr TPU v4-Kontingent in einer beliebigen Kombination von Kernen verwenden. Wenn Sie beispielsweise ein Kontingent von 32 Kernen haben, können Sie mit diesem Kontingent jeweils vier TPU-Slices erstellen. mit 8 Kernen.

Kontingente auf Abruf:

  • TPU v4-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v4-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v4-Pod-Kerne pro Projekt und Region
  • TPU v4-Pod-Kerne pro Projekt und Zone

TPU v3-Kontingente

Es gibt unterschiedliche TPU v3-Kontingente für Einzelhost-TPUs (Kern) und Multihost-TPUs (Pod) aus. Sie müssen Pod-Kontingente der Version 3 verwenden, um TPUs mit mehr als 8 Kernen zu erstellen.

Kontingente auf Abruf:

  • TPU v3-Kerne auf Abruf pro Projekt und Region
  • TPU v3-Kerne auf Abruf pro Projekt und Zone
  • TPU v3-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v3-Pod-Kerne auf Abruf pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v3-Kerne pro Projekt und Region
  • TPU v3-Kerne pro Projekt und Zone
  • TPU v3-Pod-Kerne pro Projekt und Region
  • TPU v3-Pod-Kerne pro Projekt und Zone

TPU v2-Kontingente

Es gibt separate TPU v2-Kontingente für TPUs mit einem einzelnen Host (Kern) und TPUs mit mehreren Hosts (Pod).

Kontingente auf Abruf:

  • TPU v2-Kerne auf Abruf pro Projekt und Region
  • TPU v2-Kerne auf Abruf pro Projekt und Zone
  • TPU v2-Pod-Kerne auf Abruf pro Projekt und Region
  • TPU v2 auf Abruf – Pod-Kerne pro Projekt und Zone

On-Demand-Kontingente:

  • TPU v2-Kerne pro Projekt und Region
  • TPU v2-Kerne pro Projekt und Zone
  • TPU v2-Pod-Kerne pro Projekt und Region
  • TPU v2-Pod-Kerne pro Projekt und Zone

Weitere Informationen zu TPU-Chips und TensorCores finden Sie unter TPU-Systemarchitektur.

Zusätzliches Kontingent ansehen und anfordern

Sie können das Ihrem Google Cloud-Projekt zugewiesene Kontingent auf der Seite „Kontingente“ im Google Cloud Console Wenn Sie Wenn Sie ein zusätzliches Cloud TPU-Kontingent benötigen, können Sie es unter „Kontingente“ anfordern Seite. Weitere Informationen finden Sie unter Höheres Kontingentlimit anfordern.