ollama — local LLM runner

Name: Podstack GPU Cloud
Brand: Podstack
SKU: PODSTACK-GPU-CLOUD
Availability: InStock
Rating: 4.9 (180 reviews)

Ollama packages popular open LLMs into easy-to-pull bundles with sensible defaults. One-line model installs and a simple HTTP API.

Image tag

docker.io/manvarharsh/ollama:cuda12

Port	Service
22	SSH
11434	Ollama HTTP API

Variable	Description
`ENABLE_SSH`	Enable SSH server
`ENABLE_OLLAMA`	Start the Ollama server on port 11434
`OLLAMA_MODELS`	Override model store path (default `/data/.ollama/models`)
`OLLAMA_HOST`	Bind address (default `0.0.0.0:11434`)
`SSH_PUBLIC_KEY`	Public key for SSH

ollama pull llama3.1:8b
curl http://<pod-url>:11434/api/generate \
  -d '{"model":"llama3.1:8b","prompt":"Hello"}'

Mount at /data. Ollama stores pulled models under /data/.ollama/models/ so they survive restarts.