Observability Prometheus + Grafana + Alertmanager + Loki Setup

First PublishedFeb 16, 2026ByAtif Alam

This page walks through setting up the full Prometheus + Grafana + Alertmanager + Loki stack, first with Docker Compose (for local dev or small deployments) and then with Kubernetes.

Docker Compose Setup

Directory Structure

1
monitoring/
2
  docker-compose.yml
3
  prometheus/
4
    prometheus.yml
5
    rules/
6
      alerts.yml
7
  alertmanager/
8
    alertmanager.yml
9
  grafana/
10
    provisioning/
11
      datasources/
12
        datasources.yml
13
      dashboards/
14
        dashboards.yml
15
    dashboards/
16
      node-exporter.json
17
  loki/
18
    loki-config.yml
19
  promtail/
20
    promtail-config.yml

docker-compose.yml

1
version: "3.8"
2

3
services:
4
  prometheus:
5
    image: prom/prometheus:latest
6
    ports:
7
      - "9090:9090"
8
    volumes:
9
      - ./prometheus/prometheus.yml:/etc/prometheus/prometheus.yml
10
      - ./prometheus/rules:/etc/prometheus/rules
11
      - prometheus-data:/prometheus
12
    command:
13
      - "--config.file=/etc/prometheus/prometheus.yml"
14
      - "--storage.tsdb.retention.time=15d"
15

16
  alertmanager:
17
    image: prom/alertmanager:latest
18
    ports:
19
      - "9093:9093"
20
    volumes:
21
      - ./alertmanager/alertmanager.yml:/etc/alertmanager/alertmanager.yml
22

23
  grafana:
24
    image: grafana/grafana:latest
25
    ports:
26
      - "3000:3000"
27
    environment:
28
      GF_SECURITY_ADMIN_PASSWORD: admin
29
    volumes:
30
      - ./grafana/provisioning:/etc/grafana/provisioning
31
      - ./grafana/dashboards:/var/lib/grafana/dashboards
32
      - grafana-data:/var/lib/grafana
33

34
  loki:
35
    image: grafana/loki:latest
36
    ports:
37
      - "3100:3100"
38
    volumes:
39
      - ./loki/loki-config.yml:/etc/loki/local-config.yaml
40
      - loki-data:/loki
41

42
  promtail:
43
    image: grafana/promtail:latest
44
    volumes:
45
      - ./promtail/promtail-config.yml:/etc/promtail/config.yml
46
      - /var/log:/var/log:ro
47
    command: -config.file=/etc/promtail/config.yml
48

49
  node-exporter:
50
    image: prom/node-exporter:latest
51
    ports:
52
      - "9100:9100"
53
    pid: host
54
    volumes:
55
      - /proc:/host/proc:ro
56
      - /sys:/host/sys:ro
57
      - /:/rootfs:ro
58
    command:
59
      - "--path.procfs=/host/proc"
60
      - "--path.sysfs=/host/sys"
61
      - "--path.rootfs=/rootfs"
62

63
volumes:
64
  prometheus-data:
65
  grafana-data:
66
  loki-data:

prometheus.yml

1
global:
2
  scrape_interval: 15s
3
  evaluation_interval: 15s
4

5
rule_files:
6
  - "rules/*.yml"
7

8
alerting:
9
  alertmanagers:
10
    - static_configs:
11
        - targets: ["alertmanager:9093"]
12

13
scrape_configs:
14
  - job_name: "prometheus"
15
    static_configs:
16
      - targets: ["localhost:9090"]
17

18
  - job_name: "node-exporter"
19
    static_configs:
20
      - targets: ["node-exporter:9100"]
21

22
  - job_name: "loki"
23
    static_configs:
24
      - targets: ["loki:3100"]

Alert Rules

1
groups:
2
  - name: node_alerts
3
    rules:
4
      - alert: HighCpuUsage
5
        expr: 100 - (avg by (instance) (rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100) > 80
6
        for: 5m
7
        labels:
8
          severity: warning
9
        annotations:
10
          summary: "High CPU usage on {{ $labels.instance }}"
11

12
      - alert: DiskSpaceLow
13
        expr: (1 - node_filesystem_avail_bytes{mountpoint="/"} / node_filesystem_size_bytes{mountpoint="/"}) * 100 > 90
14
        for: 10m
15
        labels:
16
          severity: critical
17
        annotations:
18
          summary: "Disk space above 90% on {{ $labels.instance }}"
19

20
      - alert: InstanceDown
21
        expr: up == 0
22
        for: 2m
23
        labels:
24
          severity: critical
25
        annotations:
26
          summary: "Instance {{ $labels.instance }} is down"

Alertmanager Config

1
global:
2
  resolve_timeout: 5m
3

4
route:
5
  receiver: default
6
  group_by: [alertname]
7
  group_wait: 30s
8
  group_interval: 5m
9
  repeat_interval: 4h
10

11
receivers:
12
  - name: default
13
    webhook_configs:
14
      - url: "http://localhost:5001/webhook"   # replace with Slack/PagerDuty

Grafana Data Source Provisioning

1
apiVersion: 1
2
datasources:
3
  - name: Prometheus
4
    type: prometheus
5
    url: http://prometheus:9090
6
    isDefault: true
7

8
  - name: Loki
9
    type: loki
10
    url: http://loki:3100
11

12
  - name: Alertmanager
13
    type: alertmanager
14
    url: http://alertmanager:9093

Grafana Dashboard Provisioning

1
apiVersion: 1
2
providers:
3
  - name: default
4
    folder: ""
5
    type: file
6
    options:
7
      path: /var/lib/grafana/dashboards
8
      foldersFromFilesStructure: true

Place exported dashboard JSON files in grafana/dashboards/. Popular community dashboards:

Dashboard	ID	Metrics From
Node Exporter Full	1860	Node exporter
Docker Monitoring	893	cAdvisor
Prometheus Stats	2	Prometheus itself
Loki Logs	13639	Loki

Import by ID: Grafana → Dashboards → Import → Enter ID.

Loki Config

1
auth_enabled: false
2

3
server:
4
  http_listen_port: 3100
5

6
common:
7
  path_prefix: /loki
8
  storage:
9
    filesystem:
10
      chunks_directory: /loki/chunks
11
      rules_directory: /loki/rules
12
  replication_factor: 1
13
  ring:
14
    kvstore:
15
      store: inmemory
16

17
schema_config:
18
  configs:
19
    - from: 2020-10-24
20
      store: tsdb
21
      object_store: filesystem
22
      schema: v13
23
      index:
24
        prefix: index_
25
        period: 24h

Promtail Config

1
server:
2
  http_listen_port: 9080
3

4
positions:
5
  filename: /tmp/positions.yaml
6

7
clients:
8
  - url: http://loki:3100/loki/api/v1/push
9

10
scrape_configs:
11
  - job_name: system
12
    static_configs:
13
      - targets: [localhost]
14
        labels:
15
          job: varlogs
16
          __path__: /var/log/*.log

Starting Everything

1
cd monitoring
2
docker compose up -d

Then open:

Grafana: http://localhost:3000 (admin / admin)
Prometheus: http://localhost:9090
Alertmanager: http://localhost:9093

Kubernetes Setup

For Kubernetes, the easiest path is the kube-prometheus-stack Helm chart, which installs Prometheus, Grafana, Alertmanager, Node exporter, kube-state-metrics, and pre-built dashboards.

Install With Helm

1
helm repo add prometheus-community https://prometheus-community.github.io/helm-charts
2
helm repo update
3

4
helm install monitoring prometheus-community/kube-prometheus-stack \
5
  --namespace monitoring \
6
  --create-namespace \
7
  --set grafana.adminPassword=admin

This deploys:

Prometheus Operator — Manages Prometheus instances via CRDs.
Prometheus — Configured to scrape Kubernetes pods, nodes, and services.
Grafana — Pre-loaded with Kubernetes dashboards.
Alertmanager — With default alert rules.
Node exporter — DaemonSet on every node.
kube-state-metrics — Kubernetes object metrics.

Access Grafana

1
kubectl port-forward -n monitoring svc/monitoring-grafana 3000:80

Open http://localhost:3000 (admin / admin).

Add Loki

1
helm install loki grafana/loki-stack \
2
  --namespace monitoring \
3
  --set promtail.enabled=true \
4
  --set loki.persistence.enabled=true \
5
  --set loki.persistence.size=10Gi

Then add Loki as a data source in Grafana: URL http://loki:3100.

Custom Scrape Targets (ServiceMonitor)

The Prometheus Operator uses CRDs to configure scraping. To scrape your app:

1
apiVersion: monitoring.coreos.com/v1
2
kind: ServiceMonitor
3
metadata:
4
  name: my-app
5
  namespace: monitoring
6
  labels:
7
    release: monitoring       # must match the Helm release label
8
spec:
9
  namespaceSelector:
10
    matchNames: [default]
11
  selector:
12
    matchLabels:
13
      app: my-app
14
  endpoints:
15
    - port: metrics
16
      interval: 15s

Your app’s Service must have a port named metrics and the label app: my-app.

Custom Alert Rules (PrometheusRule)

1
apiVersion: monitoring.coreos.com/v1
2
kind: PrometheusRule
3
metadata:
4
  name: my-app-alerts
5
  namespace: monitoring
6
  labels:
7
    release: monitoring
8
spec:
9
  groups:
10
    - name: my-app
11
      rules:
12
        - alert: MyAppHighErrorRate
13
          expr: |
14
            sum(rate(http_requests_total{app="my-app", status=~"5.."}[5m]))
15
              /
16
            sum(rate(http_requests_total{app="my-app"}[5m]))
17
              > 0.05
18
          for: 5m
19
          labels:
20
            severity: critical
21
          annotations:
22
            summary: "High error rate on my-app"

Custom Values File

1
grafana:
2
  adminPassword: "secure-password"
3
  persistence:
4
    enabled: true
5
    size: 5Gi
6

7
prometheus:
8
  prometheusSpec:
9
    retention: 30d
10
    storageSpec:
11
      volumeClaimTemplate:
12
        spec:
13
          accessModes: [ReadWriteOnce]
14
          resources:
15
            requests:
16
              storage: 50Gi
17

18
alertmanager:
19
  config:
20
    route:
21
      receiver: slack
22
    receivers:
23
      - name: slack
24
        slack_configs:
25
          - api_url: "https://hooks.slack.com/services/XXX"
26
            channel: "#alerts"

1
helm upgrade monitoring prometheus-community/kube-prometheus-stack \
2
  --namespace monitoring \
3
  -f monitoring-values.yaml

From Zero to Dashboard Checklist

Deploy the stack (Docker Compose or Helm).
Verify targets — Prometheus → Status → Targets (all should be “UP”).
Import Node Exporter dashboard (ID 1860) in Grafana.
Add your app as a scrape target (static config or ServiceMonitor).
Instrument your app with client libraries (counters, histograms).
Create alert rules for error rate, latency, and resource usage.
Configure Alertmanager receivers (Slack, PagerDuty, email).
Add Loki and configure Promtail for log collection.
Build custom dashboards combining metrics (Prometheus) and logs (Loki).

Key Takeaways

Docker Compose is the fastest way to get the full stack running locally.
kube-prometheus-stack Helm chart deploys everything for Kubernetes with pre-built dashboards and auto-discovery.
Use ServiceMonitor and PrometheusRule CRDs to add scrape targets and alerts in Kubernetes.
Provision Grafana data sources and dashboards from files — treat monitoring config as code.
Start with Node Exporter + community dashboards, then add application metrics and custom dashboards.