metaboost/scripts/k8s-env/validate-classification.sh at main · podverse/metaboost · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
#!/usr/bin/env bash
# Validate infra/env/classification/base.yaml and overlays (per-key kind + defaults).
set -euo pipefail

SCRIPT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)"
REPO_ROOT="$(cd "$SCRIPT_DIR/../.." && pwd)"
cd "$REPO_ROOT"

if ! command -v ruby >/dev/null 2>&1; then
  echo "Error: ruby is required." >&2
  exit 1
fi

export METABOOST_ROOT="$REPO_ROOT"

ruby <<'RUBY'
require 'set'
require 'yaml'

root = ENV.fetch('METABOOST_ROOT')
base_path = File.join(root, 'infra/env/classification/base.yaml')
classification = YAML.safe_load(
  File.read(base_path),
  permitted_classes: [Symbol, Time],
  aliases: true
)
env_groups = classification['env_groups'] || {}
errors = []

ALLOWED_KINDS = %w[literal config secret source_only].freeze

# Optional per-var metadata (merge/render ignore; documents home override topology). See ENV-REFERENCE.md.
PERMITTED_VAR_SPEC_KEYS = %w[kind default override_role override_file derived_from local_generator].freeze
OVERRIDE_ROLES = %w[derived none].freeze
OVERRIDE_FILES = %w[info mailer auth locale user_agent db_management_superuser].freeze
SPLIT_BUCKETS = {
  'http' => %w[api web-sidecar web management-api management-web-sidecar management-web].freeze,
  'valkey' => %w[valkey-source-only valkey].freeze
}.freeze
HTTP_FILE_SPLIT_VALUES = SPLIT_BUCKETS['http']
VALKEY_FILE_SPLIT_VALUES = SPLIT_BUCKETS['valkey']
LOCAL_GENERATORS = %w[hex_32].freeze
PERMITTED_ENV_GROUP_KEYS = %w[vars inherits no_env_from keys].freeze
INHERIT_ENTRY_KEYS = %w[from file_splits map].freeze

def array_to_set(arr)
  (arr || []).to_h { |k| [k, true] }
end

def intersection(a, b)
  a.keys & b.keys
end

def inherits_cycle?(env_groups)
  graph = {}
  env_groups.each do |name, wl|
    next unless wl.is_a?(Hash)

    edges = []
    Array(wl['inherits']).each do |e|
      next unless e.is_a?(Hash) && e['from']

      edges << e['from'].to_s
    end
    graph[name.to_s] = edges
  end

  visiting = {}
  visited = {}

  dfs = lambda do |node|
    return true if visiting[node]
    return false if visited[node]

    visiting[node] = true
    (graph[node] || []).each do |n|
      return true if dfs.call(n)
    end
    visiting[node] = false
    visited[node] = true
    false
  end

  graph.keys.any? { |n| dfs.call(n) }
end

# Vars visible for an inherit entry after file_splits filtering (matches merge-env inherit_entry_source_raw).
def flatten_inherit_filtered_source_vars(env_groups, from, entry)
  wl = env_groups[from]
  return {} unless wl.is_a?(Hash)

  if entry.key?('file_splits')
    fs = entry['file_splits']
    unless fs.is_a?(Array)
      return {}
    end

    allowed = fs.empty? ? Set.new : fs.map(&:to_s).to_set
  else
    allowed = nil
  end

  if SPLIT_BUCKETS.key?(from.to_s)
    out = {}
    SPLIT_BUCKETS[from.to_s].each do |split|
      next if allowed && !allowed.include?(split)

      (((wl[split] || {})['vars']) || {}).each { |k, v| out[k.to_s] = v }
    end
    out
  else
    (wl['vars'] || {}).transform_keys(&:to_s)
  end
end

def validate_var_spec_leaf(errors, label, key, spec, literals, literals_only, config, secrets)
  key = key.to_s
  unless spec.is_a?(Hash)
    errors << "#{label}: var #{key} must be a mapping with kind and default"
    return
  end

  # Kind/default come from inherited map; env group vars may supply only override_file (anchor).
  if spec.keys.map(&:to_s) == ['override_file']
    ofile = spec['override_file']
    if ofile.nil? || ofile.to_s.strip.empty?
      errors << "#{label}: var #{key} missing non-empty override_file"
      return
    end
    unless OVERRIDE_FILES.include?(ofile.to_s)
      errors << "#{label}: var #{key} has invalid override_file #{ofile.inspect} (use logical name: #{OVERRIDE_FILES.join(', ')})"
    end
    return
  end

  kind = spec['kind']
  if kind.nil? || kind.empty?
    errors << "#{label}: var #{key} missing kind"
    return
  end

  unless ALLOWED_KINDS.include?(kind)
    errors << "#{label}: var #{key} has invalid kind #{kind.inspect}"
    return
  end

  unless spec.key?('default')
    errors << "#{label}: var #{key} missing default"
    return
  end

  spec.each_key do |meta_key|
    next if PERMITTED_VAR_SPEC_KEYS.include?(meta_key)

    errors << "#{label}: var #{key} has unknown key #{meta_key.inspect} (permitted: #{PERMITTED_VAR_SPEC_KEYS.join(', ')})"
  end

  if spec.key?('file_split') && !spec['file_split'].to_s.empty?
    errors << "#{label}: var #{key} must not use file_split (http and valkey split env groups use split bucket keys; other env groups omit it)"
  end

  orole = spec['override_role']
  unless orole.nil? || orole.to_s.empty?
    os = orole.to_s
    if os == 'anchor'
      errors << "#{label}: var #{key} override_role anchor is redundant; use override_file only (omit override_role)"
    elsif !OVERRIDE_ROLES.include?(os)
      errors << "#{label}: var #{key} has invalid override_role #{orole.inspect}"
    end
  end

  ofile = spec['override_file']
  unless ofile.nil? || ofile.to_s.empty?
    unless OVERRIDE_FILES.include?(ofile.to_s)
      errors << "#{label}: var #{key} has invalid override_file #{ofile.inspect} (use logical name: #{OVERRIDE_FILES.join(', ')})"
    end
  end

  dfrom = spec['derived_from']
  case orole.to_s
  when 'derived'
    if dfrom.nil? || dfrom.to_s.strip.empty?
      errors << "#{label}: var #{key} override_role derived requires non-empty derived_from"
    end
  when 'none'
    errors << "#{label}: var #{key} has derived_from but override_role is none" if dfrom && !dfrom.to_s.strip.empty?
    errors << "#{label}: var #{key} has override_file but override_role is none" if ofile && !ofile.to_s.empty?
  end

  if dfrom && !dfrom.to_s.strip.empty?
    unless orole.to_s == 'derived'
      errors << "#{label}: var #{key} has derived_from; set override_role to derived"
    end
  end
  if ofile && !ofile.to_s.empty? && orole.to_s == 'derived'
    errors << "#{label}: var #{key} has override_file; derived keys must not use override_file"
  end

  lgen = spec['local_generator']
  unless lgen.nil? || lgen.to_s.empty?
    unless LOCAL_GENERATORS.include?(lgen.to_s)
      errors << "#{label}: var #{key} has invalid local_generator #{lgen.inspect} (use: #{LOCAL_GENERATORS.join(', ')})"
    end
    unless kind == 'secret'
      errors << "#{label}: var #{key} has local_generator but kind is #{kind.inspect} (must be secret)"
    end
  end

  case kind
  when 'literal'
    literals[key] = true
  when 'source_only'
    literals_only[key] = true
  when 'config'
    config[key] = true
  when 'secret'
    secrets[key] = true
  end
end

validate_inherits_for_env_group = lambda do |wl_name, inherits|
  return if inherits.nil?

  unless inherits.is_a?(Array)
    errors << "Env group #{wl_name}: inherits must be an array of mappings"
    return
  end

  inherits.each_with_index do |entry, idx|
    unless entry.is_a?(Hash)
      errors << "Env group #{wl_name}: inherits[#{idx}] must be a mapping with from:"
      next
    end

    entry.each_key do |ek|
      next if INHERIT_ENTRY_KEYS.include?(ek)

      errors << "Env group #{wl_name}: inherits[#{idx}] has unknown key #{ek.inspect} (permitted: #{INHERIT_ENTRY_KEYS.join(', ')})"
    end

    from = entry['from']
    if from.nil? || from.to_s.strip.empty?
      errors << "Env group #{wl_name}: inherits[#{idx}] requires non-empty from:"
      next
    end

    from = from.to_s
    unless env_groups.key?(from)
      errors << "Env group #{wl_name}: inherits[#{idx}] from=#{from.inspect} is not a defined env group"
    end

    if entry.key?('file_splits')
      unless %w[valkey http].include?(from)
        errors << "Env group #{wl_name}: inherits[#{idx}] file_splits is only allowed when from is valkey or http"
      end
      fs = entry['file_splits']
      unless fs.is_a?(Array)
        errors << "Env group #{wl_name}: inherits[#{idx}] file_splits must be an array"
      else
        allowed_splits =
          case from
          when 'http' then HTTP_FILE_SPLIT_VALUES
          when 'valkey' then VALKEY_FILE_SPLIT_VALUES
          else
            []
          end
        fs.each do |s|
          s = s.to_s
          unless allowed_splits.include?(s)
            errors << "Env group #{wl_name}: inherits[#{idx}] file_splits has invalid value #{s.inspect} (for #{from}: #{allowed_splits.join(', ')})"
          end
        end
      end
    end

    next unless from && env_groups.key?(from)

    if entry.key?('remap')
      errors << "Env group #{wl_name}: inherits[#{idx}] uses removed key remap (use map: SourceName: TargetName)"
    end
    if entry.key?('aliases')
      errors << "Env group #{wl_name}: inherits[#{idx}] uses removed key aliases (list every import under map)"
    end

    unless entry.key?('map')
      errors << "Env group #{wl_name}: inherits[#{idx}] requires map (non-empty source var name => target var name)"
      next
    end

    mmap = entry['map']
    unless mmap.is_a?(Hash) && !mmap.empty?
      errors << "Env group #{wl_name}: inherits[#{idx}] map must be a non-empty mapping"
      next
    end

    src_vars = flatten_inherit_filtered_source_vars(env_groups, from, entry)
    map_sources = []
    map_targets = []
    mmap.each do |src_key, tgt_key|
      sk = src_key.to_s
      tk = tgt_key.to_s
      if sk.strip.empty? || tk.strip.empty?
        errors << "Env group #{wl_name}: inherits[#{idx}] map entries must use non-empty source and target strings"
        next
      end
      map_sources << sk
      map_targets << tk
      unless src_vars.key?(sk)
        errors << "Env group #{wl_name}: inherits[#{idx}] map source #{sk.inspect} is not in filtered vars from env group #{from.inspect} (check file_splits)"
      end
    end
    if map_sources.uniq.length != map_sources.length
      errors << "Env group #{wl_name}: inherits[#{idx}] map has duplicate source var names"
    end
    if map_targets.uniq.length != map_targets.length
      errors << "Env group #{wl_name}: inherits[#{idx}] map has duplicate target var names"
    end
  end
end

unless classification['version']
  errors << 'Missing top-level version'
end

if inherits_cycle?(env_groups)
  errors << 'inherits: cycle detected in env group inheritance graph'
end

env_groups.each do |name, wl|
  next unless wl.is_a?(Hash)

  if SPLIT_BUCKETS.key?(name.to_s)
    allowed_split_top = SPLIT_BUCKETS[name.to_s]

    wl.each_key do |wk|
      unless allowed_split_top.include?(wk.to_s)
        errors << "Env group #{name}: unknown top-level key #{wk.inspect} (expected: #{allowed_split_top.join(', ')})"
      end
    end

    inh = wl['inherits']
    if inh.is_a?(Array) && !inh.empty?
      errors << "Env group #{name}: split-catalogued env group must not use inherits"
    elsif !inh.nil? && !inh.is_a?(Array)
      errors << "Env group #{name}: split-catalogued env group must not use inherits (omit or use [])"
    end
    errors << "Env group #{name}: split-catalogued env group must not set no_env_from" if wl['no_env_from']
    errors << "Env group #{name}: split-catalogued env group must not set keys" if wl.key?('keys')

    literals = {}
    literals_only = {}
    config = {}
    secrets = {}
    seen = {}

    SPLIT_BUCKETS[name.to_s].each do |split|
      unless wl.key?(split)
        errors << "Env group #{name}: missing split bucket #{split.inspect}"
        next
      end
      node = wl[split]
      unless node.is_a?(Hash)
        errors << "Env group #{name}: split #{split} must be a mapping"
        next
      end
      node.each_key do |nk|
        unless nk.to_s == 'vars'
          errors << "Env group #{name}: split #{split} unknown key #{nk.inspect} (only vars permitted)"
        end
      end
      vars = node['vars']
      unless vars.is_a?(Hash) && !vars.empty?
        errors << "Env group #{name} split #{split}: vars must be a non-empty mapping"
        next
      end
      vars.each do |var_key, spec|
        vk = var_key.to_s
        if seen.key?(vk)
          errors << "Env group #{name}: var #{vk.inspect} appears in multiple splits (#{seen[vk]} and #{split})"
        else
          seen[vk] = split
        end
        validate_var_spec_leaf(errors, "Env group #{name} split #{split}", vk, spec, literals, literals_only, config, secrets)
      end
    end

    lit_set = literals
    lo_set = literals_only
    cfg_set = config
    sec_set = secrets
    intersection(lit_set, cfg_set).each do |k|
      errors << "Env group #{name}: key #{k} appears as both literal and config"
    end
    intersection(lit_set, sec_set).each do |k|
      errors << "Env group #{name}: key #{k} appears as both literal and secret"
    end
    intersection(cfg_set, sec_set).each do |k|
      errors << "Env group #{name}: key #{k} appears as both config and secret"
    end
    intersection(lo_set, cfg_set).each do |k|
      errors << "Env group #{name}: key #{k} appears as both source_only and config"
    end
    intersection(lo_set, sec_set).each do |k|
      errors << "Env group #{name}: key #{k} appears as both source_only and secret"
    end
    intersection(lo_set, lit_set).each do |k|
      errors << "Env group #{name}: key #{k} appears as both source_only and literal"
    end

    next
  end

  wl.each_key do |wk|
    next if PERMITTED_ENV_GROUP_KEYS.include?(wk)

    errors << "Env group #{name}: unknown top-level key #{wk.inspect} (permitted: #{PERMITTED_ENV_GROUP_KEYS.join(', ')})"
  end

  inherits = wl['inherits']
  validate_inherits_for_env_group.call(name, inherits)

  vars = wl['vars'] || {}

  inherits_nonempty = inherits.is_a?(Array) && !inherits.empty?
  if vars.empty? && !wl['no_env_from'] && !inherits_nonempty
    errors << "Env group #{name}: missing vars (or set no_env_from, or add non-empty inherits)"
    next
  end

  literals = {}
  literals_only = {}
  config = {}
  secrets = {}

  vars.each do |key, spec|
    validate_var_spec_leaf(errors, "Env group #{name}", key.to_s, spec, literals, literals_only, config, secrets)
  end

  lit_set = literals
  lo_set = literals_only
  cfg_set = config
  sec_set = secrets

  intersection(lit_set, cfg_set).each do |k|
    errors << "Env group #{name}: key #{k} appears as both literal and config"
  end
  intersection(lit_set, sec_set).each do |k|
    errors << "Env group #{name}: key #{k} appears as both literal and secret"
  end
  intersection(cfg_set, sec_set).each do |k|
    errors << "Env group #{name}: key #{k} appears as both config and secret"
  end
  intersection(lo_set, cfg_set).each do |k|
    errors << "Env group #{name}: key #{k} appears as both source_only and config"
  end
  intersection(lo_set, sec_set).each do |k|
    errors << "Env group #{name}: key #{k} appears as both source_only and secret"
  end
  intersection(lo_set, lit_set).each do |k|
    errors << "Env group #{name}: key #{k} appears as both source_only and literal"
  end

  if wl['no_env_from']
    unless config.empty? && secrets.empty?
      errors << "Env group #{name}: no_env_from env groups must only use literal or source_only kinds"
    end
  end
end

if errors.empty?
  puts 'validate-classification: OK'
  exit 0
end

warn errors.join("\n")
exit 1
RUBY