CNN v2: Refactor to uniform 12D→4D architecture - demo.git

diff options

author	skal <pascal.massimino@gmail.com>	2026-02-13 12:32:36 +0100
committer	skal <pascal.massimino@gmail.com>	2026-02-13 12:32:36 +0100
commit	561d1dc446db7d1d3e02b92b43abedf1a5017850 (patch)
tree	ef9302dc1f9b6b9f8a12225580f2a3b07602656b /workspaces/main/music/KICK_90S_2.spec
parent	c27b34279c0d1c2a8f1dbceb0e154b585b5c6916 (diff)

CNN v2: Refactor to uniform 12D→4D architecture

**Architecture changes:** - Static features (8D): p0-p3 (parametric) + uv_x, uv_y, sin(10×uv_x), bias - Input RGBD (4D): fed separately to all layers - All layers: uniform 12D→4D (4 prev/input + 8 static → 4 output) - Bias integrated in static features (bias=False in PyTorch) **Weight calculations:** - 3 layers × (12 × 3×3 × 4) = 1296 weights - f16: 2.6 KB (vs old variable arch: ~6.4 KB) **Updated files:** *Training (Python):* - train_cnn_v2.py: Uniform model, takes input_rgbd + static_features - export_cnn_v2_weights.py: Binary export for storage buffers - export_cnn_v2_shader.py: Per-layer shader export (debugging) *Shaders (WGSL):* - cnn_v2_static.wgsl: p0-p3 parametric features (mips/gradients) - cnn_v2_compute.wgsl: 12D input, 4D output, vec4 packing *Tools:* - HTML tool (cnn_v2_test): Updated for 12D→4D, layer visualization *Docs:* - CNN_V2.md: Updated architecture, training, validation sections - HOWTO.md: Reference HTML tool for validation *Removed:* - validate_cnn_v2.sh: Obsolete (used CNN v1 tool) All code consistent with bias=False (bias in static features as 1.0). handoff(Claude): CNN v2 architecture finalized and documented

Diffstat (limited to 'workspaces/main/music/KICK_90S_2.spec')

0 files changed, 0 insertions, 0 deletions


context:
space:
mode: