Kvantisoidun 1.5B-mallin inferenssi on ~0.2 tok/s WASM:ssa. Pipeline-tehtävät vaativat pidemmän odotusajan. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
Kvantisoidun 1.5B-mallin inferenssi on ~0.2 tok/s WASM:ssa. Pipeline-tehtävät vaativat pidemmän odotusajan. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>