FI/SV/EN kielituki about valmis (testaamatta)
This commit is contained in:
@@ -26,9 +26,14 @@ Tässä on kooste projektin vaatimuksista, työtehtävistä ja niiden nykytilant
|
||||
- Sijoittaa Hub-palvelin julkisesti saatavuusosoitteeseen `kipina.studio`.
|
||||
|
||||
### Tehtävät
|
||||
- [ ] Tuotantopalvelimen käyttöönotto Nginxin tai Docker-compose kautta ehtojen täytyttyä
|
||||
- [ ] Turvamekanismin lisäys: Varmistetaan, ettei kukaan lähetä "falskeja" vastauksia nodeilta
|
||||
- [ ] Solmuille rekisteröitymismekanismi tai tulostaulukko
|
||||
- [x] Tuotantopalvelimen käyttöönotto Docker-compose + Caddy TLS kautta (`kipina.studio`)
|
||||
- [x] Deploy-skripti (`deploy.sh`) + Discord-webhook-notifikaatio julkaisuista
|
||||
- [x] Admin-dashboard (`/admin`) Basic Auth -suojattuna, live-sessiot ja metriikat
|
||||
- [x] REST API (`POST /api/v1/chat/completions`) task_id-pohjaisella vastausten reitityksellä
|
||||
- [x] API timeout (120s) + selkeät virheilmoitukset (504 Gateway Timeout)
|
||||
- [x] IP-pohjainen rate limiting (max 4 yhteyttä/IP) + origin-validointi
|
||||
- [ ] Turvamekanismin lisäys: Varmistetaan, ettei kukaan lähetä "falskeja" vastauksia nodeilta (PoW/challenge-response)
|
||||
- [x] SQLite-sessioseuranta (node_sessions + pair_results)
|
||||
|
||||
---
|
||||
|
||||
@@ -53,7 +58,38 @@ Tässä on kooste projektin vaatimuksista, työtehtävistä ja niiden nykytilant
|
||||
- Kyetä lataamaan selaimen IndexedDB:hen satojen megatavujen painot massivisena fetch-hakuna, kääntää ne WebGPU-puskureihin (Buffers) ja suorittaa tekstigeneraatiota etänä ohjattuna verkosta käsin WebSocketia myöden.
|
||||
|
||||
### Tehtävät
|
||||
- [ ] Refaktoroi Wasm-Noden (Burn.rs) paketti tuomaan Text-Tokenizerit (esim. BPE) ja kielimallin arkkitehtuuri käyttöön
|
||||
- [ ] Koodaa Nodeen logiikka hakea / kasata mallin painot välimuistista "Chunk"-lohkoina valmiiksi
|
||||
- [ ] Hub uudistetaan generoimaan pelkkien matikkavaikeuksien sijasta Text Prompts (esim. "Kirjoita haiku Suomesta") ja reitittämään työkuorman vapaalle solmulle
|
||||
- [ ] Kipinän käyttöliittymään Chat-ikkuna Hubin striimaamien tulossanojen tarkkailuun reaaliajassa
|
||||
- [x] Refaktoroi Wasm-Noden (Burn.rs) paketti tuomaan Text-Tokenizerit (BPE, Qwen2.5-Coder) ja kielimallin arkkitehtuuri käyttöön
|
||||
- [x] Koodaa Nodeen logiikka hakea / kasata mallin painot välimuistista IndexedDB:hen (tokenizer.json + model weights)
|
||||
- [x] Hub uudistetaan generoimaan Text Prompts ja reitittämään työkuorman vapaalle solmulle (broadcast + task_id-matching)
|
||||
- [x] Kipinän käyttöliittymään Chat-ikkuna Hubin striimaamien tulossanojen tarkkailuun reaaliajassa (llm_chunk streaming)
|
||||
- [x] SmolLM 135M — täysi transformer (Burn), ~1.2 tok/s CPU
|
||||
- [x] Qwen2.5 0.5B — Candle-inferenssi, ChatML-muotoilu, ~0.4 tok/s CPU
|
||||
- [x] Qwen2.5-Coder 0.5B & 3B — koodigeneraatio, streaming-tokenit, task_id-tuki
|
||||
- [x] Phi-3 Mini — placeholder (liian suuri selaimelle, natiivisolmulle suunnitteilla)
|
||||
- [x] EN/FI tokenisaatiovertailu overhead-laskennalla
|
||||
- [x] Natiivisolmu (Rust + CUDA) — Qwen2.5 0.5B, ~50-100 tok/s RTX 4090, NVML GPU-metriikat
|
||||
|
||||
---
|
||||
|
||||
## 🚀 Vaihe 6: Agent Workspace & CLI (KÄYNNISSÄ)
|
||||
|
||||
### Tavoitteet
|
||||
- Interaktiivinen terminaalipohjainen käyttöliittymä `kpn`-komennoilla.
|
||||
- Agenttitiimi (Koodari, Testaaja, Manageri) muokattavilla system prompteilla.
|
||||
- Agenttien ketjutus: manageri analysoi → koodari toteuttaa → testaaja arvioi.
|
||||
|
||||
### Tehtävät
|
||||
- [x] KPN-terminaali selaimeen (interaktiivinen komentorivi, komentohistoria)
|
||||
- [x] `kpn run <malli> "<prompti>"` — tehtävän lähetys REST API:n kautta
|
||||
- [x] `kpn hello` — tervehdyskomento
|
||||
- [x] `kpn pipeline "<tehtävä>"` — manageri → koodari → testaaja -ketjutus
|
||||
- [x] `kpn status`, `kpn models`, `kpn clear`, `kpn help`
|
||||
- [x] Agenttikortit (Koodari/Qwen-Coder, Testaaja/SmolLM, Manageri/KPN CLI)
|
||||
- [x] Muokattavat system promptit per agentti (localStorage-tallennus)
|
||||
- [x] Multi-select: yhteinen konteksti useammalle agentille
|
||||
- [x] Streaming-vastaukset terminaalissa (llm_chunk + vilkkuva kursori)
|
||||
- [x] URL-hash navigointi (`#agents`, `#codelab`, `#network`)
|
||||
- [x] SPA fallback (ServeDir + ServeFile)
|
||||
- [ ] Agenttien välinen keskustelu (manageri ohjaa koodaria ja testaajaa dynaamisesti)
|
||||
- [ ] Tehtävähistoria ja tulosten tallennus
|
||||
- [ ] CLI-työkalu (`kpn` binary) lokaaliin käyttöön
|
||||
|
||||
Reference in New Issue
Block a user