agentic-studio

Author	SHA1	Message	Date
jaakko	30e81875db	Reconnect yhdellä rivillä: ei floodata terminaalia Sama rivi päivittyy laskurilla: '↻ Yhdistetään uudelleen... (3)' Rivi poistetaan kun yhteys palautuu. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 07:18:13 +03:00
jaakko	73bcd3143a	WebSocket auto-reconnect: yhteys palautuu 3s kuluttua katkoksesta connectHub() luo uuden WebSocketin ja asettaa onopen/onclose/onmessage. onclose käynnistää 3s timerin joka kutsuu connectHub() uudelleen. Terminaaliin tulee '↻ Yhdistetään uudelleen...' -viesti. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 07:14:52 +03:00
jaakko	216b95d15c	kpn load: laitteiston VRAM/RAM tarkistus, liian isot mallit merkitään Hub: uusi GET /api/v1/hardware palauttaa natiivisolmun GPU/RAM-tiedot. Frontend: kpn load hakee laitteistotiedon ja näyttää mallit joihin laite riittää. Liian isot mallit näkyvät yliviivattuina + varoitus. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 07:08:34 +03:00
jaakko	34ef19472a	kpn load: Ollama-mallin vaihto lennossa (0.5b → 32b) - Hub: uusi POST /api/v1/model endpoint, broadcastaa change_model - Native node: kuuntelee change_model, kutsuu Ollaman pull + vaihtaa mallin - Frontend: kpn load näyttää 5 mallia, numero vaihtaa Ollaman mallin - Selain-WASM pysyy 0.5B:nä (kpn load 1) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 07:05:57 +03:00
jaakko	54a5af96c7	Tab-autokorjaus: korjattu ohitettu autocorrect Tab-handlerissa Tab-painallus meni suoraan dropdown-getCandidatesiin eikä kutsunut autocorrectiä. Nyt Tab yrittää ensin korjata typon, sitten täydentää. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 07:00:06 +03:00
jaakko	842153a7ec	uv-paketinhallinta: Dockerfile, README ja pyproject.toml käyttävät uv:tä Dockerfile kopioi uv:n ghcr.io/astral-sh/uv:latest -imagesta. README ohjeistaa uv sync + uv run. pyproject.toml pysyy ennallaan (uv-yhteensopiva formaatti). Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:45:08 +03:00
jaakko	5c25c7f9c1	DevOps Dockerfile-prompti: pip-only, ei poetryä/condaa Malli generoi poetry.lock-riippuvaisen Dockerfilen. Nyt prompti kertoo tarkan riippuvuuksien asennustavan (pyproject.toml/requirements.txt/pip) ja antaa valmiin CMD-rivin. Yksivaiheinen build riittää Pythonille. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:44:03 +03:00
jaakko	ac698a766e	DevOps-agentti: Dockerfile + docker-compose.yml + README pipeline-vaiheina DevOps generoi nyt kolme tiedostoa: - Dockerfile (multi-stage build, python:3.12-slim) - docker-compose.yml (palvelut, volumet, portit) - README.md (quick start docker compose up) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:41:34 +03:00
jaakko	f1b57a6c53	Tab korjaa kirjoitusvirheet + fuzzy-match alikomennoille Tab-painallus yrittää ensin autokorjausta (typo-taulukko + Levenshtein), sitten normaalia tab-completionia. Myös alikomennot korjautuvat fuzzy-matchilla (esim. "kpn rnu" → "kpn run"). Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:37:51 +03:00
jaakko	b70cdbd24d	Terminaalin autokorjaus: knp→kpn, kpn rnu→kpn run jne. Typo-taulukko yleisimmille kirjoitusvirheille + Levenshtein-etäisyys tuntemattomille ensimmäisille sanoille (max 2 merkin ero → kpn). Korjaus näytetään terminaalissa keltaisella. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:35:30 +03:00
jaakko	01d8b597e1	ZIP CRC-32 checksum lisätty: purkaminen ei enää epäonnistu Local file header ja central directory entry -tietueista puuttui CRC-32 kenttä. Lisätty crc32()-funktio ja kirjoitetaan checksum molempiin ZIP-rakenteisiin. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:31:42 +03:00
jaakko	f2ca4890df	Dockerfile: touch main.rs ennen buildia, estää stub-binaryn jäämisen Cargo ei rekompiloi jos vanha binääri on olemassa. touch pakottaa uudelleenkäännöksen. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:26:33 +03:00
jaakko	3eb0c4d939	Ollama-integraatio: GPU-inferenssi NVIDIA/AMD/Apple, ei Candle-rajoitteita - docker-compose: Ollama-container GPU:lla + persistent volume malleille - native-node: Candle poistettu, kutsuu Ollaman HTTP API:a (async) - Dockerfile: yksinkertaistettu, ei CUDA SDK:ta (Ollama hoitaa GPU:n) - Tukee kaikkia malleja: qwen2.5-coder:1.5b/3b/7b/14b/32b - OLLAMA_MODEL ympäristömuuttujalla vaihdetaan malli - kpn models näyttää Ollama-mallit nopeustiedoilla Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:22:11 +03:00
jaakko	d8443792a3	kpn load ja kpn models selkeytetty: selain vs natiivi kpn load lataa 0.5B selaimeen (ainoa joka toimii WASM:ssa). kpn models näyttää molemmat vaihtoehdot nopeustiedoilla. Ei enää harhaanjohtavia numerovalintoja. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:06:12 +03:00
jaakko	ae379bdda4	Zippi korjattu	2026-04-07 06:00:49 +03:00
jaakko	ed02e47158	ZIP-lataus korjattu: tiedostot globaaliin muuttujaan data-attribuutin sijaan JSON data-attribuutissa heittomerkit katkaisivat HTML:n. Nyt projectFiles[cardId] tallentaa tiedostot muistiin. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:00:17 +03:00
jaakko	959dc532bb	native-laskentaan säätöä	2026-04-07 05:20:54 +03:00
jaakko	1ef7f7c956	max_tokens per vaihe: manageri 200, koodari 512, testaaja 200, QA 512, DevOps 256 Hub ja natiivisolmu tukevat nyt max_tokens-kenttää API-pyynnöissä. Pipeline-vaiheet käyttävät sopivan kokoisia token-rajoja. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 22:03:26 +03:00
jaakko	e6e1f60935	Pipeline: QA kirjoittaa testit + DevOps tekee README:n Uudet vaiheet koodiarvioinnin jälkeen: - QA: kirjoittaa test_app.py (pytest, max 3 testiä) - DevOps: kirjoittaa README.md (asennus, käynnistys, testaus) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 22:00:04 +03:00
jaakko	322c98ff59	Pipeline-promptit: rajoitteet kerrottu managerille ja koodarille Manageri tietää nyt 400 tokenin rajan per tiedosto ja pitää tiedostomäärän max 3:ssa. Koodari kirjoittaa lyhyttä, fokusoidusti. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:58:51 +03:00
jaakko	406e2226f0	Native node max_tokens 64→512: koodi ei jää kesken 64 tokenia riitti vain funktion alkuun. 512 mahdollistaa kokonaisten tiedostojen generoinnin pipeline-vaiheissa. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:57:42 +03:00
jaakko	9d7496157c	Native node CPU-moodi: Candle 0.8 RMS-norm ei tue CUDA:a candle-core 0.8 ei sisällä rms-norm CUDA-kerneliä → inferenssi epäonnistui. Vaihdettu CPU:ksi joka on silti ~10-20× nopeampi kuin selaimen WASM. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:52:50 +03:00
jaakko	d332b7e910	Hub priorisoi natiivisolmut (GPU) selainsolmujen edelle Lisätty node_types HashMap joka seuraa solmutyyppiä (native/browser). API reitittää tehtävät ensin vapaalle natiivisolmulle, sitten selaimelle. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:45:20 +03:00
jaakko	8e55a15d66	bugifiksejä	2026-04-06 21:34:03 +03:00
jaakko	4e3134d908	CUDA_COMPUTE_CAP=89: bindgen_cuda ei tarvitse nvidia-smi:tä buildissa candle-kernels build vaatii GPU-arkkitehtuurin tunnistusta. nvidia-smi ei ole saatavilla Docker build -vaiheessa, joten asetetaan CUDA_COMPUTE_CAP manuaalisesti (RTX 4090 = sm_89). Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:26:03 +03:00
jaakko	cd45db001a	Dockerfile.native-node: lisätty cli/ workspace-jäsen Cargo workspace vaatii kaikkien jäsenten Cargo.toml:n kopioinnin. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:23:48 +03:00
jaakko	4ad8a8793e	Native node CUDA Docker: nvidia/cuda base + GPU runtime Dockerfile käyttää nvidia/cuda:12.6.3 -imagea jossa CUDA-kirjastot ovat valmiina. docker-compose lisää runtime: nvidia + NVIDIA_VISIBLE_DEVICES. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:02:43 +03:00
jaakko	b2694c232e	Poistettu 1.5B Q4 -vaihtoehto: GGUF dequantisointi liian hidas WASM:ssa 1.5B Q4_K_M: ~33s/token (0.03 tok/s) — käyttökelvoton 0.5B F32: ~2.5s/token (0.4 tok/s) — käyttökelpoinen kpn load lataa nyt suoraan 0.5B:n ilman valintalistaa. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 20:19:34 +03:00
jaakko	ba58236c52	Worker console.log välitetään pääsäikeelle → UI-kuuntelijat toimivat Workerin WASM-logit (lataus, malli valmis, inferenssi) eivät näkyneet pääsäikeessä. Nyt console.log on ylikirjoitettu Workerissa lähettämään viestit postMessage:lla, ja pääsäie syöttää ne omaan console.log:iin. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 20:12:42 +03:00
jaakko	861f2a6902	Worker ES module: importScripts → import (wasm-pack --target web) wasm-pack --target web generoi ES module -syntaksia (export). Worker käyttää nyt type:'module' ja import-lauseita importScripts:n sijaan. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 20:04:53 +03:00
jaakko	11fd5b0c9e	jotain tulee	2026-04-06 20:00:55 +03:00
jaakko	b3646ae5d3	Web Worker: WASM-inferenssi erillisessä säikeessä, UI ei jäädy - Poistettu kaikki web_sys::window() -kutsut Rust WASM:sta - Uudet Worker-yhteensopivat apufunktiot: perf_now(), worker_fetch(), sleep_ms() - worker.js lataa ja ajaa WASM-moduulin erillisessä säikeessä - ensureCoderNode käynnistää Workerin pääsäikeen sijaan - Selaimen UI pysyy responsiivisena inferenssin aikana Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 19:59:09 +03:00
jaakko	fc95cf8c1b	Terminaaliin varoitus inferenssin aikana + yield ennen blokkia Käyttäjälle näytetään '(selain voi hidastua)' kun inferenssi alkaa. setTimeout yield varmistaa statusrivin piirtämisen ennen WASM-blokkia. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 19:31:25 +03:00
jaakko	1ae1bf98e2	API timeout nostettu 120s → 600s: WASM-inferenssi on hidasta Kvantisoidun 1.5B-mallin inferenssi on ~0.2 tok/s WASM:ssa. Pipeline-tehtävät vaativat pidemmän odotusajan. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 19:29:15 +03:00
jaakko	f567fd3f8a	Mallin automaattinen lataus poistettu — käyttäjä käynnistää kpn load:lla Aiemmin localStorage muisti edellisen latauksen ja käynnisti mallin automaattisesti sivulle tullessa. Nyt käyttäjä päättää itse milloin lataa. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 18:03:17 +03:00
jaakko	38367eac97	Terminaaliin latauksen tilaindikaattori (spinner + vaihe) Mallin latauksen aikana terminaalissa näkyy animoitu spinner ja nykyinen vaihe: WASM → tokenizer → malli (%) → rakennus → valmis. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 16:29:33 +03:00
jaakko	20716186bc	Hub: qwen-coder reititys tunnistaa kaikki coder-solmut (05b, 3b, 1.5b) API etsi vain 'qwen-coder-05b' tai 'qwen-coder', ei 'qwen-coder-3b'. Nyt task.starts_with('qwen-coder') matchaa kaikki variantit. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 16:27:49 +03:00
jaakko	4e810ed4a2	Kaikki agentit käyttävät qwen-coder -mallia + valmis-viesti deduplikoitu QA ja DevOps käyttivät smollm-135m:ää jota ei ole selaimessa ladattuna. Nyt kaikki agentit käyttävät ladattua qwen-coder-mallia. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 16:23:59 +03:00
jaakko	91ff9e00f9	kvantisointia	2026-04-06 16:15:56 +03:00
jaakko	e652bf7ab6	1.5B Q4_K_M: vaihdettu 3B→1.5B koska 3B ei mahdu WASM:iin (~1 GB vs ~2 GB) 3B GGUF vaati ~5 GB muistia parsinnassa → SIGILL WASM:n 4 GB rajalla. 1.5B Q4_K_M on ~1 GB ja mahtuu turvallisesti selaimeen. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 16:14:41 +03:00
jaakko	eb69893124	WASM release-build: GGUF dequantize vaatii optimointeja Debug-moodi aiheutti SIGILL (Illegal Instruction) GGUF-tensorien dequantisoinnissa. Release-build ratkaisee ongelman. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 14:07:02 +03:00
jaakko	d18314bfc8	GGUF Q4_K_M -tuki 3B-mallille: kvantisoidtu versio (~1.9 GB) mahtuu selaimeen Safetensors-muotoinen 3B (~6.2 GB) aiheutti WASM capacity overflow. Nyt käytetään candle quantized_qwen2 -moduulia GGUF-tiedoston lataamiseen. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 13:54:23 +03:00
jaakko	99b011e399	Isomman qwen-mallin lataus	2026-04-06 13:40:19 +03:00
Jaakko Vanhala	3976bb6251	IP-yhteysraja nostettu 4→10: mahdollistaa useamman laitteen samasta IP:stä Jokainen selain tarvitsee 2 WebSocket-yhteyttä (UI + coder-node). Vanha raja 4 esti toisen koneen yhdistämisen samasta IP:stä (esim. kotiverkko). Uusi raja 10 riittää 5 samanaikaiselle selaimelle / laitteelle. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 08:56:36 +03:00
Jaakko Vanhala	0c32fecdc4	GUIDE.md: laajennettu tokenisaatio-osio suomi/englanti-vertailulla Lisätty konkreettiset esimerkit Qwen2.5-Coder -tokenisaattorilla: - Koodi-esimerkki: print vs. tulosta - Kolme lauseparia taulukossa (The cat sat / Kissa istui jne.) - Merkkejä/token -sarake näyttää tehokkuuseron - Selitys miksi englanti on 30-50% tehokkaampaa - Miksi tämä merkitsee: nopeus, konteksti, ymmärrys Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 08:41:12 +03:00
Jaakko Vanhala	801cc0371d	Yhtenäinen kirjoitusasu: Qwen2.5-Coder:0.5B ja Qwen2.5-Coder:3B (kaksoispiste) Korjattu agents-sivun status-palkki, codelab-loading ja GUIDE.md. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 08:27:22 +03:00
Jaakko Vanhala	176f2d6915	Mermaid-kaaviot oppaaseen + mallitiedot agents-sivun status-palkkiin GUIDE.md:n ASCII-kaaviot korvattu Mermaid-kaavioilla: - Projekti-pipeline: flowchart TD värikoodatuilla vaiheilla - Prompttirakenne: system → agent → user → prefill ketju Mermaid ladataan CDN:stä ja renderöidään automaattisesti dark-teemalla. Fallback: kaavion lähdekoodi näkyy tekstinä jos Mermaid ei lataudu. Agents-sivun compute-status näyttää nyt tarkan mallitiedon: - "Qwen2.5-Coder-0.5B" tai "Qwen2.5-Coder-3B" - Tooltip: parametrimäärä, runtime, max tokenit Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 08:23:19 +03:00
Jaakko Vanhala	dd1945ab28	Opas-välilehti: GUIDE.md renderöidään sivustolle omana näkymänä Uusi "Opas"-välilehti (panel-guide) lataa GUIDE.md:n fetchillä ja renderöi sen inline markdown→HTML -parserilla: - Otsikot (h1-h3) GitHub-tyylisesti - Koodiblokit highlight.js-korostuksella - Taulukot (header + body, border-collapse) - Listat (bullet + numeroitu) - Inline-muotoilu: bold, italic, `code` - Horisontaaliviivat GUIDE.md siirretty static/-hakemistoon jotta hub servaa sen suoraan. Navigointi: #guide hash tai klikkaa "Opas"-välilehteä. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 08:20:54 +03:00
Jaakko Vanhala	262fee3b49	GUIDE.md: opettavainen yhteenveto kielimalleista, tokeneista ja laadun parantamisesta Kattaa: - Kielimallit ja parametrimäärät (135M → 1800B vertailu) - Tokenit: mitä ne ovat, miksi kieli vaikuttaa, token-budjetti - Prompttirakenne: system/agent/user/prefill + miksi englanniksi - Prefill-tekniikka: miten se toimii ja miksi se säästää tokeneita - Sampling: temperature, top-k, repetition penalty selitettyinä - Stop-sekvenssit: milloin generointi loppuu - Projekti-pipeline: agenttitiimin työnkulku kaaviona - Laadun parantaminen 10 eri keinolla: 1. Isompi malli 2. Paremmat promptit 3. Kontekstin hallinta 4. Iterointi (review-luuppi) 5. Erikoistetut system promptit 6. Few-shot esimerkit 7. Temperature-säätö tehtävän mukaan 8. Ensemble (sama prompti usealle mallille) 9. Post-processing 10. Fine-tuning (LoRA) - Välimuistiarkkitehtuuri: miksi toinen lataus on nopea - Käytännön lukuja: token-määrät, ajat, kustannukset Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 08:16:36 +03:00
Jaakko Vanhala	aa7540a6bf	Prompt Inspector: [>]-nappi status-rivillä näyttää mitä mallille lähetettiin Jokaisen kpnRun-tuloksen status-rivillä on [>]-nappi joka avaa inspektor-paneelin: - system: inferenssin system prompt - shared: kaikille agenteille yhteinen prompti (jos asetettu) - agent: valitun agentin system prompt - user: käyttäjän/pipelinen prompti (kokonaisuudessaan, scrollattava) - prefill: ``` (ChatML prefill-tekniikka) - Token-estimaatti: ~N tok in → M tok out Paneeli avautuu/sulkeutuu klikkaamalla. Näyttää eksaktisti saman mitä malli saa syötteeksi — hyödyllinen debuggaukseen ja promptien kehittämiseen. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 08:00:11 +03:00

... 3 4 5 6 7

322 Commits