agentic-studio

Author	SHA1	Message	Date
jaakko	5c25c7f9c1	DevOps Dockerfile-prompti: pip-only, ei poetryä/condaa Malli generoi poetry.lock-riippuvaisen Dockerfilen. Nyt prompti kertoo tarkan riippuvuuksien asennustavan (pyproject.toml/requirements.txt/pip) ja antaa valmiin CMD-rivin. Yksivaiheinen build riittää Pythonille. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:44:03 +03:00
jaakko	ac698a766e	DevOps-agentti: Dockerfile + docker-compose.yml + README pipeline-vaiheina DevOps generoi nyt kolme tiedostoa: - Dockerfile (multi-stage build, python:3.12-slim) - docker-compose.yml (palvelut, volumet, portit) - README.md (quick start docker compose up) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:41:34 +03:00
jaakko	f1b57a6c53	Tab korjaa kirjoitusvirheet + fuzzy-match alikomennoille Tab-painallus yrittää ensin autokorjausta (typo-taulukko + Levenshtein), sitten normaalia tab-completionia. Myös alikomennot korjautuvat fuzzy-matchilla (esim. "kpn rnu" → "kpn run"). Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:37:51 +03:00
jaakko	b70cdbd24d	Terminaalin autokorjaus: knp→kpn, kpn rnu→kpn run jne. Typo-taulukko yleisimmille kirjoitusvirheille + Levenshtein-etäisyys tuntemattomille ensimmäisille sanoille (max 2 merkin ero → kpn). Korjaus näytetään terminaalissa keltaisella. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:35:30 +03:00
jaakko	01d8b597e1	ZIP CRC-32 checksum lisätty: purkaminen ei enää epäonnistu Local file header ja central directory entry -tietueista puuttui CRC-32 kenttä. Lisätty crc32()-funktio ja kirjoitetaan checksum molempiin ZIP-rakenteisiin. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:31:42 +03:00
jaakko	f2ca4890df	Dockerfile: touch main.rs ennen buildia, estää stub-binaryn jäämisen Cargo ei rekompiloi jos vanha binääri on olemassa. touch pakottaa uudelleenkäännöksen. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:26:33 +03:00
jaakko	3eb0c4d939	Ollama-integraatio: GPU-inferenssi NVIDIA/AMD/Apple, ei Candle-rajoitteita - docker-compose: Ollama-container GPU:lla + persistent volume malleille - native-node: Candle poistettu, kutsuu Ollaman HTTP API:a (async) - Dockerfile: yksinkertaistettu, ei CUDA SDK:ta (Ollama hoitaa GPU:n) - Tukee kaikkia malleja: qwen2.5-coder:1.5b/3b/7b/14b/32b - OLLAMA_MODEL ympäristömuuttujalla vaihdetaan malli - kpn models näyttää Ollama-mallit nopeustiedoilla Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:22:11 +03:00
jaakko	d8443792a3	kpn load ja kpn models selkeytetty: selain vs natiivi kpn load lataa 0.5B selaimeen (ainoa joka toimii WASM:ssa). kpn models näyttää molemmat vaihtoehdot nopeustiedoilla. Ei enää harhaanjohtavia numerovalintoja. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:06:12 +03:00
jaakko	ae379bdda4	Zippi korjattu	2026-04-07 06:00:49 +03:00
jaakko	ed02e47158	ZIP-lataus korjattu: tiedostot globaaliin muuttujaan data-attribuutin sijaan JSON data-attribuutissa heittomerkit katkaisivat HTML:n. Nyt projectFiles[cardId] tallentaa tiedostot muistiin. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:00:17 +03:00
jaakko	959dc532bb	native-laskentaan säätöä	2026-04-07 05:20:54 +03:00
jaakko	1ef7f7c956	max_tokens per vaihe: manageri 200, koodari 512, testaaja 200, QA 512, DevOps 256 Hub ja natiivisolmu tukevat nyt max_tokens-kenttää API-pyynnöissä. Pipeline-vaiheet käyttävät sopivan kokoisia token-rajoja. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 22:03:26 +03:00
jaakko	e6e1f60935	Pipeline: QA kirjoittaa testit + DevOps tekee README:n Uudet vaiheet koodiarvioinnin jälkeen: - QA: kirjoittaa test_app.py (pytest, max 3 testiä) - DevOps: kirjoittaa README.md (asennus, käynnistys, testaus) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 22:00:04 +03:00
jaakko	322c98ff59	Pipeline-promptit: rajoitteet kerrottu managerille ja koodarille Manageri tietää nyt 400 tokenin rajan per tiedosto ja pitää tiedostomäärän max 3:ssa. Koodari kirjoittaa lyhyttä, fokusoidusti. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:58:51 +03:00
jaakko	406e2226f0	Native node max_tokens 64→512: koodi ei jää kesken 64 tokenia riitti vain funktion alkuun. 512 mahdollistaa kokonaisten tiedostojen generoinnin pipeline-vaiheissa. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:57:42 +03:00
jaakko	9d7496157c	Native node CPU-moodi: Candle 0.8 RMS-norm ei tue CUDA:a candle-core 0.8 ei sisällä rms-norm CUDA-kerneliä → inferenssi epäonnistui. Vaihdettu CPU:ksi joka on silti ~10-20× nopeampi kuin selaimen WASM. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:52:50 +03:00
jaakko	d332b7e910	Hub priorisoi natiivisolmut (GPU) selainsolmujen edelle Lisätty node_types HashMap joka seuraa solmutyyppiä (native/browser). API reitittää tehtävät ensin vapaalle natiivisolmulle, sitten selaimelle. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:45:20 +03:00
jaakko	8e55a15d66	bugifiksejä	2026-04-06 21:34:03 +03:00
jaakko	4e3134d908	CUDA_COMPUTE_CAP=89: bindgen_cuda ei tarvitse nvidia-smi:tä buildissa candle-kernels build vaatii GPU-arkkitehtuurin tunnistusta. nvidia-smi ei ole saatavilla Docker build -vaiheessa, joten asetetaan CUDA_COMPUTE_CAP manuaalisesti (RTX 4090 = sm_89). Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:26:03 +03:00
jaakko	cd45db001a	Dockerfile.native-node: lisätty cli/ workspace-jäsen Cargo workspace vaatii kaikkien jäsenten Cargo.toml:n kopioinnin. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:23:48 +03:00
jaakko	4ad8a8793e	Native node CUDA Docker: nvidia/cuda base + GPU runtime Dockerfile käyttää nvidia/cuda:12.6.3 -imagea jossa CUDA-kirjastot ovat valmiina. docker-compose lisää runtime: nvidia + NVIDIA_VISIBLE_DEVICES. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:02:43 +03:00
jaakko	b2694c232e	Poistettu 1.5B Q4 -vaihtoehto: GGUF dequantisointi liian hidas WASM:ssa 1.5B Q4_K_M: ~33s/token (0.03 tok/s) — käyttökelvoton 0.5B F32: ~2.5s/token (0.4 tok/s) — käyttökelpoinen kpn load lataa nyt suoraan 0.5B:n ilman valintalistaa. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 20:19:34 +03:00
jaakko	ba58236c52	Worker console.log välitetään pääsäikeelle → UI-kuuntelijat toimivat Workerin WASM-logit (lataus, malli valmis, inferenssi) eivät näkyneet pääsäikeessä. Nyt console.log on ylikirjoitettu Workerissa lähettämään viestit postMessage:lla, ja pääsäie syöttää ne omaan console.log:iin. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 20:12:42 +03:00
jaakko	861f2a6902	Worker ES module: importScripts → import (wasm-pack --target web) wasm-pack --target web generoi ES module -syntaksia (export). Worker käyttää nyt type:'module' ja import-lauseita importScripts:n sijaan. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 20:04:53 +03:00
jaakko	11fd5b0c9e	jotain tulee	2026-04-06 20:00:55 +03:00
jaakko	b3646ae5d3	Web Worker: WASM-inferenssi erillisessä säikeessä, UI ei jäädy - Poistettu kaikki web_sys::window() -kutsut Rust WASM:sta - Uudet Worker-yhteensopivat apufunktiot: perf_now(), worker_fetch(), sleep_ms() - worker.js lataa ja ajaa WASM-moduulin erillisessä säikeessä - ensureCoderNode käynnistää Workerin pääsäikeen sijaan - Selaimen UI pysyy responsiivisena inferenssin aikana Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 19:59:09 +03:00
jaakko	fc95cf8c1b	Terminaaliin varoitus inferenssin aikana + yield ennen blokkia Käyttäjälle näytetään '(selain voi hidastua)' kun inferenssi alkaa. setTimeout yield varmistaa statusrivin piirtämisen ennen WASM-blokkia. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com> pre-worker-refactor	2026-04-06 19:31:25 +03:00
jaakko	1ae1bf98e2	API timeout nostettu 120s → 600s: WASM-inferenssi on hidasta Kvantisoidun 1.5B-mallin inferenssi on ~0.2 tok/s WASM:ssa. Pipeline-tehtävät vaativat pidemmän odotusajan. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 19:29:15 +03:00
jaakko	f567fd3f8a	Mallin automaattinen lataus poistettu — käyttäjä käynnistää kpn load:lla Aiemmin localStorage muisti edellisen latauksen ja käynnisti mallin automaattisesti sivulle tullessa. Nyt käyttäjä päättää itse milloin lataa. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 18:03:17 +03:00
jaakko	38367eac97	Terminaaliin latauksen tilaindikaattori (spinner + vaihe) Mallin latauksen aikana terminaalissa näkyy animoitu spinner ja nykyinen vaihe: WASM → tokenizer → malli (%) → rakennus → valmis. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 16:29:33 +03:00
jaakko	20716186bc	Hub: qwen-coder reititys tunnistaa kaikki coder-solmut (05b, 3b, 1.5b) API etsi vain 'qwen-coder-05b' tai 'qwen-coder', ei 'qwen-coder-3b'. Nyt task.starts_with('qwen-coder') matchaa kaikki variantit. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 16:27:49 +03:00
jaakko	4e810ed4a2	Kaikki agentit käyttävät qwen-coder -mallia + valmis-viesti deduplikoitu QA ja DevOps käyttivät smollm-135m:ää jota ei ole selaimessa ladattuna. Nyt kaikki agentit käyttävät ladattua qwen-coder-mallia. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 16:23:59 +03:00
jaakko	91ff9e00f9	kvantisointia	2026-04-06 16:15:56 +03:00
jaakko	e652bf7ab6	1.5B Q4_K_M: vaihdettu 3B→1.5B koska 3B ei mahdu WASM:iin (~1 GB vs ~2 GB) 3B GGUF vaati ~5 GB muistia parsinnassa → SIGILL WASM:n 4 GB rajalla. 1.5B Q4_K_M on ~1 GB ja mahtuu turvallisesti selaimeen. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 16:14:41 +03:00
jaakko	eb69893124	WASM release-build: GGUF dequantize vaatii optimointeja Debug-moodi aiheutti SIGILL (Illegal Instruction) GGUF-tensorien dequantisoinnissa. Release-build ratkaisee ongelman. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 14:07:02 +03:00
jaakko	d18314bfc8	GGUF Q4_K_M -tuki 3B-mallille: kvantisoidtu versio (~1.9 GB) mahtuu selaimeen Safetensors-muotoinen 3B (~6.2 GB) aiheutti WASM capacity overflow. Nyt käytetään candle quantized_qwen2 -moduulia GGUF-tiedoston lataamiseen. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 13:54:23 +03:00
jaakko	99b011e399	Isomman qwen-mallin lataus	2026-04-06 13:40:19 +03:00
Jaakko Vanhala	3976bb6251	IP-yhteysraja nostettu 4→10: mahdollistaa useamman laitteen samasta IP:stä Jokainen selain tarvitsee 2 WebSocket-yhteyttä (UI + coder-node). Vanha raja 4 esti toisen koneen yhdistämisen samasta IP:stä (esim. kotiverkko). Uusi raja 10 riittää 5 samanaikaiselle selaimelle / laitteelle. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 08:56:36 +03:00
Jaakko Vanhala	0c32fecdc4	GUIDE.md: laajennettu tokenisaatio-osio suomi/englanti-vertailulla Lisätty konkreettiset esimerkit Qwen2.5-Coder -tokenisaattorilla: - Koodi-esimerkki: print vs. tulosta - Kolme lauseparia taulukossa (The cat sat / Kissa istui jne.) - Merkkejä/token -sarake näyttää tehokkuuseron - Selitys miksi englanti on 30-50% tehokkaampaa - Miksi tämä merkitsee: nopeus, konteksti, ymmärrys Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 08:41:12 +03:00
Jaakko Vanhala	801cc0371d	Yhtenäinen kirjoitusasu: Qwen2.5-Coder:0.5B ja Qwen2.5-Coder:3B (kaksoispiste) Korjattu agents-sivun status-palkki, codelab-loading ja GUIDE.md. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 08:27:22 +03:00
Jaakko Vanhala	176f2d6915	Mermaid-kaaviot oppaaseen + mallitiedot agents-sivun status-palkkiin GUIDE.md:n ASCII-kaaviot korvattu Mermaid-kaavioilla: - Projekti-pipeline: flowchart TD värikoodatuilla vaiheilla - Prompttirakenne: system → agent → user → prefill ketju Mermaid ladataan CDN:stä ja renderöidään automaattisesti dark-teemalla. Fallback: kaavion lähdekoodi näkyy tekstinä jos Mermaid ei lataudu. Agents-sivun compute-status näyttää nyt tarkan mallitiedon: - "Qwen2.5-Coder-0.5B" tai "Qwen2.5-Coder-3B" - Tooltip: parametrimäärä, runtime, max tokenit Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 08:23:19 +03:00
Jaakko Vanhala	dd1945ab28	Opas-välilehti: GUIDE.md renderöidään sivustolle omana näkymänä Uusi "Opas"-välilehti (panel-guide) lataa GUIDE.md:n fetchillä ja renderöi sen inline markdown→HTML -parserilla: - Otsikot (h1-h3) GitHub-tyylisesti - Koodiblokit highlight.js-korostuksella - Taulukot (header + body, border-collapse) - Listat (bullet + numeroitu) - Inline-muotoilu: bold, italic, `code` - Horisontaaliviivat GUIDE.md siirretty static/-hakemistoon jotta hub servaa sen suoraan. Navigointi: #guide hash tai klikkaa "Opas"-välilehteä. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 08:20:54 +03:00
Jaakko Vanhala	262fee3b49	GUIDE.md: opettavainen yhteenveto kielimalleista, tokeneista ja laadun parantamisesta Kattaa: - Kielimallit ja parametrimäärät (135M → 1800B vertailu) - Tokenit: mitä ne ovat, miksi kieli vaikuttaa, token-budjetti - Prompttirakenne: system/agent/user/prefill + miksi englanniksi - Prefill-tekniikka: miten se toimii ja miksi se säästää tokeneita - Sampling: temperature, top-k, repetition penalty selitettyinä - Stop-sekvenssit: milloin generointi loppuu - Projekti-pipeline: agenttitiimin työnkulku kaaviona - Laadun parantaminen 10 eri keinolla: 1. Isompi malli 2. Paremmat promptit 3. Kontekstin hallinta 4. Iterointi (review-luuppi) 5. Erikoistetut system promptit 6. Few-shot esimerkit 7. Temperature-säätö tehtävän mukaan 8. Ensemble (sama prompti usealle mallille) 9. Post-processing 10. Fine-tuning (LoRA) - Välimuistiarkkitehtuuri: miksi toinen lataus on nopea - Käytännön lukuja: token-määrät, ajat, kustannukset Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 08:16:36 +03:00
Jaakko Vanhala	aa7540a6bf	Prompt Inspector: [>]-nappi status-rivillä näyttää mitä mallille lähetettiin Jokaisen kpnRun-tuloksen status-rivillä on [>]-nappi joka avaa inspektor-paneelin: - system: inferenssin system prompt - shared: kaikille agenteille yhteinen prompti (jos asetettu) - agent: valitun agentin system prompt - user: käyttäjän/pipelinen prompti (kokonaisuudessaan, scrollattava) - prefill: ``` (ChatML prefill-tekniikka) - Token-estimaatti: ~N tok in → M tok out Paneeli avautuu/sulkeutuu klikkaamalla. Näyttää eksaktisti saman mitä malli saa syötteeksi — hyödyllinen debuggaukseen ja promptien kehittämiseen. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 08:00:11 +03:00
Jaakko Vanhala	762066102a	PROMPTS.md: kaikki järjestelmän promptit dokumentoitu eksaktisti Kattaa kaikki 9 osa-aluetta: 1. Inferenssin system prompt (ChatML) 2. Agenttikohtaiset system promptit (7 agenttia) 3. Projekti-pipeline promptit (5 vaihetta + erikoistapaukset) 4. Yksinkertaisen pipelinen promptit 5. Yksittäiset komennot (run, hello, warmup) 6. Stop-sekvenssit (10 kpl) 7. Vastauksen siivous (4 vaihetta) 8. ChatML-promptin koostaminen (prefill-tekniikka) 9. Sampling-parametrit Jokainen prompti on eksaktissa muodossaan muuttujamerkinnöillä. Parsintasäännöt ja erikoistapaukset (pyproject.toml, requirements.txt) dokumentoitu yksityiskohtaisesti. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 07:53:01 +03:00
Jaakko Vanhala	bef5b6fc3c	uv/pyproject.toml tuki projektipipelineen, requirements.txt fallbackina Managerin prompti ohjaa käyttämään pyproject.toml:ia (.toml sallittu). Koodari saa pyproject.toml-tiedostolle eksplisiittisen esimerkkiformaatin jossa [project] + dependencies + [project.scripts] start-komennolla. requirements.txt toimii edelleen fallbackina jos malli tuottaa sen. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 07:43:47 +03:00
Jaakko Vanhala	095b72d2d6	Managerin prompti: riippuvuusjärjestys (models.py ennen main.py) Lisätty sääntö: "List dependencies first, then main app" jotta koodari saa kirjoitettua riippuvuudet (models, schemas) ensin ja pääsovelluksen (main.py) saa kontekstiksi oikeat importit. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-05 20:52:25 +03:00
Jaakko Vanhala	4cb6128a27	Tiedostoparsinta: hyväksyy myös pelkät tiedostonimet ilman kuvausta Manageri tuottaa toisinaan pelkän listan (app.py, requirements.txt) ilman "filename: description" -formaattia. Parsija hyväksyy nyt molemmat. Koodarin prompti vahvistettu: "Use the exact libraries mentioned in the project description" estää Flaskiin vaihtamisen kun tehtävä sanoo FastAPI. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-05 20:44:16 +03:00
Jaakko Vanhala	4dff534fbf	Projektikortti: tiedostovälilehdet, kopioi per tiedosto, lataa ZIP Pipeline-tulokset renderöidään interaktiivisena projektikorttina terminaaliin: - Tiedostovälilehdet (klikkaa vaihtaaksesi: main.py \| models.py \| ...) - Syntaksikorostus (highlight.js) jokaisessa tiedostossa - "Kopioi"-nappi per tiedosto (leikepöydälle) - "Kopioi kaikki" -nappi (kaikki tiedostot yhtenä tekstinä) - "Lataa ZIP" -nappi (selaimessa generoitu ZIP ilman ulkoisia kirjastoja) ZIP-generointi on toteutettu puhtaalla JavaScriptillä (uncompressed store) ilman JSZip- tai muita riippuvuuksia. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-05 20:37:10 +03:00
Jaakko Vanhala	d5ab6272d3	Paranneltu project-pipelinen promptit ja tiedostoparsinta Managerin prompti: - Selkeämpi formaatti: "filename.py: what this file contains" - Eksplisiittiset säännöt: max 4 tiedostoa, ei polkuja, vain tiedostonimet - Sallitut tiedostopäätteet: .py, .txt, .json, .html Tiedostoparsinta tiukennettu: - Hylkää polut (chucknorris/fastapi/...) — vaatii ettei sisällä / - Vaatii tiedostopäätteen (.xyz) - Ei välilyöntejä nimessä Koodarin prompti: - "Project:" konteksti ensin, sitten tarkka tiedostokohtainen ohje - "Write correct, working code. No explanations." Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-05 20:34:23 +03:00

... 5 6 7 8 9

417 Commits