agentic-studio

Author	SHA1	Message	Date
Jaakko Vanhala	dc71829430	Riippuvuuksien siivous: burn, smollm, phi3, uuid, log, console poistettu	2026-04-12 11:53:36 +03:00
Jaakko Vanhala	2f140c8a15	uusi projekti	2026-04-12 10:28:57 +03:00
Jaakko Vanhala	5f00582053	UI:n system prompt ja sampling-parametrit välittyvät inferenssiin asti Frontend lähettää agentin asetukset (system_prompt, temperature, top_k, max_tokens, repeat_penalty, stop) API:lle. Hub välittää ne solmulle. Native-node ja Wasm-coder käyttävät välitettyjä arvoja hardkoodattujen sijaan.	2026-04-12 07:39:41 +03:00
Jaakko Vanhala	403f35efdc	TUI inc	2026-04-12 06:22:52 +03:00
Jaakko Vanhala	80806498e0	Remote start stop control	2026-04-11 19:14:20 +03:00
Jaakko Vanhala	23e7b92d03	kipina-node: auth-viesti välittää mallinimen ja Ollama-mallilistauksen hubille build_auth_message käyttää nyt oikeaa mallinimeä hardkoodatun sijaan. Lisäksi natiivisolmu hakee Ollaman mallilistauksen ja lähettää sen auth-viestissä hubille. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-11 18:04:23 +03:00
Jaakko Vanhala	4ff626ab88	broadcastit pois	2026-04-11 17:37:16 +03:00
Jaakko Vanhala	4e83569194	Konsoliloki näyttää mallin nimen: ✓ qwen2.5-coder:3b \| 438 tok \| 4952ms \| 93.4 tok/s Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-11 10:01:32 +03:00
Jaakko Vanhala	f42b692eeb	Lyhennetty konsolilogi: yksi rivi per pyyntö + yksi rivi per tulos Ennen: koko prompti + vastaus logitettiin (satoja rivejä) Jälkeen: → task_id:abc \| 42r prompti \| "Write ONLY models.py..." ✓ 128 tok \| 3200ms \| 40.0 tok/s \| "from sqlalchemy import..." llm_done-viestissä prompt lyhennetty viimeiseen riviin (ei koko kontekstia). Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-11 10:00:39 +03:00
Jaakko Vanhala	8dcf269b42	strip_code_fences: poistetaan kaikki backtick-rivit aggressiivisesti Ollama tuottaa \`\`\`python ... \`\`\` -blokkeja vaikka system prompt kieltää ne. Nyt kaikki rivit jotka alkavat \`\`\` suodatetaan pois, myös keskeltä vastausta (useita koodiblokkeja per vastaus). Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-10 07:47:03 +03:00
Jaakko Vanhala	529a30a6e1	Korjattu harhaanjohtava GPU-viesti: Ollama käyttää GPU:ta automaattisesti Kun --no-default-features (ei wgpu/nvml), viesti on nyt: "GPU-tunnistus ei käytössä. Ollama käyttää GPU:ta automaattisesti." eikä "GPU:ta ei havaittu — CPU-moodissa" (joka oli väärä M2:lla). Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-10 07:35:00 +03:00
Jaakko Vanhala	12ca87415c	Poistettu native-noden kovakoodattu system prompt — agentin prompti toimii nyt Ollaman system-kenttä yliajoi agentin konfiguroiman promptin. Nyt system-kenttää ei lähetetä ollenkaan — agentin prompti tulee osana prompt-kenttää (kpnRun koostaa sen frontendissä). Tämä mahdollistaa per-agentti promptien toimimisen myös natiivilaskennalla. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-10 06:54:18 +03:00
Jaakko Vanhala	d85cab4bc0	Native-noden vastausten siivous: stop-sekvenssit + selitystekstien poisto Stop-sekvenssit laajennettu: Please note, This is, Example, ``` strip_code_fences laajennettu poistamaan: - Selitystekstit lopusta (Please note, This is a basic, Note that, ...) - Johdantolauseet alusta (Sure!, Here is, Certainly!) System prompt vahvistettu: "No 'Please note' or 'Here is' text" Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-09 22:04:43 +03:00
Jaakko Vanhala	009bf492c8	Parannetut koodarin promptit + token-raja 512→1024 Koodarin prompti sisältää nyt: - Import-vihjeen: "from models import ..." aiemmista tiedostoista - Nimeämisvihjeen: Pydantic-schemat (UserCreate) vs SQLAlchemy (User) - "Include all necessary imports. Write complete, working code." Native-noden max_tokens nostettu 512→1024 jotta CRUD-endpointit mahtuvat yhteen vastaukseen. Testattu API:n kautta: 3B-malli tuottaa nyt oikeat importit, erilliset Pydantic-schemat ja kaikki 5 CRUD-endpointtia. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-09 21:56:24 +03:00
Jaakko Vanhala	1c7362c9b0	Native-node oletusmalli: qwen2.5-coder:3b Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-09 20:46:48 +03:00
Jaakko Vanhala	9983c80ef1	Native-noden oletusmalli vaihdettu kvantisoiduksi: qwen2.5-coder:7b-instruct-q4_K_M Q4-kvantisointi: ~4GB (vs. 7GB), ~40 tok/s M2:lla (vs. ~25 tok/s). Parempi nopeus/laatu-suhde. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-09 20:35:11 +03:00
Jaakko Vanhala	84b78eb9c6	GPU-tunnistus valinnainen: cargo run --no-default-features toimii ilman nvml/wgpu Native-node kääntyy nyt macOS:llä ja muilla koneilla ilman NVIDIA-ajureita: cargo run --no-default-features ← vain Ollama, ei GPU-tunnistusta cargo run ← oletus: GPU-tunnistus mukana (nvml + wgpu) Feature flag "gpu-detect" kontrolloi nvml-wrapper ja wgpu -riippuvuuksia. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-09 15:42:35 +03:00
Jaakko Vanhala	4f18377a3b	Native-node lähettää NODE_API_KEY auth-viestissä hubille Luetaan NODE_API_KEY-ympäristömuuttuja ja lisätään api_key-kenttä auth-viestiin. Hub tarkistaa avaimen ja hylkää solmun jos se ei täsmää. Käyttö: NODE_API_KEY=kpn_sk_abc123 HUB_URL=ws://hub:3000/ws cargo run Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-09 15:39:48 +03:00
jaakko	1b0b5eb198	Eksaktit mallinimet agenteille: qwen-coder → qwen2.5-coder:7b - Kaikki agentPrompts.model vaihdettu 'qwen-coder' → 'qwen2.5-coder:7b' - Native-node selected_task: 'qwen2.5-coder:7b' - Hub-reititys: qwen-perhe matchaa keskenään (selain qwen-coder-05b, natiivi qwen2.5-coder:7b) taaksepäin yhteensopivuuden vuoksi Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-08 10:33:43 +03:00
jaakko	5d2027b2ca	Native-node: automaattinen Ollama-haistelu käynnistyksessä Jos OLLAMA_URL ei ole asetettu, kokeillaan järjestyksessä: 1. localhost:11434 (paikallinen Ollama) 2. 127.0.0.1:11434 3. ollama:11434 (Docker-verkko) 4. host.docker.internal:11434 (Docker-kontti → isäntä) Ensimmäinen joka vastaa /api/version-kutsuun valitaan. Timeout 2s per kokeilu. Jos OLLAMA_URL on asetettu, sitä käytetään suoraan. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 17:41:44 +03:00
jaakko	a12bd7ce7f	One-liner koodi: system prompt vaatii rivinvaihdot + staattinen tarkistus Ollaman system prompt: 'Use proper newlines and indentation'. Staattinen analyysi: havaitsee jos .py-tiedosto on yhdellä rivillä. Native node vaatii rebuildin. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 12:07:51 +03:00
jaakko	e2ec0fa43d	v0.2.2: responsiivinen UI, Ollama-proxy, mixed content korjaus Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 09:23:35 +03:00
jaakko	c0ccd76a4c	v0.2.1: Ollama-integraatio, pipeline, prompt-editori Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 08:41:28 +03:00
jaakko	34ef19472a	kpn load: Ollama-mallin vaihto lennossa (0.5b → 32b) - Hub: uusi POST /api/v1/model endpoint, broadcastaa change_model - Native node: kuuntelee change_model, kutsuu Ollaman pull + vaihtaa mallin - Frontend: kpn load näyttää 5 mallia, numero vaihtaa Ollaman mallin - Selain-WASM pysyy 0.5B:nä (kpn load 1) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 07:05:57 +03:00
jaakko	3eb0c4d939	Ollama-integraatio: GPU-inferenssi NVIDIA/AMD/Apple, ei Candle-rajoitteita - docker-compose: Ollama-container GPU:lla + persistent volume malleille - native-node: Candle poistettu, kutsuu Ollaman HTTP API:a (async) - Dockerfile: yksinkertaistettu, ei CUDA SDK:ta (Ollama hoitaa GPU:n) - Tukee kaikkia malleja: qwen2.5-coder:1.5b/3b/7b/14b/32b - OLLAMA_MODEL ympäristömuuttujalla vaihdetaan malli - kpn models näyttää Ollama-mallit nopeustiedoilla Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-07 06:22:11 +03:00
jaakko	1ef7f7c956	max_tokens per vaihe: manageri 200, koodari 512, testaaja 200, QA 512, DevOps 256 Hub ja natiivisolmu tukevat nyt max_tokens-kenttää API-pyynnöissä. Pipeline-vaiheet käyttävät sopivan kokoisia token-rajoja. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 22:03:26 +03:00
jaakko	406e2226f0	Native node max_tokens 64→512: koodi ei jää kesken 64 tokenia riitti vain funktion alkuun. 512 mahdollistaa kokonaisten tiedostojen generoinnin pipeline-vaiheissa. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:57:42 +03:00
jaakko	9d7496157c	Native node CPU-moodi: Candle 0.8 RMS-norm ei tue CUDA:a candle-core 0.8 ei sisällä rms-norm CUDA-kerneliä → inferenssi epäonnistui. Vaihdettu CPU:ksi joka on silti ~10-20× nopeampi kuin selaimen WASM. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-06 21:52:50 +03:00
Jaakko Vanhala	ac15336c9f	Stop-sekvenssit: katkaistaan myös "// Example usage" ja "# Example" kommentit Malli tuottaa toisinaan esimerkkikoodia funktioiden jälkeen joka ei ole osa varsinaista vastausta. Nyt generointi katkeaa ennen näitä. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-05 18:21:40 +03:00
Jaakko Vanhala	7eca426e77	strip_markdown_wrapper robustimmaksi: whitelist-kielitunnisteet + tarkempi ```-poisto Edelliset heuristiikat olivat hauraita: - Kielitunniste tunnistettiin "lyhyt alphanumeerinen rivi" → osui koodiin (i, 42) - rfind("```") poisti koodin sisäisiä backtickejä Korjaukset: - Kielitunniste poistetaan VAIN jos se on tunnettu (LANG_TAGS whitelist, 50+ kieltä) - Sulkeva ``` poistetaan VAIN jos se on omalla rivillään tiedoston lopussa (ends_with tarkistus + edeltävä rivinvaihto) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-05 10:10:48 +03:00
Jaakko Vanhala	7a1352ead7	Korjattu strip_markdown_wrapper yhteensopivaksi prefill-tekniikan kanssa Prefill lisää ``` prompttiin jolloin malli tuottaa: "rust\nfn main()...\n```" Vanha stripperi etsi aloittavaa ```-blokkia ja palautti tyhjän. Uusi logiikka: 1. Poistaa kielitunnisteen ensimmäiseltä riviltä (rust, python jne.) 2. Poistaa sulkevan ``` lopusta (rfind, varmistaa ettei ole koodin sisällä) 3. Poistaa johdantolauseet ja selityskommentit kuten ennenkin Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-05 10:07:19 +03:00
Jaakko Vanhala	518c6dc5cb	Prefill-tekniikka: pakotetaan LLM-vastaus alkamaan suoraan koodilla Assistantin vastauksen alkuun syötetään valmiiksi backtick-koodiblokki, jolloin malli jatkaa suoraan koodilla eikä tuota "Sure! Here is..." -johdantotekstejä. Säästää tokeneita ja vastausaikaa. strip_markdown_wrapper poistaa ``` -merkit jälkikäteen. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-05 09:27:28 +03:00
Jaakko Vanhala	b48eeb6f5f	Poistetaan selityskommentit LLM-vastauksista: "# This is a simple program..." -tyyppiset rivit Malli tuottaa toisinaan selityskommentin koodin alkuun ilman markdown-wrapperia. Stripperi tunnistaa ja poistaa nämä avainsanojen perusteella (this is, simple, program that, jne.) mutta säilyttää oikeat koodikommentit ja shebangin. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-05 09:26:26 +03:00
Jaakko Vanhala	949f34833f	Markdown-wrapper strippaus LLM-vastauksista + hub-status tooltip Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-05 08:41:23 +03:00
Jaakko Vanhala	0ef1a3f7cd	Säätö Hommia	2026-04-04 21:59:15 +03:00
Jaakko Vanhala	4e49cfbbfa	puristettu qwen output tiukempaan muottiin	2026-04-04 21:33:54 +03:00
Jaakko Vanhala	3ada8949d0	Päivitetty juttuja	2026-04-04 21:13:20 +03:00
jaakko	e1326b145e	hetki ennen webgpu inferenssiä	2026-04-02 12:49:40 +03:00
jaakko	b693542116	on tämä työmaa	2026-04-02 00:50:29 +03:00
jaakko	9a72d35081	toka toimiva vedos	2026-04-01 23:52:39 +03:00
jaakko	46848ee027	eka vedos	2026-04-01 17:54:08 +03:00

41 Commits