agentic-studio

Author	SHA1	Message	Date
jaakko	a3f1ead3e6	CodeBench: code-small — test_list assert >= 1 (ei == 1) 8b:n blog kaatui koska test_list assertoi tarkkaa määrää vaikka testit jakavat saman tietokannan.	2026-04-14 13:58:13 +03:00
jaakko	7fe72480b1	CodeBench: qwen3:8b primary-rooliin, FK-esimerkit code-small promptissa profiles.json: role-kenttä (primary/backup/minimal/retired). code-small.md: lisätty konkreettinen FK-pattern ja testi-esimerkki relaatioille — 8b:n blog-skenaario kaatui koska ei osannut FK:ta.	2026-04-14 13:55:40 +03:00
jaakko	92964e322f	CodeBench: mallikohtaiset promptiprofiilit (profiles.json) - profiles.json: malli → profiili → prompti -mappaus - code-small.md: tiivistetty prompti pienille malleille (8b, 4b) - benchmark valitsee automaattisesti oikean promptin mallin perusteella - qwen3-coder:30b → code.md (large), qwen3:8b → code-small.md (small)	2026-04-14 13:54:26 +03:00
jaakko	2d470ee418	CodeBench: deprecated-patterns.md + inline deprecated-säännöt promptissa Lisätty SQLAlchemy 2.0, Pydantic v2, FastAPI ja Python deprecated → modern patterniparit. Uusimmat dokumentaatiot tarkistettu 2026-04-14.	2026-04-14 12:28:35 +03:00
jaakko	062e6af776	CodeBench: vahvista CRITICAL-sääntö — ei ylimääräisiä kenttiä qwen3:14b lisäsi created_at spekin ulkopuolelta ja käytti server_default=datetime.now (virheellinen). Nostettu CRITICAL-tasolle.	2026-04-14 12:27:10 +03:00
jaakko	75870c1100	CodeBench: korjaa aikaleima-sääntö — ei lisää ylimääräisiä kenttiä, func import func.now() aiheutti NameError koska mallit eivät importanneet func:ia. Uusi lähestymistapa: kielletään ylimääräiset kentät, ja JOS speksissä on aikaleimat niin käytetään server_default + func import.	2026-04-14 12:18:36 +03:00
jaakko	6e83fad31d	CodeBench: 3 uutta promptisääntöä 5-kierroksen virheanalyysistä 1. Aikaleimakentät: server_default=func.now(), ei pakollisia Create-schemassa 2. Ei ylimääräisiä filter/search-endpointeja 3. Ei ylimääräisiä kenttiä spekin ulkopuolelta	2026-04-14 12:14:36 +03:00
jaakko	01b4fb8e22	CodeBench: --compact tiivistää golden examplen templaatiksi Python: 1340 → 335 tokenia (−75%) Rust: 3383 → 445 tokenia (−87%) Käyttö: node benchmark.mjs --compact --models qwen3:4b	2026-04-14 10:59:39 +03:00
jaakko	e7b33b7d6f	CodeBench: Rust-tuki (--lang rust), golden example todo-rs, Dockerfile.cargo-test - golden-examples/todo-rs/: Axum 0.8 + SQLx + SQLite, 10 testiä - prompts/code-rs.md: Rust-koodingenerointiprompt - Dockerfile.cargo-test: rust:1.87-slim testikontti - benchmark.mjs: --lang python\|rust, kieliriippuvainen golden example, parseri tukee cargo test -tuloksia, src/ alihakemistot	2026-04-14 10:55:50 +03:00
jaakko	7b27800390	Siirrä kipina-codebench projektin päätasolle	2026-04-14 09:44:14 +03:00

10 Commits