Kattaa:
- Kielimallit ja parametrimäärät (135M → 1800B vertailu)
- Tokenit: mitä ne ovat, miksi kieli vaikuttaa, token-budjetti
- Prompttirakenne: system/agent/user/prefill + miksi englanniksi
- Prefill-tekniikka: miten se toimii ja miksi se säästää tokeneita
- Sampling: temperature, top-k, repetition penalty selitettyinä
- Stop-sekvenssit: milloin generointi loppuu
- Projekti-pipeline: agenttitiimin työnkulku kaaviona
- Laadun parantaminen 10 eri keinolla:
1. Isompi malli
2. Paremmat promptit
3. Kontekstin hallinta
4. Iterointi (review-luuppi)
5. Erikoistetut system promptit
6. Few-shot esimerkit
7. Temperature-säätö tehtävän mukaan
8. Ensemble (sama prompti usealle mallille)
9. Post-processing
10. Fine-tuning (LoRA)
- Välimuistiarkkitehtuuri: miksi toinen lataus on nopea
- Käytännön lukuja: token-määrät, ajat, kustannukset
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>