Najpierw: jakie AI? (3 archetypy)
- Copilot — pomaga użytkownikowi robić to samo szybciej
- Automation — wykonuje zadania (np. klasyfikacja, ekstrakcja)
- Insight — podsumowuje i rekomenduje (np. analityka, raporty)
Minimalny stack, który ma sens
1) Model (LLM)
Na MVP wybierz 1 model i 1 fallback. Nie rób „model zoo”. Liczy się przewidywalność.
Przykładowa architektura (najprostsza produkcyjna)
- Frontend: chat UI + sugestie promptów
- Backend: endpoint /api (rate limiting + auth)
- RAG: embeddings + retrieval + prompt template
- Observability: logi + koszt per user + feedback
Zasada: jeśli AI dotyka danych użytkownika, backend jest obowiązkowy. Nie trzymaj kluczy API w przeglądarce.
2) RAG (jeśli masz wiedzę własną)
Jeśli odpowiedzi mają bazować na dokumentach, nie „doklejaj promptów”. Użyj RAG:
- chunking
- embedding
- vector store
- retrieval + prompt template
RAG: do / don't
- DO: trzymać źródła (link/fragment) i pokazywać je w UI
- DO: testować różne strategie chunkingu (np. 400–800 tokenów)
- DON'T: wrzucać całych PDF-ów bez czyszczenia (śmieci in = śmieci out)
- DON'T: mieszać różnych typów wiedzy w jednej kolekcji bez metadanych
3) Monitoring kosztów
Na MVP wprowadź od razu limity:
- max tokens / request
- rate limit per user
- cache na powtarzalne pytania
Kontrola kosztów (proste taktyki)
- Routing: proste pytania → tańszy model, trudne → droższy
- Context budgeting: limituj ile dokumentów dorzucasz do promptu
- Streaming: przerywanie generacji, gdy użytkownik kończy
- Cache: wyniki dla popularnych zapytań + short TTL
4) Guardrails i UX
Najlepszy guardrail to UX:
- podpowiedzi „co możesz zapytać”
- przykłady promptów
- jasne granice: czego system nie robi
Zasada: AI ma skrócić drogę do rezultatu. Jeśli użytkownik musi „uczyć się promptowania”, to UX jest do poprawy.
Najczęstsze miny w AI MVP
- brak telemetryki (nie wiesz, co działa)
- brak fallbacku, gdy model pada
- brak limitów (rachunek rośnie szybciej niż MRR)
Jak oceniać jakość (minimum na MVP)
- Task success: czy użytkownik osiągnął rezultat (tak/nie)
- Thumbs up/down + komentarz (1 klik)
- Hallucination rate: ile odpowiedzi bez pokrycia w źródłach
- Cost per successful task (to jest kluczowe!)
Chcesz zbudować AI MVP szybko i bez przepalania?
Możemy zaprojektować architekturę, kosztorys i wdrożyć pierwszą wersję produkcyjną.
Porozmawiajmy →