AI Pojmovnik — Što su Voice Agent, Chatbot, RAG, LLM i Drugi AI Pojmovi
Pojmovnik 15+ ključnih AI pojmova s jednostavnim definicijama na hrvatskom jeziku, primjerima i poveznicama na detaljne članke. Idealan resurs za poduzetnike koji žele razumjeti AI tehnologiju prije implementacije.
Pojmovnik 15+ ključnih AI pojmova s jednostavnim definicijama na hrvatskom jeziku, primjerima i poveznicama na detaljne članke. Idealan resurs za poduzetnike koji žele razumjeti AI tehnologiju prije implementacije.
Voice Agent (Glasovni AI Agent)
Voice Agent je autonomni AI sustav koji se javlja na telefonske pozive, razumije ljudski govor i odgovara prirodnim glasom u realnom vremenu. Koristi tehnologije kao što su OpenAI Whisper (govor u tekst), GPT-5 ili Claude (razumijevanje), i ElevenLabs ili OpenAI TTS (tekst u govor).
Primjer: hotel postavi voice agenta na svoj recepcijski broj. Gost zove u 23h, AI se javlja, razumije da želi rezervaciju, provjerava dostupnost i šalje SMS s linkom za potvrdu. Cijena: od 1.500 EUR + 300-800 EUR mjesečno.
AI Chatbot
AI Chatbot je inteligentni softver koji vodi tekstualnu konverzaciju s korisnicima preko web stranice, WhatsAppa, Messenger-a ili sličnih kanala. Moderni chatbotovi koriste LLM modele (poput ChatGPT-a) za prirodno razumijevanje i odgovaranje.
Razlika od starih "rule-based" chatbotova: LLM chatbot razumije kontekst, prati razgovor kroz više pitanja i može odgovoriti na nepripremljena pitanja. Cijena u Hrvatskoj: 1.500-8.000 EUR.
LLM (Large Language Model)
LLM (Large Language Model) je velika neuronska mreža trenirana na trilijunima riječi koja može generirati tekst, odgovarati na pitanja, prevoditi i analizirati sadržaj. Najpoznatiji primjeri: GPT-5 (OpenAI), Claude Opus 4.7 (Anthropic), Gemini 2.5 Pro (Google), Llama 3.3 70B (Meta).
Za hrvatsko tržište posebno bitno: GPT-5 i Claude Opus 4.7 izvrsno govore hrvatski. Llama modeli mogu se fine-tune-ati na hrvatskim podacima za specifične potrebe.
RAG (Retrieval Augmented Generation)
RAG je tehnika koja kombinira LLM s vlastitom bazom znanja. Umjesto da chatbot odgovara samo iz svog "treniranog" znanja, RAG sustav prvo pretraži vašu specifičnu bazu (cjenik, FAQ, dokumentaciju) pa onda LLM generira odgovor temeljen na tim podacima.
Praktično: vaš chatbot može točno odgovoriti "Naša soba s pogledom na more košta 89 EUR po noći u srpnju" jer dohvaća informaciju iz vaše baze, a ne izmišlja.
Fine-tuning
Fine-tuning je proces dodatnog treniranja postojećeg LLM modela na specifičnim podacima vaše tvrtke ili industrije. Rezultat je model koji "razumije" vaš biznis kao da je trenirana osoba u vašem timu.
Razlika od RAG-a: fine-tuning mijenja ponašanje modela; RAG samo dohvaća informacije. Fine-tuning skup je (1.000-10.000 EUR) ali dramatično poboljšava kvalitetu za specifične use case-ove.
Prompt i Prompt Engineering
Prompt je tekstualna instrukcija koju daješ AI modelu (npr. "Napiši email klijentu o kašnjenju isporuke"). Prompt engineering je vještina pisanja preciznih, učinkovitih promptova koji izvuku najbolje iz AI-a.
Razlika između amaterskog i profesionalnog prompta: amater napiše "Generiraj blog post o AI". Profesionalac napiše "Napiši 1500-riječni blog post o AI chatbot benefits za hrvatske hotele, target audience: vlasnici hotela 35-55 god, tone: profesionalan ali topao, uključi 3 case studies i CTA na kraju."
Embedding
Embedding je matematički prikaz teksta (ili slike, zvuka) kao niz brojeva (vektor) koji omogućuje računalu razumjeti semantičku sličnost. Na primjer, "auto" i "vozilo" imaju vrlo slične embeddinge iako su drugačije riječi.
Embeddingi su temelj RAG-a: kad korisnik pošalje upit, sustav generira embedding tog upita pa pretražuje vašu bazu znanja za najsličnije embeddinge.
Vektorska baza (Vector Database)
Vektorska baza je specijalizirana baza podataka optimizirana za pohranu i pretragu embeddinga. Najpopularnije: Pinecone, Weaviate, Qdrant, Chroma, Milvus.
U RAG sustavu: vaši podaci (FAQ, dokumentacija) → embeddings → spremljeni u vektorsku bazu → korisnikov upit dolazi → pretražuje bazu → vraća najrelevantnije rezultate → LLM generira odgovor.
Token
Token je osnovna jedinica koju LLM procesira — približno 0.75 riječi za hrvatski/engleski (npr. "Razumijevanje" je obično 3-4 tokena). Cijena LLM API-ja računa se po tokenima.
Praktično: jedna prosječna konverzacija s chatbotom (10-20 izmjena) iznosi 2.000-5.000 tokena. Pri cijeni GPT-5 ($5/1M tokena), to je $0.01-$0.025 po razgovoru.
Hallucination (Halucinacija)
Halucinacija je situacija kad LLM generira informaciju koja zvuči uvjerljivo ali nije istinita. Npr. chatbot tvrdi da hotel ima bazen iako nema.
Kako spriječiti: koristiti RAG (chatbot odgovara samo iz vaše baze), niža temperature postavka (manje kreativno, više precizno), eksplicitne instrukcije ("Ako ne znaš odgovor, reci da ne znaš"), validacija odgovora.
Agent (AI Agent)
AI Agent je naprediji oblik chatbota koji ne samo odgovara nego i POSAJE radnje: zakazuje termine u kalendar, šalje emailove, ažurira CRM, plaća račune, kreira PDF dokumente, integrira s vanjskim sustavima.
Voice Agent je posebna vrsta AI agenta specijalizirana za telefonske pozive. Multi-step agenti (Claude/GPT s tool use) mogu izvršavati kompleksne workflow-e (npr. "rezerviraj let, hotel i auto za moj posjet Splitu sljedeći vikend").
GEO (Generative Engine Optimization)
GEO je nova disciplina (2024+) koja optimizira sadržaj da ga citiraju AI tražilice (ChatGPT, Perplexity, Claude, Gemini) — slično kao što SEO optimizira za Google.
Razlika: SEO cilja Top 10 plavih linkova; GEO cilja "biti citiran u AI odgovoru". Tehnike: llms.txt fajl, structured data (schema.org), direct-answer pages, FAQ schema, comparison content.
TTS (Text-to-Speech) i STT (Speech-to-Text)
TTS pretvara tekst u govor (kako voice agent "govori"). Lider: ElevenLabs (najprirodniji glasovi, podržava 30+ jezika uključujući hrvatski).
STT pretvara govor u tekst (kako voice agent "čuje" pozivatelja). Lider: OpenAI Whisper (besplatan + open-source) i Deepgram (komercijalni, brži).
API (Application Programming Interface)
API je sučelje koje omogućuje različitim softverima da komuniciraju. OpenAI API omogućuje vašoj aplikaciji da šalje pitanja GPT-5 i prima odgovore, naplaćujući se po korištenju.
Praktično: kada chatbot na vašoj web stranici "razgovara" s GPT-5, pod haubom šalje API request prema OpenAI serverima i prima odgovor u JSON formatu.
Latency (Kašnjenje)
Latency je vrijeme od kad korisnik pošalje upit do kad dobije odgovor. Za chatbotove tipično 1-3 sekunde; za voice agente 0.5-2 sekunde.
Visok latency = loš UX. Voice agent s 5-sekundnom pauzom zvuči kao "smrznut" robot. Optimizacije: cachingiranje, streaming odgovora (postupno prikazivanje), Edge računarstvo, brži modeli (GPT-5 Turbo umjesto GPT-5).
Ključne prednosti
- Razumijevanje AI pojmova prije ulaganja
- Bolja komunikacija s AI agencijama (znate što tražiti)
- Procjena ponuda — što je realna cijena za što
- Identifikacija buzzword-a vs prave tehnologije
Često postavljana pitanja
Što je voice agent?
Voice Agent je autonomni AI sustav koji se javlja na telefonske pozive, razumije govor i odgovara prirodnim glasom 24/7. Cijena u Hrvatskoj: od 1.500 EUR + 300-800 EUR mjesečno.
Što je AI chatbot?
AI Chatbot je inteligentni softver koji vodi tekstualnu konverzaciju s korisnicima preko web-a, WhatsApp-a ili Messenger-a. Moderni chatbotovi koriste LLM modele za prirodno razumijevanje.
Što je LLM?
LLM (Large Language Model) je velika neuronska mreža za generiranje teksta. Primjeri: GPT-5, Claude Opus 4.7, Gemini 2.5 Pro, Llama 3.3.
Što je RAG?
RAG (Retrieval Augmented Generation) je tehnika koja kombinira LLM s vlastitom bazom znanja. Sustav prvo pretraži vašu bazu pa LLM generira odgovor temeljen na tim podacima.
Što je fine-tuning?
Fine-tuning je dodatno treniranje LLM modela na specifičnim podacima vaše tvrtke. Cijena: 1.000-10.000 EUR.
Što je prompt engineering?
Prompt engineering je vještina pisanja preciznih AI instrukcija (promptova) koji izvuku najbolje iz modela. Razlika između početničkog i profesionalnog prompta može biti 10x razlika u kvaliteti rezultata.
Što je halucinacija u AI?
Halucinacija je situacija kad LLM generira informaciju koja zvuči uvjerljivo ali nije istinita. Sprječava se RAG-om, niskom temperaturom i validacijom odgovora.
Što je AI agent?
AI Agent je naprednji oblik chatbota koji ne samo odgovara nego i izvršava radnje (zakazivanje termina, slanje emailova, CRM ažuriranje).
Što je GEO?
GEO (Generative Engine Optimization) je optimizacija sadržaja za AI tražilice (ChatGPT, Perplexity, Claude). Slično SEO-u, ali cilj je biti citiran u AI odgovoru.
Što je token u AI?
Token je osnovna jedinica koju LLM procesira (oko 0.75 riječi). Cijena LLM API-ja računa se po tokenima — prosječan razgovor je 2.000-5.000 tokena.
Rezervirajte besplatnu konzultaciju