Prije nego što smo razvili NIXA AI, radili smo ovako
Prije nego što smo razvili NIXA AI, radili smo ovako
Jedna od glavnih ideja iza razvoja NIXA AI nije bila zamijeniti prevoditelje. Naprotiv.
Mi smo htjeli zamijeniti softver. Odnosno softvere.
Aplikaciju smo razvili prvenstveno da sami sebi olakšamo život.
Htjeli smo poboljšati proces koji smo godinama koristili unutar Studija Nixa, a po putu smo shvatili da bi ovakav način rada mogao omogućiti i našim klijentima da, ako žele dio prijevoda raditi sami, to rade na isti način kao profesionalni prevoditeljski ured.
Jer profesionalno prevođenje nikada nije bilo samo „ubaci dokument u sučelje nekog LLM-a i klikni translate".
Prije nego što smo razvili NIXA AI, svaki je projekt prolazio kroz jasno definirani SOP (Standard Operating Procedure). Taj proces koristili smo za pravne, financijske, tehničke i medicinske dokumente, gdje dosljednost terminologije nije stvar stila nego poslovnog i pravnog rizika.
U praksi je to izgledalo ovako:
1. Priprema dokumenata
Najprije se prikupljaju svi dokumenti koji ulaze u projekt i provjerava njihova čitljivost.
Ako čitljivost zahtjeva neku intervenciju – kreće Abbyy ili neki drugi alati za ekstrahiranje teksta.
U ovom koraku minimalno je potrebna jedna stručna osposobljena osoba i dvije licence za lokalne softvere – a u najgorim slučajevima konzilij i razne akrobacije ili printanje i prepisivanje. (Onaj tko je ikada dobio mutnu sliku dokumenata na kojoj su osim materijala za prijevod i nečiji prsti, bedra i refleksija fleša – zna vrlo dobro o čemu pričamo.)
Jednom kada se prevaziđe ta prepreka kreće se u stručni dio, a to je:
2. Izrada glosara
Prije samog prevođenja izrađuje se terminološki glosar.
Dio izrade glosara je ključan za skaliranje jer glosar usmjerava prevoditelja da koristi odgovarajuću terminologiju (primjerice FIDIC, DORA, Zakon o trgovačkim društvima i slično). Glosar se u većini slučajeva radi u Excelu.
Ako dokument pripada određenoj industriji ili regulatornom okviru svaki pošteni prevoditelj ima ili svoje ili nažicane glosare. Međutim, od nedavno je najbolja praksa bila da se kreće ispočetka i da se uz pomoć LLM-ova stvara glosar budući da nema profesionalnog prevoditelja koji nema nehotice kontaminirani glosar. Tehnologija napreduje, svijet se mijenja, samo je garbage in garbage out vječno aktualna premisa.
3. Pretvaranje glosara u profesionalni CAT format
Nakon što imamo glosar s kojim smo super zadovoljni (ili bar mislimo da jesmo) on se pomoću nekog plaćenog softvera (opet lokalnog) konvertira u format koji se može importirati u MultiTerm (pogodili ste – opet plaćeni lokalni softver). Dakle, glosar nije ostajao obična Excel tablica. Mi smo ga godinama pretvarali u MultiTerm bazu kako bi prevoditelj tijekom rada dobivao automatske terminološke prijedloge u svom lokalnom CAT alatu (Computer Assisted Translation odnosno strojno potpomognuto prevođenje).
Ako u toku prevođenja shvatite da nešto ne valja s glosarom – imate dvije opcije. Plakati ili sve ručno mijenjati segment po segment.
4. Učitavanje u prevoditeljski sustav
Tek u ovom koraku krećemo polako u prevođenje.
Terminološka baza učitava se u Trados projekt i provjerava se prepoznavanje pojmova. Tek tada dokument postaje spreman za prevođenje.
5. Postavljanje strojnog prevođenja
U projekt se povezuju AI modeli putem API ključeva ili drugi sustavi strojnog prevođenja te se provjerava da su svi alati aktivni. Uz pretpostavku da ste prethodno ugovorili korištenje API-a s provajderima i svi su funkcionalni.
6. Pretranslate proces
Tek sada započinje ono što mnogi smatraju „AI prevođenjem“. Koje se prema općem vjerovanju – događa automatski😉
Koriste se API ključevi koji pozivaju LLM-ove, (koje ste naravno nekada prije kupili i upogonili), prijevodne memorije (koje ste sakupljali), glosari i strojno prevođenje zajedno, a prevoditelj na kraju potvrđuje i korigira segmente prema potrebi.
7. Kontrola kvalitete
I sad smo valjda na kraju, a na kraju ili bar kad mislite da ste došli do kraja treba uzeti u obzir da profesionalni proces prevođenja ne završava generiranjem teksta, nego njegovom validacijom.
Dakle, na tom famoznom kraju slijedi provjera terminologije, logike prijevoda i formatiranja dokumenta.
Tu nas najčešće čeka mačak u vreći. Ako smo u onom prvom koraku predpripreme formata zabušavali, tu nas stiže kazna. Morat ćemo nositi svoj pretpotopni laptop koji ne radi bez napajanja doma ili na kampiranje jer ne možemo koristiti niti jedan drugi jer su skupe licence dostupne samo za određena računala.
A gdje je tu NIXA AI? Zar je stvarno bilo potrebno razvijati svoj vlastiti sustav kad je ovaj tako jednostavan?
NIXA AI nastao je zato što smo željeli objediniti sve naše procese u jednoj aplikaciji, ukloniti prastare lokalne softvere, eliminirati beskrajno kopiranje, lijepljenje, prebacivanje između aplikacija i ručno upravljanje datotekama.
Drugim riječima, nismo izmislili novi način rada. Digitalizirali smo vlastiti SOP koji smo godinama koristili u svakodnevnom radu.
Mi smo se u ovom procesu razvoja dosta namučili tako da vi ne morate. Možemo vam pomoći. Javite se.