Programiranje pripreme velikih RTF dokumenata za uvoz u Adobe InDesign aplikaciju

Nikola Majstorović, Tomislav Kosić, Milan Tomić

Rad opisuje programiranje prevođenja velikih RTF (Rich Text Format) dokumenata u prikladan oblik sustavu za grafičku pripremu Adobe InDesign. Kao primjer je dan novi Rječnik stranih riječi, autora Bratoljuba Klaića i suradnika sastavljen od blizu 6 miliona znakova u 1.5 miliona riječi sa lokalnim formatiranjem preuzet kao izlaz iz produkcijskog sustava SoftLex. Priprema prevođenja je napravljena primjenom vlastitog alata „Oziris“ razvijenog za detaljno razlaganje velikih MS Word dokumenata u MS Access bazu podataka. Prednost tog pristupa je u velikim mogućnostima detekcije i ispravljanja zaostalih grešaka. Isprobane su četiri načina generiranja ulaza: a) Primjena svojstva „Stil“ za znakove (CharStyle) po paragrafima iterativno kroz cijeli dokument , b) Izgradnja čistog RTF dokumenta sa odabranim stilom za paragraf i znak (CharStyle, ParStyle), c) Direktno programiranje InDesig aplikacije za sekvencijalno uvođenje atribuiranog teksta i d) Generiranje standardnog formatiranog teksta za uvoz u InDesign (InDesign Markup Language) Posljednja se opcija pokazala kao najproduktivnija, sa velikim mogućnostima iskušavanja sa različitim predlošcima krajnjeg dokumenta. Pristup se pokazao korisnim za rječnike, ali nije limitiran za primjenu i kod drugih vrsta velikih dokumenata. Sam proces je visoko interaktivan i traži ekstra programiranja za svaki pojedinačni slučaj pa je prikladan za velike dokumente: stotine pa i tisuće strana teksta.

Programming the preparation of big RTF documents for import into the Adobe InDesign application

Nikola Majstorović, Tomislav Kosić, Milan Tomić

The paper describes programming of the conversion of big RTF (Rich Text Format) documents into suitable form for AdobeInDesign graphic preparation. The New Dictionary of foreign expressions written by Bratoljub Klaić and associates has been given as an example. The dictionary consists of nearly 6 million signs and 1.5 million words with local formatting taken over as the exit from the Softlex production system. Preparation for the conversion has been made by applying our own “Oziris” tool developed for detailed breakup of big MS Word documents into the MS Access database. The advantage of such an approach is in the greater detection possibilities and correction of remaining errors. Four ways of entry generating have been tested: a) Applying the characteristic “Stil” for signs (CharStyle) per paragraphs iteratively throughout the overall document, b) Development of a clean RTF document with a chosen style for paragraph and signs (CharStyle, ParStyle), c) Direct InDesign application programming for sequential introduction of attributed text, and d) Generation of a standard formatted text for import into InDesign (InDesign Markup Language). The final option has proven to be the most productive one, with great possibilities of proofing with various end document samples. The approach has proven to be useful for dictionaries, but is not limited in application in respect to other kinds of big documents. The process itself is highly interactive and requires extra programming for each individual case, and so it is suitable for big documents: hundreds and even thousands of text pages.