Stichting Ilex


Stichting Ilex
Ouddiemerlaan 47
1111 GT DIEMEN
Tel. 020-693 1191
email: (robvana@gmail.com)
Postbank: NL98 INGB 0000177997

Kamer van Koophandel Rijnland dossiernr. 41169184, ANBI-stichting

Bestuur:
Voorzitter: prof. dr. Ben Arps, Utrecht
Secretaris: Rob van Albada, Amsterdam
Penningmeester: Jos Janssen, Arnhem

Deze pagina is laatstelijk herzien op 26 augustus 2014.

De Stichting Ilex heeft tot doel het samenstellen van woordenboeken in de Indonesische talen, met name de belangrijke streektalen zoals Javaans, Balinees, Madoerees en dergelijke. Volgens opgave van het Indonesische Ministerie van Onderwijs en Cultuur is het aantal mensen dat thuis Javaans spreekt twee maal zo hoog als het aantal dergenen die het Bahasa Indonesia (de officiële landstaal) thuis gebruiken. [(ca. 2001) Resp. 70 miljoen Javaans sprekenden tegenover 35 miljoen Indonesisch sprekenden.)]

Recente woordenboeken voor deze talen bestaan helaas niet. De Javaanse woordenboeken van Jansz en van Pigeaud dateren van 1938 en zijn verouderd en in hoge mate onvolledig. Er bestaat een goed Soendaas woordenboek van Eringa (uitgave KITLV) maar voor het Balinees beschikken we alleen over een korte woordenlijst in het leerboek van Pater Kersten (uitverkocht) en voor het Madoerees in er helemaal niets, evenals voor het Bataks.

Daarom is ons eerste en belangrijkste project het samenstellen van een Javaans woordenboek. We gaan hierbij uit van een verzameling teksten (het corpus) die door de computer "gelezen" worden en waaruit de computer automatisch woordenlijsten samenstelt, compleet met bronvermelding, paginanummer en grondwoord.

In 1996 hebben we met een subsidie van de Nederlandse Taalunie materiaal verzameld in Midden Java: voorbeelden van spreektaal in verschillende dialecten. We hebben opnamen uit Yogya, Gundhih (ten N. van Sala), Tegal, Banyumas en Banjarnegara. Daarnaast hebben we (ongesubsidieerd) in 2000 materiaal verzameld in Surabaya en Malang.

Dit materiaal bestaat uit cassettes met opnamen van gesprekken (spreektaal dus) en computerbestanden met de uitgetypte inhoud van de opnamen. Op dit moment wordt de "morphological parser" (geschreven door Rob van Albada) aangepast om de nieuwe woorden in bovengenoemde teksten te kunnen herkennen. Ander materiaal waarover wij beschikken: De proza-editie van de Babad Tanah Jawa, de Serat Centhini, de Darmagandhul (ngoko), diverse romans en korte verhalen. Van de Centhini is (vrijwel) alles gescand en met OCR ingelezen. Helaas is de druk vrij slecht, zodat het OCR-programma nogal wat fouten heeft gemaakt waarvan nog slechts een deel is gecorrigeerd.

Het spreektaalcorpus zal de primaire bron zijn voor het woordenboek.

Op dit moment bedraagt het aantal grondwoorden dat we in het corpus hebben aangetroffen ruim 18.000. Het aantal overige woordvormen dat correct door de parser geanalyseerd wordt, bedraagt momenteel ruim 24.000. Beide lijsten nemen nog geregeld in omvang toe. (April 2002)

Februari 2006:

Inmiddels is er veel veranderd. We hebben besloten om het woordenboek niet van de grond af op te bouwen, maar om uit te gaan van het bestaande woordenboek van Pigeaud, dat verschenen is in 1938. 'Pigeaud' bevat ruim 43200 trefwoorden, meer dan enig ander Javaans woordenboek.
Pigeaud hebben we gescand op 600 dpi (een hoge resolutie vanwege de kleine letter) en vervolgens gelezen met FineReader OCR, een tekstherkenningsprogramma van Russische makelij. (Scannen levert plaatjes op, géén tekst. OCR kan tekst herkennen en in een tekstbestand zetten.) Helaas is zelfs FineReader nog niet foutloos; naar schatting werden er ongeveer twintigduizend tekens niet goed herkend. Vaak werd het cijfer '1' voor de letter 'l' aangezien of andersom, de onderpunte t werd vaak gelezen als 'fx' of zoiets, een 'e' werd gezien als 'c' enzovoort. Er was een aantal correctierondes nodig om (bijna) alle fouten eruit te halen. Daarna werden de Javaanse velden door de computer omgezet in de nieuwe spelling: 'oe' werd 'u', 'dj' werd 'j', 'tj' werd 'c' enzovoort. Omdat de spelling veranderd was, moest het woordenboek ook opnieuw gesorteerd worden. Ook dat is gedaan met behulp van onze computer in Solo.

Inmiddels zijn ruim 3300 nieuwe woorden of woordbetekenissen ingevoerd en is de vertaling van met name muziek- en dansterminologie aanzienlijk verbeterd. Komende zomer is Rob van Albada opnieuw in Solo, en zal wederom een groot aantal nieuwe trefwoorden worden toegevoegd. 'Nieuwe' (d.w.z. niet in 'Pigeaud' voorkomende) woordjes uit diverse teksten zullen ter vertaling worden voorgelegd aan deskundigen (Lukman Aris en Endang Tri Winarni).

Eind 2006 zal de definitieve versie worden ingeleverd bij het KITLV te Leiden. Nadat de layout voltooid is, kan het begin 2007 worden gedrukt.

RvA.

November 2006:

Het aantal nieuwe lemma's is toegenomen tot ongeveer 5800. (Niet hierbij gerekend zijn woorden op het gebied van karawitan. Naar verwachting kan binnen een maand het woordenboek worden aangeboden aan het KITLV.

Maart 2007:

Het aantal nieuwe lemma's en sublemma's heeft de 6000 overschreden. Het woordenboek is inmiddels ingeleverd bij het KITLV. Het zal worden uitgegeven in het zelfde formaat als het bekende Indonesisch-Nederlandse Woordenboek van Teeuw. Het zal ongeveer 1080 pagina's bevatten, het voorwoord niet meegerekend. We hopen dat het ongeveer eind Mei zal uitkomen.

Juni 2007:

Er is enige vertraging geweest, maar het woordenboek ligt nu bij de drukker, die heeft aangegeven ongeveer vier weken nodig te hebben. Eind Juni of begin Juli kunnen we het nieuwe woordenboek tegemoet zien!

Juli 2007

Op 5 Juli is het woordenboek (van 1086 pagina's ongeteld de inleiding) door de binder afgeleverd bij het KITLV. Het formaat en de kleur zijn gelijk aan die van het Indonesisch-Nederlandse woordenboek van Prof. Teeuw. Het KITLV bereidt een presentatie voor die naar verwachting binnenkort zal plaatshebben.

October 2007

Na de presentatie van het woordenboek op 26 October 2007 is het woordenboek nu echt officieel uitgegeven. Het wordt verkocht door het KITLV voor de prijs van €49,50.
Leden van het KITLV krijgen 25 procent korting.
Rob van Albada zal op 19 November a.s. opnieuw naar Solo reizen om daar informatie te zoeken over circa 4000 nieuwe woorden die hij in de tweede druk wil opnemen. Hierbij zijn ruim duizend woorden uit de Centhini. De overige drieduizend woorden komen uit romans en uit interviews.

April 2008

Van Albada is inmiddels terug uit Solo. Al vrij kort naa aankomst heeft hij een huis gehuurd voor de duur van tien jaar met de bedoeling daar elk jaar vier maanden te verblijven om aan het woordenboek te werken. Tien dagen na zijn verhuizing was er een grote overstroming in Solo en stond het water in zijn oude huis 1,30 m hoog! Het nieuwe huis is gelukkig hiervan gevrijwaard gebleven. Omdat het nieuwe huis nog ingericht en hier en daar verbouwd moest worden is er kostbare tijd verloren gegaan. Daardoor is het aantal nieuwe woorden dat in de computer ingevoerd is beperkt gebleven tot 2100. Er was dus bij vertrek een achterstand op de planning (3000 nieuwe woorden minimaal) van ca. 900 woorden. Deze achterstand zal de komende maanden worden ingelopen. Bij de ingevoerde nieuwe woorden is het dialect van Banyumas goed vertegenwoordigd.

Augustus 2008

Inmiddels zijn alle drieduizend nieuwe woorden ingevoerd zoals gepland. Tijdens de komende reis zal gekeken worden naar nieuwe woorden uit de spreektaalbestanden en uit romans van Soeparto Brata. De spreektaalbestanden betreffen teksten in verschillende dialecten: Gundhih, Banjarnegara, Banyumas en Tegal.

Tot onze grote vreugde heeft het Prins Bernhard Cultuurfonds ons een subsidie van €4000 toegekend. Deze zal gebruikt worden om de kosten van de reis 2008-2009 te dekken.

October 2009 – op naar de 15.000!

Het totaal aantal nieuwe woorden (nauwkeuriger: nieuwe lexicale eenheden) heeft de 12.000 overschreden. Dat wil zeggen dat er ná de druk van 2007 nog eens ruim 6.000 nieuwe lexicale eenheden aan het woordenboek zijn toegevoegd. In de komende maanden zal Van Albada daar nog eens drieduizend bij doen, zodat het grand total zal uitkomen op 15.000. Inmiddels zijn helemaal verwerkt de spreektaalteksten uit Banyumas, Gundhih en Banjarnegara. In de periode November 2009 tot en met Maart 2010 zullen woorden worden toegevoegd uit Yogya, Surabaya en Tegal. Een bescheiden begin zal worden gemaakt met woorden uit de opnames in Serang (Banten). Daarnaast zullen nog enkele honderden woorden uit de Serat Cĕnthini worden opgenomen.

April 2013:

Tijdens de laatste reis naar Indonesië zijn 2500 nieuwe woorden toegevoegd; het totaal is nu 19200 nieuwe woorden/vertalingen. Vorig jaar is er een grote stap genomen die het gebruik van het woordenboek aanzienlijk beïnvloedt: alles staat nu op grondwoord gesorteerd zodat bijvoorbeeeld kagèt nu staat onder gèt en ngankani onder angka enz. Die structuurwijziging heeft de samensteller heel wat hoofdbrekens en tijd gekost! De volgende reis is gepland voor januari 2014. Daarna is het tijd om correcties aan te brengen en een nieuwe druk voor te bereiden, want de druk van 2007 is bijna geheel uitverkocht.


November 2013:

De uitgeverij van het KITLV is helaas opgeheven. Het boekenbestand is overgenomen door de  vermaarde wetenschappelijke uitgeverij Brill in Leiden.  Sindsdien streven we naar een uitbreiding van het woordenboek met Engelse vertalingen.  Daarvoor moeten Javaans sprekende Engelse native speakers worden aangetrokken.  Dit is nog in volle gang.

Door een fout in het telprogramma werden tot April van dit jaar sommige nieuwe woorden dubbel geteld, zodat het eindcijfer ongeveer 500 te hoog was. Op dit moment zijn er 19.275 'nieuwe' woorden (lexicale eenheden) in het woordenboek opgenomen.

Komend voorjaar zullen woorden worden opgenomen uit onder meer een nieuwe roman (nog niet in druk verschenen) en uit Klempakan Cariyos Tionghwa Sik Jin Kwi Ceng See, Chinese verhalen uit de Tang-dynastie uitgegeven door Dwi Woro Retno Mastuti.


December  2014
Een nieuwe correctieronde is net achter de rug.


Januari 2014
Op 12 januari kwam Van Albada in Solo aan. 16 Januari kreeg een van de informanten de beschikking over de nieuwe teksten en de bijbehorende woordenlijsten. 22 januari  vliegt hij naar Denpasar om Max van Balgooy te ontmoeten. Max adviseer hem over plantennamen.

Februari 2014
Aan het eind van de maand telden we 20.425 nieuwe lexicale eenheden. De nieuwe woorden kwamen uit een roman van Suparto Brata, een inzending voor de romanwedstrijd van 2010 en een gedicht over de Chinese gechiedenis tijdens de Tang-dynastie.

Maart  2014
Begin maart heeft Lukman het te druk met zijn werk als leraar om veel tijd te besteden aan de vertalingen. Daardoor is Rob van Albada een aantal dagen werkloos. Zijn visum verloopt op 9 maart en hij vliegt naar Singapore om een nieuw visum bij aankomst te krijgen.

April 2014
Een zestiental irritante fouten in de opmaak van het woordenboek (ontbrekende Griekse punten aan het eind van een artikel) konden worden opgespoord en verbeterd. Een enkele foute vertaling is gecorrigeerd (er zullen nog wel meer foute vertalingen in het woordenboek zitten, aangezien er nu een groot aantal zeer zeldzame woorden is opgenomen, waardoor controle moeilijk is). Het totaal nieuwe lexical items bedraagt nu 20976. Woorden uit de oude poëtische teksten (in Kawi) zijn vaak moeilijk te vertalen en mijn informant Lukman laat daarom soms verstek gaan. In andere gevallen doet hij een gok, en dan is het mijn taak om die gok al of niet goed te keuren. Hierdoor gebeurt het nogal eens dat er wel een vertaling wordt gegeven, maar dat die gevolgd wordt door een vraagteken om aan te geven dat de vertaling onzeker is.
(12 April) Aantal nieuwe lexical items: 21123. Aantal artikelen: 56003. Het woordenboek blijft groeien!
Er komt dit jaar een nieuwe uitgave; ditmaal zal het verschijnen bij Brill, dat de titels van de uitgeverij KITLV heeft overgenomen. Het wordt een tweedelige uitgave, compleet met vindplaatsen en citaten bij alle 'nieuwe' woorden. Bovendien is het woordenboek nu heel anders ingedeeld: alles staat nu op grondwoord. Dus in plaats van te kijken bij panerus of kagèt moet je zoeken onder terus of gèt. Tenslotte is er ook wat etymologische informatie toegevoegd: aan redelijk groot aantal woorden is voorzien van het teken A (Arabisch), (Nederlands), S (Sanskriet), E (Engels) enzovoort om de herkomst aan te geven. Waar mogelijk is de oorspronkelijke woordvorm ook gegeven (in Latijns schrift).
Op de website van Brill staat een enigszins verouderde tekst die het heeft over 19.000 nieuwe woorden. Dat zou moeten zijn ca. 20.500.  (De tekst van het woordenboek is eind maart ingeleverd.)
(18 April) Klaar met het invoeren van de nieuwe woorden van deze reis. Het totaal aaan nieuwe lexical items is gegroeid tot 21344.

Mei-Juni 2014
Twee correctierondes zijn inmiddels voltooid. Het hele woordenboek is uitgeprint en nauwkeurig doorgelezen. Het bestand met correcties is doorgestuurd naar Brill. Bovendien werd er drie keer een programma'tje aangevuld om specifieke structuurfouten op te sporen: vet vergeten in hoofdwoord, nummer van vertaling weggelaten enz. Een paar keer werd een vertaling verbeterd of een artikel verplaatst. Vandaag of morgen komt de gecorrigeerde versie van Brill; nadat deze is gecontroleerd is onze taak klaar en kan het boek worden uitgegeven.
Ondertussen wordt een nieuwe reis naar Solo voorbereid en nieuwe Javaanse teksten worden gel\ezen en nagezocht op 'nieuwe' woorden en uitdrukkingen, die ter vertalingaan een informant zullen worden voorgelegd.. De uitbreiding van het woordenboek gaat nog steeds door!

Augustus 2014
21 Augustus: we hebben bericht van Brill (de uitgever) ontvangen dat het woordenboek bij de drukker is. In deze editie staat bij vrijwel elke nieuwe toevoeging  de vindplaats vermeld en een citaat. Gebruikers die graag de context willen zien kunnen (voorlopig) bij de Stichting Ilex de complete tekst opvragen (behalve van boeken die in de handel zijn). Dit geldt dus voor de spreektaalopnames en onder meer ook voor de inzendingen van de romanwedstrijd. De betreffende teksten mogen echter niet verder verspreid worden.

September 2014
19 September: het woordenboek is nu echt uit; de eerste exemplaren liggen hier voor me. Het ziet er prachtig uit: twee kloeke banden met een fraai batikpatroon op de omslag. Alleen jammer dat een malle verschrijving op de achterflap niet tijdig is opgemerkt en daardoor niet meer kon worden gecorrigeerd. Er staat: 'woorden die beginnen met een voorzetsel' en dat moet natuurlijk zijn: 'met een voorvoegsel'. Verder is het echt schitterend. Het bevat véél nieuwe woorden, waaronder dialektwoorden, veel plantennamen met de recente wetenschappelijke naam erbij, veel muziektermen (vooral gamelan). 'Nieuwe' woorden werden geoogst uit zowel proza als poëzie (tembang macapat). Nee, het woordenboek is nog bepaald niet volmaakt of volledig, maar het is weer een grote stap in de goede richting. Nu is een woordenboek van een levende taal natuurlijk nooit volledig: altijd komen er nieuwe woorden bij. Maar als we een wat minder absolute betekenis geven aan het woord volledig, dan kunnen we bijvoorbeeld zeggen dat een woordenboek 'volledig' is als je per 1000 woorden niet meer dan één woord tegenkomt dat niet in het woordenboek staat met een passende vertaling. Ook dat is nog lang niet bereikt, maar het aantal niet gevonden woorden is wél met ongeveer twee derden gedaald ten opzichte van het woordenboek van Pigeaud uit 1938. Dat is al heel wat, maar er is nog wel veel werk te doen.

November 2014
Via-via heb ik een naam opgekregen van iemand die een goede informante voor het dialect van Tjirebon zou zijn. Ik heb meteen contact opgenomen en inmiddels is ze al begonnen met het maken van opnames.  De eerste resultaten heb ik al binnen!  Ik bereid me voor op mijn vertrek naar Solo op 10 december. In Solo zal ik nieuwe woorden kunnen toevoegen, vooral wajangtaal, wat dichtertaal  uit de Klempakan Cariyos Tionghwa Sik Jin Kwi Ceng See  (zie november vorig jaar), uit wat korte verhalen van J.F.X.Hoery en uit een klein stukje Centhini. In Djakarta en misschien in Tjirebon zal ik mijn nieuwe informante en haar man ontmoeten. Een aantal gratis exemplaren van het woordenboek is inmiddels op weg naar Java, waar ik mijn informanten en een aantal geselecteerde bibliotheken van een exemplaar kan voorzien.

R. van Albada en Th. Pigeaud, Javaans-Nederlands woordenboek (2 vols),  1511 pp hardback. Brill, Leiden 2014. ISBN13: 9789004276956. Verschenen in September 2014. €149. Te bestellen bij Brill in Leiden (print on demand). 

Werkwijze tot nu toe:

De secretaris/lexicograaf bereidt elk jaar thuis een aantal uiteenlopende teksten voor, variërend van de Centhini (oude, poëtische tekst) tot recente Wikipedia-artikelen.
Vervolgens reist hij naar Java (de laatste jaren steeds naar Munyung bij Solo)  om informanten te raadplegen en de nieuwe woorden in te voeren in het woordenboek. Als hij na vier of vijf maanden weer thuiskomt, brengt hij nog correcties aan, soms met raadpleging van anderen, en begint daarna aan een nieuwe portie teksten. De reis van december 2014 tot april 2015 is in voorbereiding.

Financiëring:

Aangezien Uw donatie respectievelijk legaat nog niet door ons ontvanngen is, zijn de middelen van de stichting zeer beperkt.  In de praktijk betekent dit dat alleen de kosten van het vliegticket (economy class) van de lexicograaf vergoed kan worden. Alle overige kosten (zoals het salaris van de informanten, boeken enz.) moet hij zelf betalen. De huishuur is tot 2017 betaald uit de subsidie van het Prins Bernhard Fonds.

Financieel overzicht 2011

Financieel overzicht 2012

Uitgave van 2007:

Rob van Albada en Th. Pigeaud: Javaans-Nederlands woordenboek. Herziene uitgave gemoderniseerd en aangevuld. KITLV Uitgeverij Leiden 2007. Pp xxxii+1086;
ISBN 978 90 6718 208 9

Texten/Texts/Teks:

Om copyrightredenen kunnen we helaas niet alle teksten ter beschikking stellen.

-Sêrat Darmagandhul in proza (ngoko) versie (ca. 190kB).

-Stuur ons een email




Laatste update: 26-08-2014