Stichting Ilex
Stichting Ilex
Ouddiemerlaan 47
1111 GT DIEMEN
Tel. 020-693 1191
email: (robvana@gmail.com)
Postbank: NL98 INGB 0000177997
Kamer van Koophandel Rijnland dossiernr. 41169184, ANBI-stichting. RSIN: 804224766
Bestuur:
Voorzitter: prof. dr. Ben Arps, Utrecht
Secretaris: Rob van Albada, Amsterdam
Penningmeester: Jos Janssen, Arnhem
Deze pagina is laatstelijk herzien op 24 juli 2017.
De Stichting Ilex heeft tot doel het samenstellen van woordenboeken in de
Indonesische talen, met name de belangrijke streektalen zoals Javaans,
Balinees, Madoerees en dergelijke. Volgens opgave van het Indonesische
Ministerie van Onderwijs en Cultuur is het aantal mensen dat thuis Javaans
spreekt twee maal zo hoog als het aantal dergenen die het Bahasa Indonesia (de
officiële landstaal) thuis gebruiken. [(ca. 2001) Resp. 70 miljoen Javaans sprekenden
tegenover 35 miljoen Indonesisch sprekenden.)]
Recente woordenboeken voor deze talen bestaan helaas niet. De Javaanse
woordenboeken van Jansz en van Pigeaud dateren van 1938 en zijn verouderd en in
hoge mate onvolledig. Er bestaat een goed Soendaas woordenboek van Eringa
(uitgave KITLV) maar voor het Balinees beschikken we alleen over een korte
woordenlijst in het leerboek van Pater Kersten (uitverkocht) en voor het
Madoerees in er helemaal niets, evenals voor het Bataks.
Daarom is ons eerste en belangrijkste project het samenstellen van een
Javaans woordenboek. We gaan hierbij uit van een verzameling teksten (het
corpus) die door de computer "gelezen" worden en waaruit de computer
automatisch woordenlijsten samenstelt, compleet met bronvermelding,
paginanummer en grondwoord.
In 1996 hebben we met een subsidie van de Nederlandse Taalunie materiaal
verzameld in Midden Java: voorbeelden van spreektaal in verschillende
dialecten. We hebben opnamen uit Yogya, Gundhih (ten N. van Sala), Tegal,
Banyumas en Banjarnegara. Daarnaast hebben we (ongesubsidieerd) in 2000
materiaal verzameld in Surabaya en Malang.
Dit materiaal bestaat uit cassettes met opnamen van gesprekken (spreektaal
dus) en computerbestanden met de uitgetypte inhoud van de opnamen. Op dit
moment wordt de "morphological parser" (geschreven door Rob van
Albada) aangepast om de nieuwe woorden in bovengenoemde teksten te kunnen
herkennen. Ander materiaal waarover wij beschikken: De proza-editie van de
Babad Tanah Jawa, de Serat Centhini, de Darmagandhul (ngoko), diverse romans en
korte verhalen. Van de Centhini is (vrijwel) alles gescand en met OCR
ingelezen. Helaas is de druk vrij slecht, zodat het OCR-programma nogal wat
fouten heeft gemaakt waarvan nog slechts een deel is gecorrigeerd.
Het spreektaalcorpus zal de primaire bron zijn voor het woordenboek.
Op dit moment bedraagt het aantal grondwoorden dat we in het corpus hebben
aangetroffen ruim 18.000. Het aantal overige woordvormen dat correct door de
parser geanalyseerd wordt, bedraagt momenteel ruim 24.000. Beide lijsten nemen
nog geregeld in omvang toe. (April 2002)
Februari 2006:
Inmiddels
is er veel veranderd. We hebben besloten om het woordenboek niet van de grond
af op te bouwen, maar om uit te gaan van het bestaande woordenboek van Pigeaud,
dat verschenen is in 1938. 'Pigeaud' bevat ruim 43200 trefwoorden, meer dan
enig ander Javaans woordenboek.
Pigeaud hebben we gescand op 600 dpi (een hoge resolutie vanwege de kleine
letter) en vervolgens gelezen met FineReader OCR, een tekstherkenningsprogramma
van Russische makelij. (Scannen levert plaatjes op, géén tekst. OCR kan tekst
herkennen en in een tekstbestand zetten.) Helaas is zelfs FineReader nog niet
foutloos; naar schatting werden er ongeveer twintigduizend tekens niet goed
herkend. Vaak werd het cijfer '1' voor de letter 'l' aangezien of andersom, de
onderpunte t werd vaak gelezen als 'fx' of zoiets, een 'e' werd gezien als 'c'
enzovoort. Er was een aantal correctierondes nodig om (bijna) alle fouten eruit
te halen. Daarna werden de Javaanse velden door de computer omgezet in de
nieuwe spelling: 'oe' werd 'u', 'dj' werd 'j', 'tj' werd 'c' enzovoort. Omdat
de spelling veranderd was, moest het woordenboek ook opnieuw gesorteerd worden.
Ook dat is gedaan met behulp van onze computer in Solo.
Inmiddels zijn ruim 3300 nieuwe woorden of woordbetekenissen ingevoerd en is
de vertaling van met name muziek- en dansterminologie aanzienlijk verbeterd.
Komende zomer is Rob van Albada opnieuw in Solo, en zal wederom een groot
aantal nieuwe trefwoorden worden toegevoegd. 'Nieuwe' (d.w.z. niet in 'Pigeaud'
voorkomende) woordjes uit diverse teksten zullen ter vertaling worden
voorgelegd aan deskundigen (Lukman Aris en Endang Tri Winarni).
Eind 2006 zal de definitieve versie worden ingeleverd bij het KITLV
te Leiden. Nadat de layout voltooid is, kan het begin 2007 worden gedrukt.
RvA.
November 2006:
Het
aantal nieuwe lemma's is toegenomen tot ongeveer 5800. (Niet hierbij gerekend
zijn woorden op het gebied van karawitan. Naar verwachting kan binnen
een maand het woordenboek worden aangeboden aan het KITLV.
Maart 2007:
Het
aantal nieuwe lemma's en sublemma's heeft de 6000 overschreden. Het woordenboek
is inmiddels ingeleverd bij het KITLV. Het zal worden uitgegeven in het zelfde
formaat als het bekende Indonesisch-Nederlandse Woordenboek van Teeuw. Het zal
ongeveer 1080 pagina's bevatten, het voorwoord niet meegerekend. We hopen dat
het ongeveer eind Mei zal uitkomen.
Juni 2007:
Er
is enige vertraging geweest, maar het woordenboek ligt nu bij de drukker, die
heeft aangegeven ongeveer vier weken nodig te hebben. Eind Juni of begin Juli
kunnen we het nieuwe woordenboek tegemoet zien!
Juli 2007
Op 5
Juli is het woordenboek (van 1086 pagina's ongeteld de inleiding) door de
binder afgeleverd bij het KITLV. Het formaat en de kleur zijn gelijk aan die
van het Indonesisch-Nederlandse woordenboek van Prof. Teeuw. Het KITLV bereidt
een presentatie voor die naar verwachting binnenkort zal plaatshebben.
October 2007
Na
de presentatie van het woordenboek op 26 October 2007 is het woordenboek nu
echt officieel uitgegeven. Het wordt verkocht door het KITLV voor de prijs van
€49,50.
Leden van het KITLV krijgen 25 procent korting.
Rob van Albada zal op 19 November a.s. opnieuw naar Solo reizen om daar
informatie te zoeken over circa 4000 nieuwe woorden die hij in de tweede druk
wil opnemen. Hierbij zijn ruim duizend woorden uit de Centhini. De
overige drieduizend woorden komen uit romans en uit interviews.
April 2008
Van
Albada is inmiddels terug uit Solo. Al vrij kort naa aankomst heeft hij een
huis gehuurd voor de duur van tien jaar met de bedoeling daar elk jaar vier
maanden te verblijven om aan het woordenboek te werken. Tien dagen na zijn
verhuizing was er een grote overstroming in Solo en stond het water in zijn oude
huis 1,30 m hoog! Het nieuwe huis is gelukkig hiervan gevrijwaard gebleven.
Omdat het nieuwe huis nog ingericht en hier en daar verbouwd moest worden is er
kostbare tijd verloren gegaan. Daardoor is het aantal nieuwe woorden dat in de
computer ingevoerd is beperkt gebleven tot 2100. Er was dus bij vertrek een
achterstand op de planning (3000 nieuwe woorden minimaal) van ca. 900 woorden.
Deze achterstand zal de komende maanden worden ingelopen. Bij de ingevoerde
nieuwe woorden is het dialect van Banyumas goed vertegenwoordigd.
Augustus 2008
Inmiddels
zijn alle drieduizend nieuwe woorden ingevoerd zoals gepland. Tijdens de
komende reis zal gekeken worden naar nieuwe woorden uit de spreektaalbestanden
en uit romans van Soeparto Brata. De spreektaalbestanden betreffen teksten in
verschillende dialecten: Gundhih, Banjarnegara, Banyumas en Tegal.
Tot onze grote vreugde heeft het Prins Bernhard Cultuurfonds ons
een subsidie van €4000 toegekend. Deze zal gebruikt worden om de kosten van de
reis 2008-2009 te dekken.
October 2009 – op naar
de 15.000!
Het totaal aantal nieuwe woorden
(nauwkeuriger: nieuwe lexicale eenheden)
heeft de 12.000 overschreden. Dat wil zeggen dat er ná de druk van 2007 nog
eens ruim 6.000 nieuwe lexicale eenheden aan het woordenboek zijn toegevoegd.
In de komende maanden zal Van Albada daar nog eens drieduizend bij doen, zodat
het grand total zal uitkomen op 15.000. Inmiddels zijn helemaal verwerkt de
spreektaalteksten uit Banyumas, Gundhih en Banjarnegara. In de periode November
2009 tot en met Maart 2010 zullen woorden worden toegevoegd uit Yogya, Surabaya
en Tegal. Een bescheiden begin zal worden gemaakt met woorden uit de opnames in
Serang (Banten). Daarnaast zullen nog enkele honderden woorden uit de Serat Cĕnthini
worden opgenomen.
April 2013:
Tijdens de laatste reis naar Indonesië zijn 2500 nieuwe woorden toegevoegd; het totaal is nu 19200
nieuwe woorden/vertalingen.
Vorig jaar is er een grote stap genomen die het gebruik van het woordenboek aanzienlijk beïnvloedt:
alles staat nu op grondwoord gesorteerd zodat bijvoorbeeeld kagèt
nu staat onder gèt en ngankani onder angka
enz.
Die structuurwijziging heeft de samensteller heel wat hoofdbrekens en
tijd gekost!
De volgende reis is gepland voor januari 2014. Daarna is het tijd om
correcties aan te brengen en een nieuwe druk voor te bereiden, want de
druk van 2007 is bijna geheel uitverkocht.
November 2013:
De uitgeverij van het KITLV is helaas
opgeheven. Het boekenbestand is overgenomen door de vermaarde wetenschappelijke uitgeverij Brill in Leiden.
Sindsdien streven we naar een uitbreiding van het woordenboek met
Engelse vertalingen. Daarvoor moeten Javaans sprekende Engelse
native speakers worden aangetrokken. Dit is nog in volle gang.
Door een fout in het telprogramma werden tot April van dit jaar sommige
nieuwe woorden dubbel geteld, zodat het eindcijfer ongeveer 500 te hoog
was. Op dit moment zijn er 19.275 'nieuwe' woorden (lexicale eenheden)
in het woordenboek opgenomen.
Komend voorjaar zullen woorden worden opgenomen uit onder meer een nieuwe roman (nog niet in druk verschenen) en uit
Klempakan Cariyos Tionghwa Sik Jin Kwi Ceng See, Chinese verhalen uit de Tang-dynastie uitgegeven door Dwi Woro Retno Mastuti.
December 2014
Een nieuwe correctieronde is net achter de rug.
Januari 2014
Op
12 januari kwam Van Albada in Solo aan. 16 Januari kreeg een van de
informanten de beschikking over de nieuwe teksten en de bijbehorende
woordenlijsten. 22 januari vliegt hij naar Denpasar om Max van Balgooy te ontmoeten. Max adviseer hem over plantennamen.
Februari 2014
Aan
het eind van de maand telden we 20.425 nieuwe lexicale eenheden. De
nieuwe woorden kwamen uit een roman van Suparto Brata, een inzending
voor de romanwedstrijd van 2010 en een gedicht over de Chinese
gechiedenis tijdens de Tang-dynastie.
Maart 2014
Begin
maart heeft Lukman het te druk met zijn werk als leraar om veel tijd te
besteden aan de vertalingen. Daardoor is Rob van Albada een aantal
dagen werkloos. Zijn visum verloopt op 9 maart en hij vliegt naar
Singapore om een nieuw visum bij aankomst te krijgen.
April 2014
Een
zestiental irritante fouten in de opmaak van het woordenboek
(ontbrekende Griekse punten aan het eind van een artikel) konden worden
opgespoord en verbeterd. Een enkele foute vertaling is gecorrigeerd (er
zullen nog wel meer foute vertalingen in het woordenboek zitten,
aangezien er nu een groot aantal zeer zeldzame woorden is opgenomen,
waardoor controle moeilijk is). Het totaal nieuwe
lexical items bedraagt nu 20976. Woorden uit de oude poëtische teksten (in Kawi) zijn vaak moeilijk te vertalen en mijn informant
Lukman
laat daarom soms verstek gaan. In andere gevallen doet hij een gok, en
dan is het mijn taak om die gok al of niet goed te keuren. Hierdoor
gebeurt het nogal eens dat er wel een vertaling wordt gegeven, maar dat
die gevolgd wordt door een vraagteken om aan te geven dat de vertaling
onzeker is.
(12 April) Aantal nieuwe
lexical items: 21123. Aantal artikelen: 56003. Het woordenboek blijft groeien!
Er komt dit jaar een nieuwe uitgave; ditmaal zal het verschijnen bij
Brill, dat de titels van de uitgeverij KITLV heeft overgenomen. Het
wordt een tweedelige uitgave, compleet met vindplaatsen en citaten bij
alle 'nieuwe' woorden. Bovendien is het woordenboek nu heel anders
ingedeeld: alles staat nu op grondwoord. Dus in plaats van te kijken
bij
panerus of
kagèt moet je zoeken onder
terus of
gèt. Tenslotte is er ook wat etymologische informatie toegevoegd: aan redelijk groot aantal woorden is voorzien van het teken
A (Arabisch),
N (Nederlands),
S (Sanskriet),
E
(Engels) enzovoort om de herkomst aan te geven. Waar mogelijk is de
oorspronkelijke woordvorm ook gegeven (in Latijns schrift).
Op de website van Brill staat een enigszins verouderde tekst die het
heeft over 19.000 nieuwe woorden. Dat zou moeten zijn ca. 20.500.
(De tekst van het woordenboek is eind maart ingeleverd.)
(18 April) Klaar met het invoeren van de nieuwe woorden van deze reis. Het totaal aaan nieuwe
lexical items is gegroeid tot 21344
.
Mei-Juni 2014Twee
correctierondes zijn inmiddels voltooid. Het hele woordenboek is
uitgeprint en nauwkeurig doorgelezen. Het bestand met correcties is
doorgestuurd naar Brill. Bovendien werd er drie keer een programma'tje
aangevuld om specifieke structuurfouten op te sporen: vet vergeten in
hoofdwoord, nummer van vertaling weggelaten enz. Een paar keer werd een
vertaling verbeterd of een artikel verplaatst. Vandaag of morgen komt
de gecorrigeerde versie van Brill; nadat deze is gecontroleerd is onze
taak klaar en kan het boek worden uitgegeven.
Ondertussen wordt een nieuwe reis naar Solo voorbereid en nieuwe
Javaanse teksten worden gel\ezen en nagezocht op 'nieuwe' woorden en
uitdrukkingen, die ter vertalingaan een informant zullen worden
voorgelegd.. De uitbreiding van het woordenboek gaat nog steeds door!
Augustus 2014
21 Augustus: we hebben bericht van Brill (de uitgever) ontvangen dat
het woordenboek bij de drukker is. In deze editie staat bij vrijwel
elke nieuwe toevoeging de vindplaats vermeld en een citaat.
Gebruikers die graag de context willen zien kunnen (voorlopig) bij de
Stichting Ilex de complete tekst opvragen (behalve van boeken die in de
handel zijn). Dit geldt dus voor de spreektaalopnames en onder meer ook
voor de inzendingen van de romanwedstrijd. De betreffende teksten mogen
echter niet verder verspreid worden.
September 2014
19 September: het woordenboek is nu echt uit; de eerste exemplaren
liggen hier voor me. Het ziet er prachtig uit: twee kloeke banden met
een fraai batikpatroon op de omslag. Alleen jammer dat een malle
verschrijving op de achterflap niet tijdig is opgemerkt en daardoor
niet meer kon worden gecorrigeerd. Er staat: 'woorden die beginnen met
een voorzetsel' en dat moet natuurlijk zijn: 'met een voorvoegsel'.
Verder is het echt schitterend. Het bevat véél nieuwe woorden,
waaronder dialektwoorden, veel plantennamen met de recente
wetenschappelijke naam erbij, veel muziektermen (vooral gamelan).
'Nieuwe' woorden werden geoogst uit zowel proza als poëzie (
tembang macapat).
Nee, het woordenboek is nog bepaald niet volmaakt of volledig, maar het
is weer een grote stap in de goede richting. Nu is een woordenboek van
een levende taal natuurlijk nooit volledig: altijd komen er nieuwe
woorden bij. Maar als we een wat minder absolute betekenis geven aan
het woord volledig, dan kunnen we bijvoorbeeld zeggen dat een
woordenboek 'volledig' is als je per 1000 woorden niet meer dan één
woord tegenkomt dat niet in het woordenboek staat met een passende
vertaling. Ook dat is nog lang niet bereikt, maar het aantal niet
gevonden woorden is wél met ongeveer twee derden gedaald ten opzichte
van het woordenboek van Pigeaud uit 1938. Dat is al heel wat, maar er
is nog wel veel werk te doen.
November 2014
Via-via heb ik een naam opgekregen van iemand die een goede informante
voor het dialect van Tjirebon zou zijn. Ik heb meteen contact opgenomen
en inmiddels is ze al begonnen met het maken van opnames. De
eerste resultaten heb ik al binnen! Ik bereid me voor op mijn
vertrek naar Solo op 10 december. In Solo zal ik nieuwe woorden kunnen
toevoegen, vooral wajangtaal, wat dichtertaal uit de
Klempakan Cariyos Tionghwa Sik Jin Kwi Ceng See (zie
november vorig jaar), uit wat korte verhalen van J.F.X.Hoery en uit een
klein stukje Centhini. In Djakarta en misschien in Tjirebon zal ik mijn
nieuwe informante en haar man ontmoeten. Een aantal gratis exemplaren
van het woordenboek is inmiddels op weg naar Java, waar ik mijn
informanten en een aantal geselecteerde bibliotheken van een exemplaar
kan voorzien.
April 2015
De reis van
2014-2015 (vier maanden) is achter de rug. Helaas heb ik met nogal wat
problemen te kampen gehad. In de eerste plaats had mijn informant
Lukman het dit jaar erg druk met zijn werk als leraar Engels, hij had
een eindexamenklas en zijn collega Engels is oud en laat Luknan
veel van diens werk doen. Daardoor had hij veel te weinig tijd om
mij vertalingen te leveren, zodat ik erg achter raakte op mijn
tijdschema. Daaro heb ik een tweede informant aangesteld voor met
name de wajangteksten. Daarna ging het wat vlotter, maar toen werd in
geplaagd door ziekte: eerst dengue, daarna paratyphus. Het goede nieuws
is dat mijn informante in Tjirebon uitstekend werk levert, haar
vertalingen zijn waar nodig voorzien van een uitvoerige en duidelijke
toelichting, waardoor ik makkelijker de juiste Nederlandse vertaling
kan vinden.
Ik heb al mijn informanten - die met citaten in het woordenboek
vertegenwoordigd zijn - een gratis exemplaar van het woordenboek kunnen
overhandigen. Gratis exemplaren waren er ook voor een aantal
bibliotheken, met name van de Mangkunagaran, ISI Solo, Kraton Kasunanan
Solo, Kraton Yogya, UGM,. ISI Yogya en Puro Paku Alaman.
De komende maanden zal ik opnieuw wajangteksten gaan lezen, met name
een Ranayana-lakon van Ki Manteb en een Tjirebonse lakon, en verder
getranscribeerde opnames uit Tjirebon.
Oktober 2015
Momentopname: het
woordenboek zoals het nu is (d.w.z. op schijf, nog niet in gedrukte
vorm) heeft 57.919 lemma's en 23.785 nieuwe woorden resp. nieuwe
vertalingen (met citaat). Nieuwe tesksten zijn: (1) een lakon van Ki
Purbo Asmara (Makutha Rama)
en (2) teksten uit Tjirebon. Er zijn echter nog geen plannen voor een
nieuwe druk - daarvoor is het nog te vroeg. Maar ik ga hardnekkig door
met het toevoegen van nieuw materiaal en ga in Januari 2016 weer naar
Solo.
Oktober-November 2016
Nu (1 november) hebben we 59.149 lemma's en 25.413 nieuwe
woorden. Er is veel toegevoegd uit teksten uit Tjirebon-Indramajoe en
ook veel (maar nog niet genoeg)
basa pedhalangan.
De volgende reis is gepland voor januari 2017. Dat had december
2016 moeten zijn, maar wegens ziekte heb ik dat een maad moeten
uitstellen. Ik concentreer me nu helemaal op
basa pedhalangan en op het dialect van de noordkust.
Juli 2017
Wegens langdurige ziekte heb ik weinig kunnen doen, ik was voortdurend moe. Er zijn nu 25.846 nieuwe lexicale eenheden
opgenomen (met citaat). Het aantal lemma's uit Tjirebon bedraagt nu
857. Hopelijk komt het spoedig tot een nieuwe, vermeerderde uitgaaf.
Ondertussen ga ik zoveel mogelijk vertaalfouten opsporen en verbeteren,
onder andere in de vertaling van spreekwoorden.
R. van Albada en Th. Pigeaud, Javaans-Nederlands woordenboek
(2 vols), 1511 pp hardback. Brill, Leiden 2014. ISBN13:
9789004276956. Verschenen in September 2014. €149. Te bestellen bij
Brill in Leiden (print on demand).
Werkwijze tot nu toe:
De secretaris/lexicograaf bereidt elk jaar thuis een aantal uiteenlopende teksten voor, variërend van de Centhini (oude, poëtische tekst) tot recente Wikipedia-artikelen.
Vervolgens reist hij naar Java (de laatste jaren steeds naar Munyung
bij Solo) om informanten te raadplegen en de nieuwe woorden in te
voeren in het woordenboek. Als hij na vier of vijf maanden weer
thuiskomt, brengt hij nog correcties aan, soms met raadpleging van
anderen, en begint daarna aan een nieuwe portie teksten.
Beloning:
De medewerkers worden niet beloond voor hun aan Ilex bestede
tijd. Reiskosten worden (indien gedeclareerd) wél vergoed. In de
praktijk gebeurt dat alleen met vliegtickets naar Indonesdië. Alle
overige kosten worden gedragen door de bestuursleden zélf. (De huur van
het huis in Munyung bij Solo is betaald door het Prins Bernhard Fonds.)
Financiëring:
Aangezien Uw donatie
respectievelijk legaat nog niet door ons ontvanngen is, zijn de
middelen van de stichting zeer beperkt. Alle kosten (zoals het vliegticket, het salaris
van de informanten, boeken enz.) moet hij zelf betalen. De huishuur is tot 2017
betaald uit de subsidie van het Prins Bernhard Fonds. De spreektaalopnamen uit 1996 zijn betaald door de Taalunie.
Financieel overzicht 2011
Financieel overzicht 2012
Financieel overzicht 2014
Financieel overzicht 2015
Financieel overzicht 2016
Uitgave van 2007:
Rob van Albada en
Th. Pigeaud: Javaans-Nederlands woordenboek. Herziene uitgave gemoderniseerd
en aangevuld. KITLV Uitgeverij Leiden 2007. Pp xxxii+1086;
ISBN 978 90 6718 208 9
Texten/Texts/Teks:
Om copyrightredenen kunnen we helaas niet alle teksten ter beschikking
stellen.
-Sêrat Darmagandhul in
proza (ngoko) versie (ca. 190kB).
-Stuur ons een email
Laatste update: 1-10-2015