De Nederlandse Vereniging voor Fonetische Wetenschappen nodigt u uit voor een bijeenkomst in Leiden met als thema:

Lexicografie

Tijd:   11 mei 2001, 13.15 - 17.00

Plaats: Centraal Faciliteitengebouw, 
        Cleveringaplaats 1, Leiden, 
        zaal 147 (1e etage)

Programma:

13.15 Huishoudelijk deel

13.30 Truus Kruyt: Wat hebben de lexicograaf en de foneticus elkaar te vertellen?

14.00 Josťe Heemskerk: Uitspraak en woordenboek

14.30 Arthur Dirksen: Van transcriptie naar spraak

15.00 pauze

15.30 Jacques van Keymeulen: De fonetische component in de drie grote regionale dialectwoordenboeken voor het zuidelijke Nederlands

16.00 Anneke Nunn: Woordvormen en uitspraak

16.30 Janneke Froon: Zoeken met behulp van uitspraak

17.00 borrel


Routebeschrijving:

Vanaf voorzijde station rechtdoor Stationsweg en verlengde (Steenstraat) volgen, voorbij plein met rijtje boompjes (aan linkerhand) linksaf Blauwpoortsbrug over, rechtsaf en doorlopen tot begin Rapenburg, rechterzijde gracht nemen, tweede straat rechts (Doelensteeg) en deze komt uit op de Cleveringaplaats; op de gevel van het gebouw hangt een bord met "LAK Theater"

Samenvattingen

Wat hebben de lexicograaf en de foneticus elkaar te vertellen?

Truus Kruyt (Instituut voor Nederlandse Lexicologie, Leiden)

De foneticus en de lexicograaf spraken tot voor kort nooit met elkaar. Immers, er lijkt nauwelijks relatie te zijn tussen beider werelden. Door de moderne technologie, internationale ontwikkelingen en in ons taalgebied het project Corpus Gesproken Nederlands (CGN) komt daarin verandering. Dit thema werk ik uit als lexicograaf (met een ver verleden als foneticus). Het accent valt op de vraag hoe het CGN te gebruiken is in de lexicografische praktijk: hoe fungeert het als corpus bij de lexicografische bewerking en welk belang heeft het voor de inhoud van woordenboeken (en computationele lexica). Hierbij komen verschillen aan de orde tussen geschreven taal en gesproken taal en tussen het Nederlands en het Vlaams. Vervolgens wordt een toekomstige potentiŽle rol voor het CGN geschetst in het kader van het INL-project GeÔntegreerde Taalbank. In de discussie kunnen de fonetici mij wellicht vertellen wat zij van de lexicograaf verwachten.

Uitspraak en woordenboek

Josťe Heemskerk (Van Dale Data)

De maker van een uitspraakwoordenboek krijgt te maken met de volgende vragen: Waarom pakt een native speaker een uitspraakwoordenboek? Bijvoorbeeld om voor eens en altijd te weten te komen hoe een bepaald woord nu eigenlijk uitgesproken wordt. De gebruiker verwacht dus dat het woordenboek voorschrijft. De taalkundige die het woordenboek maakt wil en kan echter slechts beschrijven. Hoe gaan we om met variatie? Van een groot aantal woorden zijn er evenveel uitspraken als mensen die het uitspreken. Aangezien een woordenboek per definitie een groot aantal woorden bevat is het ondoenlijk om alle varianten op te tekenen. Het woordenboek zou te dik en onleesbaar worden. Bovendien ontbreekt de benodigde kennis. Hoe maak je de transcriptie van 230.000 woorden? Hoewel de tijd dat woordenboekmakers met de hand transcripties maakten voorbij is en onze transcripties grotendeels automatisch aangemaakt zijn, is altijd handmatige controle nodig. Een van de grootste problemen daarbij is het bewaren van de consistentie: als croissant een variant krijgt, dan moet chocoladecroissant dat ook krijgen.

Van transcriptie naar spraak

Arthur Dirksen (Fluency/Van Dale Data)

Het lastige van fonetische transcripties is dat bijna niemand ze goed kan interpreteren. Een voordeel van een woordenboek op cdrom of internet is dan ook dat de uitspraak van woorden hoorbaar gemaakt kan worden. Dit kan door voor alle trefwoorden opnamen van een echte spreker te maken, een andere mogelijkheid is het gebruik van synthetische spraak. Een belangrijk voordeel van synthetische spraak is dat een formele relatie gelegd wordt tussen transcriptie en uitspraak, die bovendien geparametriseerd kan worden. Een voorbeeld is de meervouds-"n" die in trancripties van Van Dale een speciale code krijgt. De synthesemodule kan hem volledig realiseren (nadrukkelijk, zoniet hypercorrect), weglaten (vlot, of wellicht enigszins plat), of subtiel aanduiden (een "n" met een duur van 15 ms wordt niet als zodanig waargenomen, maar het nasaliserend effect op de voorafgaande schwa is wel goed hoorbaar). In mijn lezing geef ik overzicht van de vertaling van transcriptie naar spraak aan de hand van een aantal fonologisch/fonetische verschijnselen.

De fonetische component in de drie grote regionale dialectwoordenboeken voor het zuidelijke Nederlands

dr. Jacques Van Keymeulen (RUGent)

Mijn lezing handelt over de manier waarop de dialectische fonetica gerepresenteerd wordt in de drie grote regionale dialectwoordenboeken voor het zuidelijke Nederlands: Woordenboek van de Vlaamse Dialecten (WVD), Woordenboek van de Brabantse Dialecten (WBD) en Woordenboek van de Limburgse Dialecten (WLD), die resp. aan de universiteit Gent (WVD, vanaf 1972) en aan de universiteiten van Nijmegen (WBD, WLD, vanaf 1960) en Leuven (deelredactie voor WBD en WLD vanaf 1995) worden samengesteld. Volgende punten worden aangesneden:

a) de manier waarop in de woordenboeken een dialectische fonetische realisatie naar een 'Nederlandse' trefwoordvorm wordt getransformeerd.

b) de onderscheiden manieren waarop de drie woordenboeken de dialectische fonetica in het fonetische gedeelte (wetenschappelijk apparaat of materiaalbasis geheten) van de woordenboeken proberen weer te geven. Meer bepaald wordt ingegaan op de initiŽle opties en de evoluties daarna.

c) het experiment i.v.m. het samenvoegen van de drie woordenboeken in een zgn. 'Digitale Woordatlas van de zuidelijk-Nederlandse Dialecten' (zie http://allserv.rug.ac.be/~jvkeymeu/cyberlemmata). Hierbij wordt ingegaan op de problemen in verband met het samenvoegen van het materiaal uit de drie woordenboeken en worden hypertext-woordenboekartikelen gepresenteerd.

Woordvormen en uitspraak

Anneke Nunn (Van Dale Data)

Om te voorkomen dat papieren woordenboeken te dik worden, worden bij elk trefwoord maar een paar verbogen of vervoegde vormen (expansies) gegeven, en zelfs die paar vormen worden wel eens weggelaten. Zo worden verkleinvormen weggelaten als ze worden gevormd door toevoeging van -je (bokje), als ze ongebruikelijk zijn (citadelletje) of als het trefwoord een samenstelling is (moesappeltje). Voor een gebruiker van een woordenboek is deze onvolledigheid onhandig en soms zelfs misleidend. Voor lexicografen is het ook handiger om een volledige lijst van expansies te hebben, want dat maakt het makkelijk om te controleren of aangetroffen nieuwe vormen horen bij reeds bestaande trefwoorden. Toen het maken van woordenboeken voor een belangrijk deel geautomatiseerd werd en er ook elektronische woordenboeken (met minder ruimtebeperkingen) kwamen, werd het mogelijk om gebruikers en lexicografen tegemoet te komen: alle expansies van trefwoorden kunnen nu met behulp van taalregels automatisch afgeleid worden. Hiervoor moest de uitspraak van trefwoorden een centrale rol krijgen: op grond van de spelling alleen kunnen de expansies niet goed berekend worden, zoals bijvoorbeeld blijkt uit het verschil tussen maken-gemaakt en faken-gefaket, en tussen hotel-hotelletje en schotel-schoteltje. Na het berekenen van alle vormen werd er door middel van parameters aangegeven welke vormen werkelijk bestaan, zodat voorkomen kan worden dat bijvoorbeeld *wij regenen in een elektronisch woordenboek terechtkomt.

Zoeken met behulp van uitspraak

Janneke Froon (Van Dale Data)

Iemand die een woord wil opzoeken in een woordenboek, weet lang niet altijd hoe het geschreven moet worden. Omdat een woordenboek is georganiseerd op de spelling van woorden, wordt het dan moeilijk om het bedoelde woord te vinden. In een elektronisch woordenboek is hier iets aan te doen door de gebruiker in staat te stellen om het woord fout in te typen en dan door te verwijzen naar goed gespelde woorden. Bij de Elektronische Grote Van Dale is gebruik gemaakt van de functionaliteit van de Van Dale Spellingcorrector om dit 'bij benadering zoeken' mogelijk te maken. De spellingchecker is gespecialiseerd in het zoeken van goede spellingen bij foute spellingen, waarbij uitspraak een belangrijke rol speelt. Ten eerste wordt uitspraak gebruikt om de klankgebaseerde spelling van woorden te voorspellen (bv. *sjieke is een mogelijke spelfout van chique). Ten tweede kan voorspeld worden waar problemen in woorden zitten omdat er iets vreemds met de uitspraak aan de hand is. Een voorbeeld is het woord balustrade waar de onbeklemtoonde a een spellingprobleem (verdubbelen of niet) bij de l veroorzaakt.