Nieuwe stap in communicatie met computer

Echt praten met computers komt steeds dichterbij!Praten met computers werkt alleen goed in science-fictionfilms. Maar in de dagelijkse praktijk zijn er op dat gebied nog heel wat hordes te nemen. Inmiddels is er een nieuwe stap in de goede richting gezet.

Muizen, toetsenborden en touchscreens zijn handige dingen. Maar het liefst zouden we onze computers en smartphones natuurlijk met gewone mensentaal bedienen. Om dat echt voor elkaar te krijgen, moet een computer

  • de woorden die we uitspreken herkennen
  • de structuur van een zin ontleden
  • de betekenissen van woorden combineren tot de betekenis van een hele zin (semantiek).

En dat is zelfs voor de allersnelste en allerslimste computers nog een hele klus.

Semantiek nog gebaseerd op ‘oude’ aanpak

De technieken voor spraakherkenning en automatisch ontleden zijn de afgelopen 20 jaar wel radicaal veranderd. Ze zijn vrijwel allemaal gebaseerd op slimme kansberekening en op zelflerende systemen. Die systemen worden getraind op miljoenen of zelfs miljarden voorbeelden.

Maar de technieken voor het berekenen van zinsbetekenissen – de compositionele semantiek – zijn vrijwel allemaal nog gebaseerd op de aanpak van de briljante logicus Richard Montague uit begin jaren zeventig.

Nieuw leerprogramma vertaalt beter

UvA-student Phong Le en zijn begeleider Jelle Zuidema vonden het tijd daar iets aan te veranderen. Phong Le ontwikkelde een nieuw, op kansen gebaseerd model voor semantiek als alternatief voor het systeem van Montague. Dat kansmodel was vervolgens de basis voor een nieuwe leermethode.

Die is enigszins vergelijkbaar met de methodes die automatische vertaalprogramma’s zoals Google Translate gebruiken om beter te leren vertalen. Dankzij een dataset van ruim 9.000 met betekenis gemarkeerde zinnen kon Le laten zien dat zijn methode heel goed werkt.

Bedrijfsleven wacht met smart op nieuwe systeem

Hij legt daarmee een veelbelovende basis voor toekomstige taaltechnologie, een vakgebied waar in het bedrijfsleven grote behoefte aan is. Daarom heeft hij vandaag de STIL Thesis Prize voor zijn afstudeeronderzoek ‘Learning Semantic Parsing’ gewonnen, waarin zijn bevindingen zijn vervat. De Stichting Toepassing Inductieve Leertechnieken (STIL) stimuleert onderzoek naar toepassingen van leertechnieken in de taaltechnologie.

Het werk van Phong Le is gepubliceerd in de Proceedings of the International Conference on Computational Linguistics (Le & Zuidema, Coling 2012). Met zijn scriptie verwierf hij in augustus 2012 al een Master of Sciencediploma in Artificial Intelligence (cum laude) aan de Universiteit van Amsterdam.

Renske Cramer

Over Renske Cramer
Ik ben gepensioneerd communicatie- en marketingadviseur. Ik houd me bezig met dingen die nóg leuker zijn dan werken ;-)

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s