Modellen in de nieuwe institutionele economie

Plaatsing in Heterodoxe Gazet Sam de Wolff: 2 juli 2017

E.A. Bakkum is blogger voor het Sociaal Consultatiekantoor. Hij denkt graag na over de arbeiders beweging.

De huidige column presenteert weer enkele interessante modellen van de nieuwe institutionele economie. Allereerst wordt het herhaalde gevangenen-spel geanalyseerd. Vervolgens wordt een model gepresenteerd, dat de zoekkosten op de markt in rekening brengt. Eveneens nuttig zijn modellen die de handhaving van normen beschrijven. En tenslotte wordt nogmaals ingegaan op het beslisser-uitvoerder probleem. De gehanteerde abstracties over de menselijke natuur worden getoetst aan inzichten uit de psychologie.

Traditioneel hanteert de economische wetenschap de antropologie van de homo economicus: een rationele beslisser, die zijn eigen belang behartigt. In de standaard theorie heeft hij bovendien stabiele voorkeuren, en hij is alwetend. Dit mensbeeld is controversieel, ook binnen de economie zelf, sinds de opkomst van de gedragseconomie. Daarom zijn in de afgelopen halve eeuw allerlei nieuwe modellen bedacht, die de homo economicus menselijker maken. Een groot gedeelte van deze modellen is opgenomen in de nieuwe institutionele economie. Met name houden zij rekening met de transactie kosten, die onvermijdelijk ontstaan bij het menselijke handelen. Zulke bijkomende kosten maken de situatie aanmerkelijk complexer.

Bijvoorbeeld gaat het hele zoekproces naar de optimale transactie zelf gepaard met kosten. Evenzo moet worden geïnvesteerd om normen en andere instituties in stand te houden. Arbeidscontracten en andere economische afspraken worden niet vanzelf nageleefd, zodat extra kosten nodig zijn om ze te ten uitvoering te brengen. Daar staat als positief punt tegenover, dat onder gepaste omstandigheden de homo economicus bereid is tot samenwerking, zij het slechts uit eigenbelang. Tegenwoordig zijn dit soort eigenaardigheden opgenomen in de economische modellen, en de huidige column behandelt enkele belangrijke onder hen.


Het gevangenen-spel met herhaling

In de hedendaagse economische wetenschap heeft de speltheorie een vaste plaats verworven. In diverse columns is verwezen naar het beroemde spel van de gevangenen (in de Engelse taal: prisoner's dilemma). Volledigheids halve wordt dit spel (transactie) weergegeven in de tabel 1. Er zijn twee handelaren A1 en A2, die allebei kunnen kiezen voor samenwerking of uitbuiten. Zij kunnen niet vooraf een bindende afspraak maken. De tabel 1 laat zien wat in elke situatie de beloningen (b1, b2) zijn voor A1 en A21. Het is duidelijk, dat samenwerken de beste optie is voor de handelaren als collectief. Echter de handelaar afzonderlijk moet vrezen, dat de andere hem zal uitbuiten. In deze situatie wil elk van de handelaren zijn nut (opbrengst) optimaliseren. Daarom zullen uiteindelijk beide handelaren kiezen voor uitbuiten, hoewel zij daardoor als collectief een slechte uitkomst behalen.

Tabel 1: uitkomsten matrix van het gevangenen spel
 A2 werkt samenA2 buit uit
A1 werkt samen1, 1-1, 2
A1 buit uit2, -10, 0

De collectief slechte uitkomst (0, 0) wordt het Nash evenwicht genoemd. Immers geen enkele handelaar kan eenzijdig zijn situatie verbeteren. En de keuze van de beide handelaren wordt de dominante strategie genoemd. In de practijk treedt het eenmalige gevangenen spel vaak op. Echter nog vaker zullen de twee handelaren regelmatig zaken doen met elkaar, en dan verandert het spel van karakter2. Namelijk, bij herhaling van het spel moet de handelaar niet meer de eenmalige uitkomst optimaal maken, maar de uitkomst van al zijn transacties tezamen. Interessant is dat A1 en A2 hun transacties kunnen gebruiken om wederzijds hun intenties te signaleren. In de huidige situatie blijkt de lik-op-stuk strategie (in de Engelse taal tit-for-tat) goede resultaten op te leveren. Beide spelers beginnen met samenwerken, en imiteren in elke volgende transactie de keuze van de ander in de vooraf gaande transactie.

Het is direct duidelijk, dat beide handelaren nu steeds zullen samenwerken. Uitbuiting door een handelaar zou dom zijn, omdat de ander dat ook zou gaan doen. Overigens zou elke handelaar kunnen terugkeren naar samenwerking door dat opnieuw zelf te doen. Uitbuiten is niet meer automatisch de dominante strategie, omdat de lik-op-stuk strategie meer kan opleveren voor beide handelaren. Onder deze omstandigheden zou de lik-op-stuk strategie een maatschappelijke norm kunnen worden, die ten goede komt aan allen. Helaas is het kenmerk van een informele norm, dat niet iedereen hem navolgt. Neem eenvoudigheids halve aan, dat elke handelaar afzonderlijk consequent kiest voor de lik-op-stuk of uitbuit strategie. Men kan uitrekenen, wanneer de gehoorzaamheid aan de norm lonend is. Stel dat bij elke transactie de kans π is, dat er minstens nog een transactie zal volgen. Dan wordt de totaal verwachte uitkomst gegeven door3

(1)     Bk = Σj=1 bk(j) × πj-1

Als één van de twee handelaren een uitbuiter is, dan zullen vanaf de tweede transactie beide handelaren uitbuiten. Dat levert 0 op, zodat de totaal verwachte uitkomst gelijk is aan die in de tabel 1. Enkel als twee handelaren uit de lik-op-stuk groep elkaar treffen, wordt de uitkomst anders. Immers dan zal altijd gelden bk(j) = 1. Daardoor krijgt de reeks in de formule 1 een simpele vorm, te weten 1 / (1 − π). De tabel 2 geeft de uitkomsten van het herhaalde gevangenen spel.

Tabel 2: uitkomsten matrix van het herhaalde gevangenen spel
 A2 werkt samenA2 buit uit
A1 werkt samen(1 − π)-1, (1 − π)-1-1, 2
A1 buit uit2, -10, 0

Kennelijk leidt de lik-op-stuk combinatie tot de beste Bk, zodra geldt π>½. Stel nu dat een fractie p van de handelaren behoort tot de lik-op-stuk groep. Iets anders gezegd: p is het vertrouwen, dat de handelaar heeft in de geldigheid van de norm. Blijkens de tabel 2 wordt dan de verwachte uitkomst voor de lik-op-stuk strategie p / (1-π) + (-1) × (1-p), en voor de uitbuit strategie 2×p. De lik-op-stuk strategie is ten minste gelijkwaardig, zodra geldt p / (1-π) + p − 1 ≥ 2×p. Dat wil zeggen, er moet gelden p ≥ 1/π − 1. Deze formule drukt de kwaliteit van de norm uit. Een bijzonder geval doet zich voor, wanneer men een (bijna) eindeloze rij transacties verwacht. Immers dan is π=1, zodat moet gelden p≥0 en dien ten gevolge presteren de handelaren met een lik-op-stuk strategie gemiddeld altijd even goed als of beter dan de rest.

Opmerkelijk is ook de situatie, waarin twee handelaren weliswaar de lik-op-stuk norm aanhangen (dat wil zeggen, p=1), maar op j=J+1 per ongeluk de ene kiest voor uitbuiten. Stel dat de laatste interactie plaats vindt op j=N (wat uiteraard vooraf onbekend is). Lik-op-stuk impliceert, dat men vertraagd reageert op de handeling van de ander. Daarom zullen voor interacties j>J nu allebei de handelaren uitbuiten en samenwerken afwisselen, wat resulteert in een reeks van uitkomsten (-1, 2) en (2, -1). Dan zal er gelden Bk = J×1 + (N − J) × ½ × (-1+2) = ½ × (N+J). De fout van de ene handelaar heeft een verlies veroorzaakt van maar liefst ½ × (N-J) voor beiden. Kennelijk kan de andere handelaar beter de fout vergeven, en blijven samenwerken. Dat zou hem N-2 opleveren, en zijn onhandige concurrent N+1. De lik-op-stuk strategie zou niet meer optimaal zijn4.

Dit voorbeeld van het gevangenen spel met herhaling maakt de cruciale aanname, dat de handelaren een vaste strategie hebben. Zij worden in hun moraal gesteund door het gegeven, dat het moment van de laatste interactie onbekend is. Alleen dan wordt de lik-op-stuk norm interessant. Namelijk, stel dat j=N met zekerheid de laatste interactie zou zijn5. Neem bovendien aan, dat de handelaren nog hun strategie-norm moeten kiezen. In de interactie j=N wordt uitbuiting weer de dominante strategie. Echter hieruit volgt, dat de lik-op-stuk strategie eveneens zinloos is voor j=N-1. Dien ten gevolge domineert ook op j=N-1 de strategie van uitbuiten. Enzovoort. Rationele handelaren zullen al direct vanaf j=1 kiezen voor uitbuiten als norm. Kennelijk is de lik-op-stuk norm enkel rationeel bij onbepaald vaak herhaalde interacties. Gelukkig is in de werkelijkheid het aantal interacties meestal inderdaad vooraf onbepaald.

Samenvattend: zolang het aantal interacties onbepaald is, zal zich niet vanzelf een bepaalde gedragsnorm ontwikkelen. Weliswaar is het bij een voldoende grote p optimaal en dus rationeel om de lik-op-stuk moraal aan te hangen. Maar als een handelaar de moraal van uitbuiten aanhangt, dan is dit een evenwichtige situatie, waarbij nooit zal worden samengewerkt. Nochtans laten experimenten in laboratoria zien, dat proefpersonen inderdaad enig lik-op-stuk gedrag vertonen. Overigens kan de situatie dynamisch ontwikkelen6. Voorts blijkt in zulke experimenten, dat zelfs in eenmalige spelen of transacties de handelaren soms neigen naar samenwerken. Kennelijk is de mens van nature niet een homo economicus, die louter egoïstisch en rationeel zijn eigenbelang nastreeft7. Bovendien zijn zeker buiten de laboratoria de individuen maatschappelijk ingebed, en onderworpen aan groepsdruk, waardoor het rationeel is voor hen om het eigen egoïsme te beteugelen8.


Grenzen aan de zoekkosten

De bekende econoom R.H. Coase heeft gewezen op de zoekkosten, die moeten worden gemaakt om op de markt de beste product-prijs combinatie te vinden. Dat zoeken bespaart natuurlijk wel geld uit, omdat de handelaar daardoor een gunstige ruil realiseert. Dit impliceert, dat een optimale zoek-inspanning bestaat, waarbij de baten en kosten van het zoeken in balans zijn. Het blijkt mogelijk om dit zoekgedrag te beschrijven in een wiskundig model9. Neem aan, dat de verdeling van prijzen p uniform is in het interval [0, pmax]. Dat wil zeggen, de verdelingsfunctie (kansdichtheid, frequentie functie) heeft de constante waarde f(p) = 1/pmax. Zij F(p) = ∫0p f(ρ) dρ = p / pmax de cumulatieve verdelings-functie. Zij is de kans dat de aangeboden prijs niet hoger is dan p. Kennelijk is er een kans Pr(>p) = 1 − p/pmax, dat de aangeboden prijs hoger is dan p.

De zoektocht van de consument vereist het aanvragen van diverse offertes (tenzij de eerste offerte een gelukkige toevalstreffer is). Namelijk, naarmate men meer offertes heeft, wordt het waarschijnlijker dat er een laag aanbod bij zit. Veronderstel dat het eenmalig aanvragen van de offerte leidt tot kosten c, en dat de consument q stuks van het product wil kopen. Stel de laagste aanbodprijs van al die n offertes bedraagt hoogstens p0(n). Helaas kan de consument niet vooraf zijn uiteindelijke kosten T uitrekenen, wegens de toevalsfactor. Wel kan hij de verwachte kosten schatten, te weten E(T) = E(n×c + q×p0) = n×c + q × E(p0). Minimalisatie van E(T) is enkel mogelijk, wanneer de samenhang tussen de verwachte E(p0) en n wordt bepaald.

Bij n offertes zijn alle aangeboden prijzen p0 of groter met een kans Pr(>p0)n. Hieruit volgt direct dat de situatie, waarin minstens één aangeboden prijs beneden p0 ligt, voorkomt met een kans 1 − Pr(>p0)n. Deze kans Pr(p ≤ p0) correspondeert natuurlijk weer met een cumulatieve verdelingsfunctie, zeg G(n, p0). De bijbehorende dichtheidsfunctie g(n, p0) is de afgeleide van G. Aldus krijgt p0 de verwachtingswaarde10

(2)     En(p0) = ∫0pmax p0 × g(n, p0) dp0 = pmax / (n + 1)

Figuur van optimaal zoekgedrag
Figuur 1: Optimaal zoekgedrag

Nu kan de consument nagaan wanneer het opvragen van een volgende offerte niet meer loont. Blijkens de formule 2 zijn de verwachte kosten E(T) minimaal voor n = -1 + √(q×pmax/c). Dus dit is het aantal offertes, dat optimaal is voor de consument (zie figuur 1). Deze waarde n=n0 legt tevens via de formule 2 vast, welke bovengrens p0 voor de aanbodprijs wenselijk is bij gegeven c en q. Er is daadwerkelijk een uitruil mogelijk van informatie-kosten en aankoopsom. Natuurlijk kan de consument pech hebben, waardoor na n offertes alle aanbodprijzen nog steeds boven p0 liggen. Anderzijds kan hij boffen, en (bijna) direct een lage offerte aangeboden krijgen. In dat geval heeft het weinig zin om nog verder te zoeken. Ook hiervoor zijn vuistregels te geven11.

Namelijk, zij p0 het onverwacht lage aanbod. Nogmaals een offerte aanvragen heeft enkel zin, als naar verwachting die transactie zal leiden tot lagere kosten dan q×p0, zodat E(T, nogmaals) = c + q × E(p, nogmaals) ≤ q×p0. Nu heeft E(p, nogmaals) twee componenten. De volgende offerte kan liggen boven p0, met een kans Pr(>p0) = 1 − p0/pmax. In dat geval blijft de koopprijs p0. Of de volgende offerte ligt beneden p0, en dan is E(p0') = ∫0p0 p × f(p) dp = p0²/2. Combinatie van de twee componenten geeft E(p, nogmaals) = p0 × (1 − ½×p0/pmax). Invullen in de formule voor E(T, nogmaals) leidt tot

(3)     E(T, nogmaals) = c + q × p0 × (1 − ½ × p0/pmax)

Kennelijk biedt nogmaals zoeken goede vooruitzichten, zolang geldt dat c ≤ ½×q × p0²/pmax. Dit model laat verrassend zien, dat het neoklassieke paradigma rekening kan houden met transactie kosten. Daarbij moet worden aangetekend, dat hier sprake is van een bijzondere situatie. Immers de consument kent vooraf de waarschijnlijkheids-verdeling f(p) van de aangeboden prijzen. Ook dat is informatie, waarvoor de consument ongetwijfeld een prijs heeft moeten betalen.

Bijvoorbeeld is hij wellicht lid van een consumenten-netwerk, dat hem deze informatie heeft verschaft. Volgens de theorie van het maatschappelijke kapitaal Cs kunnen zulke netwerken inderdaad de transactie kosten verminderen. Leden van een netwerk bepalen daarvoor de prijs, dat zij de collectieve normen van het netwerk moeten handhaven, door zelf te gehoorzamen en door anderen te prikkelen tot onderwerping. Bovendien zullen de leden van het netwerk enkel samenwerken, zoals via het verstrekken van informatie, zolang de ontvanger zich verplicht voelt, en op een later tijdstip bereid is tot wederdienst. Zulke complexe mechanismen kunnen niet worden opgenomen in het model. Het neoklassieke paradigma beschikt (voor alsnog) niet over formules om algemene maatschappelijke processen zoals rechten en plichten te beschrijven. Dien ten gevolge voelen velen nog steeds enig onbehagen bij de toepassing van het paradigma.


Instituties in een groep

Aan het einde van de voorgaande paragraaf is geschetst, dat elke groep haar eigen informele en formele instituties heeft. Die maken het individuele gedrag beter voorspelbaar, maar perken tevens de vrijheid van de groepsleden in. Institutionele invloeden zijn belangrijk, maar hun theoretische modellering staat nog in de kinderschoenen. Een voorgaande column heeft enkele van deze vroege modellen beschreven. De huidige paragraaf gaat daarmee door. Beschouw allereerst het spel van Tsebilis, dat de interactie tussen een groepslid A1 en een handhaver A2 modelleert. Het groepslid A1 kan gehoorzamen aan de groepsnorm, of haar overtreden. De handhaver A2 kan de norm handhaven, of dat nalaten (uit gemakzucht of om een andere reden). De tabel 3 somt typische uitkomsten van dit spel op12. De lezer kan nagaan, dat de uitkomsten logisch zijn. Bijvoorbeeld, zolang A1 maar gehoorzaamt, is het onzinnig voor A2 om te handhaven.

Tabel 3: uitkomsten matrix van het handhavingsspel van Tsebilis
 A2 handhaaftA2 handhaaft niet
A1 overtreedt0, 11, 0
A1 gehoorzaamt1, 00, 1

Dit spel is bijzonder, omdat er geen Nash evenwicht van gedrags-strategieën is. Immers bij elke uitkomst (b1, b2) kan één van de handelaren zijn situatie verbeteren door te veranderen van gedrag. Bij voorbeeld, stel dat A1 gehoorzaamt, en A2 handhaaft niet. Dan heeft A1 er baat bij om voortaan de norm te overtreden. Deze situatie is verwarrend voor allebei de handelaren. In beginsel kunnen zij zorgen voor een Nash evenwicht door allebei te kiezen voor een zogenaamde gemengde strategie. Bijvoorbeeld kan A1 kiezen voor gehoorzamen met een kans p1, en dus voor overtreden met een kans 1 − p1. Evenzo moet A2 dan kiezen voor handhaven met een kans p2, en dus voor niet handhaven met een kans 1 − p2. De kansen matrix is weergegeven in de tabel 4.

Tabel 4: kansen matrix van het handhavingsspel van Tsebilis met gemengde strategie
 A2 handhaaftA2 handhaaft niet
A1 overtreedt1-p1, p21-p1, 1-p2
A1 gehoorzaamtp1, p2p1, 1-p2

In zo een situatie met gemengde strategieën zijn de uitkomsten louter toevallig, zodat de handelaren enkel de verwachte uitkomsten E(bk) over een reeks interacties kunnen schatten. Aldus vindt men E(b1) = p1 × (p2×1 + (1-p2)×0) + (1-p1) × (p2×0 + (1-p2)×1) = 2×p1×p2 − (p1+p2) + 1. Nu bereikt A1 zijn beste uitkomst voor ∂E(b1)/∂p1 = 0, dat wil zeggen voor p2=½. Evenzo is E(b2) = p2 × ((1-p1)×1 + p1×0) + (1-p2) × ((1-p1)×0 + p1×1) = p1+p2 − 2×p1×p2. Ook A2 bereikt zijn beste uitkomst voor ∂E(b2)/∂p2 = 0, dat wil zeggen voor p1=½. Kennelijk is het voor beide handelaren voordelig om de gemengde strategie te kiezen met p1 = p2 = ½. De verwachte uitkomst in dit optimum is (½, ½). De situatie is analoog aan de beste reacties bij een oligopolie van het Cournot type. Een handelaar, die hiervan afwijkt, benadeelt zichzelf en bevoordeelt de ander. Een voorbeeld: bij p2=¼ wordt E(b1) = ¾ − ½×p1. Dan kan A1 kiezen voor p1=0 en de uitkomsten worden (¾, ¼).

Dankzij de gemengde strategie kan er nu toch dit Nash evenwicht ontstaan. De twee handelaren hebben op rationele wijze een situatie van evenwicht gecreëerd. Tevens blijft er voorspelbaarheid, althans wat betreft het gemiddelde gedrag. Echter het zou betekenen dat de handelaren niet meer een zuivere strategie-norm navolgen, wat intuïtief onwenselijk aanvoelt. De menselijke natuur en cognitie zijn niet ingericht op een dergelijke opportunistische omgang met de moraal. Dit illustreert dat soms inderdaad de instrumentele rationaliteit minder aantrekt dan de waarde rationaliteit. Des al niettemin treedt in de practijk de gemengde strategie toch vaak op. Denk aan de controle van het vervoersbewijs in het openbaar vervoer, die nooit meer is dan een regelmatige steekproef. Toch blijft ook hier de bedoeling, dat zwartrijden wordt ontmoedigd, en de reizigers de norm verinnerlijken.

De verinnerlijking van instituties is een fascinerend thema, omdat daarmee de individu zijn nutsfunctie verandert. De Nederlandse econoom P. Frijters heeft een aanzet gegeven om dit fenomeen op te nemen in de nutsfunctie. Zijn collega B.M.S. van Praag heeft empirische formules gevonden voor de preferentie drift, waarbij de individu het nut aanpast aan zijn referentie-groep. Nochtans postuleert de meerderheid van de modellen een onveranderlijke nutsfunctie. Dan is de individu simpelweg een rationele beslisser. Beschouw weer een handelaar A1, die een uitkomst b1 verwacht van een transactie. Dat levert hem een nut v(b1) op. Stel dat hij de uitkomst kan vergroten met Δb1 door een norm te overtreden. Dat zou de transactie nuttiger maken. Helaas voor A1 is er een handhaver, die overtredingen kan bestraffen met een boete s. Net zoals in het spel van Tsebilis is de kans op handhaving gelijk aan p2. Dan wordt het verwachte nut U van A1 bij een overtreding13

(4)     U = p2 × v(b1 + ρ×Δb1 − σ×s) + (1 − p2) × v(b1 + Δb1)

De parameters ρ en σ hebben waarden tussen 0 en 1. Dat wil zeggen, zelfs bij handhaving is het denkbaar dat A1 toch een deel van Δb1 behoudt. Bijvoorbeeld kent de handhaver niet altijd de werkelijke grootte van Δb1. Omgekeerd is denkbaar, dat de boete s niet volledig wordt opgelegd. Bijvoorbeeld kan A1 goede relaties hebben met juristen. Of A1 onderschat simpelweg de strafmaat s met de factor σ. Neem tenslotte aan, dat de handelaar A1 risico-neutraal is. Dan zal hij besluiten om te gehoorzamen aan de norm, zolang geldt U ≤ v(b1). Dien ten gevolge moet de handhaver de parameters p2, ρ en σ zodanig kiezen, dat is voldaan aan deze voorwaarde. Er volgt direct uit de formule 4, dat A1 zal gehoorzamen zolang geldt dat

(5)     p2 ≥ (v(b1 + Δb1) − v(b1)) / (v(b1 + Δb1) − v(b1 + ρ×Δb1 − σ×s))

De formule 5 laat zien, dat de handhaver diverse opties heeft. Een verminderde kans op handhaving p2 kan enigszins worden gecompenseerd via hogere straffen s. Wegens de risico-neutraliteit van A1 kan men uitgaan van v(b) = b. Duid het rechterlid van de formule 5 aan met p2°. Dan is p2° = 1/ (1 − ρ + σ×s / Δb1), en kan men eenvoudig de elasticiteit van p2° voor s berekenen: (∂p2° / ∂s) × (s / p2°) = -p2° × σ×s / Δb1.

De formule 5 is nuttig, omdat zij de causale verbanden bij handhaving zo helder weergeeft. Des ondanks is het lastig om haar practisch toe te passen. Immers elke individu heeft zijn eigen functie U. Sommigen zullen niet risico-neutraal zijn, maar risico-mijdend of -zoekend. Wie nauwelijks kan leven van b1, zal zeer verlangen naar Δb1. Soms kan een overtreder rekenen op bewondering in de eigen subgroep14. Bij kinderen blijken milde straffen s meer te stimuleren tot verinnerlijking van de norm dan zware straffen. Juist omdat de externe dwang beperkt blijft, ontwikkelen zij de gedachte dat gehoorzaamheid aan de norm een eigen keuze is15. Juist omdat de functie U zo persoonlijk is, heeft men dit model vooral toegepast op statistische gegevens van grote groepen, waarbij de individuele kenmerken uitmiddelen.

Merk voorts op, dat de straf s ook immaterieel kan zijn. Denk aan status-verlies, afkeuring door de groep, of zelfs uitsluiting16. In feite zal binnen groepen de immateriële straf zelfs overheersen, omdat de meeste groepsnormen informeel zijn. Immers overtredingen ondermijnen de onderlinge samenhang, en daarmee het bestaan van de groep. Bovendien zorgt gehoorzaamheid voor zelfbevestiging bij de groepsleden, waardoor omgekeerd een overtreding kan gepaard gaan met enige zelf-betraffing17. De machtsverschillen tussen groepsleden ontstaan meer uit de maatschappelijke verhoudingen dan uit materiële ongelijkheid. Natuurlijk monden immateriële sancties op langere termijn vaak uit in materiële verliezen, maar de omvang van die verliezen is lastig te kwantificeren. De rationele-keuze leer van de socioloog J.S. Coleman is een gedurfde poging om de uitwisselbaarheid (substitutie) van materiële en immateriële sancties te modelleren.


Het beslisser-uitvoerder probleem in de Edgeworth box

Een kernstuk van de nieuwe instititutionele economie is het beslisser-uitvoerder probleem (in de Engelse taal principal-agent). Een bekende variant van dit probleem is de situatie van een onderneming, die wegens allerlei toevallige omstandigheden een per productie-periode schommelende productie q heeft. Dat wil zeggen, q is verdeeld volgens een kansdichtheid f(q). De variant veronderstelt, dat de opbrengst q helemaal opgaat aan de betaling van de loonsom w en de winst π (dus q=w+π). Dien ten gevolge lopen de bedrijfsgenoten een inkomens-risico. Stel dat de werkers (tevens uitvoerders) risico-mijdend zijn, terwijl de ondernemer (tevens beslisser) risico-neutraal is. In deze situatie is belangrijk, of de ondernemer in staat is om de inspanning e van de werkers te meten. Als dat het geval is, dan kan het arbeidsloon simpel contractueel worden vastgelegd. Maar als de ondernemer e niet kan waarnemen, dan moet hij loonprikkels inbouwen in het arbeidscontract.

Gewoonlijk wordt in deze variant het optimum van de ondernemer en de werkers wiskundig berekend. Het is echter ook mogelijk om het probleem te analyseren met een Edgeworth box, en dat is het thema van deze paragraaf18. Al levert de grafische methode geen nieuwe kennis, hij verdiept wel de reeds bestaande inzichten uit de wiskundige methode. De Edgeworth box wordt meestal gebruikt om de ruil van goederen te beschrijven. Hier zal een bijzondere ruil worden geanalyseerd, te weten het verdelen van de inkomens-risico's. De toepassing van de grafische methode vergt, dat de kansdichtheid f(q) van de opbrengst simpel is. Er zijn slechts twee opbrengsten mogelijk, te weten qH met een kans pH, en qL met een kans pL = 1 − pH, waarbij geldt dat qH>qL. Dan is het inkomens-risico qH − qL. Het is voordelig voor allen, wanneer de ondernemer zijn werkers verzekert voor dit risico, en in ruil daarvoor een premie-afdracht ontvangt19.

Zichtbare inspanning

De figuur 2 toont de Edgeworth box voor de verzekering. Horizontaal zijn de inkomens bij qH uitgezet, en verticaal de inkomens bij qL. Het assenkruis (wH, wL) van de werkers heeft zijn oorsprong linksonder, waarbij de waarden langs de assen oplopen naar rechts en omhoog. Het assenkruis (πH, πL) van de ondernemer heeft zijn oorsprong rechtsboven, waarbij de waarden langs de assen oplopen naar links en omlaag. De oorsprong van de ondernemer is dus het punt (qH, qL) van de werkers, en vice versa. Aangezien de werkers hechten aan zekerheid, geven zij de voorkeur aan de situatie wH= wL. In de figuur 2 is deze zogenaamde zekerheidslijn weergegeven als de lijn met een hoek van 45°. Volledigheids halve is ook de zekerheidslijn van de ondernemer ingetekend. Deze twee lijnen zijn enkel gelijk, indien geldt qH=qL.

Figuur van Edgeworth box voor risico verdeling
Figuur 2: Edgeworth box voor risico verdeling
   met zichtbare inspanning

Het verwachte loon van de werkers is E(w) = pH×wH + pL×wL. Een soortgelijke formule geldt voor de verwachte winst E(π). Kennelijk hebben in de figuur 2 de lijnen met een constant verwacht inkomen (E(w)=a of E(π)=a met constante a) een helling -pH/pL. Geef hen de naam isoloon lijnen (bij de werkers) en isowinst lijnen (bij de ondernemer). Merk op, dat E(w) + E(π) = E(q), en die is vast in deze situatie. Daarom vallen de isoloon lijnen en de isowinst lijnen samen. In de figuur 2 zijn zij afgebeeld in het groen. De werkers ontlenen een nut v(w) aan hun loon, en de ondernemer ervaart een nut φ(π). Aangezien de ondernemer risico-neutraal is, komen de indifferentie curven (φ(E(π)) = φ(a) = constante) van zijn verwachte winst overeen met zijn isowinst lijn E(π)=a. Dien ten gevolge worden allebei voorgesteld door de groene lijnen in de figuur 2.

Dat ligt anders bij de werkers. Beschouw een isoloon lijn E(w)=a. In het snijpunt met de zekerheidslijn E(w) = wH = wL geldt v(E(w)) = v(a). Toch valt de indifferentie curve v(E(w)) = v(a) van het verwachte loon niet samen met deze isoloon lijn. Immers als men over de isoloon lijn beweegt, zodanig dat de afstand tot het genoemde snijpunt toeneemt, dan wordt de spreiding wH − wL steeds groter. Dat leidt tot een onvrede bij de werkers, die hun nut v verlaagt. De werkers willen als het ware een materiële compensatie hebben voor het extra risico. De grafische uitdrukking van deze risico-mijding is de convexe indifferentie curve v(E(w)) = v(a), zoals in de figuur 2 is weergegeven in het rood.

De figuur 2 laat ook de consequenties zien, die de verschillende risico-voorkeuren hebben voor het arbeidscontract. Zij het punt b = (wH, wL) het oorspronkelijke contract. Dit contract is niet optimaal. Immers de indifferentie curven van de werkers en de ondernemer, die elkaar kruisen in b, wijken uiteen buiten het snijpunt. De grootste afstand tussen de twee indifferentie curven wordt bereikt op de zekerheidslijn van de werkers, te weten de lengte van het lijnstuk a-d. De punten a en d zijn tevens raakpunten van indifferentie curven van de ondernemer met die van de werkers20. In het punt a heeft de ondernemer zijn nut vergroot in vergelijking met het punt b. Hetzelfde geldt voor de werkers in het punt d. Kennelijk zijn de punten op het lijnstuk a-d arbeidscontracten, die zorgen voor een optimale verdeling van de inkomens. Elk van deze contracten verzekert de werkers tegen loonschommelingen. De machtsverhouding zal bepalen welke van deze punten wordt gekozen21.

Onzichtbare inspanning

Merk op, dat elk contract in het gele gebied van de figuur 2 beter is dan het oorspronkelijke contract in b. De verhouding tussen de beslisser en de uitvoerder wordt ingewikkelder, wanneer de beslisser kosten moet maken om de inspanning van de uitvoerder te meten. Neem bijvoorbeeld aan, dat de kans pH afhangt van de inspanning e van de werkers. Dat wil zeggen, er geldt pH = pH(e), met uiteraard ∂pH/∂e > 0 en dus ∂pL/∂e < 0. De ondernemer wil graag de inspanningen stimuleren, want zij vergroten zijn verwachte winst E(π). Helaas kan hij e niet aflezen aan q, omdat elke qH of qL ontstaat door een toevalsproces. De houding van de werkers jegens e is ambivalent, omdat zij de inspanning ervaren als een last. Zij c(e) de omvang van de last (kosten, onvrede). In deze situatie wordt hun nut gegeven door

(4)     u(w, e) = v(w) − c(e)

Figuur van Edgeworth box voor werkers met variabele inspanning
Figuur 3: Edgeworth box voor werkers
   met variabele inspanning

Aldus zullen de werkers proberen om w maximaal te maken en e minimaal te houden. Als E(q(e)) toeneemt, dan kan de ondernemer inderdaad hogere lonen w(e) betalen. De werkers kennen de motieven van de ondernemer, en kunnen die uitbuiten via leugens over hun inspanning22. Dat dwingt de ondernemer om de omstandigheden te bepalen, waarin de werkers werkelijk (uit vrije wil) een extra inspanning zullen leveren. Zijn methode wordt uitgelegd in de figuur 3. De indifferentie curven v(w) van de figuur 2 zijn ook hier ingetekend. Neem aan dat op deze curven e niet wordt ervaren als een last, zodat geldt c(e)=0. Stel nu dat de werkers zouden besluiten om een extra inspanning Δe te leveren. Daardoor ontstaan nieuwe indifferentie curven, die in de figuur 3 zijn weergegeven in bruin. De nieuwe indifferentie curven zijn steiler dan de oude, omdat Δe de verhouding pH/pL opdrijft en dus de isoloon lijn steiler wordt.

De figuur 3 toont twee snijpunten van de oude en nieuwe indifferentie curven, te weten b en g. Beschouw eerst het punt b, gedefinieerd door v(E(w)) = v(a) = u(E(w), Δe). De nieuwe indifferentie curve door b snijdt de zekerheidslijn in het punt m. Merk op, dat zonder de extra inspanning dit punt zou corresponderen met een groter nut v(m). De formule 4 laat zien, dat het verschil v(m) − v(a) juist de last c(e + Δe) is van de extra inspanning. Kennelijk krijgen op de nieuwe indifferentie curve de werkers een hoger loon w 23. Daarom zijn de werkers in de verleiding om onterecht te beweren dat zij die Δe hebben verricht. Gelukkig is dat anders in het deel van de nieuwe indifferentie curve u(E(w), Δe) = v(a) beneden b. Immers dit deel ligt beneden de oude indifferentie curve. Zonder de extra inspanning hebben de punten van dit deel een nut v(w), dat lager is dan v(a). Nu zijn de werkers bereid om vrijwillig Δe te leveren.

Dezelfde redenatie kan worden gevolgd voor het punt g, en voor alle andere punten op de gestippelde curve. Ter rechterzijde van de gestippelde curve kan de ondernemer er op vertrouwen, dat zijn werkers inderdaad zullen voldoen aan de gecontracteerde e. Kortom, de ondernemer moet zorgen, dat hij geen arbeidscontracten aanbiedt ter linkerzijde van de curve b-g24. Dit wordt nog nader uitgewerkt, in de figuur 4.

Figuur van Edgeworth box voor risico verdeling met onzichtbare inspanning
Figuur 4: Edgeworth box voor risico verdeling
   met onzichtbare inspanning

Veronderstel, dat het punt a het oude arbeidscontract zonder extra inspanning voorstelt. Hier is het loon w=a, zodat de isowinst lijn wordt gegeven door E(π) = E(q) − a. Dit is tevens de indifferentie curve φ(E(π)) = φ(E(q) − a) = constant van de ondernemer (groene lijn). Zij snijdt de zekerheidslijn van de ondernemer in het punt n. In de situatie met extra Δe worden de nieuwe isowinst lijnen en indifferentie curven van de ondernemer steiler. De blauwe indifferentie curve in de figuur 4, door de punten n en g, is hiervan een voorbeeld. Zoals gezegd correspondeert die met een constante nutswaarde van φ(E(q) − a). Echter boven de lijn a-n hebben de oude indifferentie curven een waarde beneden φ(E(q) − a). Kennelijk maakt Δe inderdaad de ondernemer beter af. Dankzij de extra inspanning zijn er betere contracten mogelijk dan a, te weten de punten tussen de oude en nieuwe indifferentie curve.

Wegens het opportunisme (inspanning overdrijven) van de werkers moet de ondernemer zich beperken tot de betere contracten ter rechterzijde van de curve b-g. Bovendien willen de werkers geen nut inleveren, zodat die contracten moeten liggen boven de nieuwe indifferentie curve u(E(w), Δe) = v(a) van de werkers. Aldus vindt men in de figuur 4 de haalbare verbeterde contracten in het gele gebied. De concrete keuze voor het contract hangt weer af van de machtsverhouding. Het valt op dat de contracten niet meer liggen op de zekerheidslijn van de werkers, zodat zij nu bereid zijn om enig risico te dragen. De onzichtbaarheid van Δe blokkeert een ruil, die leidt tot de optimale verdeling van het risico. Daarom raken op de curve b-g de indifferentie curven van de werkers en de ondernemer elkaar niet. Overigens zijn de contracten wel Pareto efficiënt.

Men kan dit ook zo uitleggen, dat de werkers extra moeten worden beloond om hen te compenseren voor hun inkomens-risico. Deze clausule in het contract is ongunstig voor de ondernemer, omdat die risico-neutraal is en daarom zelf het risico van de werkers zou kunnen dragen tegen lagere kosten. De noodzaak om de werkers de aanmoedigings-premie te betalen (de beperking van haalbare contracten door de curve b-g) maakt deze risico-spreiding onhaalbaar. Uiteraard zou dit veranderen, wanneer de werkers risico-neutraal worden. Deze constateringen vindt men als afsluiting in de voorgaande column over het beslisser-uitvoerder probleem met onzichtbare inspanning. Grafisch ingestelde lezers zullen ongetwijfeld de afleiding in de huidige column aantrekkelijker vinden25.

Het zij nogmaals benadrukt dat dit model een abstracte voorstelling geeft van het arbeidscontract. In werkelijkheid beschikt de ondernemer over allerlei bijkomende instrumenten om zijn werkers te motiveren. Vaak zijn die instrumenten gebaseerd op enig vertrouwen tussen de ondernemer en zijn werkers. Het verlangen naar billijkheid en wederkerigheid zijn een deel van de menselijke natuur. Men noemt dit prosociale normen. Men gaat onderling verplichtingen aan voor de lange termijn. Nochtans blijft uw columnist van mening, dat de homo economicus van de hedonistische loontheorie een plausibel antropologisch model is en het zonet gepresenteerde beslisser-uitvoerder model bijdraagt aan het inzicht.

  1. Volgens p.172 in Rational-Choice-Theorie (2011, Juventa Verlag) van N. Braun en T. Gautschi is 2 de Temptation, 1 de Reward, 0 de Punishment, en -1 de Sucker's payoff. In het algemeen is er een gevangenen spel, zodra er geldt T > R > P > S. (terug)
  2. Het nu volgende betoog is ontleend aan paragraaf 1.8.2 in The economics of business enterprise (2002, Edward Elgar Publishing, Inc.) van M. Ricketts. (terug)
  3. Merk op, dat de formule 1 geen disconto factor δ bevat, of zo men wil δ=1. Uitkomsten worden gelijk gewogen, ondanks de verschillende tijdstippen van ontvangst. Op p.194 en verder in Rational-Choice-Theorie wordt ook het geval doorgerekend, waarin geldt dat δ<1. Dan blijkt de lik-op-stuk norm enkel te lonen, zolang δ voldoende groot is. Voor de situatie in de tabel 1 leidt dit tot de eis δ>½.(terug)
  4. Zie voor dit betoog p.192-193 en p.261 in Rational-Choice-Theorie. Daar wordt de tabel 1 algemener geformuleerd, met Tk=2, Rk=1, Pk=0, en Sk=-1. Deze algemene vorm stelt als voorwaarde Tk > Rk > Pk > Sk. Dan leidt lik-op-stuk gedrag in combinatie met een ongeluk tot Bk = J×R + (N − J) × (S+T)/2 = J × (R − ½×(S+T)) + N × (S+T)/2. Een opmerkelijke situatie ontstaat, indien er geldt 2×R < S+T (bijvoorbeeld R=¼ in tabel 1). Nu is S+T dermate groot, dat een afwisselende uitbuiting en samenwerking lonen. Hoewel de lik-op-stuk norm hier optimaal blijft, dient hij niet meer om samenwerking af te dwingen. Kennelijk vereist lik-op-stuk gedrag als wapen tegen uitbuiten, dat geldt 2×R > S+T. (terug)
  5. Zie voor dit inductie argument bijvoorbeeld paragraaf 7.1.2 in Rational-Choice-Theorie. (terug)
  6. Zie p.342 in An introduction to behavioral economics (2008, Palgrave Macmillan) van N. Wilkinson. Soms zijn zulke experimenten zodanig ingericht, dat de handelaren regelmatig wisselen van partner. Aldus wordt niet de concrete individu belangrijk, maar de gemiddelde individu, gedefinieerd door de kans p. Als p klein is, dan zijn de uitkomsten zo slecht, dat soms toch de lik-op-stuk norm veld wint, en p zal stijgen. Zelfs wordt wel beweerd, dat lik-op-stuk gedrag (wederkerigheid) genetisch wordt bevorderd door de evolutie (p.343). Als de keuze voor samenwerking een gevoelsmatige beloning veroorzaakt, dan zal uiteraard p hierdoor stijgen. Zie p.361-362. Merk voorts op, dat individuen socialiseren in hun omgeving, en daardoor zich eveneens bepaalde normen eigen maken. Wie een bepaalde p heeft verinnerlijkt, zal die ook hanteren in laboratorium experimenten. Zie p.264 in Behavioral economics (2014, Springer Gabler) van H. Beck. (terug)
  7. Zie p.268 in Behavioral economics, of p.88 en verder in Économie comportementale (2016, Economica) van D. Serra. Volgens Serra kiest in zulke situaties typisch 50% van de proefpersonen voor samenwerken. Uw columnist denkt dat in economische transacties die fractie wel lager zal liggen, wegens de zorgvuldige afweging en de inherente drang tot wedijver. De bekende socioloog J. Coleman past in hoofdstuk 9 van Foundations of social theory (1990, Harvard University Press) het gevangenen spel toe op paniek in aandelen markten. Zie p.215 en verder. (terug)
  8. Zie p.532-533 in Sozialpsychologie (2008, Springer-Verlag) van L. Werth en J. Mayer. (terug)
  9. Het model is overgenomen van paragraaf 3.2.3.2 in The economics of business enterprise. Kennelijk is het model afkomstig van G.J. Stigler. (terug)
  10. Immers g(n, p0) = n × (1 − p0/pmax)n-1 / pmax. Dien ten gevolge is En(p0) = ∫0pmax p0 × n × (1 − p0/pmax)n-1 / pmax dp0. Dit kan worden herschreven tot En(p0) = ∫0pmax n × (1 − p0/pmax)n-1 dp0 − ∫0pmax n × (1 − p0/pmax)n dp0. Integratie levert En(p0) = [-pmax × (1 − p0/pmax)n]0pmax + [pmax × (1 − p0/pmax)n+1 × n/(n+1)]0pmax = pmax × (1 − n/(n+1)) = pmax / (n+1). Hetgeen was te bewijzen. (terug)
  11. Zie p.85 in The economics of business enterprise. Ricketts diept het geval van pech niet verder uit. (terug)
  12. Zie paragraaf 7.1.1 in Rational-Choice-Theorie. Een aardige curiositeit is dat op p.287 van An introduction to behavioral economics deze tabel wordt aangeduid als het serveerders-spel. In een tenniswedstrijd kiest de serveerder of hij richting forehand of backhand speelt. De ontvanger probeert te anticiperen op een service richting forehand of backhand. Men kan ook denken aan strafschoppen, waarbij zowel de schutter als de doelman een hoek uitkiezen. Uiteraard is bij sport de gemengde strategie wèl ethisch toelaatbaar. Bovendien is zij onmisbaar om te winnen. (terug)
  13. Zie paragraaf 5.2 in Rational-Choice-Theorie. Het model is vaak toegepast om de effectiviteit van het strafrecht te analyseren. (terug)
  14. Zie voor dit soort argumenten p.442 in Sozialpsychologie. (terug)
  15. Zie p.237-238 in Sozialpsychologie. De kinderen reduceren aldus de mentale discrepantie tussen hun gedrag en hun behoeften. (terug)
  16. Zie p.162 in Group dynamics (1983, Brooks/Cole Publishing Company) van D.R. Forsyth. (terug)
  17. Zie bijvoorbeeld p.141 en verder in De kern van de sociale psychologie (1990, Van Loghum Slaterus) van P. Veen en H.A.M. Wilke. Als een lid besluit om de groepsnormen te overtreden, dan vindt hij waarschijnlijk zijn uitkomsten in die groep niet bijster bevredigend. In Nederland waren Veen en Wilke leidend op hun vakgebied. Hun boek blinkt inderdaad uit door originaliteit. Uw columnist las het 22 jaren terug voor het eerst. In paragraaf 3.1.2 van Économie comportementale wordt opgemerkt, dat het lidmaatschap soms tijdelijk is. Iemand zal toetreden tot de groep op basis van zijn inzichten. Hij is bereid om zich aan te passen (socialisatie). Deze fase moet uitmonden in een stabiele verhouding. In geval van conflicten tussen het lid en zijn groep zal een bijstelling nodig zijn (resocialisatie). De uitkomsten van het lid kunnen dermate ongunstig worden, dat hij de groep verlaat (althans indien de exit optie aanwezig is). Dit hele traject is een leermoment voor het lid en voor de groep. Hetzelfde fase-model is te vinden op p.95-99 van Group dynamics. (terug)
  18. Er wordt met name geput uit paragraaf 5.3 van The economics of business enterprise. (terug)
  19. In de naoorlogse decennia was er in het westen een sterke beweging om de loontrekkers medezeggenschap te geven in de bedrijfsvoering, minstens over sociale zaken, maar wellicht ook over de commercie. Zij kon zo sterk worden, omdat deze periode een continue groei kende en de economische risico's onbeduidend leken (Trentes glorieuses, Wirtschaftswunder, Great society). Ten tijde van New Left ontaardde deze stroming in eisen, die grensden aan arbeiders-zelfbestuur. Nuchter beschouwd is het billijk dat alleen de kapitaalverstrekker besluit over de commercie, omdat hij bij de ondergang van de onderneming zijn bron van inkomen onherroepelijk kwijt is. Dit feit geeft hem tevens een sterke prikkel om besluiten te nemen, die het voortbestaan van de onderneming zeker stellen. (terug)
  20. Het fenomeen van rakende indifferentie curven is kenmerkend voor het optimum in de Edgeworth box. Ook elders in de Gazet is hiervan vaak gebruik gemaakt, bijvoorbeeld in de column over de hedonistische loontheorie, in de column over loon-onderhandelingen en in de column over het contract van de directie. (terug)
  21. In de voorgaande column over het beslisser-uitvoerder probleem met zichtbare inspanning wordt eveneens de verwachte winst maximaal gemaakt. De wiskundige aanpak maakt het mogelijk om een continuüm van q-waarden te modelleren, in plaats van enkel qH en qL. De maximalisatie van E(π) wordt beperkt door de participatie voorwaarde, die de macht van de werkers bepaalt, via hun reserveringsnut U. Het reserveringsnut zou bijvoorbeeld kunnen baseren op het CAO loon, dat is afgesproken met de vakbond. Het afgesproken minimum in de CAO hangt weer af van de werkloosheid in de betreffende bedrijfstak en in de economie als geheel. (terug)
  22. Wellicht stelt deze constatering de moraal van de werkers ongunstiger voor dan het geval is in de realiteit. In ieder geval heeft de socialistische klassenstrijd er voor gezorgd, dat nog heden vele werkers zich uitgebuit voelen en een slachtoffer van de directie. De vakbeweging kan als intermediair op een zakelijke manier onderhandelen over de arbeidscontracten. Helaas is dat niet altijd in haar belang, en ten tijde van de New Left gooide zij juist olie op het vuur.
    Volgens de maatschappelijke psychologie heeft toezicht twee effecten. Enerzijds heeft de onderlinge wedijver het resultaat, dat de werker meer zal presteren dan zonder toezicht. Anderzijds kan de werker het ervaren als een druk, die hem ontmoedigt. Zie paragraaf 8.1 van Sozialpsychologie voor respectievelijk de social facilitation en inhibition. Dien ten gevolge moet het toezicht zodanig worden georganiseerd, dat het de arbeidsmotivatie niet aantast. In paragraaf 9.2 wordt de aandacht gevestigd op social loafing, dat wil zeggen, de neiging om de eigen inspanning te verminderen bij een gemeenschappelijke taak. Deze "luiheid" blijkt een universeel fenomeen te zijn. Als de inspanning onzichtbaar is, dan wordt luieren het Gimpel effect genoemd (p.359). De onzichtbaarheid ondermijnt de onderlinge wedijver. Zie ook p.269 en verder van Group dynamics voor de discussie van social loafing. Daarnaast schat de afzonderlijke werker gewoonlijk zijn inspanning hoger in dan zij werkelijk is (p.360 in Sozialpsychologie). De overschatting van de eigen prestatie is eveneens vastgesteld in zogenaamde dictator spellen met voorafgaande wedijver. Men spreekt van een self-serving bias. Zie p.345 in An introduction to behavioral economics, en p.60 van Behavioral economics. (terug)
  23. Deze constatering vindt men eveneens in de voorgaande column over het beslisser-uitvoerder probleem met onzichtbare inspanning. Zij wordt daar wiskundig afgeleid. (terug)
  24. In de voorgaande column over het beslisser-uitvoerder probleem met onzichtbare inspanning wordt deze gestippelde curve de aanmoedigings-voorwaarde genoemd. (terug)
  25. Vermeldens waard is dat in paragraaf 5.5 van The economics of business enterprise een uitbreiding van het model wordt behandeld, waarbij de ondernemer de prestatie-afspraak in het arbeidscontract handhaaft met een kans p2. Bovendien voegt Ricketts de kans ψ toe, dat de ondernemer zich vergist in zijn waarneming van e, en dan onterecht de straf s oplegt. Deze vorm van toezicht en handhaving confronteert de werker met een loterij, wanneer hij moet besluiten over de extra inspanning Δe. Aldus worden de effecten van informatie en van normen geïntegreerd in één model! (terug)