In deze video leggen we je alles uit over de berekeningen achter recommender systems

In een vorig item hebben we gekeken naar de werking van recommender systems. Onderzoekster en mission chair Aletta Smits vertelde ons over de verschillende manieren waarop die systemen te werk gaan. Dit keer gaan we dieper in op de totstandkoming van dit soort aanbevelingen.

Bekijk hieronder de video, waarin onze mission chair Smits laat zien welke berekeningen ervoor zorgen dat jij bijvoorbeeld een film wel of niet aanbevolen krijgt, en waarom jij andere aanbevelingen ontvangt dan een vriend of vriendin van je.

De producties voor deze missie worden ondersteund door redacteur Remi Terhorst

 

Bekijk hier de andere items van deze missie:

Aanbevelingen op Spotify

Hoe Spotify jouw muzieksmaak bepaalt

De werking van Netflix

De werking van algoritmes van dating apps

Berekeningen van aanbevelingssystemen

De feedbackloop

Aanbevelingen en bedrijven

Alternatieve aanbevelingssystemen, gemaakt door studenten

Controle en transparantie

Terugblik op deze missie

Missie 1: HELP, Spotify begrijpt me niet!


Het is donderdagavond. De laatste aflevering van het laatste seizoen van een fijne serie op Netflix is afgelopen. Het is niet laat, en zeker niet zo laat dat je al naar bed wilt, maar niet zo vroeg dat je nog overweegt de deur uit te gaan. Wat nu?  

(Pak een boek, hoor ik mijn moeder roepen). 

Het einde van de serie is goed. Daar zijn jullie het over eens. Echt goed. Als dit echt het laatste seizoen was dan is dat verhaal goed verteld. Maar eerlijk gezegd ben je nog niet klaar om afscheid te nemen van deze serie. Hij was weliswaar al een paar jaar oud, maar jij ontdekte hem pas vorige maand en in één maand heb je alle seizoenen er doorheen gejast. Wat vroeger een liefdesrelatie van een paar jaar was, tussen jou en Grey’s anatomy, of tussen jou en Prison Break, is nu een hele heftige korte relatie: bloedspannend, zo weer over, en daar zit je op de bank met je lege gevoel. Je zoekt op internet nog of er een volgend seizoen komt, want je bent nog niet klaar om afscheid te nemen. Dat komt er, waarschijnlijk, of misschien niet, maar als het komt, dan pas volgend jaar september, de opnames zijn nog niet gestart. Potentieel fijn nieuws, maar wat doe je ondertussen?  

(Mam, echt! Ik hoorde je net ook wel) 

En dan doet Netflix  een suggestie: “Aletta, omdat je The Good Place hebt gekeken, raden we nu deze series aan. Je scrolt door het rijtje aanbevelingen, en bij verreweg de meeste daarvan denk je “Hoezo!?” Hoezo dacht Netflix dat dit een goede suggestie was? Op basis van welke eigenschappen van een serie beslist Netflix: joh, dan is dit een goede optie? Op basis van welke eigenschappen van mij als kijker, dacht Netflix: maar dan vind je vast ook dit leuk. Het lijkt er niet eens op! 

Omdat je Suits hebt gekeken Netflix-Suits-Recommendation 

Waarom begrijpt Netflix mij zo slecht? Of Spotify, met zijn Discover Weekly. Waarom zit daar zo vaak rommel tussen? Of Bol.com met zijn “andere kopers kochten ook dit” en die dan boeken aanraden die ik al lang een keer gekocht had of die ik echt nooit ga lezen. Of een datasite met tamelijk obscure suggesties. Op basis waarvan doen dit soort diensten hun aanbevelingen? En waarom zitten die er zo vaak naast?  

Dit soort diensten genereren hun aanbevelingen met behulp van zogenaamde recommender systemen. Dat zijn algoritmes die (1) op basis van eigenschappen die verschillende producten gemeenschappelijk hebben of (2) op basis van wat verschillende gebruikers onderling gemeenschappelijk hebben, een match proberen te vinden. De openbare missie “Spotify begrijpt mij niet” onderzoekt hoe deze recommender systemen werken. Wat gebeurt onder de motorkap van zo een aanbevelingssysteem? Waarom klopt de aanbeveling soms? Waarom klopt hij zo vaak helemaal niet? Hoeveel producten heb je eigenlijk nodig om een goede aanbeveling te maken? Waar kunnen we invloed op uitoefenen? En hoe werken de aanbevelingen samen met de businessmodellen van de diensten? Wij onderzoeken in deze missie waarom Spotify ons niet begrijpt en waarom Netflix ons niet hoort. We onderzoeken trouwens niet hoe Google en Facebook zoekresultaten, berichten en advertenties voor ons selecteren. Dat is ook een spannend onderzoek, maar daar komen nog weer hele andere dingen bij kijken. Wij houden het even bij de Spotifies van deze wereld. En de Bol.commen. Dating sites natuurlijk. En Netflix dus.  

Stel, bijvoorbeeld, dat je “The Good Place” hebt gekeken en dat vond je een fijne serie (echt! Ga de Good Place kijken als je dat nog niet gedaan hebt”). Ik heb nog expliciet aan Netflix laten weten dat ik het een fijne serie vond door een duimpje omhoog te zetten bij mijn review.  

Netflix kan dan op zoek naar andere series die kenmerken gemeenschappelijk hebben met The Good Place. Bijvoorbeeld: deze andere serie is ook een comedy. Bijvoorbeeld: deze andere serie heeft dezelfde acteurs. Of dezelfde producer. Of dezelfde decorbouwer (dat gebeurt ook). Dat heet een “content-based” recommender system.  

Netflix kan ook op zoek naar andere gebruikers die “The Good Place” een duimpje omhoog gaven. En dan in hun lijstje kijken welke series die andere gebruikers goed vonden. Zo’n andere serie kunnen ze dan weer aan mij aanbevelen. Dan gaan ze er van uit dat als je alle twee “The Good Place” leuk vond, dat je ook alle twee die andere serie leuk vindt. Dat heet “user-based” recommender systemen.  

Welke systeem je ook gebruikt: je hebt sowieso ontzettend veel users en ontzettend veel producten nodig (producties bij Netflix, boeken bij bol.com, muziek bij Spotifyelligible candidates op een matching site), om maar in de buurt te komen van een interessante aanbeveling. En je moet heel goed kiezen welke eigenschappen van een product of een user interessant genoeg zijn om mee te laten tellen.  

Neem bijvoorbeeld als eigenschap van een serie: “de acteurs die erin spelen”. Zelfs als ik een van die acteurs echt goed vind, ben ik niet per se geïnteresseerd in een andere serie waarin een van die acteurs toen zij nog ‘young and upcoming’ was, één regel tekst had als de “tweede cafébezoeker van rechts” in de derde aflevering van seizoen 6. De eigenschap “de acteurs die erin spelen is niet genoeg voor een goede aanbeveling. Of stel dat ik een avond een Mexicaans etentje heb gegeven en die hele avond voor de lol traditionele Mexicaanse mariachimuziek gedraaid heb, dan hoef ik de maandag erna in Spotify’s “Discover weekly” niet opeens allerlei obscure mariachibands te vinden. De eigenschap ‘welke muziek een user draait’ is ook niet altijd genoeg.  

Maar wat is dan wel genoeg? Hoe moeten die eigenschappen gedefinieerd? Hoe vinden recommendersystemen de liefde van mijn leven voor mij op een dating site, waarmee ik dan perfect op ons aansluitende series op Netflix kan vinden, nadat we elkaar verleid hebben met echt goede muziek die Spotify voor ons gevonden heeft. Kopen we daarna (ja, mam!) een fijn boek dat Bol.com voor ons uitgezocht heeft.  

Dus mijn vraag aan u is: wanneer heeft een recommender systeem u iets aanbevolen dat uw leven veranderde? Die muziek! Die documentaire! Dat boek! En wat zijn de raarste aanbevelingen die u gehad heeft? En trouwens ook: welke eigenschappen zijn voor u belangrijk in uw eigen aanbevelingssysteem in uw hoofd? U heeft een boek uit, u legt het weg, u gaat op zoek naar een nieuw boek: wat zijn dan dingen die u gebruikt om te zoeken? Terwijl u daarover na denkt en ons dat laat weten gaan wij ook alvast op zoek en proberen een interview los te peuteren bij het recommender team van Spotify.  

De producties voor deze missie worden ondersteund door redacteur Remi Terhorst

 

Bekijk hier de andere items van deze missie:

Aanbevelingen op Spotify

Hoe Spotify jouw muzieksmaak bepaalt

De werking van Netflix

De werking van algoritmes van dating apps

Berekeningen van aanbevelingssystemen

De feedbackloop

Aanbevelingen en bedrijven

Alternatieve aanbevelingssystemen, gemaakt door studenten

Controle en transparantie

Terugblik op deze missie