Nieuwsvideo’s scannen met Watskeburt?!

september

ma di wo do vr za zo
28
29
30
31
1
1
2
2
3
3
4
4
5
5
6
6
7
7
8
8
9
9
10
10
11
11
12
12
13
13
14
14
15
15
16
16
17
17
18
18
19
19
20
20
21
21
22
23
23
24
24
25
26
26
27
28
28
29
29
30
30
1

Watskeburt?! maakt het voor de kijker mogelijk om effectief en snel video’s te analyseren en zo te beoordelen wat relevant is. Het project van TNO en Media Distillery wekte de interesse van de NOS.

Een nieuwsartikel op een website is gemakkelijk te scannen. Door naar de koppen, streamers en foto’s te kijken, ziet een lezer binnen een paar seconden of het artikel relevant voor hem is. Bij video’s werkt dat gecompliceerder. Bij het scannen van een nieuwsvideo is de kijker bijna uitsluitend afhankelijk van de titel van de video.

Kennisinstelling TNO en technologiestart-up Media Distillery ontwikkelden daarom Watskeburt?!: een tool die de inhoud van een video inzichtelijk maakt. Ze kregen er in juli 2015 subsidie voor van het Stimuleringsfonds voor de Journalistiek.

Watskeburt?! scant nieuwsvideo’s onder andere op spraak, ondertiteling, gezichten en logo’s. Op basis van de verzamelde informatie kan een goede samenvatting van de video worden gemaakt. Uit iedere scène in de video wordt automatisch een frame geselecteerd dat representatief is voor het stukje video. Door die frames te combineren, ontstaat een filmstrip waar de kijker doorheen kan scrollen.

“Op televisie wordt het NOS Journaal dagelijks door zo’n twee miljoen mensen bekeken, maar online kijkt nog geen 10 procent het terug”, aldus José de Vries van NOS Lab. “Het was interessant om te onderzoeken of we dat terugkijken beter konden faciliteren. Kan een filmstrip ervoor zorgen dat mensen het NOS Journaal online eerder aanklikken?”

Twee seconden nadat een uitzending is afgelopen, is de filmstrip compleet. “Tijdens de uitzending wordt de video automatisch gescand op bijvoorbeeld spraak”, zegt Joost de Wit, één van de oprichters van Media Distillery. “We willen alles herkennen wat mensen zeggen: wanneer wordt er gesproken en wanneer horen we andere geluiden? Die twee dingen proberen we van elkaar te onderscheiden.”

De spraak wordt vertaald in klanken en vervolgens in woorden, maar ook aanwezige tekst wordt uit de video ‘losgeknipt’.

Bron: SVDJ/Broadcast Magazine