Tien handige tips voor iedere beginnende datajournalist! (of cijfers nu wel of niet ‘zeg maar echt helemaal je ding’ zijn)

LocalFocus-numbercruncher Yordi gaf maandag 29 januari een workshop datajournalistiek in het kader van de ZZPeer Academy. Dit is een reeks journalistieke masterclasses speciaal voor ZZP’ers. Daar gaf hij tien handige tips voor iedere (beginnende) datajournalist. Van de woordkeuze bij verzoekjes tot methodologische missers.

Tip 1: Vraag – als je een verzoek indient bij een woordvoerder – nooit om ‘(onderliggende) data’
Dat klinkt eng, Cambridge-Analytica-esque en riekt naar privacyschending. Is natuurlijk helemaal niet zo, maar dat weten zij niet. Vraag om een tabel, spreadsheet, overzicht, lijst, of cijferreeks.

Tip 2: Bekijk altijd eerst de kolomtitels in je dataset: wat is wat?
Doe dit voordat je numbers gaat crunchen. Op basis van de kolomtitels kun je namelijk zien wat er in je dataset zit en ontdek je meteen welke vragen je ‘aan’ de dataset kunt stellen. Het maakt niet uit of je nou vijf of vijftigduizend rijen in je dataset hebt, de vragen blijven hetzelfde.

Tip 3: Probeer altijd drie  ‘soorten cijfers’ te verzamelen/te berekenen
Komen ze: zorg voor absolute aantallen, relatieve cijfers – bijvoorbeeld het aantal per duizend inwoners – en de procentuele ontwikkeling (nieuw-oud/oud*100. Haal je havo 4-economieskills weer even naar boven) Deze drie variabelen bieden je alle handvatten voor een compleet bericht.

Tip 4: Staat je tabel in een PDF-bestand? Huilon. But there’s an app for that!
Tik geen cijfers handmatig over, maar gebruik een tool als Tabula om supereenvoudig tabellen uit PDF’s te ‘scrapen’ en om te zetten in een CSV-bestand (dat je vervolgens kunt openen in Excel)

Tip 5: Ben je op zoek naar data, maar is er geen tabel voorhanden? Check of er iets gemeld wordt
Als iets ergens wordt gemeld, wordt deze info mogelijk ook ergens opgeslagen. Denk aan verkeersinformatiemeldingen of inspectierapporten.

Tip 6: Wil de bronhouder geen cijfers leveren? Kijk dan of die organisatie moet rapporteren
Veel organisaties moeten rapporteren aan een hoger orgaan, bijvoorbeeld een ministerie. Daar kun je de cijfers opvragen: gewoon met een mailtje of belletje, of via de wob.

Tip 7: Cijfers zijn relatief makkelijk te wobben. Probeer het eens!
Okay, het gaat lang niet altijd goed en sommige processen duren vreselijk lang. Maar de zwartste scenario’s – volledig zwartgelakte documenten – hebben we met LocalFocus nauwelijks meegemaakt. We gebruiken met LocalFocus tegenwoordig een ‘standaardwob’ die we qua opzet hergebruiken en qua inhoud aanpassen. Best wel effectief!

Tip 8: Dubbelcheck uitschieters
Is iets ‘too good to be true’? Die extreme stijging, of die heftige outlier, bijvoorbeeld? Check altijd eerst of er niet een suffe statistische oorzaak is zoals een methode- of definitiewijziging. Bel dit desnoods even na. Je wilt immers niet dat je knaller van een nieuwskop onderuit gehaald wordt door een methodologische misvatting.

Tip 9: Ga tussentijds visualiseren!
Zet je cijfers ook voordat je gaat publiceren om in staafjes, bollen, lijnen, kleuren en vlakken. Dit helpt je om snel antwoorden te vinden op de vragen die je ‘aan’ je dataset hebt gesteld. Gebruikt visualisaties dus als analysetool.

Tip 10: sharing = caring
Je hoeft niet alle facetten van ddj even goed te beheersen (ik kan bijvoorbeeld voor geen meter programmeren). Als je maar wél weet wat de mogelijkheden zijn: there’s always a nerd nearby!

Heb jij zelf nog handige datadingentips? Stuur dan een mailtje naar yordi@localfocus.nl

LocalFocus 2019: en nu gaan we voor HARD 📈🚀

Van misdadigers tot miljonairs en van wijngaarden tot woonboten: de afgelopen vijf jaar maakten we met LocalFocus honderden nieuwsberichten, vooral met cijfers uit open databronnen. Tof, maar nu is het tijd voor the next level. 

Er ligt wat ons betreft namelijk nog te veel ‘slapende’ data bij instanties, in lastige formaten of verspreid over regio’s opgeslagen. Daarmee willen we verhalen maken over bijvoorbeeld jeugdzorg, milieuvervuiling en de transitie naar duurzame energie. Het verbaast ons niet dat die onderzoeken tot nu toe blijven liggen, zowel bij ons als andere media. Er is namelijk een hoop handwerk voor nodig. Maar hey, we like a challenge.

Eerder dit jaar scrapeten en analyseerden we – in samenwerking met Open State en NOS – de kandidatenlijsten voor de gemeenteraadsverkiezingen. We ontdekten hoeveel werk zo’n project is: de lijsten lagen bij afzonderlijke gemeenten, sommigen hadden ze niet openbaar gemaakt of zo opgeslagen dat je ze handmatig moest overtypen. En dan viel het ook nog niet mee om de informatie, verzameld door verschillende redacteuren, overzichtelijk bij elkaar te krijgen én bij te houden wie wat doet.

Achteraf gezien waren er zeker tools te bedenken die de workload hadden kunnen verlichten: een slimme scraper, een lekker overzichtelijk samenwerkingsplatform, dat soort werk. Dankzij een bijdrage van het Stimuleringsfonds van de Journalistiek kunnen we in het komende jaar deze arbeidsintensieve onderzoeken verrichten en bouwen aan slimme tools die ook in de jaren daarna het werk van onze datajournalisten en andere onderzoeksredacties lichter maken en de mogelijkheid geven om nieuwe bronnen aan te boren.

Voor elk verhaal werken we met andere mediapartners. Zij weten immers wat er speelt onder hun publiek, wij vertalen dat naar een datajournalistiek onderzoek. De uitkomsten gebruiken zij weer om sterke regionale verhalen te maken.

Word je enthousiast van dit project? We zijn op zoek naar een redacteur met gevoel voor data en onderzoek. Check hier de vacature.

WERK! Journalist met gevoel voor data en onderzoek (36u p/w)

Ben jij een gravende journalist met minimaal twee jaar journalistieke ervaring, die niet bang is voor een spreadsheetje meer of minder? Wie weet kom jij dan het team van LocalFocus versterken! Jij gaat helpen met:

  • een nieuw project waarmee we in 2019 gaan starten. We gaan aan de slag gaan met diepgravend, langlopend onderzoek.
  • onze Nieuwsdienst. De redactie van LocalFocus zoekt elke dag naar interessante cijfers en maakt daar verhalen en visualisaties mee. Onze klanten, landelijke en regionale media, kunnen deze artikelen plaatsen op hun site.

Hoe ziet jouw dag er dan uit?
Je gaat ‘s ochtends aan de slag voor de Nieuwsdienst. Je hebt actualiteiten gevolgd en een idee voor een artikel. Zijn er interessante regionale cijfers gepubliceerd? Bijvoorbeeld van het CBS? Dan ga je deze cijfers analyseren, pik je het nieuws eruit voor het begeleidende verhaal en maak je visualisaties. Klanten van LocalFocus, landelijke media als NU.nl en het AD maar ook regionale titels als Omroep Brabant en De Gelderlander, kunnen dit overnemen. Daarom zijn cijfers die je gebruikt altijd op regionaal niveau, bijvoorbeeld alle provincies of gemeenten. Ook redigeer je stukken van jouw collega’s en beantwoord je mailtjes of telefoontjes met vragen van onze klanten.

Na deze kortlopende zaken is er tijd voor diepgravend werk. Jij hebt je eigen ideeën en onderzoeksvragen voor nieuwsverhalen. Deze wil je beantwoorden met data. Je belt experts en instanties om goed te begrijpen wat de data wel en niet vertellen. Misschien doe je een Wob-verzoek. Voor deze langlopende onderzoeken krijg je natuurlijk genoeg tijd.

En dit zien we graag van jou:
We zijn vooral benieuwd naar wat je eerder hebt gedaan. Heb jij toffe journalistieke producties waar je trots op bent? Stuur ze dan op. Graag zien wij dat je over bepaalde onderwerpen veel weet. Dat je er nieuwsberichten over hebt gemaakt, interviews hebt uitgewerkt, vette visualisaties hebt gebouwd of diep in de data bent gedoken. En als het ook nog regionaal is zijn we helemaal blij.

Praktische zaken:
Wij bieden een functie van 36 uur per week, al is overleg mogelijk, met een marktconform salaris. Het gaat in eerste instantie om een dienstverband van één jaar, van 1 januari tot en met 31 december 2019. Je werkt in een team van zes news nerds op ons kantoor in Amsterdam Noord.

En nog even over LocalFocus:
LocalFocus bestaat uit een klein team van drie (data)journalisten en drie developers. Sinds oprichtingsjaar 2013 is het bedrijf uitgegroeid tot een van de grootste spelers op het gebied van datavisualisatie en datajournalistiek in Nederland. Onder andere NOS, NU.nl, NRC, De Volkskrant, AD en Omroep Brabant maken gebruik van het visualisatieplatform en/of de Nieuwsdienst. Daarnaast maken ook partijen buiten de journalistiek gebruik van onze tools, waaronder de Rijksoverheid.

Iets voor jou? Stuur dan uiterlijk zondag 6 januari een mail naar Yordi Dam (yordi@localfocus) met daarin je cv en niet onbelangrijk: een aantal producties die je gemaakt hebt.

Verkiezingen in België: 17 titels, 75 miljoen pageviews

In maart verzorgde LocalFocus de verkiezingsdashboards voor de sites van 28 Nederlandse titels tijdens de gemeenteraadsverkiezingen. Afgelopen zondag mochten we dit doen voor 17 Belgische titels. Van landelijke titels als De Standaard en Het Laatste Nieuws tot regionale titels als de Gazet van Antwerpen. Voor titels als Le Soir en 7sur7 hadden we Franstalige versies. De uitslagen kwamen binnen vanuit de feeds van de Vlaamse en Waalse overheden.

Het ging hard qua pageviews. Heel hard 🚀We zagen pieken van 115.000 paginaweergaven per minuut. Op zondag werden de dashboards 40 miljoen en maandag 24 miljoen keer geopend. Het totaal staat vandaag op 75 miljoen👌 Ter vergelijking: in Nederland haalden we in maart 50.000 pageviews per minuut. Twee verklaringen voor dit verschil: bij de Belgische titels draaiden de dashboards op de voorpagina’s én de uitslagen kwamen sneller binnen.

De dashboards draaiden op de (voor)pagina’s van 17 titels. Zo zag dat eruit:

Voorbeeldcase LocalFocus ‘Vraag en Antwoord’: bierbrouwerijen

Momenteel werken we hard aan de LocalFocus ‘Vraag en Antwoord’. Met deze nieuwe feature kun je twee dingen doen. Allereerst kun je makkelijk lijsten doorzoeken en filteren. Dit is handig als er bijvoorbeeld verkiezingen zijn en je wil snel alle vrouwen op de kieslijsten bekijken. Met de tweede functie stel je een aantal ‘vragen’ aan de lezer, die vervolgens op basis van een dataset ‘antwoord’ krijgt op zijn vraag. Hier onder vind je een voorbeeld van de laatste optie: waar kun je in jouw regio een (speciaal)biertje scoren bij een brouwerij? Doorloop de stappen om daar achter te komen! Bekijk hier hoe Yordi de onderstaande tool maakte.



Dit is een beta-versie. De LocalFocus ‘Vraag en Antwoord’ is momenteel nog in ontwikkeling. Heb je op basis van deze versie opmerkingen of tips? Stuur dan een mailtje naar erik@localfocus.nl

De LocalFocus #GR2018 recap in zes getallen

Waarschijnlijk begon voor veel mensen de verkiezingen gisteren pas echt te leven maar op het LocalFocus HQ zat de kieskoorts er al een aantal maanden flink in. Voor de tweede keer in vier jaar coverden we namelijk de verkiezingen, waarbij de gemeenteraadsverkiezingen voor ons als ‘liefhebbers van lokaal’ (onze naam zegt het al, uiteraard) natuurlijk een tof project was om eens goed uit mee uit te pakken. It was a hell of a ride, maar wel een hele leuke, die we aan de hand van zes getallen met jullie willen delen.

2 keer kiezen 🗳2️⃣

Dit jaar werd niet alleen in 335 gemeenten een nieuwe raad gekozen, maar mocht in alle gemeenten ook gestemd worden voor het raadgevend referendum. Twee keer kiezen, twee tools dus. Gelukkig hoefden we het wiel niet twee keer uit te vinden. Veel elementen uit de uitslagentool konden we namelijk gebruiken voor de referendumtool. Easyshmeasy!

De uitslagen van de gemeenteraadsverkiezingen

De uitslag van het referendum per gemeente

5 teamleden (en een kat) 👨🏻👨🏻👨🏻👩🏻👩🏻(😽)

Je hebt geen gigantisch team nodig om veel voor elkaar te kunnen krijgen: met een team van in totaal vijf mensen werkten we de afgelopen maanden hard de voor-, achter- en zakelijke kant van de tool, met als hoogtepunt de uitslagenavond. Heb je daarvoor een hippe newsroom nodig? Nee hoor; dat kan allemaal prima aan de keukentafel!

Priscilla, Yordi, Jelle en Linda tijdens de uitslagenavond. Developer Erik zorgde vanuit zijn eigen huis dat alles technisch op rolletjes liep

(Ongeveer) 5 maanden 🗓

Eind oktober, maanden voor de verkiezingen dus, begonnen we met de eerste voorbereidingen. Lees: grafiekkrabbels met pen en papier, interfaceprobeersels en een voorzichtige verkenning van titels die dit mogelijk net zo tof zouden vinden als wij. Het idee was dit keer om de uitslagentool, zowel voor de gemeenteraad als het referendum, mobile first, te desingen. Meer een app dan zo’n typische ‘dashboard look and feel’ die je op desktop vaak ziet dus. Na flink wat uren schetsen, schaven, stijlen, schaven, schaven en schaven, startte developer Erik begin februari met het bouwen van de tool.

28 titels 📰🖥📱

Dit jaar verzorgden we de online uitslagenvisualisaties voor 28 verschillende titels. Van landelijke media als NU.nl, de Volkskrant en de NOS tot regionale titels als Omroep West, PZC en Omroep Fryslan. Alle uitslagen, van zowel de gemeenteraadsverkiezingen als het referendum, vulden automatisch de tool op het moment dat ze bij het ANP binnenkwamen. Daarvoor koppelden we de datafeed van het persbureau aan onze tool, zodat de meeste recente uitslagen altijd instant op de kaart en in de grafieken staan. Dat ging op Schiermonnikoog lekker rap; het Waddeneiland kwam na 13 minuten en 59 seconden al met de definitieve uitslag (in onder andere Almere, Amsterdam, Diemen en Venray zijn ze op het moment van schrijven, donderdagmiddag, trouwens nog bezig).

Een overzicht van alle titels waarvoor we de verkiezingsvisualisaties hebben gemaakt

5 (televisie-)uitzendingen 📺

Een nieuwe uitdaging: televisiegraphics. Dit jaar maakten we voor het eerst ook verkiezingsuitslagen tijdens de live-uitzending van vier omroepen (Omroep West, Zeeland, Brabant en Fryslan) en NU.nl. We maakten op basis van de online-uitslagentool een televisievariant: dezelfde data en ‘achterkant’, maar dan met een lik verf die past bij de televisievormgeving met een simpele interface die de studiotechnicus zelf kon bedienen.

De visualisaties tijdens de live-uitzending van Omroep Brabant

Frisse visualisaties tijdens de show van Omroep Zeeland

 

50 duizend pageviews (per minuut) 📈

Tijdens de uitslagenavond en nacht tikten alle graphics bij elkaar zo’n 50 duizend pageviews per minuut aan. Zijn we blij mee!

Wil je de visualisaties in actie zien? Hieronder check je enkele titels:

1Limburg | Gemeenteraad
Algemeen Dagblad | Gemeenteraad
Brabants Dagblad | Gemeenteraad
De Limburger | Gemeenteraad | Referendum
Hart van Nederland | Gemeenteraad
HMC (Noord-Hollands Dagblad) | Gemeenteraad
NOS | Gemeenteraad
NRC | Gemeenteraad | Referendum
NU.nl | Gemeenteraad
Omroep Flevoland | Gemeenteraad
Omroep West | Gemeenteraad
Het Parool | Gemeenteraad | Referendum
Telegraaf | Gemeenteraad

DIY: KNMI-data realtime op kaartjes

Wat een storm vandaag! Mooi moment voor Yordi, Priscilla en Linda om KNMI-weerstations te koppelen aan een Nieuwskaart in LocalFocus. Dit is het resultaat. En dit is hoe zij dat deden:

Stap 1. Bekijk de data

Het KNMI houdt een tabel bij met gegevens van weerstations. Deze tabel wordt elke 10 minuten bijgewerkt. De data valt onder een open licentie. Dat is mooi! 👌

Stap 2. Importeer tabel in Google Spreadsheets

Ooit wel eens gespeeld met de functie IMPORTHTML in Google Spreadsheets? Dit is een mooi moment! Plak onderstaande formule in de eerste cel (dat is A1):

=IMPORTHTML(“http://www.knmi.nl/nederland-nu/weer/waarnemingen”; “table”; 1)Voila. De tabel is geladen en wordt ook up-to-date gehouden door Google Spreadscheets. Top! 👌

Stap 3. Coordinaten vinden

Even wat handwerk. Elk meetstation staat ergens in Nederland. Maar waar? En graag als geografisch coördinaat (latitude en longitude). Het KNMI houdt een overzicht bij en Yordi, Priscilla en Linda namen 15 minuten om de coördinaten naast de geïmporteerde meetstations te plakken in twee extra kolommen. Zolang het KNMI de volgorde van de meetstations in de tabel niet verandert werkt dit prima.
De Google Spreadsheet ziet er nu zo uit:

Stap 4. Koppelen aan Nieuwskaart

Publiceer jouw Spreadsheet nu op internet. Druk op Bestand > Publiceer op internet en bevestig. Maak een nieuwe Nieuwskaart in LocalFocus. Klik onder Meerdere punten ophalen uit spreadsheet op de Cirkels vanuit spreadsheet. Een nieuw venster opent. Hoe wil je de dataset invoeren? Vanuit Google Spreadsheet. Plak de link naar de Spreadsheet in het vakje. Klik op onder Wind (m/s) op Afmeting cirkels.

De tabel met meetpunten van het KNMI is nu gekoppeld aan jouw kaart. Je kan nog veel meer instellen, zoals kleuren, tooltips, popups, etc. maar dat is aan jou. Lees er hier meer over.
Meer info? Contact jelle@localfocus.nl

Nieuw in LocalFocus: staaf- en lijngrafieken met dubbele Y-as

We gaan het nieuwe jaar fris in met een nieuwe frisse visualisatievorm! Vanaf nu kun je eenvoudig een lijngrafiek met twee verticale assen maken of een lijn- en staafgrafiek combineren. Deze vorm gebruik je als je twee variabelen met verschillende eenheden (een eenheid is het ‘soort’ cijfer, bijvoorbeeld een percentage, aantal of bedrag) wilt vergelijken of om een verband aan te tonen. Denk aan de jaar-op-jaar prijsstijging van chocola, snoep of ijs en de ontwikkeling ten opzichte van het beginpunt januari 2015 (1) of het aantal melkveebedrijven ten opzichte van het gemiddeld aantal gehouden melkkoeien (2).

Hoe maak je een grafiek met dubbele Y-as?

Voor het maken van een grafiek met een dubbele Y-as heb je een tabel met twee variabelen nodig. Een voorbeeld: we willen uitzoeken hoe het zit met de schaalvergroting van landbouwbedrijven. In onderstaande tabel vind je het aantal bedrijven dat melkvee houdt en het gemiddeld aantal gehouden melkkoeien per landbouwbedrijf

Deze tabel voeg je toe aan het LocalFocus-platform zoals je gewend bent (ben je nieuw met LocalFocus of heb je een opfrisser nodig? Volg dan deze tutorial), waarbij je aangeeft dat het aantal bedrijven en het gemiddeld aantal melkkoeien de eenheden zijn. Vervolgens zet je beide eenheden aan en selecteer je een lijngrafiek.

Omdat je normaal gesproken twee eenheden niet direct met elkaar kunt vergelijken, het zijn immers verschillende ‘soorten’ cijfers, geeft het platform je een automatische waarschuwing (‘Waarschijnlijk kun je de eenheden in deze visualisatie niet met elkaar vergelijken’). Als je van plan bent om een grafiek met dubbele Y-as te maken kun je deze waarschuwing echter negeren.

Ga vervolgens naar het tabje ‘Creëren’ en klik in de grafiek op het legendablokje van de variabel die in de tweede Y-as moet komen te staan, in dit geval het gemiddeld aantal gehouden melkkoeien per landbouwbedrijf. Vink ‘Plaatsen in rechter as aan’ en voilà: een grafiek met dubbele Y-as!

Het platform maakt automatisch een inschatting van de benodigde schaalverdeling voor je grafiek. Mocht je deze alsnog aan willen passen, klik dan wederom in de grafiek op een van cijfers op de verticale as die je aan wilt passen. Vervolgens kun je zelf een minimale en maximale waarde aangeven.

Tot slot is het nog mogelijk om een staaf- en lijngrafiek te combineren. Om dit te doen selecteer je binnen het tabje “Verkennen” de kolomgrafiek (Deze: 📊), selecteer je de variabel die als lijngrafiek weergegeven moet worden (in dit geval gemiddeld aantal gehouden melkkoeien per landbouwbedrijf) en vink je ‘Teken als lijn’ aan.

Hoewel een grafiek met dubbele Y-as in sommige gevallen heel doeltreffend kan zijn, is het voor sommige lezers een complexe en lastig af te lezen grafiekvorm. Vraag jezelf dus goed af of deze vorm geschikt is voor je data. Bij twijfel, kies voor een Storyboard of een grafiek met een interactieve dropdown. Heb je vragen over deze visualisatievorm? Stuur dan een mailtje naar yordi@localfocus.nl

Nieuw in LocalFocus: de scatterplot

Een scatterplot is een enorm veelzijdige manier om data te visualiseren – hoewel het misschien niet de meeste bekende visualisatie is. Met de scatterplot, of puntenwolk, kun je namelijk de relatie tussen twee variabelen tonen: iets waar veel andere visualisatievormen een stuk meer moeite mee hebben. Een van de bekendere voorbeelden van de scatterplot zit in deze lezing van wijlen Hans Rosling, waarin hij de levensverwachting afzet tegen de welvaart.

Het is nu ook mogelijk om scatterplots met LocalFocus te maken. Het voorbeeld in bovenstaande video kan bijvoorbeeld ook gemakkelijk worden gemaakt in het dataplatform.

Voor het maken van een scatterplot heb je een tabel nodig met ten minste twee variabelen voor op de assen. In bovenstaand voorbeeld zijn dat de levensverwachting en het BBP per hoofd van de bevolking. De punten worden bepaald door andere dimensie, bijvoorbeeld de landen van de wereld. Mogelijkheden die je in ons platform bij andere visualisaties hebt, werken ook voor de scatterplot:

  • Er kunnen interactieve elementen aan de visualisatie worden toegevoegd. Een timeslider maakt het bijvoorbeeld mogelijk om de patronen door de tijd heen te bekijken.
  • Er kan extra nadruk worden gegeven aan belangrijke punten met behulp kleur en directe labels.

Tot slot is het ook mogelijk om een zogeheten connected scatterplot te maken. Hierbij werden we geïnspireerd door dit voorbeeld uit het boek The Functional Art van Alberto Cairo. De richting van de lijn laat zien hoe Brazilië zich tussen 1981 en 2010 heeft ontwikkeld. Wanneer de lijn zich bijvoorbeeld naar rechtsboven beweegt, laat dit zien dat de welvaart toeneemt, maar wel steeds ongelijker verdeeld is.

Lees meer over connected scatterplots in deze blog van Alberto Cairo of ga er zelf mee aan de slag in ons dataplatform om een productie zoals deze te maken:

Vragen of opmerkingen over de scatterplot? Mail naar jelle@localfocus.nl!