Tien handige tips voor iedere beginnende datajournalist! (of cijfers nu wel of niet ‘zeg maar echt helemaal je ding’ zijn)

LocalFocus-numbercruncher Yordi gaf maandag 29 januari een workshop datajournalistiek in het kader van de ZZPeer Academy. Dit is een reeks journalistieke masterclasses speciaal voor ZZP’ers. Daar gaf hij tien handige tips voor iedere (beginnende) datajournalist. Van de woordkeuze bij verzoekjes tot methodologische missers.

Tip 1: Vraag – als je een verzoek indient bij een woordvoerder – nooit om ‘(onderliggende) data’
Dat klinkt eng, Cambridge-Analytica-esque en riekt naar privacyschending. Is natuurlijk helemaal niet zo, maar dat weten zij niet. Vraag om een tabel, spreadsheet, overzicht, lijst, of cijferreeks.

Tip 2: Bekijk altijd eerst de kolomtitels in je dataset: wat is wat?
Doe dit voordat je numbers gaat crunchen. Op basis van de kolomtitels kun je namelijk zien wat er in je dataset zit en ontdek je meteen welke vragen je ‘aan’ de dataset kunt stellen. Het maakt niet uit of je nou vijf of vijftigduizend rijen in je dataset hebt, de vragen blijven hetzelfde.

Tip 3: Probeer altijd drie  ‘soorten cijfers’ te verzamelen/te berekenen
Komen ze: zorg voor absolute aantallen, relatieve cijfers – bijvoorbeeld het aantal per duizend inwoners – en de procentuele ontwikkeling (nieuw-oud/oud*100. Haal je havo 4-economieskills weer even naar boven) Deze drie variabelen bieden je alle handvatten voor een compleet bericht.

Tip 4: Staat je tabel in een PDF-bestand? Huilon. But there’s an app for that!
Tik geen cijfers handmatig over, maar gebruik een tool als Tabula om supereenvoudig tabellen uit PDF’s te ‘scrapen’ en om te zetten in een CSV-bestand (dat je vervolgens kunt openen in Excel)

Tip 5: Ben je op zoek naar data, maar is er geen tabel voorhanden? Check of er iets gemeld wordt
Als iets ergens wordt gemeld, wordt deze info mogelijk ook ergens opgeslagen. Denk aan verkeersinformatiemeldingen of inspectierapporten.

Tip 6: Wil de bronhouder geen cijfers leveren? Kijk dan of die organisatie moet rapporteren
Veel organisaties moeten rapporteren aan een hoger orgaan, bijvoorbeeld een ministerie. Daar kun je de cijfers opvragen: gewoon met een mailtje of belletje, of via de wob.

Tip 7: Cijfers zijn relatief makkelijk te wobben. Probeer het eens!
Okay, het gaat lang niet altijd goed en sommige processen duren vreselijk lang. Maar de zwartste scenario’s – volledig zwartgelakte documenten – hebben we met LocalFocus nauwelijks meegemaakt. We gebruiken met LocalFocus tegenwoordig een ‘standaardwob’ die we qua opzet hergebruiken en qua inhoud aanpassen. Best wel effectief!

Tip 8: Dubbelcheck uitschieters
Is iets ‘too good to be true’? Die extreme stijging, of die heftige outlier, bijvoorbeeld? Check altijd eerst of er niet een suffe statistische oorzaak is zoals een methode- of definitiewijziging. Bel dit desnoods even na. Je wilt immers niet dat je knaller van een nieuwskop onderuit gehaald wordt door een methodologische misvatting.

Tip 9: Ga tussentijds visualiseren!
Zet je cijfers ook voordat je gaat publiceren om in staafjes, bollen, lijnen, kleuren en vlakken. Dit helpt je om snel antwoorden te vinden op de vragen die je ‘aan’ je dataset hebt gesteld. Gebruikt visualisaties dus als analysetool.

Tip 10: sharing = caring
Je hoeft niet alle facetten van ddj even goed te beheersen (ik kan bijvoorbeeld voor geen meter programmeren). Als je maar wél weet wat de mogelijkheden zijn: there’s always a nerd nearby!

Heb jij zelf nog handige datadingentips? Stuur dan een mailtje naar yordi@localfocus.nl

DIY: KNMI-data realtime op kaartjes

Wat een storm vandaag! Mooi moment voor Yordi, Priscilla en Linda om KNMI-weerstations te koppelen aan een Nieuwskaart in LocalFocus. Dit is het resultaat. En dit is hoe zij dat deden:

Stap 1. Bekijk de data

Het KNMI houdt een tabel bij met gegevens van weerstations. Deze tabel wordt elke 10 minuten bijgewerkt. De data valt onder een open licentie. Dat is mooi! 👌

Stap 2. Importeer tabel in Google Spreadsheets

Ooit wel eens gespeeld met de functie IMPORTHTML in Google Spreadsheets? Dit is een mooi moment! Plak onderstaande formule in de eerste cel (dat is A1):

=IMPORTHTML(“http://www.knmi.nl/nederland-nu/weer/waarnemingen”; “table”; 1)Voila. De tabel is geladen en wordt ook up-to-date gehouden door Google Spreadscheets. Top! 👌

Stap 3. Coordinaten vinden

Even wat handwerk. Elk meetstation staat ergens in Nederland. Maar waar? En graag als geografisch coördinaat (latitude en longitude). Het KNMI houdt een overzicht bij en Yordi, Priscilla en Linda namen 15 minuten om de coördinaten naast de geïmporteerde meetstations te plakken in twee extra kolommen. Zolang het KNMI de volgorde van de meetstations in de tabel niet verandert werkt dit prima.
De Google Spreadsheet ziet er nu zo uit:

Stap 4. Koppelen aan Nieuwskaart

Publiceer jouw Spreadsheet nu op internet. Druk op Bestand > Publiceer op internet en bevestig. Maak een nieuwe Nieuwskaart in LocalFocus. Klik onder Meerdere punten ophalen uit spreadsheet op de Cirkels vanuit spreadsheet. Een nieuw venster opent. Hoe wil je de dataset invoeren? Vanuit Google Spreadsheet. Plak de link naar de Spreadsheet in het vakje. Klik op onder Wind (m/s) op Afmeting cirkels.

De tabel met meetpunten van het KNMI is nu gekoppeld aan jouw kaart. Je kan nog veel meer instellen, zoals kleuren, tooltips, popups, etc. maar dat is aan jou. Lees er hier meer over.
Meer info? Contact jelle@localfocus.nl

Nieuw in LocalFocus: staaf- en lijngrafieken met dubbele Y-as

We gaan het nieuwe jaar fris in met een nieuwe frisse visualisatievorm! Vanaf nu kun je eenvoudig een lijngrafiek met twee verticale assen maken of een lijn- en staafgrafiek combineren. Deze vorm gebruik je als je twee variabelen met verschillende eenheden (een eenheid is het ‘soort’ cijfer, bijvoorbeeld een percentage, aantal of bedrag) wilt vergelijken of om een verband aan te tonen. Denk aan de jaar-op-jaar prijsstijging van chocola, snoep of ijs en de ontwikkeling ten opzichte van het beginpunt januari 2015 (1) of het aantal melkveebedrijven ten opzichte van het gemiddeld aantal gehouden melkkoeien (2).

Hoe maak je een grafiek met dubbele Y-as?

Voor het maken van een grafiek met een dubbele Y-as heb je een tabel met twee variabelen nodig. Een voorbeeld: we willen uitzoeken hoe het zit met de schaalvergroting van landbouwbedrijven. In onderstaande tabel vind je het aantal bedrijven dat melkvee houdt en het gemiddeld aantal gehouden melkkoeien per landbouwbedrijf

Deze tabel voeg je toe aan het LocalFocus-platform zoals je gewend bent (ben je nieuw met LocalFocus of heb je een opfrisser nodig? Volg dan deze tutorial), waarbij je aangeeft dat het aantal bedrijven en het gemiddeld aantal melkkoeien de eenheden zijn. Vervolgens zet je beide eenheden aan en selecteer je een lijngrafiek.

Omdat je normaal gesproken twee eenheden niet direct met elkaar kunt vergelijken, het zijn immers verschillende ‘soorten’ cijfers, geeft het platform je een automatische waarschuwing (‘Waarschijnlijk kun je de eenheden in deze visualisatie niet met elkaar vergelijken’). Als je van plan bent om een grafiek met dubbele Y-as te maken kun je deze waarschuwing echter negeren.

Ga vervolgens naar het tabje ‘Creëren’ en klik in de grafiek op het legendablokje van de variabel die in de tweede Y-as moet komen te staan, in dit geval het gemiddeld aantal gehouden melkkoeien per landbouwbedrijf. Vink ‘Plaatsen in rechter as aan’ en voilà: een grafiek met dubbele Y-as!

Het platform maakt automatisch een inschatting van de benodigde schaalverdeling voor je grafiek. Mocht je deze alsnog aan willen passen, klik dan wederom in de grafiek op een van cijfers op de verticale as die je aan wilt passen. Vervolgens kun je zelf een minimale en maximale waarde aangeven.

Tot slot is het nog mogelijk om een staaf- en lijngrafiek te combineren. Om dit te doen selecteer je binnen het tabje “Verkennen” de kolomgrafiek (Deze: 📊), selecteer je de variabel die als lijngrafiek weergegeven moet worden (in dit geval gemiddeld aantal gehouden melkkoeien per landbouwbedrijf) en vink je ‘Teken als lijn’ aan.

Hoewel een grafiek met dubbele Y-as in sommige gevallen heel doeltreffend kan zijn, is het voor sommige lezers een complexe en lastig af te lezen grafiekvorm. Vraag jezelf dus goed af of deze vorm geschikt is voor je data. Bij twijfel, kies voor een Storyboard of een grafiek met een interactieve dropdown. Heb je vragen over deze visualisatievorm? Stuur dan een mailtje naar yordi@localfocus.nl

Nieuw in LocalFocus: de scatterplot

Een scatterplot is een enorm veelzijdige manier om data te visualiseren – hoewel het misschien niet de meeste bekende visualisatie is. Met de scatterplot, of puntenwolk, kun je namelijk de relatie tussen twee variabelen tonen: iets waar veel andere visualisatievormen een stuk meer moeite mee hebben. Een van de bekendere voorbeelden van de scatterplot zit in deze lezing van wijlen Hans Rosling, waarin hij de levensverwachting afzet tegen de welvaart.

Het is nu ook mogelijk om scatterplots met LocalFocus te maken. Het voorbeeld in bovenstaande video kan bijvoorbeeld ook gemakkelijk worden gemaakt in het dataplatform.

Voor het maken van een scatterplot heb je een tabel nodig met ten minste twee variabelen voor op de assen. In bovenstaand voorbeeld zijn dat de levensverwachting en het BBP per hoofd van de bevolking. De punten worden bepaald door andere dimensie, bijvoorbeeld de landen van de wereld. Mogelijkheden die je in ons platform bij andere visualisaties hebt, werken ook voor de scatterplot:

  • Er kunnen interactieve elementen aan de visualisatie worden toegevoegd. Een timeslider maakt het bijvoorbeeld mogelijk om de patronen door de tijd heen te bekijken.
  • Er kan extra nadruk worden gegeven aan belangrijke punten met behulp kleur en directe labels.

Tot slot is het ook mogelijk om een zogeheten connected scatterplot te maken. Hierbij werden we geïnspireerd door dit voorbeeld uit het boek The Functional Art van Alberto Cairo. De richting van de lijn laat zien hoe Brazilië zich tussen 1981 en 2010 heeft ontwikkeld. Wanneer de lijn zich bijvoorbeeld naar rechtsboven beweegt, laat dit zien dat de welvaart toeneemt, maar wel steeds ongelijker verdeeld is.

Lees meer over connected scatterplots in deze blog van Alberto Cairo of ga er zelf mee aan de slag in ons dataplatform om een productie zoals deze te maken:

Vragen of opmerkingen over de scatterplot? Mail naar jelle@localfocus.nl!

Maak de tofste nieuwskaart met LocalFocus en win! #mapmania

Misschien had je het al ontdekt; gisteren hebben we stilletjes een paar toffe nieuwe opties aan onze nieuwskaart toegevoegd. We wilden dat jullie met de nieuwskaarten nog veel meer verhalen konden vertellen – en volgens ons is dat goed gelukt.

Win!
Yordi en Priscilla hebben hieronder zoveel mogelijk van die nieuwe mogelijkheden in een aantal kaarten gepropt om te laten zien wat er mogelijk is. Ongetwijfeld kunnen jullie nog meer toffe opties ontdekken, dus ga aan de slag! Voor de mooiste nieuwskaart hebben we een prijs in petto. Onderaan deze blogpost vind je alle info.


Kleuren basemap aanpassen
Je kunt zelf bepalen welke kleuren de verschillende onderdelen van je kaart krijgen. Bij een dataset over parken kan je natuur extra groen maken, bij een verhaal over dijken kan je water er lekker uit laten knallen. Soms wil je alle aandacht laten gaan naar de data: dan is een ‘cleane’ basemap – zoals deze van Yordi – een mooie optie:

 

Een ‘cleane’ basemap zorgt ervoor dat alle
aandacht naar de data gaat
 


Filteren in dropdowns..
Je kunt dropdowns meegeven aan de kaarten. Gebruikers kunnen dan zelf selecteren wat ze op de kaart willen zien. Door aan te geven dat één kolom in
je dataset zowel de stijl van de punten op de kaart als een dropdown bepaalt,
kan je mensen bijvoorbeeld restaurants filteren op het aantal Michelinsterren.
..en beperken tot één keuze
Ook tof: door in de dropdown de optie ‘beperkt tot één keuze’ aan te klikken, zorg
je ervoor dat de gebruiker van je kaart maar één filter tegelijkertijd kan
kiezen. Dat geeft je bijvoorbeeld de mogelijkheid om de ontwikkeling in tijd te
laten zien, zoals in Priscilla’s kaart met waarnemingen van halsbandparkieten
in de omgeving van Amsterdam tussen 2010 en 2015.

 

Door jaren in een filter te zetten waarbij je maar
één jaar kunt selecteren, kan je de verandering in de tijd laten zien.


Zoeken ook in KML-lagen
De nieuwe optie voor een zoekscherm
bovenin de kaart geeft je gebruiker de mogelijkheid om alles te waarvan jij in
het platform hebt aangegeven dat het in het zoekscherm moet: jaren, wijken, treinstations,
wat je maar wilt. Het maakt daarbij niet meer uit of je dataset vlakken of
punten bevat: alles is in principe doorzoekbaar. Yordi heeft in de kaart hieronder
bijvoorbeeld de gemeenten uit zijn KML-laag in het zoekscherm geplaatst. Dit
voorbeeld laat direct zien dat de nieuwskaart ook best tegen een stootje kan:
een KML-laag met alle wijken van Nederland, een KML-laag met de sporen en een
laag met alle treinstations van Nederland, tooltips, kleuren, en natuurlijk een
zoekscherm – het werkt.

 

Jep, ook dit kan hij hebben.


Winnaar!
We denken dat er nog veel meer
mogelijk is dan we hierboven hebben laten zien en dagen je daarom uit om een
toffe hack van onze nieuws nieuwskaart te vinden. Mail de door jou gemaakte
nieuwskaart vóór of op 17 februari naar Jelle om mee te doen. Ben
jij onze winnaar? Dan krijg je van
ons een schouderklopje – en het boek ‘Designing
Better Maps – A Guide for GIS Users’. Geen LocalFocus-abonnement? Geen nood!
Met LocalFocus Go kan je direct (gratis) aan de slag en hier vind je de tutorial voor de nieuwskaart. Mocht je nog geen idee hebben wat je op de kaart wilt zetten dan kun je beginnen met deze dataset over de kwaliteit van zwemwater.

Beschikbare datumnotaties

Het platform herkent verschillende datumnotaties in datasets. In de datumnotaties kunnen de streepjes ( – ) overal worden ingewisseld door slashes ( / ), punten ( . ) of spaties.

  • Jaar, bijvoorbeeld 2014 of 14
  • Maand-jaar, bijvoorbeeld 4-2014, apr-2014 of april 14
  • Jaar-maand, bijvoorbeeld 2014-4, 2014-apr of 14 april
  • Dag-maand-jaar, bijvoorbeeld 20-4-2014 of 20 april 2014
  • Jaar-maand-dag, bijvoorbeeld 2014-4-20 of 2014 feb 20
  • Maand-Dag-Jaar, bijvoorbeeld 4-20-2014 of 4-20-14
  • Kwartalen, bijvoorbeeld 1e kwartaal 2012, kwartaal 1 2012, 2012 kwartaal 1, 2012 1e kwartaal, q1 2012 of 2012 q1
  • Weken, bijvoorbeeld wk 9 2014

Zo koppel je een Google Spreadsheet aan een Nieuwskaart

Op deze manier kun je eenvoudig een Google Spreadsheet koppelen aan een Nieuwskaart een datapunten toevoegen of aanpassen. De kaart is realtime gekoppeld aan de spreadsheet, dus aanpassingen worden (vrijwel) meteen doorgevoerd.

Volg onderstaande stappen om dit zelf te doen:

  • Upload of maak je spreadsheet met lengte- en breedtegraden in Google Spreadsheets

Nog geen lengte- en breedtegraden en heb je plaatsen of adressen in Nederland? Gebruik dan de LocalFocus Geocoder

 

  • Ga naar “Bestand” en selecteer “Publiceren op internet

 

 

  • Klik vervolgens op “Publiceren”. Zorg dat je de instellingen op “Heel document” en “Webpagina” laat staan

 

 

  • Kopieer de geselecteerde link in onderstaande balk

 

 

  • Maak een nieuwe Nieuwskaart in LocalFocus en kies bij “Haal meerdere punten op dataset” het type kaart dat jij wilt maken.

 

  • Kies bij “Hoe wil jij de dataset invoeren?” voor “Google Drive Sheet” en plak de link in het vlak

 

En voila! De spreadsheet is nu gekoppeld aan de kaart en je kunt deze nu verder gaan stijlen in LocalFocus. Zodra je wijzigingen aanbrengt in je spreadsheet of punten toevoegt, worden deze vrijwel automatisch aangepast of toegevoegd.

Update LocalFocus: nieuwe functies!

We hebben een update doorgevoerd met nieuwe functies!

Liggende staafgrafiek groeperen of stapelen

We kregen van veel gebruikers deze wens door en vanaf nu kan het! Liggende staafgrafieken groeperen of stapelen.

 

 

Klik en bewerk

Als je in het tabje Creëren bent, kan je elementen van de visualisatie direct bewerken. Op dit moment zijn nog niet alle elementen aanklikbaar, maar we zullen dit steeds verder uitbreiden.

 

Dus je wilt honderden adressen op een kaart zetten?

Wij ook! De redactie van LocalFocus krijgt regelmatig spreadsheets met honderden, of zelfs duizenden, adressen. Hoe krijg je die snel op een kaart? Probeer dan eens onze eigen nieuwe geocoder voor Nederlandse adressen:

geocode.localfocus.nl

Knip en plak jouw adressen uit een spreadsheet en go! Als de adressen zijn omgezet naar geografische coordinaten, kan je deze op een kaart plaatsen met bijvoorbeeld de Nieuwskaart-functie van LocalFocus.

De geocoder draait op servers van LocalFocus en er zit geen rem op de snelheid. Het is een experiment, dus we horen graag hoe we deze tool kunnen verbeteren.