Nicar 2016
25 maj 2015
I helgen ägde världens största datajournalistikkonferens Nicar rum i Denver, i regi av IRE (den amerikanska föreningen för grävande journalister). Vi var där, och här är vad vi tar med oss hem.
Först, för dig som vill ha allt:
Och så för dig som vill ha lite mindre:
Känsla: Optimism
Anslagstavlan med lediga jobb var överfull på Nicar, och det var symptomatiskt för stämningen. Datajournalistikvärlden bubblar av framtidsoptimism, och sessionerna hade namn som ”Right is the new Cool”.
Trend: Språkanalys
Natural language processing i olika former. Maskin-lärning i ställer för regler för textanalys. Ett verktyg som imponerade var Parserator https://github.com/datamade/parserator, som gör det möjligt för oss vanliga dödliga att bygga egna, självlärande algoritmer, för att förstå saker som t.ex. svenskspråkiga datum eller polska namn.
Kan du lite Python och vill veta mer om hur maskinlärning går till i praktiken? Då ska du ägna en timme åt Chase Davis introduktion här: https://github.com/cjdd3b/nicar2016/tree/master/machine-learning
Verktyg
En tillämpning av Parserator (se ovan): DocumentParserator, som tolkar texter from DocumentCloud.
https://github.com/AbeHandler/DocumentParserator
Overview är inget nytt verktyg, men det nämndes gång efter annan. Med det kan du automatiskt tagga upp och organisera stora mängder (engelskspråkiga) textdokument.
https://www.overviewdocs.com/help
Aldrig mer en VLOOKUP! Trött på att gång på gång översätta kommunkoder till kommunnamn, kommuner till län, länder till regioner, etc, etc? Här är ett försök att automatisera det jobbet. En samling vanliga översättningar för lookup-behov, med tillhörande Pythonbibliotek
https://github.com/wireservice/lookup
https://github.com/wireservice/agate-lookup
LIWC | Det här är kanske mindre användbart i praktiken, men väldigt spännande: Ett verktyg för att se om texter är statistiskt otypiska. Det skulle kunna tyda på att den som skrivit texten, ljuger, eller är upprörd, eller något annat du vill försöka fånga.
http://www.liwc.net/tryonline.php
Tutorials
En bra introduktion till hur du kan använda Twitterklienten t (den heter så, t) för kommandotolken, för att snabbt och enkelt stoppa in tweets i ett Excelark.
https://gist.github.com/dannguyen/7c592c4559ee64f753e5
Lär dig bygga interaktiva VR-presentationer med Javascript: https://github.com/datadesk/vr-interactives-three-js
Sugen på att bygga en Twitter-bot? Här är länkarna för att komma igång:
https://github.com/thomaswilburn/nicar-twitter-bot
Introduktion till satellitbilder som datakälla: http://shaw.al.s3.amazonaws.com/nicar16/nicar16-space.pdf
Metod
Upprepningsbarhet | Idén här är att dina läsare alltid ska kunna upprepa din metod. Just den här metodmallen är gjord för R, men kan förstås översättas till de verktyg ni använder på din redaktion.
https://github.com/grssnbchr/rddj-reproducibility-workflow
Best practises i datavisualisering:
Interaktivitet
Datajournalistikikonen Gregor Aisch höll ett passionerat tal för en uppgraderad definition av interaktivitet. Att trycka åp en knapp är inte interaktivitet. Människor kan göra så mycket mer; tala, skriva, etc. Här är hans presentation, med ett par exempel.
http://slides.com/drivenbydata/nicar16#/22
|