De Circulaire #115: de gestructureerde editie ⛓
Verzonden: 01-06-2020
Waarom staan er geen plaatjes op deze pagina?Hallo! Het is maandag 1 juni, tweede Pinksterdag (geen idee wat dat voor betekenis heeft), we mogen eindelijk weer het terras op (ik zit op de bank) en ons helemaal doodzuipen (ik drink water en misschien een half flesje Cola Zero bij de avondmaaltijd). Gelukkig zijn er ook dingen waar u geen anderhalve meter afstand voor hoeft te houden: deze Circulaire mag u zo dicht bij uw gezicht houden als u wilt (wel bij voorkeur met een niet-medisch mondkapje). Én er is een speciale pubquizbingo omdat deze nieuwsbrief bijna vijf jaar bestaat (maar dan moet u eerst even alles lezen in deze editie).
Veel plezier!
Gestructureerd zoeken
Zoals u wellicht weet doe ik wel eens wat met Wikipedia en aanverwante projecten. Zoals bijvoorbeeld Wikimedia Commons , de centrale mediabank van alle Wikimedia-projecten (zoals Wikipedia). Op Commons zijn inmiddels meer dan 60 miljoen foto's en andere mediabestanden te vinden. Allemaal te gebruiken onder een vrije licentie of zelfs helemaal zonder licentie. Oftewel: gratis en voor niks, vaak wel onder de voorwaarde dat je de auteur vermeldt.
Het zoeken op Commons gaat echter helaas niet altijd even makkelijk. Dat heeft te maken met twee dingen: de metadata van de bestanden is vaak gebrekkig én de zoekinterface is nogal...basaal.
De metadata is gebrekkig omdat woorden in een beschrijving vaak meerdere dingen kunnen betekenen. Een kiwi is bijvoorbeeld zowel een vrucht als een vogel . En die beschrijvingen zijn meestal beschikbaar in slechts één taal. Als je die taal dan niet machtig bent is het lastig zoeken: niet iedereen spreekt Engels, en niet alle beschrijvingen worden gegeven in het Engels.
Maar voor dit probleem is een oplossing bedacht: Structured Data . Je kan mediabestanden beschrijven met behulp van de items op Wikidata . Omdat die items een uniek nummer hebben is er geen verwarring over woorden ('kiwi de vrucht' en 'kiwi de vogel' hebben een apart nummer). Én die items zijn meertalig, dus je bent niet gebonden aan één taal.
Dan is er het tweede probleem: die basale zoekinterface. De standaard zoekmachine toont een hoop informatie die voor de meeste gebruikers weinig nut heeft (zoals bestandsgrootte en resolutie). En de manier om te zoeken op gestructureerde data is weinig gebruiksvriendelijk.
Maar daar heb ik een oplossing voor bedacht: Structured Search . Een nieuwe zoekinterface voor Wikimedia Commons die de afbeeldingen centraal zet, en zo is gemaakt om goed te kunnen zoeken met structured data. Dus je kunt bijvoorbeeld makkelijk zoeken op zowel kiwi's (de vrucht) als op kiwi's (de vogel). Mijn tool is meertalig, en vrijwilligers hebben al vertalingen voor de interface aangeleverd in 11 talen, waaronder het Nederlands (ok, dat was ik zelf), het Italiaans ( Ricerca strutturata ) en zelfs in het Japans ( 構造化サーチ ).
Er zijn soms nog wat weinig resultaten. Nog lang niet alle mediabestanden op Commons hebben gestructureerde data (we zitten nu rond de 4%), maar dat is een kwestie van tijd en veel (vrijwillig) werk.
Mediadieet
Wat ik de afgelopen weken keek en luisterde.
-
🌝 De Man en de Maan . Achtdelige podcast over Nederlandse wetenschappers die een radiotelescoop bouwen voor áchter de maan. Ze mogen meeliften op een Chinese satelliet. Je zou denken dat dit een hele nerdy wetenschapspodcast is. Maar het gaat vooral over de culturele verschillen tussen Nederland en China, en hoe dat leidt tot enorme communciatieproblemen en politieke intriges op hoog ambtelijk niveau. Zeer onderhoudend en vlot verteld door maker Saar Slegers, mede dankzij de hoofdpersoon: de sterrenkundige Mark Klein Wolt, die altijd doorgaat in situaties waarin ieder ander het al lang had opgegeven. (★★★★)
-
🤑 The Missing Cryptoqueen . Nóg een achtdelige podcast (ik luisterde de eerste vijf delen), over de Bulgaarse Dr. Ruja Ignatova die een cryptocurrency bedacht waar miljoenen mensen in gingen investeren. Ignatova verdween met de noorderzon: de cryptomunt bleek een piramidespel. Interssant onderwerp, maar ik mis focus en redactie in deze podcast. Veel informatie wordt eindeloos vaak herhaald en is te fragmentarisch opgenomen. Ook is het af en toe op het prekerige af (ik begrijp na vijf afleveringen wel dat Ignatova een boef is). Een goede eindredacteur had dit tot vijf afleveringen van een half uur kunnen reduceren. (★★☆☆)
-
⛹🏿♂️ The Last Dance . Tiendelige Netflix-docu over het laatste seizoen van Michael Jordan voor de Chicago Bulls, en hoe ze daar kwamen. Prachtig geschoten, met medewerking van vrijwel alle sleutelfiguren uit die periode en uitgebreide archiefbeelden. Zelfs leuk als je geen bijzondere interesse hebt in basketball (hoi). Enige minpuntje: het heen en weer springen in de tijd tussen de verschillende jaren is af en toe wat verwarrend. (★★★★)
Rare tijden
Het zijn rare tijden. En daarom heb ik een nutteloze Chrome extensie gemaakt die dat stomme zinnetje automatisch voor ELK artikel zet op de grootste Nederlandse nieuwssites.
En als je nog niet genoeg hebt van rare tijden tipte Marc me nog deze video die laat zien dat alle corona-reclama's hetzelfde zijn .
15 linkjes
-
Toffe illustraties: Japan by Car . (via Dense Discovery )
-
Kunstenaar Michael Landy had 7.277 bezittingen. In 2001 maakte hij er kunst van. Door alles systematisch te vernietigen . (via Siebrand)
-
Hoe weet je wie je publiek is? Dat is een belangrijke vraag voor mediabedrijven. Matt Locke schreef er zinnige dingen over .
-
Wat is het verhaal achter curieuze pophits als "Toppertje", "Busje komt zo" en "Hakke & Zage"? 3voor12 heeft er een hele leuke serie over . (via 82% )
-
Elke minuut komt er 500 uur video bij op YouTube. Het meeste daarvan ziet niemand. Daarom toont astronaut.io je fragmenten van video's die bijna niemand ziet . (via Menno)
-
Op zijn 22ste stopte Marcus Hutchins eigenhandig de Wannacry-cyberaanval. Een paar maanden later werd hij gearresteerd door de FBI op verdenking van het schrijven van malware . Nu doet hij voor het eerst zijn hele verhaal in Wired .
-
Kevin Kelly (die Wired mede hielp oprichten) werd 68 en schreef daarom 68 adviezen voor de jeugd .
-
The Atlantic beschrijft hoe Trump in vier jaar de ambtenarij kapot maakte en de overheid bestuurt als een maffiabaas . Ik weet het, leuk zijn die gigantische Trump-longreads niet (volgens mijn statistieken klikt er bijna niemand op), maar belangrijk is het wel. Wil je ook graag dagelijks op de hoogte worden gehouden van de transformatie van de Verenigde Staten in een fascistische dictatuur (sadomasochisme is mij niet vreemd)? Dan kan ik je van harte aanraden om je te abonneren op Dave Pell's uitstekende nieuwsbrief: NextDraft .
-
Nu we het toch hebben over pathologische leugenaars: wat moeten media doen met leugens die te nieuwswaardig zijn om niét over te schrijven? Stop het als beleg in een waarheidsboterham.
-
John Gardner over hoe je jezelf kunt vernieuwen (1990).
-
Alle soorten Zoom-deelnemers geïllustreerd met katten . (via Pim)
-
Hoera, je kunt jezelf nu eindelijk beschermen tegen 5G-straling met een USB-stick van 315 euro. Hoe werkt zo'n ding eigenlijk? Heel verrassend: niet .
-
Krijg je vim (een teksteditor) niet afgesloten? Dan is daar nu ook een superhandig snufje voor .
-
Een video van 25 minuten met een man die een bijzondere sudoku oplost. En ja, dat is echt 25 minuten onderhoudend .
-
Hoe kun je nou én je stories bijhouden én afstand houden als je op straat loopt? Met een anderhalvemeter-Instagramfilter natuurlijk . (via Halfvet )
3 gifjes
Zoals elke keer weer fantastisch gecureerd door de superlieve Lotte Belice!
Deze kat heeft wat met kersen.
Deze alpaca heeft niets met een nieuw vriendje dat zich niet normaal gedraagt.
En dit schaap is gewoon lekker zichzelf en staat graag in de spotlights.
Dat was het!
Over twee weken is het maandag 15 juni, en dan verschijnt behalve deze nieuwsbrief ook de nieuwe, 37-jarige editie van uw hoofdredacteur want dan ben ik 🎉jarig🎉.
Een dag later, op dinsdag 16 juni, is het precies vijf jaar geleden dat de allereerste Circulaire verscheen (time flies when you're writing newsletters). Om dat te vieren organiseer ik dan de allereerste Circulaire pubquizbingo. In de vorige editie al aangekondigd, en toen schreven zich opeens 15 mensen in, dus nu ben ik bang dat ik het ook echt moet organiseren.
Inschrijven voor de pubquizbingo is simpel: u stuurt een reply op deze nieuwsbrief en geeft aan dat u wilt meedoen. We beginnen om 19.30. Pubquizbingokaarten en verdere instructies verschijnen automatisch in uw mailbox. U mag meedoen met een team, maar dan moet u de geweldige prijzen wel delen met uw teamgenoten. Als u zich al heeft ingeschreven bij de vorige nieuwsbrief hoeft u dat niet nogmaals te doen: op die manier maakt u geen extra kans op de geweldige prijzen.
Tot over twee weken!