Gaat metadata helpen? Stel: u wilt in uw organisatie beter samenwerken door informatie beter beschikbaar te maken en te delen in een cloudsysteem. Bv. Sharepoint of Google Sites. Op dit moment staat al uw informatie op servers in conventionele filesystemen met de naam C-schijf en L-schijf etc. Deze zijn ingedeeld op basis van een hiërarchische directorystructuur met onderliggende mappen (taxonomie). Het nadeel hiervan is dat deze structuren te star zijn van opzet omdat zij 1-dimensionaal zijn. Bovendien is informatie in een hiërarchische structuur lastig te terug te vinden.
Documentmanagement systeem
Beter geschikt is een documentmanagement systeem waar we werken met bibliotheken waar we multidimensionaal (zoals het kijken naar de facetten van een diamant) in kunnen zoeken. Na een gedegen voorbereiding kiest u voor een documentmanagement systeem en migreert u uw informatie van het filesysteem naar het documentmanagement systeem. Hierbij besluit u om de hiërarchische structuur te vervangen voor een ‘platte’ structuur op basis van bibliotheken zonder mappen. De uitdagingen waar u dan voor staat zijn dat informatie:
- makkelijk moet zijn op te slaan
- voor iedereen snel terug te vinden moet zijn
- doorbladerbaar (browsen) moet zijn op kernwoorden/metadata
Het systeem moet goed en snel doorzoekbaar zijn. Het nadeel van een zoekmachine is dat deze meestal (te) veel hits op uw kernwoorden teruggeeft. Daarom besluit u om metadata (tags, ofwel trefwoorden) toe te voegen in combinatie met bibliotheken. De gedachte is hierbij om het aantal hits te reduceren door op de juiste trefwoorden/metadata te zoeken. We schuiven dan op van taxonomie naar folksonomie. Folksonomie is de ordening van data op basis van consensus door het ‘volk’, (de gebruikers van het systeem) op basis van metadata.
Metadateren
Bij het creëren van nieuwe informatie laten we de maker van het bestand trefwoorden toevoegen.(bookmarken) Bijvoorbeeld: We forceren dat de maker trefwoorden toevoegt waarbij deze kiest uit een vooraf bepaalde set van trefwoorden. Dit kent een aantal nadelen:
- de lijst van trefwoorden mag niet te lang zijn omdat het anders te omslachtig wordt om te kiezen
- de lijst van trefwoorden blijkt nooit dekkend te zijn, tenzij het een organisatie betreft waar alle data in een bepaalde work-flow uitermate gestructureerd is
- gebruikers raken gefrustreerd: de praktijk leert dat dit al snel tot vervuiling van het systeem leidt omdat na een paar maanden het eerste trefwoord uit de lijst het meeste voorkomt. Simpelweg omdat gebruikers het te omslachtig vinden om elke keer de in hun ogen nooit dekkende lijst van trefwoorden te doorlopen. Of, erger, gebruikers gaan het documentmanagement systeem omzeilen en uitwijken naar USB-memorysticks of Dropboxachtige oplossingen.
- dit geldt uitsluitend voor nieuwe informatie. Waarschijnlijk heeft uw organisatie al jarenlang informatie opgebouwd met bestanden die nooit gemetadateerd zijn. Deze data wordt wel naar het nieuwe documentmanagement systeem gemigreerd. Hoe lang gaat het dan duren voordat metadatering vruchten af gaat werpen?
Een beter alternatief is het toekennen van metadata zo veel mogelijk te automatiseren (ook van historische data) en het toekennen vrij te laten. Als hulpmiddel kan bij het intypen van een trefwoord een match worden gemaakt met al eerder gebruikte trefwoorden. Op deze wijze wordt er een zelflerende lijst van trefwoorden opgebouwd door gebruikers i.p.v. door beheerders. Het documentmanagement systeem moet dit uiteraard wel ingebouwd hebben. Daarnaast is het hebben van een zogenaamde full-text zoekmachine een must. Deze indexeert tevens de inhoud van documenten.
Gefacetteerd zoeken
Maar hoe vinden gebruikers dan informatie terug als zij vooraf niet bekend zijn met een ‘vaste’ lijst van trefwoorden?Dit kan als het zoekmechanisme op basis van meest gebruikte trefwoorden automatisch filters aanmaakt waaruit de gebruiker kan kiezen. Het motto hierbij is: filter bij de uitgang, niet bij de ingang. Dit heet gefacetteerde indexering. Informatie wordt hierbij vooraf al vanuit verschillende ‘facetten’ bekeken. (Zoals de verschillende facetten van een diamant). Een platform wat al deze functies in zich heeft is Apache Solr, een open source enterprise search platform wat ook ingezet wordt voor webshops en data mining toepassingen.
Kortom de weg naar beter samenwerken in de cloud kent vele functionele en technische uitdagingen. Los van het feit dat een systeem er niet voor gaat zorgen dat u beter gaat samenwerken. Een systeem is geen randvoorwaarde. Samenwerken is in de basis een cultuurvraagstuk. Een systeem is slechts ondersteunend .