söndag 21 februari 2016

Medier och format - en illustration

Jag tänker spinna lite vidare på gårdagens reflektioner kring semantik och digital humaniora. Eller genom ett exempel visa hur informationsvetenskap och det digitala som medium tvingar en till reflektion, och vad den reflektionen går ut på.

Jag fick i veckan skäl att göra en snabb genomgång av "olika typer av innehåll". Det är ibland viktigt då man söker material i databaser och på webben att kunna sortera ut eller specificera vad man är ute efter: söker man bilder eller artiklar eller vill man kan kanske ha en 3D-modell av något? För att det hela ska fungera har man ganska länge i digitala sammanhang använt Dublin Core-standarden som erbjuder följande typer av innehåll:

  • samling
  • dataset
  • händelse (t ex en konferens eller utställning)
  • bild (även "fysiska" bilder såsom tavlor eller teckningar)
  • interaktiva resurser (t ex webbsajter eller spel)
  • rörlig bild (underkategori till bild, video, tv-program etc)
  • fysiskt objekt (observera inte deras digitala representationer, som ska sättas i andra kategorier)
  • tjänst (webbservers, fjärrlånstjänster osv)
  • programvara
  • ljud (material avsett att avlyssnas, t ex en cd-skiva)
  • stillbild (underkategori till bild, hit räknas inte bilder av text, som är text)
  • text (böcker, brev etc)

I biblioteken har man sedan urminnes tider ägnat sig åt att beskriva och katalogisera saker för att kunna hitta vad man behöver. Enligt min uppfattning råder här ändå en sammanblandning mellan olika typer av innehåll. I bakgrunden finns förvirringen som orsakas av frågan hur man borde klassificera eller förstå de digitala formaten. Att förteckningen har ett ursprung i biblioteksvärlden ser man ganska tydligt. Numera skiljer man i biblioteksstandarden tydligare på mediet och innehållstypen, men lösningen är fortfarande inte helt självklar eller intuitiv åtminstone för mig: talar man om fysiska format, tekniska format eller de sinnen eller referensramar (teckensystem eller språk) som används för att förmedla information eller en erfarenhet? Sedan några år tillbaka finns nu i bibliotekskatalogerna två olika typer av klassificeringar: typ av innehåll och typ av medium. Då avser man med innehåll det senare, alltså innehållets kodning (som typer finns bl a tal, framförd musik eller noter, data, rörelse t ex dans, föremål) och det senare beskriver närmast vilken typ av teknik man behöver för att kunna ta del av innehållet (projiceras, video (DVD, VHS etc), mikrofilm, audio etc). Personligen har jag mycket svårt att förstå denna kategorisering av "medietyper". Man har enligt mig blandat ihop teknik och innehållets kod/språk på ett olyckligt sätt.

Pudelns kärna är enligt mig att det förutom hårdvaran är mjukvaran som idag definierar mediet, det berättar för oss vilket språk meddelandet använder sig av. Man har också på sätt och vis varit på rätt spår då man i många fall hänvisar till användning av så kallade MIME-types, där man kopplat ihop rent tekniska filformat med medietyper. I praktiken innebär detta att man i många standarder kräver användning av ett traditionellt internetregister, där vem som helst kan registrera ett filformat. I praktiken är de relevanta medietyperna då programvara, ljud, bild, meddelande, modell, flerdelad, text och video. Till exempel anses pdf-filer vara programvara enligt detta och många databasdumpar är förstås bara text. Så ni förstår att ur användarperspektiv är inte dessa kategorier särdeles behjälpliga.

Under mina efterforskningar hittade jag ändå en ganska bra klassificering, tycker jag, i den klassificering av filformat som gjorts för långsiktigt bevarande, PRONOM:


  • Sammansatt
  • Ljud
  • Databas
  • Dataset
  • E-post
  • Geodata
  • Rasterbild
  • Vektorbild
  • Modell
  • Sidbeskrivning (pdf)
  • Presentation
  • Kalkylfil
  • Annoterad text
  • Strukturerad text
  • Ostrukturerad text
  • Video
  • Textbehandlingsprogam (fil ur/för)

Jag tycker denna lista ganska väl motsvarar olika typer av medier i dag och också korrelerar på ett förhållandevis vettigt sätt med innehållets "språk".

Med medium avses "det som förmedlar", som ligger emellan avsändare och mottagare. Man kan så se till det fysiska materialet, vilket man gör i it-branschen. Man talar om lagringsmedium; bevaras informationen på ett magnetband, en hårdskiva eller kanske på en CD-skiva. Då de fysiska medierna föråldras kan man migrera samma data till ett annan medium, ofta utan att man behöver ändra på innehållet alls. Men om man är tvungen att göra det eller konvertera data från ett filformat till ett annat talar man i stället om formatmigration. Filformaten är också avgörande då vi ska ta del av innehållet. Vi behöver en mjukvara som kan presentera filens innehåll för oss. Själva innehållet kan sedan beskrivas och kategoriseras på många olika sätt: vilka sinnen använder vi eller vilka språk och kodsystem används.


Audio, ljud, musik, framförd musik eller LP-skiva? Vad avser vi med typ av innehåll?
Av Lombana (Eget arbete) CC BY-SA 4.0  via Wikimedia Commons


Det digitala har helt enkelt ställt till det för oss. Om det vi söker finns i en tryckt bok eller i en e-bok är bara en liten del av det vi behöver veta, beskriva och koda. Och ofta är det inte så stor skillnad bara vi kan ta del av innehållet på ett smidigt sätt. Men för att kunna göra det, behöver man fundera på just semantiken. Och jag menar alltså, att om man inte kan analysera dessa saker tillräckligt kritiskt, gör man inte digital humaniora eller ens anpassad forskning. På så sätt går moderna informationsvetenskap och studier i nya medier eller digital kultur faktiskt in i varandra.

Inga kommentarer:

Skicka en kommentar