En nod att stilla bedja omav Mats DahlströmAbstractTo electronically publish master theses at universities and colleges through the Internet, is not simply a matter of digitising the theses and putting them online. A great many issues have to be addressed in the process: What format do we choose for the files? Do we mark up the texts, according to some SGML-DTD, or do we prefer a page-description format such as PDF? Does it matter? A basic question is: What do we regard as the primary record to be digitised and distributed on the Internet? The printout-thesis on paper, to which the digitised version has to be "true" - or the digital, word-processed working material? At the end of the day, the result will probably turn out to be a compromise between, on the one hand, the promises of current and future technologies and, on the other, practical concerns such as labour resources, economy and competence. Innehåll6. Uppmärkning eller sidbeskrivning: "SGML is for structure, PDF is for pages" 8. PDF - "Printa ut den Djävla Filen" 9. Maktfrågor och andra diskussioner 10. För krångligt eller för lätt? 12. Förvaltandet av papperets signaler 13. Homogena eller heterogena dokumentsamlingar? 15. Avvikelser från den rätta vägen 17. Endera eller kanske bådadera? 18. En nod att stilla bedja om 1. InledningI den artikel jag skrev till Human IT:s första nummer (1/1997) lämnade jag en tråd på slutet, hängande löst. En tråd som kunde leda vidare till frågor om kodning och format. Jag har nu haft anledning att knyta an till tråden igen: frågor om formatval. Jag började skriva den här artikeln därför att jag var orolig och förbannad. Förbannad därför att universitet och högskolor verkade föredra en kastrerad form för publicering, en impotent och stympad textform. Orolig för läsarens framtida maktmöjligheter i förhållande till den facklitterära texten. Snart mildrades min ilska. Jag hade dragit förhastade slutsatser. Som så ofta händer, nyanserades problemställningen ganska snart när jag väl börjat luta mig tillbaka och fundera lite mer. Saker och ting var förstås inte så enkla som jag först inbillat mig. Jag hade stämplat SGML som dynamiskt och elastiskt, medan PDF var statiskt och låst, samtidigt som å andra sidan Men jag går tankarna i förväg. Jag skall förklara vad jag menar. (Åter till början av artikeln) 2. Nya vägar för litteraturenSkolorna datoriseras. Våra medier digitaliseras. Alltmer börjar elektronisk publicering bli ett seriöst alternativ till papper för högskolorna och universiteten att distribuera sina textuella produkter på. Internet och webben framstår alltmer som en litteraturens aktör att räkna med på allvar. Skall pappersboken försvinna? Frågor av ett sådant mer svepande slag verkar hemsöka många debattörer, akademiker och yrkesmänniskor i det offentliga samtalet. De försök till svar som ges är sällan särskilt konstruktiva och analytiska eller deskriptiva försök att beskriva ett faktiskt skeende, utan tycks, i min mening, ofta snarare fylla en antingen teknofobiskt eller teknofilt terapeutisk funktion och härrör inte sällan ur förändringsångest, förändringsiver eller mediechauvinism 2. Jag vill i det här sammanhanget dock lämna de mer övergripande diskussionerna om vilka makroeffekter den pågående digitaliseringen får när det gäller samhällsinformation och litteraturdistribution i stor skala, samt också undvika den dikotomi 3 och motsatsställning som alltför ofta görs mellan pappersburna medier kontra digitalt lagrande elektroniska medier 4. Det förefaller mig, att diskussionen behöver både fördjupas och nyanseras. Låt oss i stället betrakta ett snävare distributionssystem, där diskussioner just nu förs över hela landet om lämpliga och olämpliga former för litteraturdistribution och -presentation. Kanske kan vi i en sådan mer lätthanterlig kontext försöka hitta några belysande problem och frågeställningar, som kan fungera som en plattform för vidare diskussioner om digitaliseringens effekter. Jag tänker då på de akademiska institutionerna och publiceringsformer för dessas textuella produktion, i första hand då grundutbildningens magisteruppsatser. Ett sådant exempel kan i förstone tyckas behandla en beslutsfråga som bara är relevant för några få personalgrupper inom en sluten administrativ högskolekrets, men processen rör fler aktörer än så - dokumentproducenter som studenter och forskare, intermediärer som bibliotek och i slutändan dokumentkonsumenter: studenter, lärare, forskare, bibliotek och intresserade läsare över huvud taget. Diskussioner av den här typen kan också erbjuda Human IT:s läsare en nyfikenhet på problem av mer generell karaktär: Vilka modeller börjar användas för dokumentdistribution över Internet? I vilken form kommer vi att kunna ta del av vetenskapligt material? I vilken grad kommer vi att kunna utnyttja den digitala ord och textbehandlingens fördelar? Vilka möjligheter underlättas respektive försvåras med olika typer av format? (Åter till början av artikeln) 3. Digitala magisteruppsatserOckså de akademiska institutionerna och biblioteken står, som bekant, inför en omfattande "digitalisering" inte när det gäller de enskilda studenternas och forskarnas arbetsverktyg för textproduktion 5, utan när det gäller former för publicering och distribution av dessa texter. Från centralt håll (inte minst från vår f.d. utbildningsminister Carl Tham) har vid flera tillfällen fördelarna framhållits med en övergång från papper till digitala former för distribution av exempelvis studenters magisteruppsatser, vetenskapliga rapporter, licentiatuppsatser och doktorsavhandlingar. Sådan övergång har länge efterlysts av forskare 6, och börjar nu bli allt mer aktuell. Högskolorna och universiteten kan numera således välja att tillgängliggöra studenternas magisteruppsatser i pappersform, digitalt eller via båda sätten parallellt. Papper har som bekant hittills varit det förhärskande medievalet. I arbetsprocessen knådar visserligen studenterna huvudsakligen en digital uppsatsdeg, men denna process har än så länge huvudsakligen haft en "analog" pappersprodukt som slutmål. Vid ett slutseminarium behandlas en pappersutskrift av det digitala arbetsmaterialet. Efter seminariet införs eventuella ändringar och korrektioner, och en ny pappersutskrift görs av den modifierade produkten. Denna ytterligare slutprodukt på papper har hittills varit den som arkiveras, pliktlevereras, kopieras samt i några fall också köps. Den digitala arbetsversionen har, när den s.a.s. har tjänat sitt syfte, kunnat raderas 7. Med andra ord är det en på papper utskriven version av det digitala materialet som tilldelas status av original eller primärdokument 8, medan den digitala versionen tilldelats en sekundär status. Digital distribution börjar nu bli en allt vanligare form för tillhandahållande av den här typen av texter. Bland uppgivna orsaker kan nämnas: minskade tryckkostnader; behovet av och kostnaderna för lagringsutrymme minskar; upplagor efterfrågeanpassas och behöver heller i princip aldrig ta slut; omedelbar elektronisk leverans vid beställning; ständigt flytt-, sök- och redigerbart material. Inte sällan börjar vi hantera dokument som endast förekommer i digital version, och som aldrig får avledare i form av pappersutskrivna versioner. Med Johan Svedjedals ord börjar vi här övergå till en miljö, där (den t.o.m. eventuella) pappersprodukten blir en utprodukt i stället för en slutprodukt (Svedjedal, 1997, s.344). En tanke bakom digitaliseringen av den textdistributiva processen är ju att den inte överflödiggör pappersversionen som sådan, men att den inrymmer pappersversionen som ett bland flera möjliga presentationsalternativ. (Åter till början av artikeln) 4. VägvalI denna distributionsförändring nödgas universitet och högskolor förhålla sig till ett antal vägval, exempelvis i vilken form och via vilka medietyper distributionen skall ske, hur man tänker sig behålla upphovsrättslig och ekonomisk kontroll över materialet, och inte minst: Skall texternas format, struktur och utseende standardiseras 9? I så fall, vilket formatval kan, bör och skall göras? Spelar detta någon roll? Är det viktigt i vilket format studenternas texter distribueras? Jag hävdar att det kan spela en ansenlig roll. Att exempelvis villkora själva läsningen av och deltagandet i texterna till en särskild, kommersiell programvara, kan på sikt visa sig vara ödesdigert. Donald Broady drar en mediehistorisk parallell (1995, s.90):
Ett sådant vägval och eventuell förändring av medie- och formatval för lagring, presentation och distribution kan få avsevärda effekter. Dessa effekter kan analyseras på många olika sätt, och det är lätt att här se ett behov av framtida forskning inom skilda discipliner: En eller annan litteratursociolog skulle exempelvis kunna medge, att medieförändringar i distributionssystemet kan få djupgående konsekvenser för det facklitterära systemet. Utmanas kanske de traditionella kretsloppsmodeller som hittills använts för att illustrera exempelvis det facklitterära systemet? Kan diskussionen gagnas av att vi ersätter kanalmodeller och kretsloppsmodeller med exempelvis en nätverksmodell, bestående av knutpunkter, s.k. noder 10? Kanske har just materialitets- och kodningsaspekten inte belysts tillräckligt inom litteraturvetenskapen och -sociologin hittills 11? Ett enkelt frågeexempel kan räcka: vid digitalisering och webbdistribution av en pappersproducerad uppsats, skall de "webbreferenser", vilka i pappersversionen fungerat som implicita länkar, i den digitala versionen göras till explicita, direkta hypertextlänkar, emedan det ju tillåts av tekniken, eller skall man avstå från förändringar av den typen (vi är här återigen inne på frågan om versionernas "status")? Inom min egen biblioteks- och informationsvetenskapliga sfär inses lätt, att förändringarna avsevärt utmanar fenomen och begrepp som "lagring", "presentation" och "beskrivning" av dokumenten. En semiotiker skulle kunna undersöka hur i ett sådant sammanhang också själva det semiotiska systemet förändras, av vilket dessa publikationer är en del. Man kan exempelvis tänka sig en ett närmande av förändringseffekterna utifrån ett maktrelationellt perspektiv à la Michel Foucault mellan läsare/text/författare. Intressant är att se hur detta också sakta men säkert börjar uppmärksammas inom litteraturvetenskapen:
Vi kan slutligen också fundera på i vilken mån förändringar av typen digitalisering av dokument kan förstås och belysas genom filosofisktestetiska angreppssätt. Vad händer med koncepten "verk", "dokument", "text" 12, relationen original/kopia 13, manuskript/utgåva, primär och sekundär status hos olika verks(re)presentationer? De val av medieformer och verktyg för publicering och distribution som kommer att göras, vilka de nu än blir, kan analyseras som ett sätt att förhålla sig till text och som ett vittnesbörd om en generell textmediell attityd. Michael Sperberg-McQueen (1991) har uttryckt det kärnfullt, när det gäller kodning: en kodning av en text är en teori om denna text, och ett kodspråk (eller "märkschema") är en generell textteori, ett generellt sätt att förhålla sig till text. Analogt kan vi se ett principiellt val av format (såsom mellan sidbeskrivning och uppmärkning) som en utsaga om ett sätt att förhålla sig till textdistribution och publicering. (Åter till början av artikeln) 5. ÖnskemålJag nämnde ovan några föregivna orsaker till att digitalisering av den här typen av textdistribution börjar efterlysas: Det finns ekonomiskt-administrativa vinster att göra, hoppas man: utrymmeskrävande lager av upptryckta uppsatser kan slopas, kostnaderna för tryckning och leverans av dokumentet kan överlämnas på textkonsumenten, "upplagor" efterfrågeanpassas, texter är ögonblickligen och oupphörligen tillgängliga och levererbara, säkerhetskopior av dokumenten kan enkelt göras, den dokumentdistributiva processen kring etapp- och slutseminarier kan på sikt avsevärt förenklas och förbilligas, dokumentsamlingen kan sorteras och presenteras på olika sätt enligt olika behov och önskemål. Förhoppningar knyts också till det textprocessuella arbetet på individplan: uppsatser, delar av uppsatser (t.ex. nyckelord eller abstracts) och inte minst samlingar av uppsatser blir indexerbara och sökbara, uppsatser behöver inte vara svåråtkomliga därför att exemplaren är "utlånade", åtkomst sker omedelbart, jag kan som konsument arbeta med dokumentets text på ett annat sätt än när den är knuten till en pappersbärare. I åberopade fördelar av det här slaget kan man egentligen skönja en begynnande kravspecifikation på vad vi förväntar oss av ett system för digital dokumentdistribution av, i det här fallet, magisteruppsatser och vetenskapligt material över nätverk. Ett ofta påkallat önskemål är just att som individ kunna arbeta med en text, utöver att "bara" läsa den: klippa ut och flytta text, söka i text, ersätta (i) text, kopiera och citera, överföra text från en miljö till en annan och från ett utseende till ett annat, kommentera text, excerpera, extrahera, korsreferera via länkar etc. Nu finns det förstås en fascinerande uppsättning olikheter när det gäller att förhålla sig till en text 14, exempelvis: 1. Att läsa för förströelse 2. Att läsa för att bli road 3. Att läsa för att lära sig något 4. Att läsa för att förstå någonting bättre 5. Att kritiskt granska en text 6. Att bearbeta en text 7. Att omarbeta en text 8. Att använda sig av en text eller en del av en text, citera en text
I de olika sätten att läsa är vi mer eller mindre aktiva med att själva bidra till dokumentexemplarets text. Av alla punkter ovan vilken eller vilka uppfylls när vi tar del av studenters magisteruppsatser? Nummer 58, förslagsvis. Ofta också, lyckligen, nummer 34. Emellanåt också (ibland ofrilligen, får man väl säga) nummer 12. Men huvudsakligen närmar vi väl oss den typ av dokument som magisteruppsatser utgör, med syftena 58 ovan i bakhuvudet. Vi är med andra ord ofta ute efter att på ett eller annat sätt studera och arbeta med en text. Donald Broady har presenterat (1995) en preliminär lista över kriteriekrav på ett system för arbete med dokumentbaser, varur kan nämnas:
Nu är detta en svårligen tillfredsställd önskelista. Få (om ens något) standardiserade, allmänt tillgängliga system stöder alla dessa funktioner samtidigt. Hur är det då med de två tillvägagångssätt, som f.n. tycks vara de mest attraktiva när det gäller formatval för distribution av uppsatser? I aktuella diskussioner om standardiserat formatval dyker två alternativ ständigt upp: å ena sidan SGML och/eller HTML, och å andra sidan PDF. (Åter till början av artikeln) 6. Uppmärkning eller sidbeskrivning: "SGML is or structure, PDF is for pages"Det vägval som brukar åskådliggöras med alternativen SGML och PDF handlar egentligen om ett val mellan två väsensskilda metoder att digitalisera och distribuera text: vi kan lite generellt kalla dessa metoder för å ena sidan uppmärkning dvs. att strukturellt och innehållsligt märka upp ett dokument med koder ("taggar") och å andra sidan sidbeskrivning dvs att deklarera hur ett dokument skall se ut på en papperssida eller en bildskärm. (Åter till början av artikeln) 7. SGMLHär är inte platsen att ge en uttömmande introduktion till tekniken och filosofin bakom uppmärkning i allmänhet och SGML i synnerhet (se för detta ändamål Broady 15, Möller eller Cover). Några huvudtankar skall dock konstateras: SGML 16 (accepterad som en international standard 1986 ISO8879) definieras ibland slarvigt som ett kodspråk för texter. Riktigt så enkelt är det inte. SGML anger inte regler för hur man skall koda dokument. Snarare är SGML en "överenskommelse om en uppsättning regler för hur den som märkt ett dokument skall berätta för andra hur denna märkning gått till, en berättelse som är omedelbart läsbar för mottagaren (antingen denne är en människa eller en maskin)" (Broady, 1995, s. 101). "Döttrar" i familjen SGML, särskilda definitioner (DTD Document Type Definition), innehåller en uppsättning koder "taggar"), med vilka man skall märka, koda strukturella element i ett dokument. Vi lägger med koderna på sätt och vis på ett lager av metainformation, vilken vi i sin tur sedan kan bearbeta, strukturera, genomsöka och presentera på olika sätt för olika syften. Uppmärkningen kan vara oerhört komplex och mångfacetterad (såsom DTD:n TEI 17) eller betydligt mer simpel och rudimentär (såsom det för närvarande populära och välbekanta HTML 18). Med en avancerad DTD av SGML kan man relativt enkelt söka efter, extrahera och kompilera särskilda dokumentdelar som bibliografiska referenser, abstracts, författarnamn och titlar, citeringar, nyckelord etc. Finessen med SGML är att i ett plattformsoberoende format paketera struktur och innehåll, samtidigt som man överlämnar utseendet och presentationen av dokumentet i fråga till den enskilde läsaren (vanligtvis via ett presentations?lter av något slag, exempelvis ett Style Sheet). En intressant konsekvens av detta blir, att dokumentinnehållet och också delar av detta kan återanvändas 19 i olika miljöer, med olika sortering och presentation. Uppmärkning av ett dokument med en DTD av SGML handlar således huvudsakligen om struktur, och inte alls om utseende. Det är så att säga SGML:s raison detre. För att föregripa avsnittet om sidbeskrivning:
Tack vare att man i med ett sådant förfarande separerar dokumentets struktur och innehåll från dess presentation, är det förhållandevis lätt att flytta över informationen till andra miljöer: till nya uppmärkningsscheman och/eller nya standarder av dessa 20 (exempelvis till XML 21 och till olika specifikationer av HTML 22), till andra mediala former (t.ex. via punktskriftsplatta eller talsyntes), till en ordbehandlingsapplikation, till olika skärmpresentationer, till såväl enkla laserutskrifter som till mer avancerade utskrifter och fotosättningar m.m. Dokumentet blir elastiskt, om man så vill. (Åter till början av artikeln) 8. PDF "Printa ut den Djävla Filen"Formatet PDF 23, som på senare tid fått avsevärd spridning via Internet, är en biprodukt till PostScript (PS). PS är i sin tur ett exempel på hur man försökt lösa problemen kring sidbeskrivning i den grafiska världen, och utgör egentligen ett programmeringsspråk, inte ett format. Fördelar är att PS är maskinoberoende rent teoretiskt kan man skriva ut en PS-sida med identiskt utseende på olika typer av skrivare. Språket fungerar också oberoende av operativsystem Linde, 1997).Den grafiska bild- och modellhanteringen förbättras. Det finns, för vårt sammanhang, också en rad nackdelar med PS: de enskilda sidorna är inte självständiga och kan inte behandlas(skrivas ut etc.) som sådana vid behandling av dokumentet måste man ha tillgång till hela dokumentet; det är i praktiken omöjligt att söka i, redigera och indexera en PS-fil; filerna blir oerhört komplexa och utrymmeskrävande. För att delvis kunna erbjuda publiken en mer lätthanterlig sidbeskrivning, utvecklade företaget Adobe formatet PDF, som bygger på filosofin och tekniken 24 bakom PS 25. Den bakomliggande PS-filosofin lyser igenom, när fördelarna och syftena med PDF åberopas: möjlighet att distribuera, "publicera" och framför allt skriva ut digitaliserade dokument, där troheten mot det förmenta pappersoriginalet åstundas hett. Med PDF låser man dokumentet, på gott och ont, till ett visst presentationsutseende och stabiliserar layouten beständigt. Detta är ett viktigt skäl till att de publicister, som står i begrepp att flytta ena benet över till den digitala världen, och samtidigt ha ett ben kvar i den pappersproducerande, attraheras av PDF. Formatet blir över huvud taget intressant för alla typer av sammanhang, där bibehållande av en viss layout och typografi är väsentlig av olika anledningar, till exempel att den i ovanligt hög grad är betydelsebärande. Där uppmärkning såsom SGML intresserar sig för struktur och innehåll, syftar sidbeskrivning som PDF i första hand mot själva utseendet och presentationen av ett dokument: "SGML is for structure, PDF is for pages" (Kasdorf, 1998, ¶ 10). Såsom en följdprodukt av PS bibehåller PDF en del av dess egenskaper, egenskaper vi efter behov kan se som för- resp. nackdelar: konsekvent utseende, en layout och en presentation som både är tryggt stabil och samtidigt trogen ett förmodat digitaliserat original. Samtidigt är PDF-filer synnerligen besvärliga att söka i och redigera. Filerna är plattformsberoende till företaget Adobes särskilda programvaror. Formatet stödjer inte problemfritt metadata, indexering, hyperlänkar etc. Formatets tillfredsställande av frekventa önskemål om dokuments stabilitet medför sålunda både för- och nackdelar. (Åter till början av artikeln) 9. Maktfrågor och andra diskussionerLåt oss nu stanna upp ett slag. Jag är nämligen medveten om att jag, av mitt resonemang ovan att döma, tycks vilja propagera häftigt för SGML som svaret på frågan om formatval för magisteruppsatser. Men diskussionen behöver nyanseras. Valet mellan uppmärkning och sidbeskrivning är inte alldeles enkelt. Båda metoderna erbjuder för- och nackdelar, därför att de, svarande mot var sin attityd till dokument och text, tjänar olika syften. Låt oss bolla några fler för- och nackdelar fram och tillbaka! (Åter till början av artikeln) 10. För krångligt eller för lätt?Att implementera SGML i en dokumentproducerande organisation (såsom en högskola med dess forskare och studenter), är en tid-och kostsam process. Medvetande om och kunskaper i uppmärkning och SGML måste helst genomsyra hela den dokumentproducerande kedjan, från den skrivande studenten , över den intermediära administrationen och lärarkåren, till den dokumentdistribuerande institutionen, t.ex. högskolans bibliotek. Inom ramen för det s.k. DELFIN-projektet 26 har en undersökning företagits betr. just formatval (SGML eller PDF) för bl.a. studenters uppsatser, varvid just behovet av förändrad och fördjupad kompetens talar mot en SGML-lösning:
Utredarna drar därför slutsatsen:
Den här omständigheten går emellertid att vrida och vända på: SGML är avancerat och svårt att implementera, därför att det kräver hög kompetens, medan PDF är lättanvänt och enkelt, med en yta av "användarvänlighet". Samtidigt kan man konstatera, att SGML är en helt öppen standard, där källkoderna är direkt och synligt tillgängliga, medan PDF knyts till en visst låst standard. Det förs redan en diskussion när det gäller vilken nivå av ett dokument läsaren har tillgång till, och hur detta påverkar dennes eventuella makt i förhållande till dokumentet (och dess producent):
Också detta är en diskussion aktörer som universitet och högskolor bör följa med intresse. (Åter till början av artikeln) 11. Grafiska elementEtt bekant problem med SGML är också svårigheten att hantera grafiska element som illustrationer, diagram, tabeller och modeller, vilket PDF tvärtom kan hantera betydligt lättare. (Åter till början av artikeln) 12. Förvaltandet av papperets signalerEn omständighet, som brukar (se ex. Kasdorf, 1998) läggas till sidbeskrivningens minuskonto, är omöjligheten att identifiera och bearbeta strukturella element. Att de första tjugo raderna i andra stycket i en uppsatstext utgör dess engelskspråkiga abstract, är något sidbeskrivningsformatet inte har en aning om. Allt PDF "förstår", är att just det textstycket är (t.ex.) kursiverat, indraget och skrivet med teckensnittet Arial, storlek 10p. Det kan kanske lika gärna röra sig om ett intervjucitat. Eller ett litteraturcitat. PDF har ingen möjlighet att vare sig veta detta, eller för läsarens räkning bearbeta sådan metainformation, t.ex. genom att söka igenom och plocka ut alla abstractstycken ur en dokumentsamling. Det kan däremot SGML-märkta dokument(samlingar). Förutsatt, förstås, att man i koder talat om detta explicit Här ligger samtidigt en av svårigheterna med uppmärkningsmetoden: förutom att märkning av den typen av metadata kan vara tidsödande att åstadkomma, kan den också vara problematisk vissa element i de för oss (sedan många hundra år 28) mer eller mindre självklara typografiska konventionerna har blivit så till den grad självklara, att de faktiskt är kinkiga att medvetet identifiera, namnge och meddela uppmärkningssystemet (som ju naturligtvis inte alls har samma givna "förkunskaper"). (Åter till början av artikeln) 13. Homogena eller heterogena dokumentsamlingar?Ambitiösa och sofistikerade uppmärkningsmetoder som SGML tycks samtidigt lämpa sig väl för dokumentgrupper med stark homogenitet, där tydliga strukturella element återkommer i ungefär samma ordning från dokument till dokument. Magisteruppsatser utgör ett exempel på just den typen av dokument. Just konsekvens och uniformitet och anslutning till en överenskommen standard eller "formattering" är i själva verket ett av de kriterier som hårdast betonas i processen att via ett godkänt betyg välkomna uppsatsen in i den akademiska textuella produktionsvärlden 29. SGML tycks också utgöra en passande lösning för den typ av arkiv, ur vilket man önskar flera olika utproduktstyper, såsom pappersutskrifter, CDROM, webbdistribution m.m. (Åter till början av artikeln) 14. Lagring för framtidenInstitutioner som universitet och högskolor gör antagligen klokt i att inte för lång tid framåt låsa sina dokument till en viss kommersiell programvara, en viss standard, ett visst format. Utvecklingen när det gäller digitala dokument är häpnadsväckande snabb, och såväl nya format, nya programvaror, nya metoder för märkning och beskrivning samt nya versioner och specifikationer avlöser varandra med jämna mellanrum. Ett arkiv för dokument som magisteruppsatser bör byggas med inriktning på lagring för lång tid framåt, beständigt och acklimatiserbart till flera olika befintliga och kommande miljöer. Här bör vi därför trycka på det faktum att SGML är tillverkar och plattformsoberoende, men inte PDF. (Åter till början av artikeln) 15. Avvikelser från den rätta vägenI min karakteristik ovan av de två tillvägagångssätten hävdade jag, att uppmärkning till sin natur handlar om struktur, inte om utseende, medan sidbeskrivning tvärtom handlar om utseende, inte struktur. En följd av uppmärkningens natur är att SGML-märkta dokument lämpar sig väl för sökning, hyperlänkning, redigering och (om)strukturering. Sidbeskrivna dokument brukar å andra sidan klandras för att inte alls vara sökbara, lätt rediger- eller (om)strukturerbara samt sakna möjligheter till hypertextuella referenser. Detta skall vi erkänna är en sanning med modifikation! Det finns onekligen programvaror, med vilkas hjälp PostScript-filer i viss mån kan indexeras, sökas, redigeras och t.o.m. förses med en typ av hypertextuella länkar 31. Med andra ord är inte tudelningen de facto absolut svartvit. Av olika skäl och behov finns alltså områden,där uppmärkningsscheman (exempelvis HTML) integrerar presentationselement, samtidigt som PDF försetts med hjälpmedel för sådan metahantering av dokument som utgår från dokumentets struktur och form. I grunden ändrar detta dock inte den fundamentala skillnaden mellan de två angreppssätten, utan utgör snarare pragmatiskt motiverade avvikelser från en djupt bakomliggande uppfattning om textteknik och konceptet text:
(Åter till början av artikeln) 16. Arkivets syfteMan kan slutligen också se uppmärkning respektive sidbeskrivning som behändigt för olika typer av dokumentarbete: akademiskt publiceringsarbete ("academic computing") respektive administrativt publiceringsarbete ("administrative computing"). I valet mellan de två bör man ha bestämt syftet med dokumentarkivet:
Broady döljer inte hur han i det här fallet själv tar ställning:
Kanske kan man, för att återknyta till Fechner-Smarsly ovan, se valet mellan de två angreppssätten som en fråga om makt? Makten att manipulera med och råda över dokumentet, en maktbalans mellan dokumentets producent, dokumentet självt samt dess konsument. (Åter till början av artikeln) 17. Endera eller kanske bådadera?Några inledande undersökningar har, som jag tidigare varit inne på, företagits på svensk, men också på finsk botten när det gäller valet mellan uppmärkning (specifikt SGML) och sidbeskrivning (specifikt PS/ PDF). Vilka slutsatser har dragits? Helsingfors Tekniska Högskolas (HTH) bibliotek i Espoo 32 har valt att arbeta med SGML-lösningar: dokumenten förses med metadata enligt DublinCore och lagras dels som SGML-fil, HTML-fil och som ASCII-fil, och nätpubliceringen sker i SGML och HTML (se Linde, 1997) DELFIN- projektet rekommenderar dock tills vidare PDF, men med en viss reservation:
Möjligen är redaktören Bill Kasdorf inne på ett troligt slutresultat nämligen att aktörer i allt större utsträckning kommer att behöva begagna båda metoderna. Han konstaterar:
och förtydligar:
(Åter till början av artikeln) 18. En nod att stilla bedja omJag skrev i inledningen, att den här artikeln ursprungligen initierades ur en sorts orolig ilska. Ilskan har mognat till engagemang, men oron finns kvar. Oron för att det vägval högskolorna står inför görs i skymundan, i skydd av det till hälften omedvetna beslutets mörker. Oron för att läsaren blir den som i slutändan förlorar makt i det ställningstagande institutionerna står inför. Oron för en kastrerad läsare. Vi har konstaterat, att valet mellan uppmärkning och sidbeskrivning inte är alldeles enkelt. Båda valmöjligheterna medför avsevärda påfrestningar och problem. Angreppssätten utgår egentligen från två olika förhållningssätt till begreppen och fenomenen "text" respektive "publicering". Valet av endera alternativet innebär ett mer eller mindre medvetet ställningstagande i frågan vad vi uppfattar som primär och sekundär textversion. Högskolor och universitet har att gå in i den digitala publiceringsrollen med ett medvetet sådant ställningstagande, vilket det nu blir. Låt oss använda den nätverksmetafor jag ovan berörde: i den allt viktigare textförmedlande väv webben innebär, skulle en aktör med ett medvetande av det slaget utgöra en nod att stilla bedja om. (Åter till början av artikeln) Om författarenMats Dahlström är doktorand vid Institutionen för biblioteks och informationsvetenskap, Göteborgs universitet, och undervisar vid Institutionen Bibliotekshögskolan, Högskolan i Borås. Objektet för hans forskarstudier är konstruktion och distribution av hypereditioner av flerversionella texter över nätverk, och en arbetstitel är "Vällagrad text". Webbplats: http://www.adm.hb.se/personal/mad/ Fotnoter
ReferenserAarseth, Espen (1997): Cybertext: Perspectives on Ergodic
Literature. Baltimore: Johns Hopkins Univ. Press. © Mats Dahlström 1998 Åter till Human IT 3/1998 |