--- permalink: /artikel/313/index.html ---
"I stora drag återskapas ljusvågfronter för virtuella objekt i en (kraftfull) dator, för att sedan kan projiceras ut framför betraktaren" -Tryckfelsnisse har varit framme
Det går ju även att nämna att ljudet ekar otroligt mycket i en CAVE, med tanke på att väggarna är gjorda av glas. Jag kom förresten att tänka på en sak, det är intressant att du använder serifer som rubriker och linjärer i brödtext. Tvärt om vad som är "normalt" alltså. Jag antar att detta beror på att linjärer är lättare att läsa på bildskärmar, samtidigt som problemet med serifer försvinner allt eftersom typsnittet blir större?
Precis, Peter. På bildskärmar är det vedertaget lättare att läsa linjärer. Serifer använder jag i rubrikerna just för att det ska bli litet variation.
Det leder oavkortat in mig på en annan sak. Du skrev just "litet variation", något som jag inte förstår mig på i dagens vardagsspråk. Jag har sedan barnsben lärt mig "lite variation", "lite gröt" och "lite ledsen". Varför har det på senare år blivit inne att skriva "litet"?
Hm intressant fråga. Jag har tagit för vana att alltid skriva "litet", men nu var jag ju tvungen att kolla upp det. Enligt Svenska språknämnden ska "litet" användas i till exempel "ett litet hus" medan "lite" är normalt att nyttja i till exempel "sova för lite". Det verkar dock inte vara några strikta regler.
Ja det var så jag också tyckte att det var. För mig är det två helt skilda ord.
Peter, du kanske vill skriva din egen VR-sammanfattning?!
Hahah gillar er disskusion om lite och litet. Jag skulle ställa mig bakom Peters sätt att se på det. En annan detalj som fick mig att skratta lite, (inte litet), under denna dysta pluggning till muntan, (även om texten du skrivit här Anders är mycket trevligare att läsa än en del av de ofantligt många artiklarna), var ditt nya uttryck "fladderfrekvensen". Bra jobbat! Nu ska jag gå vidare och läsa de andra artiklarna.
Hehe, tackar tackar...
Det finns en mängd olika typer av apparater för visualisering av VR-miljöer, allt från vanliga bildskärmar med stereoeffekt till märkliga halvmekaniska lösningar. I den här artikeln tänkte jag gå igenom några av dem, för att försöka ge en god överblick.
Egentligen är titeln "bildskärmsteknik" litet missvisande, eftersom VR-miljöer visualiseras på många olika sätt där traditionella bildskärmar inte alltid är inblandade. Å andra sidan kom jag inte på någon bättre titel, och jag tror nog att man förstår vad det handlar om.
Vad är det då som krävs av en VR-bildskärm? Hela idén är ju att man ska kunna uppleva en påhittad miljö som i någon mening ska kännas verklig. Detta innebär att den "bildskärm" man använder måste kunna återskapa den virtuella modellen av miljön på ett övertygande sätt, vilket implicerar att den ska förefalla att vara lika tredimensionell som den verkliga världen. Detta är alltså grundkriteriet, enligt min tolkning.
Datorprogram som visar "3D-grafik" har ju funnits länge, och vi använder våra vanliga bildskärmar för att titta på dem. Vad är då problemet? Jo, även om människans hjärna är bra på att tolka 2D-projektioner av 3D-objekt som i någon mån tredimensionella, så erbjuder "standard-3D-grafik" på vanliga bildskärmar inte en "äkta" tredimensionell bild. Till exempel finns det inget riktigt djup i bilden, och vi kan inte titta runt hörn genom att flytta på huvudet.
För att komma ett steg närmare riktig 3D kan man introducera stereoskopiska visningstekniker. Dessa bygger på att ögonen hela tiden visas varsin bild, där man tagit hänsyn till att ögonen faktiskt ser olika bilder i verkligheten på grund av (eller snarare tack vare) att de är placerade med ett visst mellanrum. Det är denna lilla "funktion" som gör att vi i normala fall har ett djupseende, och detta fungerar även att reproducera med stereoskopisk 3D-grafik.
Sättet att faktiskt presentera olika bilder för olika ögon varierar. En metod går ut på att låta varannan bildruta som visas vara för det vänstra ögat och varannan för det högra. Betraktaren får ha på sig speciella glasögon som "blundar" med ett "öga" åt gången, och som är synkroniserade med bildskärmen, så att rätt öga ser rätt bild hela tiden. Detta kallas för "aktiv" stereo. En uppenbar nackdel är förstås att uppdateringshastigheten halveras eftersom varje bildruta i realiteten visas dubbelt så länge som den borde. En annan tråkighet är att man inte kan använda de i övrigt trevliga LCD-monitorer som är standard för persondatorer idag, eftersom sådana ger ifrån sig polariserat ljus, och "blundningsfunktionen" i glasögonen utnyttjar polariserande filter.
Ett annat sätt är att låta två projektorer med olika polarisering på ljuset belysa en projektorduk som bevarar polariseringen, och sedan utrusta betraktaren med glasögon som visar de olika polariseringarna för olika ögon. Detta är känt som "passiv" stereo. En trist grej här är att det inte fungerar på en vanlig datormonitor, eftersom en sådan inte kan producera olika polariseringar på samma gång.
Det finns även bildskärmar med autostereoskopi. Med detta menas att man inte behöver någon speciell utrustning för att få en upplevelse av djup i bilden. Några särskilda glasögon krävs till exempel inte. Det finns olika varianter av den här tekniken också, men gemensamt för de olika är att de bara producerar ett ändligt antal möjliga betraktningsvinklar, vilket nog kan ses som en av de större nackdelarna. En fördel är å andra sidan att vissa implementationer fungerar för fler betraktare samtidigt.
Tracking skulle man kanske kunna kalla "spårning" på svenska, men jag tycker att det låter ännu fjantigare än att behålla det engelska ordet, så jag gör ingen översättningsmanöver denna gång.
"Head tracking", eller kort och gott "tracking av huvudet" innebär att visningssystemet på något sätt tar hänsyn till var huvudet (och därmed ögonen) befinner sig. I ett sådant system är det alltså teoretiskt möjligt att titta "runt hörn" och på det sättet faktiskt få en känsla av att miljön är tredimensionell. Det är vanligt att huvud-tracking kombineras med stereoskopi eftersom effekten blir mycket tydligare då.
Även inom detta område (tracking allmänt) så existerar en mängd olika implementationer som angriper problemet på skilda sätt. Arrangemang med ultraljudsmikrofoner och -högtalare utnyttjar det faktum att ljud har en viss hastighet i luft för att räkna ut positionen för en viss punkt (som till exempel kan vara placerad på användarens huvud). Andra varianter använder accelerometrar för att matematiskt beräkna position utifrån hur en sensor rört sig från sitt utgångsläge. Även rent mekaniska apparater finns förstås också, och räknas till de enklare lösningarna. Naturligtvis finns det även implementationer som bygger på kombinationer av flera tekniker. På det sättet kommer man runt flera av de individuella lösningarnas nackdelar.
Okej, okej...här kommer en till engelsk term som jag inte ids översätta. "Head-mounted displays" eller HMDs är alltså den typ av visningshårdvara som gemene man kanske främst associerar med begreppet VR. De stora och klumpiga hjälmar som vi kanske minns från för ett par år sedan är av typen HMD (som ordet indikerar). Nu för tiden är denna variant betydligt lättare och smidigare, men bygger fortfarande på att man har en liten bildskärm framför varje öga, som därigenom kan visa olika bilder och utnyttja stereoeffekten. Dessutom kombinerar man detta med tracking, så att man kan hålla reda på position och orientering av användarens huvud.
En stor nackdel med HMDs är att de ofta har för låga uppdateringsfrekvenser, vilket innebär att användaren kan uppleva att den virtuella världen "släpar efter" och inte hänger med i svängarna. I förlängningen leder detta inte sällan till illamående och andra obehag. I övrigt är det en smidig princip, eftersom användaren kan röra sig förhållandevis fritt (förutsatt att tracking-systemet tillåter det). Jämför detta med att sitta och titta på en vanlig bildskärm med stereoglasögon – känslan av inlevelse blir garanterat större med en HMD på skallen.
En ganska säregen klass inom VR-bildskärmar använder speciella volymetriska tekniker för att visa virtuella objekt i vad som upplevs som riktig 3D. För att åstadkomma detta kan man till exempel projicera ljus på en mycket snabbt roterande skiva. Eftersom skivan snurrar så snabbt så ser man den inte, men däremot ser man resultatet av dess belysning – ett objekt som tycks sväva i luften. En uppenbar nackdel är förstås att denna typ av visualisering inte kan bilda en hel omgivning, men jag tycker ändå att det är en spännande lösning. En stor fördel är förstås att man inte behöver några speciella glasögon för att titta på de genererade objekten, och dessutom går det bra att vara flera stycken som studerar visualiseringen samtidigt från olika vinklar.
En intressant approach till visning av 3D-objekt är datorgenererade hologram. De är idag våldsamt dyra och används därför nästan inte i praktiken, men allteftersom datorhårdvara blir billigare så kanske de kan komma att bli mer tillgängliga. I stora drag återskapas ljusvågfronter för virtuella objekt i en (kraftfull) dator, för att sedan projiceras ut framför betraktaren. Jag ska inte ens låtsas att jag förstår hur det går till, men det verkar häftigt i alla fall.
När man projicerar den virtuella miljön på en stor projektorduk eller widescreen-monitor i kombination med stereoskopi och möjligen huvud-tracking talar man om icke-immersiva visningstekniker (immersiv är nog inte ett riktigt svenskt ord, men det betyder i alla fall något i stil med övertygande, omslutande).
Exempel på en sådan implementation är Silicon Graphics "Reality Centre", som bygger på en stor, horisontellt välvd projektionsyta som man tittar på med aktiva stereoglasögon. Om man vill kan man även använda ett trackingsystem för att hålla koll på användarens huvud så att grafiken kan anpassas efter dess position, men detta fungerar förstås bara för en användare. Om man struntar i trackingen har man däremot en av denna typ tekniks största fördelar – man kan visa upp VR-miljön för många personer samtidigt.
En viktig faktor i system av samma slag som Reality Centre är förstås projektorn (eller projektorerna). Den måste kunna upprätthålla en tillräckligt hög uppdateringsfrekvens samtidigt som den ska vara ljusstark, driftsäker och tillåta att man utnyttjar stereoskopi.
En vanlig projektortyp är CRT-baserad, och innefattar vanligen tre projektorer i varje enhet; en för vardera rött, grönt respektive blått. Eftersom det handlar om en CRT så är det ett analogt system, vilket gör att det är lätt att anpassa projektorn till välvda projektionsytor, som ju finns med i bilden när vi talar om Reality Centre. Man vill att bilden ska förefalla att vara rektangulär trots att duken är välvd. En stor nackdel med CRT-baserade projektorer är att de måste kalibreras ofta, samt att de är relativt ljussvaga.
Nästa projektorvariant bygger istället på LCD-teknik. En stark lampa lyser igenom ett LCD-filter som färgar ljuset. Denna metod resulterar i starkare ljus, något som man gärna vill ha. Däremot är det krångligare att anpassa projektionen till den välvda duken, och dessutom rör det sig om en lägre uppdateringsfrekvens, vilket är ett stort problem. Vidare producerar LCD-projektorn polariserat ljus, vilket leder till problem med stereoglasögon.
En relativt ny projektorteknik har utvecklats av Texas Instruments och kallas för DLP - Digital Light Processor. Denna använder en stor uppsättning mikroskopiska speglar (DMD - Digital Micromirror Device), som "fladdrar" med mycket hög frekvens (tusentals Hertz) och växlar mellan att spegla vidare ljuset mot duken och att reflektera bort det så att det inte syns. Genom att variera "fladderfrekvensen" kan olika intensiteter i det projicerade ljuset skapas. Ett roterande genomlysbart "färghjul" används för att producera färgbilder.
En stor fördel med DLP-tekniken är att man inte har några problem med uppdateringsfrekvensen, eftersom speglarna kan justeras så våldsamt snabbt. Dessutom får man en ljusstyrka som överglänser LCD-projektorernas. Vidare har man möjlighet att använda polariserat ljus för att utnyttja stereoskopi. Fortfarande är det dock ett problem att justera projektionen efter den välvda ytan.
Den sista typen av projektorer som jag tänkte nämna bygger på laserteknik. Färgade laserstrålar scannar (mycket snabbt) över projektionsytan (som kan vara välvd eller på annat sätt ojämn) och producerar en väldigt ljusstark och skarp bild som kan uppdateras med hög frekvens. Det finns dock en stor nackdel: laserprojektorer är i dagsläget ofantligt dyra.
Förutom "VR-teatrar" i stil med Reality Centre så finns det andra varianter som bygger på samma princip (projektion, stereoeffekt). En sådan är den så kallade "arbetsbänken", som i princip är en stor bakprojicerad monitor. Bakprojiceringen medför problem med förluster i ljusstyrka, men i övrigt är för- och nackdelarna liknande dem för Reality Centre.
En speciell implementation av ett projektorsystem är den så kallade CAVE (Cave Automatic Virtual Environment) som i sin mest kompletta form består av en cirka 3x3x3 meter stor kub med bakprojicerade väggar, tak och golv. Användaren befinner sig inuti kuben och har vanligen på sig stereoglasögon med huvud-tracking. Sex projektorer producerar bilder på kubens alla sidor, som då syns från insidan. På det sättet omsluter CAVE helt och hållet användaren.
Problem med CAVE innefattar tracking av huvudet – när användaren rör huvudet för snabbt hinner systemet inte med, vilket uppfattas som att världen släpar efter. Det är även svårt att på något bra sätt lägga till ljud i systemet. Var ska högtalarna placeras för att inte förstöra den visuella upplevelsen? Dessutom kräver CAVE en massa plats och kostar en väldig massa pengar. Och det blir, enligt uppgift, ohyggligt varmt och kvavt inne i kuben efter en liten stunds användande…
Nu tror jag att jag har tagit upp de viktigaste teknikerna och implementationerna inom VR-bildskärmar. Detta är alltså tänkt mest som en överblick, och som synes går jag inte in på djupet i hur teknikerna egentligen fungerar. Förhoppningsvis har jag ändå lyckats belysa de centrala problemställningarna.
Anders Fjeldstad
Publicerad 15 oktober 2005, uppdaterad 18 oktober 2005
Copyright © 2005 Anders Fjeldstad et al.