Menneskeleg vs. kunstig intelligens: om å generere mest mogleg rettvise og sanne portrett av psykiatriske pasientar ca 1925.

I doktorgradsprosjektet mitt Psykiatriens visuelle kultur: ei alternativ historieforståing har REK fremja vilkår om at eg må sladde alle ansikt i tidlegare upubliserte fotografi av pasientar frå psykiatrihistoriske arkiv. Dette vilkåret har ført med seg nye utfordringar og spørsmål som eg måtte finne ut av og undersøke i dette pågåande arbeidet.
Etter å ha vist nokre av dei sladda pasientfotografia til andre, har det mellom anna blitt nemnd at sladden førte til at vedkomande la betre merke til omgjevnadane rundt den eller dei som var avbilda. Det at merksemda vart flytta vekk frå andleta, vart i dette høvet såleis sett på som noko positivt.
Ei anna tilbakemelding har vore at eg framleis er fri til å skildre bileta og snakke om kva dei formidlar, sjølv om eg ikkje får vise dei i sin heilskap, altså utan sladd. Såleis kan eg både få fram kva dei einskilde fotografia viser, samt ivareta personvernet til personane som ein gong vart fotografert. Tell – don’t show, med andre ord, likeins som Roland Barthes ganske overtydande demonstrerte med skildringa av fotografiet av mor hans som ung, i Det lyse rommet: tanker om fotografiet.[1]
Det er fint å bli gjort merksam på kvalitetar og moglegheiter med materialet eg presenterer, med dei vilkåra som er gitt. I tillegg til at det utvidar mi eiga forståing for moglegheitsrommet eg faktisk har, er det også smigrande (ja, smigrande) å høyre at eg kan skildre fotografia og det som skjuler seg bak sladden – det må jo bety at det finst tillit til at observasjonar generelt, dermed også mine, ber ein tilstrekkeleg grad av truverd med seg.
Men kor god er eg eigentleg er til å skildre eit fotografi eller menneske som er fotografert? Evnar eg å skrive fram ei overtydande, truverdig og levande førestilling av fotografiet/portrettet, i ein slik grad at det gjenspeglar den store detaljrikdomen som finst i både andletsuttrykk, kroppshaldning, klede, omgjevnader og alt av tekniske kvalitetar ved fotografia? Vil psykiatrifotografiets ekfrase kunna vera frigjort frå historisk stigma, galskapssjargong og resepsjonsfordommar?
For å utforske desse spørsmåla byrja eg å skrive så detaljerte skildringar som eg kunne av einskilde paisentfotografi frå pasientjournalar frå den norske psykiatrien. Dernest mata eg desse skildringane, promtsa, inn i nokre biletgeneratorar (nokre gratisprogram og Adobe Firefly), for å sjå om bileta som vart generert likna på fotografia eg freista å skildre. Det korte svaret er nei.
Medan eg utforska gjorde eg meg mellom anna følgjande observasjonar:
- Eldre menn med psykiske lidingar blir helst visualisert med vilt hår, briller og gapande munn. Når eg reformulerer promptet, og presiserer at personen ikkje skal ha briller, skjer det inga endring. Programmet ignorerer meg til sist på dette feltet.
- «Sengeliggande pasient på sovesal» genererer ofte eit motiv der pasienten ligg på magen i ei senga. Personen – kvinne eller mann – har gjerne dyna leikent over hovudet, og eit lurt glimt i auga, som er direkte retta mot fotografen.
- I mange samanhengar kviler «pasientane» haka konvensjonelt på den eine handa, anten dei ser mot fotografen eller ser kontemplativt ut i lufta. Hendene deira har ofte meir eller mindre enn ei handfull fingrar, og fingrane som kjem til syne, veks gjerne saman i einannan, på klumpete vis.
- Enkelte pasientar manglar bein eller føter. (My bad: eg kom ikkje på å presisere kor mange bein pasienten skulle ha i promptet.)
- Nynorske skildringar av fotografiske motiv av pasientar genererer i hovudsak illustrasjonar og teikningar – ikkje fotografi-liknande bilete – av folketomme landskap, der estetikken minner meir om den kinesiske kunsttradisjonen enn om det historiske psykiatrifotografiet.
- Eg ønskjer at den kunstige intelligensen skal kle pasientane i noko som passar inn på tidleg 1900-tal, og legg inn ei presisering; «gammeldagse klær». Brått er pasientane smilande og kledd i flotte vintage-antrekk, som ser svært kostbare ut, og med smykke av typen som i dag helst er utstilt på museum. Eg endrar bestillinga til «gamle klær» og får eit meir korrekt bilete. At ord ikkje berre er ord blir med eitt svært tydeleg.
- Deprimerte, melankolske eller triste jenter og kvinner smiler pent og tankefullt, og er stort sett “fotografert” i flatterande lys.
- Blant dei sinnssjuke pasientane meiner algoritmane i Firefly at den absolutte hovuddelen av desse er melaninfattige. Blant kvinnene er dette regelen – utan unnateke. Blant dei mannlege pasientane finst det derimot nokre få unntak.

Bileta som blei generert gjennom denne utforskinga, vart utstilt ved Halsnøy Kloster våren 2024 (Ill. 1), rygg mot rygg til dei sladda pasientfotografia som eg hadde freista å skildre (Ill. 2).[2] Sjølv om bileta fekk meg til å mista all tru på eigne ekfrasekunster – resultata var nemleg svært langt unna å likna fotografia eg prøvde å skildre – var det interessant å undersøke om, og eventuelt korleis, kunstig intelligens kunne bidra til å formidle noko av det som skjuler seg bak sladdane i pasientfotografia i dette prosjektet.
Program og system som genererer bilete er trent på det massive omfanget av digitaliserte fotografi som ligg på nett, gjennom rettleia eller urettleia maskinlæring.[3] Bileta eg genererte på denne måten formidlar difor truleg talrike fragment av pasientfotografi frå den verkelege psykiatrihistoria, sidan det ligg eit hopetal av slike ålment tilgjengeleg på nett i dag. Dessutan kan ein anta at systema truleg gjengir gester og positurar som finst i meir generelle portrettbilete-data som systema trenar på og har tilgjengeleg.
Prompta mine tok jo faktisk utgangspunkt i faktiske psykiatrihistoriske fotografi. Kunne dette bety at dei genererte bileta faktisk kunne seiast å vere representative for denne delen av psykiatrihistoria?
Dette spørsmålet var utgangspunkt for det som dernest vart ein interessant samtale med KI-språkmodellen ChatGPT, ein samtale som er gjengjeve i sin heilskap under.[4]
Spørsmålet fekk meg nemleg til å undersøke korleis KI ville forklare sin eigen genererings-logikk.
[Samtale start]
Jorun: Korleis vil du beskrive utsjåanden til ein kvinneleg psykiatrisk pasient, innlagt på eit lite asyl på Vestlandet, ca 1925?
ChatGPT: Det er viktig å huske at beskrivelser av en person, spesielt når det gjelder psykiatriske pasienter, bør være sensitive og respektfulle. Utseendet til en kvinnelig psykiatrisk pasient på et lite asyl på Vestlandet rundt 1925 kunne ha variert, men her er en generell beskrivelse som tar hensyn til den tiden og situasjonen:
Kvinnen kunne ha hatt på seg enkle, slitte klær som kanskje ikke var helt rene. En vanlig drakt på den tiden for kvinner kunne vært en lang, enkel kjole eller skjørt og bluse. Kanskje var klærne litt misfargede eller flekkete, som et resultat av manglende mulighet til å skifte eller vaske dem regelmessig.
Håret hennes kunne ha vært ubørstet eller i en enkel flettet eller knute, kanskje med noen strå som stakk ut og ville vært vansklig å holde på plass. Mangel på tilgang til hygieneartikler kunne ha resultert i at håret var urent og litt rotete.
Hennes hud kunne ha hatt et blekt og slitt preg, på grunn av begrenset tid utendørs og mangel på sollys. Det kunne ha vært tydelige tegn til stress eller angst i ansiktet hennes, kanskje i form av rynker eller et anspent uttrykk.
Øynene hennes, som vinduer til sjelen, kunne ha uttrykt en blanding av forvirring, sorg og kanskje til og med frykt. Kanskje var de litt røde og hovne fra gråt eller søvnmangel. Det er også mulig at hun hadde en sløret eller fraværende blikk, noe som kan være vanlig hos noen psykiatriske pasienter.
Det er viktig å huske at hver pasient er unik, og dette er bare en generell beskrivelse som tar hensyn til den historiske perioden og forholdene på den tiden. Det er også viktig å vise respekt og medfølelse når man snakker om en persons utseende, spesielt når det gjelder sårbare grupper som psykiatriske pasienter.
Jorun: Er det ei generell oppfatning at alle psykiatriske pasientar uttrykkjer frykt, sorg eller forvirring?
ChatGPT: Nei, det er ikke en generell oppfatning at alle psykiatriske pasienter uttrykker frykt, sorg eller forvirring. Psykiatriske lidelser er svært varierte, og pasientenes følelser og uttrykk kan variere betydelig avhengig av en rekke faktorer, inkludert typen lidelse, personligheten deres, individuelle opplevelser og behandlingstilstanden.
Mens noen pasienter kan oppleve frykt, sorg eller forvirring som en del av symptomene på deres psykiske tilstand, kan andre ha andre følelsesmessige uttrykk. Noen kan være apatiske eller ha redusert følelsesmessig reaksjon, mens andre kan være glade, rolige eller til og med entusiastiske i visse situasjoner.
Det er viktig å huske at psykiske lidelser ikke definerer hele personen, og at psykiatriske pasienter er like forskjellige som enhver annen gruppe mennesker når det gjelder personlighet, følelser og uttrykk. Enkeltpersoner kan også ha varierende grad av funksjonsevne, så det er ikke en “one-size-fits-all” beskrivelse av hvordan psykiatriske pasienter uttrykker seg eller oppfører seg.
Jorun: Men kvifor er det då dette uttrykket (frykt, forvirring og sorg) som pregar den generelle beskrivelsen?
ChatGPT: Det er en god observasjon. Uttrykket “frykt, forvirring, sorg” er ofte assosiert med psykiatriske pasienter i historisk litteratur og medier. Dette kan delvis skyldes stereotype forestillinger som har blitt formidlet gjennom kultur, kunst og tidligere beskrivelser av psykiatriske tilstander.
I historisk sammenheng har psykiatriske pasienter ofte blitt fremstilt på en stereotypisk måte som preget av intense følelser og forstyrret oppførsel. Dette kan ha bidratt til at disse spesifikke følelsene ble assosiert med psykiatriske tilstander, selv om det ikke er representativt for alle pasienter.
I tillegg er det slik at noen psykiatriske lidelser kan inkludere symptomer som frykt, forvirring eller sorg. For eksempel kan depresjon være preget av dyp sorg, angstlidelser kan inkludere frykt og forvirring, og psykotiske lidelser kan innebære forstyrret tenkning og oppfatning, som kan fremstå som forvirring.
Det er viktig å understreke at dette er generelle trekk som ikke gjelder for alle psykiatriske pasienter. Mange psykiatriske pasienter har en bred variasjon av følelser og uttrykk, og det er ikke hensiktsmessig å generalisere deres opplevelser. I dagens tid er det større forståelse for den individuelle variasjonen og kompleksiteten til psykiske lidelser, og det er et økende fokus på å se pasienter som enkeltpersoner med unike behov og erfaringer.
Jorun: Kan du sei noko om kvifor det er dei stereotype beskrivelsane av den fortidige psykiatrien som blir brukt til å formidle noko om vår forståing for pasientar og psykiatrihistorie i chatGPT og andre kunstig intelligens-appar og verktøy?
ChatGPT: Ja, det er flere grunner til at stereotypiske beskrivelser av fortidens psykiatri ofte blir brukt i kunstig intelligens-apper og verktøy for å formidle noe om vår forståelse av pasienter og psykiatrihistorie:
- Kulturelle påvirkninger: Stereotyper om psykisk sykdom har vært dypt forankret i kulturen gjennom historien. Denne kulturelle arven påvirker hvordan samfunnet som helhet ser på psykiatri og psykiske lidelser. Kunstig intelligens, som er trent på store mengder tekst og data, kan derfor gjenspeile disse historiske stereotypiene.
- Historiske kilder: Mye av informasjonen som er tilgjengelig for kunstig intelligens er basert på historiske tekster, romaner, filmer og andre medier. Disse kildene har ofte fremstilt psykiatriske pasienter på en stereotypisk måte, og når AI-modeller blir trent på slike datasett, kan de reflektere disse skjevhetene.
- Enkelhets skyld: Kunstig intelligens forsøker ofte å forenkle og generalisere komplekse emner for å gi rask og enkel informasjon. Stereotyper kan være en forenklet måte å beskrive komplekse situasjoner på, selv om de ikke er nøyaktige eller representative.
- Manglende nyanser: Kunstig intelligens er bare så god som dataene den er trent på. Hvis datamengden er begrenset og ikke inkluderer et bredt spekter av nyanserte beskrivelser, kan AI-en gjenspeile den begrensede forståelsen som lå til grunn for opplæringen.
- Populærkulturell påvirkning: TV-serier, filmer og andre former for populærkultur har også bidratt til å forme stereotyper om psykiatriske pasienter og asyl i fortiden. Siden AI-modeller kan hente informasjon fra en rekke kilder, inkludert populærkulturelle referanser, kan dette påvirke hvordan de formidler informasjon.
Det er viktig å være oppmerksom på disse faktorene når man bruker AI-verktøy for å få informasjon om psykiatrihistorie og pasienter. Å ta hensyn til nyere forskning, mer nyanserte beskrivelser og en mer moderne forståelse av psykisk helse kan bidra til å unngå å forsterke gamle stereotyper og misforståelser.
[Samtale slutt]
Samtalen underbygde at det er dei tilgjengelege treningsdataene som legg grunnlaget for representasjonane som blir skapt, anten dei kjem i form av bilete eller tekst. Det var også interessant at ChatGPT trekte fram korleis stereotypiar og fordommar, som mellom anna byggjer på fiktivt materiale frå populærkulturen, påverkar korleis KI oftast – og av enkelheits skuld – vil framstille til dømes ein kvinneleg pasient på eit lite vestnorsk asyl rundt 1925.
Med dette i tankane, står punkt 4 og 5 i den siste delen av samtalen fram for meg som særleg vesentleg i forhold til den delen av prosjektet mitt som særleg handlar om psykiatriens visuelle kultur: Dersom dei tilgjengelege dataa er avgrensa og ikkje «inkluderer et bredt spekter av nyanserte beskrivelser», er det berre den avgrensa og stereotype forståinga som kan informere oss om psykiatrien; kva den har vore og kva for forteljingar den har bore med seg opp gjennom historia. Dei avgrensa, unyanserte og stereotype dataa vil difor – mellom anna grunna dagens strenge personvern – få sirkulere i ekkokammeret sitt, bli stadfesta og ytterlegare resirkulert uansett om ein nyttar KI eller MI (menneskeleg intelligens).
Kunstig intelligens etterliknar måten menneske lærer på; gjennom symbol. Inga Strümke forklarar logikken bak maskinlæringsmodellar i Maskiner som tenker (2023) på denne måten:
Når vi samler inn data, uansett hva slags data, er målet alltid å gjøre det på en slik måte og i en slik mengde at dataene kan brukes til å estimere den sanne fordelingen. Først da kan dataene brukes til å gjøre generelle utsagn – eller trene gode maskinlæringsmodeller. Og når en AI-utvikler dytter data inn i en læringsalgoritme, har hun – om hun tenker over det eller ei – antatt at dataene er en god representasjon av den sanne fordelingen. Dette er enormt viktig å være klar over, for viss dataene ikke er en god representasjon, vil hun ende opp med en modell som fungerer dårlig og i verste fall kan gjøre skade. Maskinlæringsmodeller har ingen anelse om de har fått representative data; de fungerer slik at målet oppnås på dataene de har fått. Alt maskinlæringsmodeller vet om verden, er dataene de ser under trening.[5]
Dette avsnittet handlar om maskinlæring, men reflekterer likevel måten eg forstår menneskeleg læring: Det me menneske veit om verda, baserer seg på den empirien, objekta og fenomena me har tilgjengeleg eller får presentert, og det er også desse tilgjengelege objekta og fenomena me kan øve og nyansere vår komplekse erkjenning om verda rundt oss på.
Graden av kor godt eller dårleg maskinlæringsmodellar fungerer, er det menneska bak dei ulike modellane som har ansvaret for. Det same kan ein sei om menneskelæringsmodellar. Skadane som kan skje om datagrunnlaget for menneska er for dårleg, kan truleg slå ut i form av diskriminering, misforståingar, feilbehandling eller negative sjølvbilete blant folk med psykiske lidingar.
Det fotografiske materialet eg undersøker i doktorgradsprosjektet mitt ville, slik eg ser det, kunne bidrege til å nyansere dei etablerte, og ofte stereotype psykiatrihistoriske representasjonane og (for)forståingane av det ein tidlegare kalla galskap eller sinnssjukdom. Men når eg må sladde andleta i fotografia til det ugjenkjennelege forsvinn ikkje berre blikka, andletsuttrykka, identiteten, personlegdommen og det menneskelege som i utgangspunktet finst i dei einskilde portretta, men også potensialet materialet mitt har til å utfordre dei allereie eksisterande stereotype framstillingane av psykiatriske pasientar. Dette har såleis ikkje berre følgjer for ulike KI-modellar som genererer tekst, bilete eller andre format. Det har også følgjer for samfunnet og forutsetninga me har til å endra forståinga vår om kva for nyansar psykiatrihistoria vår eigentleg rommar.
Attende står eg med den utfordrande oppgåva om å presentere pasientfotografi frå psykiatrien gjennom rettvise og sannferdige ekfrasar og sladda fotografi. Korleis gjere dette på ein måte som er fristilt for dei unyanserte galskaps-stereotypiane som også har danna grunnlaget for mi (vestlege) forforståing av psykiatrihistoria?

[1] Roland Barthes, Det lyse rommet : tanker om fotografiet, vol. nr 6, La chambre claire note sur la photographie, (Oslo: Pax, 2001).
[2] Utstillinga Et noget stereotypt uttrykk, 2024: https://sunnhordland.museum.no/events/et-noget-stereotypt-uttrykk-utstillingsopning/.
[3] Inga Strümke, Maskiner som tenker : algoritmenes hemmelighet og veien til kunstig intelligens (Oslo: Kagge forlag, 2023), 83-108.
[4] Samtalen vart gjort i mars 2024; https://chatgpt.com/c/b8047092-fee5-4898-b942-3922dbe13e3c. I gjengjevinga av samtalen her, har eg skrive spørsmåla mine om frå bokmål til nynorsk. Eg har for vane å skrive bokmål eller engelsk når eg nyttar KI. Dette er mellom anna fordi eg erfarer å få dårlegare svar når eg skriv nynorsk, noko også utforskinga av Adobe Firefly bidrog til å underbyggje.
[5] Strümke, Maskiner som tenker : algoritmenes hemmelighet og veien til kunstig intelligens, 85.
