Der Gang ins Innere der Maschine Vom drohenden Verlust der Realität
Der Textgenerator ChatGPT war im Jahr 2023 in aller Munde. Die Menschen waren von diesem neuen technischen System so fasziniert wie 2007 von dem ersten iPhone. Dagegen erregte eine andere wichtige technische Entwicklung sehr viel weniger Aufmerksamkeit: Der IT-Gigant Apple stellte im Juni 2023 «Vision Pro» vor, eine Mixed-Reality-Brille, die dem Menschen eine Überla-gerung der Kamerabilder seiner Umgebung mit virtuellen Bildern präsentiert. Die Markteinfüh-rung war im Februar 2024.
Zeitschrift STIL abonnieren
Der Textgenerator ChatGPT war im Jahr 2023 in aller Munde. Die Menschen waren von diesem neuen technischen System so fasziniert wie 2007 von dem ersten iPhone. Dagegen erregte eine andere wichtige technische Entwicklung sehr viel weniger Aufmerksamkeit: Der IT-Gigant Apple stellte im Juni 2023 «Vision Pro» vor, eine Mixed-Reality-Brille, die dem Menschen eine Überlagerung der Kamerabilder seiner Umgebung mit virtuellen Bildern präsentiert. Die Markteinführung war im Februar 2024.
«Vision Pro» ist, wie alle MR-Headsets, so aufgebaut, dass man wenige Zentimeter vor den Augen zwei kleine hochauflösende Bildschirme hat, die zusammen ein Stereobild liefern. Dadurch bildet sich im Menschen die Illusion, eine dreidimensionale Welt zu sehen. Unterstützt wird dies durch zwei Stereo-Lautsprecher über den Ohren. Das Gerät ist mit mehreren Mikrofonen und zwölf Kameras ausgerüstet, die unter anderem die Augenbewegungen, aber auch die Bewegungen der Hände und Finger verfolgen. Man kann daher die MR-Brille allein durch Blicke und Handgesten, darüber hinaus auch durch Sprache steuern. Das Gerät lässt sich mit einem Laptop koppeln, sodass man dessen Bildschirm in Großformat vor sich im Raum zu sehen vermeint. Arbeit am Bildschirm, gemütliche 3D-Kinoabende, Surfen im Internet, 3D-Fotografie, Computerspiele usw.: alles lässt sich mit diesem MR-Headset machen.
Vom inneren Bild zum virtuellen Raum
Eine sehr alte Menschheit lebte mit inneren, mythischen Bildern. In ihren Mythen brachte sie bildhaft zum Ausdruck, wie sie die Welt und die in ihr schaffenden Kräfte erlebte. Diese Bilder wurden in sprachlicher Form durch Erzählungen weitergegeben. Erst spät gerannen sie in gemalte oder plastische Bilder. Erste Vorformen waren die steinzeitlichen Felszeichnungen der Buschmänner in Afrika, der Aborigines in Australien, aber auch der Völker in Asien, Amerika sowie in Europa.
Um 3000 v. Chr. wurden die Malereien konkreter, beispielsweise in Ägypten: Es wurden Szenen des Alltags abgebildet, vor allem aber die Gottheiten und das, was diese tun. Zugleich gerann das Bild bereits zu einer ersten Form der Schrift: der logografischen Schrift.
In der griechischen Kultur, welche auch die phonetische Schrift entwickelte, erreichte die Malerei eine nächste Stufe: Sie bildet die äußere Welt exakt ab, wenn auch auf künstlerische Weise. Die gemalten Bilder werden realitätsgetreuer. Plinius der Ältere (23/24-79) berichtete von den berühmten Malern der Griechen und dabei auch von einem Wettstreit des Malers Zeuxis mit Parrhasius um die Wende des 5. zum 4. vorchristlichen Jahrhunderts, wer am realistischsten malen könne.
Die Wandmalereien im Römischen Reich zeigen eine realistische Malweise, die auf eine gewisse Beherrschung der Perspektive weist, auch wenn sie noch nicht bewusst reflektiert wurde.
Mit dem Untergang des Römischen Reiches und dem Übergang ins Mittelalter breitete sich in Europa das Christentum aus. Das Bewusstsein der Menschen richtete sich auf die religiösen Inhalte des Christentums. Diese standen im Mittelpunkt des Denkens der Menschen. Da wurde kein Wert mehr darauf gelegt, die äußere Welt exakt abzubilden, denn es kam ja darauf an, eine Gegebenheit aus dem Leben Christi oder dem eines Heiligen darzustellen. Die Bilder kannten daher keine Raumperspektive, sie waren flächig. Perspektive trat allenfalls in Form der Bedeutungsperspektive auf: Das geistig Bedeutendste war am größten und je weniger bedeutsam es war, desto kleiner wurde es gemalt.
Mit dem Beginn der Neuzeit wandte sich der Mensch dem irdischen Leben zu. Die Erscheinungen der Welt wurden wichtig. Es galt, aus der genauen Beobachtung der Welterscheinungen das Leben zu begreifen. Man wollte die sichtbare Welt korrekt abbilden. Das brachte die Menschen dazu, die Gesetze der Perspektive zu studieren. Es entstand die darstellende Geometrie, an die sich im Übergang zum 19. Jahrhundert die Entwicklung der nichteuklidischen Geometrien anschloss.
Ein wesentliches Merkmal des perspektivischen Gemäldes besteht darin, dass es nicht nur die sichtbare Welt exakt abbildet, sondern dass es unausgesprochen den betrachteten Menschen in das Bild mit einbezieht. Ein perspektivisch korrektes Bild setzt die vorherige Festlegung eines «Augpunktes», eines Perspektivitätszentrums voraus, von dem aus das Motiv gemalt wird. Wird das fertige Bild angeschaut, dann weist es dem Betrachter eben diesen Augpunkt zu. Der Betrachter kann nicht anders, als den Blickpunkt des Künstlers einzunehmen. Im perspektivisch exakten Gemälde wird ein Raumerlebnis simuliert, das seinen Betrachter dazu bringt, sich selbst als Leib unterschwellig in das Bild hinein zu empfinden, denn im Betrachten eines perspektivischen Gemäldes wird der Mensch auf einen Standpunkt im (Bild-)Raum hingewiesen.
Die perspektivische Malerei begann zunächst mit religiösen Motiven. Der Dominikaner Fra Angelico (zwischen 1386 und 1400 - 1455) bemalte die Wände der Mönchszellen im Kloster San Marco so, dass das Gemälde einen perspektivisch korrekten Bildraum eröffnet, in welchem eine religiöse Szene erscheint. Wer ein solches Fresko betrachtet, fühlt sich wie ein unmittelbarer Zeuge des Dargestellten, er sieht mit irdischen Augen den Engel, der die Jungfrau Maria besucht.
Die reale Welt stülpt sich gewissermaßen aus und setzt sich im virtuellen Bildraum fort. Die Geometrie des realen Raumes stimmt mit derjenigen des gemalten Raumes überein. Was Fra Angelico bereits musterhaft beherrschte, wurde in den folgenden Jahrhunderten allgemeines Kulturgut.
Die Kunst der perspektivischen Malerei wurde bis zum 19. Jahrhundert weiter perfektioniert. In Barockkirchen wird der physische Sakralraum in der Deckenmalerei perspektivisch so fortgesetzt, dass die virtuellen Motive des Heiligen real gegenwärtig erscheinen. Virtualität und Realität vermischen sich. Im Übergang ins 19. Jahrhundert erfährt die perspektivische Malerei mit dem Panorama einen letzten Höhepunkt, indem die Malerei versucht, einen immersiven Bildraum zu gestalten, in den der Mensch vollständig eingeschlossen und der realen Welt enthoben wird.
Bei einem gewöhnlichen Gemälde zeigt schon der umgebende Rahmen, dass in dem Bild eine eigene Welt zu sehen ist, die sich von dem realen Raum unterscheidet. Im Panorama wird diese Vergleichsmöglichkeit systematisch ausgeschaltet, sodass der Betrachter ganz in der Illusion der Panoramawelt aufgehen kann. Insofern kann man das am Ende des 18. Jahrhunderts aufgekommene Panorama als eine erste Vorform des virtuellen Raumes sehen.
Das Panorama befriedigte das menschliche Bedürfnis, in eine andere Welt einzutauchen, die ihn aus dem irdischen «Hier und Jetzt» herausführt. Die Menschen wollten eine jenseitige Welt mit ihren Geheimnissen erleben; sie wollten Neues und Unbekanntes schauen. Im Panorama kündigt sich an, was zwei Jahrhunderte später eine sehr viel höhere technische Reifung erlangen sollte. Mit der Erfindung der Kinematographie, des lebenden Bildes, wie man damals sagte, verschwand das Interesse an den Panoramen. An ihre Stelle traten die Kino-Theater.
Der US-amerikanische Filmemacher Morton Heilig (1926-1997), ein Pionier des virtuellen Raumes, stellte Überlegungen an, wie man das Erlebnis des Zuschauers im Filmgeschehen zu sein, intensivieren könnte. 1962 beantragte er ein Patent für das von ihm entwickelte Sensorama.
Das Sensorama veranschaulicht das, was Stanislaw Lem wenige Jahre später in seiner Phantomologie als die Gefangenschaft des Menschen in der Maschine charakterisierte. Der Mensch ist von einer Kabine umschlossen, welche die Eindrücke der Außenwelt weitgehend fernhält. Ein Film wird auf einem eingebauten Bildschirm gezeigt, aus Lautsprechern kommt der entsprechende Ton. Aus einer kleinen Düse entweichen sogar Gerüche. Der Stuhl, auf dem der Mensch sitzt, kann durch eine Mechanik gerüttelt werden, beispielsweise, wenn der Mensch eine simulierte Motorradfahrt durch unwegsames Gelände erleben soll.
Beim Sensorama konnte der Mensch noch nicht in die tönende Bildwelt verändernd eingreifen. Das wurde erst möglich, als man Computer und Bildschirme miteinander verband.
Der Informatiker Ivan Sutherland befasste sich ab dMitte der 1960er-Jahre mit der Frage, wie man den Benutzer eines Computersystems in eine maschinell generierte dreidimensionale Grafikwelt versetzen könne. Ihm gelang es, das erste Head Mounted Display (HMD), das vor jedes der beiden Augen einen Bildschirm brachte, zu bauen. Das HMD registrierte die Kopfbewegungen und der daran angeschlossene Computer veränderte entsprechend die Bilder auf den beiden Bildschirmen. Das erste computergenerierte 3-D-Bild war das Gerüst eines etwa 5 cm großen Würfels.
Recht bald kam die Möglichkeit hinzu, dass man diese vom Rechner erzeugten Bilder nicht nur anschauen, sondern durch Bewegung von Eingabegeräten verändern konnte.
In den 1980er-Jahren wurde an verschiedenen Stellen an der Idee der virtuellen Realität weiter gearbeitet. Vor allem die NASA hatte Interesse an solchen Systemen.
In den 1990er-Jahren versuchte vor allem die Spielindustrie, virtuelle Welten publikumsfähig zu machen. Allerdings waren die frühen Versionen von VR-Techniken bei Weitem nicht ausgereift und scheiterten meist in der Vermarktung. Das lag vor allem an der fehlenden Leistungsfähigkeit der Prozessoren der Spielkonsolen sowie der Personal Computer.
2012 gründete der junge Unternehmer Palmer Luckey das Unternehmen «Oculus VR». Nach kurzer Zeit wurde die VR Brille «Oculus Rift» vorgestellt, die sowohl von ihrer Technik als auch vom Preis her für den Markt attraktiv war. 2014 wurde diese Firma von Facebook für über 2 Milliarden Dollar gekauft.
Auch andere große Unternehmen, wie Microsoft, Sony, HP, Dell, Lenovo, Asus und Acer, arbeiteten an der Entwicklung von VR-Brillen. Einerseits sollten Computerspiele lebensechter erlebt werden und andererseits auch die Videotelefonie sowie Online-Meetings durch Telepräsenzerlebnisse ersetzt werden. Mit der Umbenennung des Facebook Konzerns in «Meta» wurde zugleich auch das Zeichen gesetzt, dass dieser Konzern seine Forschung darauf konzentriert, zukünftig ein VR-Unternehmen, ein Metaversum-Unternehmen zu werden. Mit «Vision Pro» istApple ebenfalls einen gewichtigen Schritt in die Richtung gegangen, die auch Satya Nadella, der CEO von Microsoft, als Ziel seines Unternehmens beschrieb: «Mithilfe gemischter Realität erzeugen wir das ultimative Computererlebnis, in dem Ihr Sichtfeld zur Computeroberfläche wird und Ihre digitale mit Ihrer physischen Welt verschmilzt».[1]
Yobie Benjamin, Mitgründer der Firma Avegant (USA) sagt unumwunden: «Am Ende werden die Unterschiede zwischen AR und VR vermutlich verschwinden.»[2] Wir werden nicht mehr zwischen Virtualität und Realität unterscheiden können – das heißt, wir haben dann die Realität verloren.
Es werden von der Industrie gegenwärtig Technologien entwickelt, die den Menschen systematisch von der Welt und sich selbst entfremden. Da sind zum einen die immer perfekter werdenden Computersysteme, die als künstliche Intelligenz bezeichnet werden. Sie ersetzen das Denken der Menschen. Der Arzt und Psychotherapeut Joachim Bauer charakterisierte die Folge sehr treffend: «Man hilft uns beim Denken, bis wir nicht mehr denken können.»[3] Auf der anderen Seite wird die Wahrnehmung der realen Welt durch das Blicken auf Bildschirme ersetzt.
Deshalb ist es eine zentrale Frage der Gegenwart: Was geschieht eigentlich, wenn man auf einem Bildschirm ein Bild betrachtet? Überhaupt: Was ist deigentlich das Wesen eines Bildes?
Vom Wesen des Bildes
Beim Nachdenken über das Bild darf man nicht einfach Fotografien, Filme und künstlerische Gemälde gleichsetzen. Sicher, sie haben Gemeinsamkeiten, aber unterscheiden sich doch. Es wird in der Folge zunächst das fotografische Bild betrachtet, so wie es im Alltag vorwiegend vorkommt.
Die Kunsthistoriker Wolfram Pichler und Ralph Ubl unterscheiden in ihrer Bildtheorie drei Grundbegriffe: Bildvehikel, Bildinhalt und Bildreferent.[4] Mit Bildvehikel bezeichnen sie den Gegenstand, durch den das Bild sichtbar wird, beispielsweise der Bildschirm, auf dem das Bild erscheint. Mit Bildinhalt oder auch Bildwelt bezeichnen sie die dargestellten Bildobjekte. Der Bildreferent bezeichnet ein Drittes, nämlich die Person, das Ding, die Ereignisse usw., die von einem Bild oder Bildobjekt vertreten werden. Pichler und Ubl treffen eine Unterscheidung, die schon der Phänomenologe Edmund Husserl unternahm, indem er Bildding, Bildobjekt und Bildsujet unterschied. Diese (klassische) Unterscheidung der Bildphilosophie beschrieb der Philosoph Hans Jonas mit den Worten: dass «das Dargestellte, die Darstellung und das Darstellende verschiedene Schichten in der ontologischen Struktur des Bildes sind». Man muss also bei einem Bild verschiedene ontische Ebenen unterscheiden: Der physikalisch vorhandene darstellende Bildträger (Bildschirm, Fotopapier usw.); sodann der Bildgegenstand, also die Darstellung: Sie «kann das Gefährliche darstellen ohne zu gefährden, dass Schädliche ohne zu schaden, das Erwünschte, ohne zu sättigen. Das im Bilde Dargestellte ist in ihm herausgehoben aus dem Kausalverkehr der Dinge und überführt in eine nicht dynamische Existenz, welches die Bildexistenz schlechthin ist – ein Existenzmodus, der weder mit dem des abbildenden Dinges noch mit dem der abgebildeten Wirklichkeit zu verwechseln ist. Die beiden letzteren bleiben in der Bewegung des Werdens.»[5]
Wird ein Bild durch ein Medium sichtbar gemacht, dann hat dessen Präsenz prinzipiell eine andere Qualität als die des Bildträgers. Der Bildschirm, das Fotopapier befinden sich in derselben physikalischen Wirklichkeit wie der Körper des Menschen, das Bild auf dem Monitor dagegen nicht: Es steht außerhalb der physikalischen Wirklichkeit. Dies zeigt sich schon darin, dass das Bild jenseits von Ort und Zeit ist. Es kann beliebig vervielfältigt werden und an verschiedenen Orten und zu verschiedenen Zeiten von Menschen gesehen werden; dabei sehen die Menschen nicht das gleiche, sondern dasselbe Bild.
Der Bildgehalt steht in keinerlei Beziehung zu den realen Dingen, die den Bildträger umgeben. Der «Bildgehalt schert aus dem Kausalnexus aus, in denen der Bildträger unverbrüchlich eingelassen ist und bleibt».[6] «Das Fiktionale an den Bildern ist geradezu und explizit gegen den faktischen Kontext gerichtet, in dem Bilder vorkommen. Die Freiheit des Bildes behauptet sich gegen die Kausalität der physikalischen Wirklichkeit. Der Idealismus des Bildes steht gegen den »Realismus« der wirklichen Welt.»[7]
Will man mit Bildern sinnvoll umgehen, muss man den im fotografischen Akt verloren gegangenen Kontext durch eine gedankliche Anstrengung wieder herstellen. Man ist genötigt, wenn die Fotografie in irgendeiner Weise mit Sinn verbunden werden soll, durch eine gedankliche Aktivität das Bild in begriffliche Bezüge hineinzustellen.
Wie steht das Bild zum wahrnehmenden Menschen?
Wahrnehmen ist ein Willensprozess
Der Mensch nimmt die Welt nicht passiv auf, sondern er tastet sie beispielsweise mit seinen Händen ab. Das macht er auch mit seinen Augen: Durch Mikrobewegungen tastet er das gesehene Objekt ab. Der Mensch fixiert für eine kurze Weile einen Punkt des Objektes, um dann mit einem Sprung, einer sogenannten Sakkade, einen nächsten Fixationspunkt einzunehmen.
Das aktive Sehen findet nicht nur mit den Augen statt, sondern die Bewegungen der Augen sind ein Teil des gesamten leiblichen Zusammenhangs, der dem Sehen zugrunde liegt. Wenn beispielsweise ein anderes Lebewesen wahrgenommen wird, dann hängt die Beurteilung von dessen Bewegung von der Erfahrung der eigenen Körperbewegung ab. Deshalb ist es nicht übertrieben, wenn man sagt, dass der ganze Mensch sieht und nicht nur die Augen sehen.
Alles Wahrnehmen ist eng mit dem Bewegungsorganismus des Menschen verbunden. Ja mehr: Wahrnehmen und Bewegen sind so eng verwandt, dass das eine nicht ohne das jeweils andere auskommt.
Dieser Zusammenhang gilt für alle Wahrnehmungsprozesse. Besonders deutlich ist das beim Tasten zu beobachten. Man tastet etwas ab, d.h. der Tasteindruck setzt die Bewegung der Hand voraus. Die Hand ruht nicht bloß auf einem Punkt eines Dinges und «empfängt Daten», sondern sie gleitet über die Oberfläche des Dinges. Die Tastempfindungen sind unmittelbar davon abhängig, dass sich die Hand bewegt, und umgekehrt die Empfindungen der Hand beeinflussen auch die tastende Bewegung, denn je nach dem gerade Empfundenen richtet sich die Bewegung neu aus, um den Gegenstand weiter zu erkunden. Der wahrgenommene Gegenstand und der wahrnehmende Mensch sind in eine gemeinsame Aktivität eingebettet. Man kann daher feststellen, dass der Mensch beim Wahrnehmen willensmäßig mit der Welt verbunden ist. Er nimmt seine Umgebung mit seinem ganzen Leib wahr.
Bildwelten spalten die Sensomotorik
Der Organismus der menschlichen Sinne umfasst 12 Sinne, die sich in drei große Gruppen gliedern lassen:
– Sinne, welche die äußere Welt eröffnen: Sehsinn, Geruchssinn, Geschmackssinn, Wärmesinn.
– Sinne, die vor allem den eigenen Leib wahrnehmen lassen: Tastsinn, Bewegungssinn, Gleichgewichtssinn, Lebenssinn.
– Sinne, die den anderen Menschen erkennen und verstehen: Hörsinn, Sprach-/Wortsinn, Gedankensinn, Ichsinn.
In diesen 12 Sinnesqualitäten offenbart sich dem Menschen die umgebende Welt ‒ und auch der eigene Leib. Das Gewahrwerden des eigenen Leibes ist qualitativ gleich dem Gewahrwerden der äußeren Welt.
Die Sinne bilden einen Organismus. Sie sind als Organe in das Gesamte des Organismus eingebettet und so, wie in diesem alles miteinander verwoben ist, ebenso auch sie. Fällt beispielsweise ein Sinn aus, dann gleichen die anderen Sinne die durch den fehlenden Sinn gestörte Offenbarung der Welt aus. Auch die Synästhesien zeigen, wie Sinne zusammenwirken, dass beispielsweise eine Farbe gehört oder ein Ton als Farbe gesehen wird usw.
Betrachtet der Mensch ein Bild oder schaut in einen virtuellen Raum, dann ist vor allem das Auge als Sinnesorgan gefragt. Im Sehen wirken Bewegungssinn und Sehsinn zusammen. Durch Fixationen und anschließende Sakkaden tasten die Augen gewissermaßen das Betrachtete ab. Wird ein Bild betrachtet, dann werden die Bewegungen der Augen auf die vom Bildträger zur Verfügung gestellte Fläche eingeschränkt.
Da der Bildgehalt stets ohne Zusammenhang mit dem realen Raum ist, bedeutet das für den Organismus der menschlichen Sinne, dass das Sehen, beim Headset auch noch das Hören, einen der Physikalität enthobenen virtuellen Bildraum wahrnehmen, während alle übrigen Sinne nach wie vor den Bildträger sowie den wirklichen Raum erleben. Das heißt, dass sich während der Wahrnehmung die Zusammenhanglosigkeit von Bildgehalt und realem Raum bis in den Leib erstreckt.
Die Betrachtung eines Bildes hat daher grundsätzlich für den Menschen leibliche Konsequenzen, denn «sie treibt [...] die Kräfte des wahrnehmenden Menschen auseinander. Da der Standort eines Menschen, der ein Foto betrachtet, nichts zu tun hat mit dem, was er sieht, entstehen zwei getrennte Wahrnehmungsbereiche. Mit den Augen taucht der Betrachter in das Bild [...] ein. Durch alle übrigen Sinne ist er mit dem Ort verbunden, an dem er sich leiblich befindet.»[8]
Mit Hans Jonas gesprochen, steht der leibliche Mensch mit dem Darstellenden (Bildträger) in Beziehung, während der Sehsinn mit der Darstellung (Bildinhalt) zu tun hat, der «herausgehoben [ist, EH] aus dem Kausalverhältnis der Dinge».[9]
Wenn das Auge in einen VR-Helm blickt, dann geschieht eine weitere Trennung: Die Akkommodation der Augenlinsen bleibt gleich, da die Bildschirme nur wenige Zentimeter vor dem Auge sind, aber die Vergenzbewegung der Augenachsen verändert sich fortwährend, weil das Auge unbewusst die beiden stereoskopischen Bilder zur Deckung bringt und die Illusion von nah und fern, also der Dreidimensionalität, durch das unbewusste Erlebnis der Vergenzbewegung entsteht.
Da es eine Grundeigenschaft des Leibes ist, sich an seine Lebensgegebenheiten anzupassen, besteht die prinzipielle Gefahr, dass sich im Menschen der sensomotorische Organismus tendenziell deformiert. Für Kinder, deren sensomotorisches System sich erst noch ausbildet, ist daher – unabhängig davon, ob die Bildgehalte kindgerecht sind oder nicht – ein ausgedehnter Medienkonsum leiblich krank machend.
Auf der anderen Seite ermöglicht die Kontextlosigkeit des Bildgehaltes bezüglich des realen Raumes dem Menschen, Raum und Zeit zu überbrücken. Ein globales Bewusstsein ist ohne Bilder, überhaupt ohne Medien nicht denkbar. Anthroposophisch gesprochen: Die Entwicklung der Bewusstseinsseele setzt das Leben mit Medien aller Art voraus. Dabei kommt jedoch alles darauf an, dass das Individuum in der Lage ist, aus eigenem starken Denken gedankliche Kontexte zu schaffen, in die ein Bildgehalt eingebettet werden kann oder bei einem Kunstwerk, ob das Individuum die Willensstärke und die Geduld hat, in einer hingebungsvollen Betrachtung die im Kunstwerk selbst liegenden inneren Zusammenhänge zu finden.
Eintauchen in Bildwelten
Die Tatsache, dass der Bildraum frei von der Gebundenheit an den physikalischen Raum ist, macht es möglich, dass nicht nur Kopien vergangener Welterscheinungen darin erscheinen können, sondern es kann auch das Bild eines Wesenhaften sein, das durch einen Künstler in Erscheinung gerufen wird. Wenn also beispielsweise Maler darstellen, was sich in ihrem Innern aus der Natur offenbart, so wie Paul Cézanne (1839-1906) einmal formulierte: «Die Landschaft spiegelt sich, vermenschlicht sich, denkt sich in mir. Ich objektiviere sie, übertrage sie, mache sie fest auf meiner Leinwand. […] Vielleicht rede ich dummes Zeug, aber mir scheint, daß ich das subjektive Bewußtsein dieser Landschaft wäre».[10]
Die Malerei «verleiht demjenigen sichtbare Existenz, was das profane Sehen für unsichtbar hält».[11] Der Maler leiht der Welt seinen Leib und dadurch «verwandelt er die Welt in Malerei.»[12] Das gilt für alle Künstler und natürlich auch für einen guten Fotografen.
Der Bildraum, welcher der Physikalität prinzipiell enthoben ist, gibt der Kunst die Möglichkeit, ein in der Welt Unsichtbares, ein Verborgenes darzustellen.
Für den Betrachter ergibt sich hier eine andere Situation, denn in einem Kunstwerk enthält der Bildgehalt gewissermaßen seinen Kontext selbst. Muss man bei einer gewöhnlichen Fotografie den Zusammenhang mit einem außerhalb des Bildes liegenden sinnlich Wahrnehmbaren suchen, so fordert das Kunstwerk dazu auf, den Zusammenhang mit der innerhalb des Bildes sich offenbarenden Erfahrung des Künstlers zu finden. Man muss daher lernen, ein Kunstwerk zu «lesen», in ein Kunstwerk «einzutauchen», es wirklich zu «sehen». Das geht nur durch eine starke Willensanstrengung, die im geduldigen wahrnehmenden Verweilen immer tiefere Aspekte der im Bild verborgenen inneren Zusammenhänge zu entdecken sucht. Dabei wird der Betrachter selbst zum nachschaffenden Künstler, der, vom Kunstwerk geleitet, zu eben der Erfahrung vordringt, von welcher dessen Schöpfer ausgegangen ist. Wenn das Bild, wie beispielsweise von Cézanne geschildert, aus einer Wesensbegegnung hervorgegangen ist, kann dessen Betrachter sich dieser Begegnung in der eigenen Kunsterfahrung nähern.
Indem man in der Computertechnologie lernte, Bilder in einzelne Punkte zu zerlegen, denen man digital darstellbare Zahlenwerte zuordnete, war man einerseits in der Lage, Bilder auf Computer zu speichern und sie andererseits durch ausgeklügelte Algorithmen auch zu verändern. Mit der Entwicklung von Bildgeneratoren wie «DALL-E» oder «Midjourney», war man sogar fähig, aus den Schnipseln von Abermillionen von Bildern neue Bilder zu generieren.
Was Künstler aus einem inneren Prozess im Umgang mit Wesenhaftem als Kunstwerke neu schaffen, erfährt durch die Bildgeneratoren sein maschinelles Gegenstück. Die Maschine errechnet Bildgehalte, die dem Ergebnis künstlerischen Schaffens äußerlich gleichen, es aber nicht sind.
Alle Technik ist gegenwärtige Vergangenheit, denn sie ist das Ergebnis von vergangenen intelligenten Arbeiten der Ingenieure. Die in KI-Systemen gespeicherten Bilder sind ebenfalls in der Vergangenheit entstanden, auch die algorithmischen Verfahren, mit denen deren Elemente zu neuen Bildern zusammengesetzt werden, sind «geronnene», vergangene menschliche Gedankengänge. Maschinen können daher prinzipiell nur Vergangenes in neuer Kombination wiederholen und die Illusion erzeugen, etwas «Neues» geschaffen zu haben.
Ein Kunstwerk dagegen entsteht immer aus der Zukunft, denn der Künstler stellt sich dem, was sich als Wesenhaftes in seinem Werk in Erscheinung bringen will, zur Verfügung. Die großen Kunstwerke sind zwar auch gegenwärtige Vergangenheit, aber sie zeugen von der einstigen Aktivität des Künstlers.
Die Bilder, welche die Bildgeneratoren errechnen, sind aus den Schnipsel von Millionen von Bildern, neu zusammengesetzt ‒ da war nirgends ein Mensch, der eine innere Begegnung mit einem Wesenhaften hatte.
Wirkliche Kunsterkenntnis erfordert damit eine durch innere Übungen auf das intensivste verfeinerte Wahrnehmungsweise, die sich zu höheren ‒ man kann auch sagen: tieferen ‒ Erkenntnisstufen emporgearbeitet hat.
Der aus dem Eingebundensein in die physikalischen Verhältnisse befreite Bildraum ist also grundsätzlich offen für Imagination. Er vermag das von Menschen in einer inneren Wesensbegegnung Erfahrene als Kunstwerk zu offenbaren, aber auch das von der Maschine generierte Gegenstück, das eben kein Kunstwerk mehr ist, sondern dessen technische Negation.
Eintritt in die «heile Welt»
Computergenerierte Bilder machen es nun möglich, dass jeder Mensch gewissermaßen sein eigenes Panorama im häuslichen Wohnzimmer haben kann. Man nennt es «Cyberspace», «virtuelle Realität» oder auch «Metaverse». Es ist ein der realen Welt enthobener Raum. Wenn der Mensch mit Auge, Ohr und kleinen Handbewegungen dort «eintritt», dann vergisst er seinen Leib, er lässt ihn gewissermaßen abgespalten in der physischen Welt zurück. Der Mensch taucht mit seinem Bewusstsein in eine heile «göttliche» Welt ein und flieht das Körperliche, wie der Philosoph Hartmut Böhme treffend charakterisierte:
«Cyberspace ist das Medium von Weltflucht und zugleich das Medium, um sich immer und überall präsent zu machen. Cyberspace ist die technische Form Gottes: ubiquitäre Gegenwart in der Form abwesender Anwesenheit.
Natürlich ist Cyberspace nicht Gott selbst, sondern ein menschliches Medium. Gott ist kein Flüchtling. Flüchtling freilich ist der Mensch [...] Der Flüchtling überlässt das, woraus er flieht, seinem Schicksal, um dorthin zu gelangen, wo diejenigen Probleme nicht bestehen, um derentwillen er flieht. Es ist zu vermuten, dass die religiösen Motive von Cyberspace dazu führen, die Welt ihrem Elend zu überlassen und Cyberspace als mögliche Weltflucht in eine Sphäre des Reinen anzubieten – jenseits der sterbenden Erde.»[13]
Im 3-D-Headset, wie beispielsweise Apples «Vision Pro», zeigt sich am deutlichsten, wohin die technische Entwicklung der Medienwelt zielt: den Menschen bewusstseinsmäßig in eine nichtphysikalische Bildwelt hineinzustellen, innerhalb der sich beliebige Fantasien als Schein realisieren lassen. Im virtuellen Raum wird durch dessen Immaterialität die Realität der Körperlichkeit aufgehoben. Wir begegnen damit innerhalb eines diesseitigen technischen Milieus bereits einer Art Jenseits; wir erfahren mit dem Gang in die Maschine eine dem Raum und der Zeit enthobene Unstofflichkeit, die göttliche Eigenschaften imitiert. Der menschliche Leib wird mit dem Eintritt in den immateriellen Raum ‒ dem Cyberspace oder Metaverse ‒ zurückgelassen und der menschliche Geist taucht in ein scheinbar «Ewiges» ein.
Was sich beim Buch ankündigte, in Fotografie und Film eine Fortsetzung erfuhr, zeigt sich nun in seiner vollen Gestalt: Die technische Möglichkeit, die Erde vorstellend und fühlend zu verlassen, indem man den eigenen Willen immer mehr der Maschine überlässt.
Der virtuelle Raum ist in seinen zweidimensionalen Vorformen bereits vorhanden und zeigt seine Verführungskraft, wie die enormen Bildschirmnutzungszeiten zeigen. Wenn in Zukunft die künstlichen Intelligenzen eine Vielzahl menschlicher Arbeitsplätze ersetzen und die Menschen im Bereich des Wirtschaftslebens keine Aufgabe mehr finden, ist die Gefahr gegeben, dass die Menschen ihre freie Zeit in virtuellen Welten verbringen werden. Die Frage ist, wie viele Menschen in der Lage sein werden, einerseits in die Maschine zu «gehen» und andererseits ihr Seelenleben durch innere Übungen so sehr zu erkraften, dass sie, ebenso wie die großen Künstler, die in der Realität verborgene Göttlichkeit der Welt wahrnehmen lernen.
Das ist die Aufgabe der Menschen: Dem Gang in das Innere der Maschine das Gewahrwerden der verborgenen Tiefen des Lebens hinzuzustellen, d. h. die technischen Möglichkeiten der Zeit verständig zu nutzen und gleichzeitig, beispielsweise durch ein meditatives Leben, zu üben, das Geistige in Mensch und Welt immer klarer wahrnehmen zu lernen.
Prof. Dr. Edwin Hübner studierte Mathematik sowie Physik in Frankfurt am Main und in Stuttgart. Von 1985-2015 war er Lehrer an der Freien Waldorfschule Frankfurt am Main. Von 2015-2022 hatte er den Tessin-Lehrstuhl für Medienpädagogik der Freien Hochschule Stuttgart inne. 2020 erschien Menschlicher Geist und Künstliche Intelligenz. Die Entwicklung des Humanen inmitten einer digitalisierten Welt; 2023 ChatGPT. Symptom einer technischen Zukunft.
STIL Goetheanismus in Kunst und Wissenschaft
Die Zeitschrift STIL Goetheanismus in Kunst und Wissenschaft ist das Organ der Sektionen für Schöne Wissenschaften und Bildende Künste der Freien Hochschule für Geisteswissenschaft, Goetheanum, Dornach/Schweiz. Zentrale Fragen aus Kultur, Kunst, Wissenschaft und Zeitgeschehen werden in Aufsätzen und Essays untersucht. Jedes Heft hat einen besonderen thematischen Schwerpunkt, enthält Interviews mit Künstlern, Schriftstellern, Philosophen und informiert über die Forschung innerhalb der Sektionen sowie über Ausstellungen am Goetheanum und andernorts. Der STIL erscheint vier Mal im Jahr und ist im Abonnement sowie als Einzelausgabe zu beziehen.
[1] Satya Nadella: «Zum Geleit», in: Klaus Schwab mit Nicolas Davis: Die Zukunft der Vierten Industriellen Revolution. Wie wir den digitalen Wandel gestalten, München 2019, S. 7.
[2] Yobie Benjamin: «Die Schnittstelle: das A und O», in: Klaus Schwab mit Nicolas Davis: Die Zukunft der Vierten Industriellen Revolution. Wie wir den digitalen Wandel gestalten, München 2019, S. 262.
[3]Joachim Bauer: Realitätsverlust. Wie KI und virtuelle Welten von uns Besitz ergreifen und die Menschlichkeit bedrohen, München 2023, S. 9 und 144.
[4] Wolfram Pichler: «Vehikel, Inhalt, Referent: Grundbegriffe einer Bildtheorie», in: Seitz, Sergej/Graneß, Anke/Stenger, Georg (Hrsg.): Facetten gegenwärtiger Bildtheorie. Interkulturelle und interdisziplinäre Perspektiven, Wiesbaden 2018, S. 39-54; Wolfram Pichler, Ralph Ubl: Bildtheorie zur Einführung, Hamburg 2018.
[5] Ebd., S. 166.
[6] Christoph Asmuth: Bilder über Bilder, Bilder ohne Bilder. Eine neue Theorie der Bildlichkeit, Darmstadt 2011, S. 119.
[7] Ebd., S. 136.
[8] Heinz Buddemeier: Von der Keilschrift zum Cyberspace. Der Mensch und seine Medien, Stuttgart 2001, S. 64 f.
[9] Hans Jonas: «Homo Pictor und die Differentia des Menschen», in: Zeitschrift für philosophische Forschung, Bd. 15, H. 2 (Apr.-Jun.1961), S. 161-176, hier, S. 166.
[10] Paul Cézanne: Über die Kunst. Gespräche mit Gasquet und Briefe, Hamburg 1957, S. 10.
[11]Maurice Merleau-Ponty: Das Auge und der Geist. Philosophische Essays, Hamburg, 2003, S. 284.
[12] Ebd. S, 278.
[13] Hartmut Böhme: «Die technische Form Gottes. Über die theologischen Implikationen von Cyberspace», in: Neue Zürcher Zeitung vom 13.04.1996, S. 69. Auch in: Praktische Theologie, H. 4 (1996), S. 257-261.