Programmatische Verhältnisse Wer oder was lebt in Zoom? Fragen an die neue Normalität von Videokonferenzen

Von Jan Distelmeyer

Einer der frühen Effekte des ersten Corona-Lockdowns war, dass es plötzlich zwei neue Klassen gab. Jene, die als berufstätig galten und deren Arbeit also (im Unterschied zu allen unbezahlten Arbeitsformen) gesehen und gezählt wird, teilten sich auf. Es gab nun die, die weiter «zur Arbeit» gingen oder gegangen wären, weil ihre Berufe nichts mit Büro- oder Informationsarbeit zu tun hatten. Und jene, die zuhause bleiben konnten, um «im Homeoffice» zu arbeiten. Zu letzteren gehörte auch ich; wie die meisten, die an Universitäten und Hochschulen arbeiten, hatte ich damit zu tun, Lehre, Prüfungen und Verwaltung nun online zu erfinden und zu organisieren.

Die neue Klasse der Heimarbeit, in der gleichwohl immense Unterschiede in Sachen Bezahlung blieben, wuchs zusehends. Auch deshalb, weil die andere existentiellen Einbußen und Verlusten entgegensah. Immer mehr Berufszweige fragten sich so, was von zuhause aus getan werden konnte, wobei dieses Zuhause natürlich zugleich als Netzknoten und always on gedacht wurde. Neben der Funktion der nun – im Modus des «social distancing» – noch bedeutenderen Social Media-Plattformen war es gerade diese neue und diverse Klasse der Heimarbeit, für die zu Beginn der Pandemie Loblieder auf «das Digitale» angestimmt wurden. Die Corona-Krise beweise «auch den bisherigen Skeptikern, dass die Digitalisierung ein Geschenk für die Menschheit ist» (Süddeutsche Zeitung). Denn: «Das Digitale hält uns jetzt zusammen» (Die Welt).

Was den «Digital-Skeptikern» oder «Kulturpessimisten und Fortschrittsskeptikern» in einem für Deutschland (dem Land, in dem 2017 Wahlplakate wie «Digital first, Bedenken second» als nötig und sinnvoll erachtet wurden) recht typischen Diskurs vor Augen gehalten wurde, war vor allem der Segen der Videokonferenzen. Ein Weg für alle, von Familie bis Firma, sich trotz Distanz zu treffen. Diese neue Normalität privater und beruflicher Begegnungen durch Plattformen wurde schnell mit der großen Gewinnerin dieses wachsenden Interesses an Videokonferenz-Diensten identifiziert: «We live in Zoom now», fasste die New York Times im März 2020 zusammen.

Seitdem hat sich Zoom als Synonym von Online-Treffen etabliert und ist die notorische Kachelästhetik Symbol einer neuen Plattform-Konnektivität. Gemeinsam allein, in Fugen vereint. Wir sehen uns als Rastergruppe auf Monitoren, neben- und untereinander aufgereiht, die Kachelgröße sagt nichts über Statur, Status oder Stimmung aus, mit freigeschaltetem Mikrofon kann jede*r den akustischen Raum übernehmen – alles eine Frage der Einstellungen des Programms.

Auch wenn andere Dienste wie Skype, Microsoft Teams, Jitsi, Webex, Google Meet, BigBlueButton und andere ebenso die neue Gegenwart unserer Bildschirmbegegnungen bauen und auch die Kachelordnung des eckig begrenzten Miteinanders nichts rein Zoom-Spezifisches ist, gilt dieser Firmenname als Inbegriff der Videokonferenz. Von «Zoom University» bis «Zoom fatigue», als Zeichen der Hoffnung oder des Grauens, steht Zoom für Effekte, die allgemein mit der internationalen Verbreitung von Online-Meetings zusammenhängen. Der Name ist Programm. Auch die keineswegs plattformbeschränkten Störmanöver, bei denen (u. a. dank Twitter-Bots) Meetings gehackt und Teilnehmende insbesondere sexistischen und rassistischen Angriffen ausgesetzt werden, wurde durch Zoom berüchtigt und so zum «Zoom bombing».

Zugleich waren es sehr spezifische Datenschutzprobleme, mit denen Zoom parallel zum rasanten Aufstieg in die Schlagzeilen kam. So sorgte der heimliche Datentransfer zu Facebook Ende März 2020 für einen Skandal, auf den das Unternehmen aus San José, Kalifornien, binnen weniger Tage reagieren musste. Doch auch in diesem Zusammenhang steht Zoom eher pars pro toto. Im letzten Sommer hat dies die Berliner Datenschutzbeauftragte Maja Smoltczyk mit ihrer Kritik an «führenden Videokonferenzsystemen wie Microsoft Teams, Skype, Zoom, Google Meet, GoToMeeting, Blizz und Cisco WebEx» unterstrichen. «Leider erfüllen», so Smoltczyk, «einige der Anbieter, die technisch ausgereifte Lösungen bereitstellen, die datenschutzrechtlichen Anforderungen bisher nicht», wohingegen Open-Source-Lösungen wie Jitsi und BigBlueButton positiv beurteilt wurden.

Über Zoom zu sprechen bedeutet darum aus vielen Gründen, über folgenreiche Prozesse von Vernetzung und Verlagerungen auf Plattformen zu sprechen. Dabei bietet sich Zoom nicht nur als schillerndes Beispiel oder Kalauer-Konstante für Schlagzeilen an («Und es hat Zoom gemacht», allein in der taz vierfach im April, Juni, Oktober und November 2020), sondern auch als ein symptomatischer Erfahrungsraum. In und mit Zoom lassen sich aktiv und körperlich wesentliche Grundstrukturen dessen erfahren, was ansonsten als «die Digitalisierung» eher mythisch und distanziert bleiben mag. Die neue Gegenwart der Videokonferenzen konfrontiert offensiv, un-verschämt, mit Bedingungen der Computerisierung. Das ist gerade in meinem Bereich der Heimarbeit – und hier besonders in Formen von Studium und Lehre – gut zu beobachten.

Ein Jahr alltäglicher Plattform-Erfahrungen (viele ausprobiert, nach BigBlueButton wurde Zoom zum Status quo) zeichnet ein recht deutliches Bild. Einige Studierende und Lehrende erfahren Vorteile durch die räumliche Unabhängigkeit. Die Freiheit der Wahl des Ortes entschädigt für den Verlust der Begegnungen, die ja auch nicht für alle immer das pure Glück gewesen sein müssen. Die Freude über wegfallende Wege aber ist gerade bei jenen schnell getrübt, deren räumliche Unabhängigkeit in den Grenzen eines kleinen WG- oder Wohnheim-Zimmers endet. Ganz zu schweigen von unterschiedlich belastbaren Internetverbindungen, die im Zweifel auf Kosten der «mobilen Daten» von Smartphones gehen.

Unabhängig davon aber, ob nun großzügige Räume, schnelle Rechner und optimales WLAN zur Verfügung stehen oder eher das Gegenteil: Fast alle, die ich gesprochen habe, berichten über rasch einsetzende Erschöpfung, Konzentrationsprobleme und eine merkwürdige Teilnahmslosigkeit, was den Eindruck, nicht wirklich zusammen zu sein, verstärkt. Das fehlende Gefühl für die Stimmung in einem gemeinsamen Raum, der hier ja auch gar nicht existiert, macht die eigene Stimmung präsenter; Erfahrungen von Ermüdung, Distanziertheit und Isolierung.

Dieses Phänomen ist als «Zoom fatigue» so omnipräsent und vieldiskutiert, dass hier ruckzuck ein neuer Markt entstanden ist. Da wird z. B. nach einem findigen Schnelltest der Problemlage, «dass Menschen einfach nicht wissen, wie man charismatisch auf Video rüberkommt», eine probate App beworben, mit der die eigene Performance gepimpt und jede Videokonferenz «fuseful» («fun» + «useful») werden soll. Das hat viel mit herrschenden technischen und sozioökonomischen Bedingungen zu tun und nichts mit der «Zoom fatigue», die plattformübergreifend beobachtet wird.

Sie setzt sich aus vielen Teilphänomenen zusammen, die gerade von Studierenden und Lehrenden gleichermaßen betont werden. Geert Lovink (Hogeschool van Amsterdam), Jena Lee (UC Los Angeles) und Robby Nadler (UC Santa Barbara) haben sie mit The Anatomy of Zoom Fatigue, A Neuropsychological Exploration of Zoom Fatigue und Understanding Zoom fatigue auseinandergenommen, und ein prägendes Element, das in allen Beschreibungen wiederkehrt, hat der Student Gordon Kamer für Harvard Political Review so zusammengefasst: «Was Videokonferenzen so verhängnisvoll macht, sind die leichten Artefakte – die Verzögerung, die Roboterstimmen und so weiter –, die dazu führen, dass wir uns noch unverbundener fühlen, als wenn wir uns überhaupt nicht treffen würden.»

Das deckt sich mit dem Bild, das der Psychiater Gianpiero Petriglieri für die BBC unter dem Titel «The reason Zoom-calls drain your energy» skizziert hat: «Unser Verstand ist zusammen, wenn unser Körper das Gefühl hat, dass wir es nicht sind.» Seinen Hinweis, «dass wir uns mehr anstrengen müssen, um nonverbale Hinweise wie Gesichtsausdrücke, Tonfall und Tonhöhe der Stimme und die Körpersprache zu verarbeiten», hat auch Neta Alexander (Colgate University) mit dem Problem jener «leichten Artefakte» verbunden: «Die technische Desynchronisation zwischen Video und Audio erzeugt ein tieferes Gefühl der psychologischen und kognitiven Desynchronisation.»

Was also im Kachelformat schwer zu haben ist – Gordon Kamer erzählt von den schweigenden Versuchen bei Zoomgeburtstagen, «das Lächeln der anderen durch die Verpixelung zu erkennen» –, wird zudem unter besonderen Bedingungen vermittelt. Die engen Grenzen des User-Interface wirken desto stärker, je mehr Störungen sich in ihnen zeigen. «Das Problem ist», bilanzierte die New York Times, «dass die Art und Weise, wie die Videobilder digital kodiert und dekodiert, verändert und angepasst, gepatcht und synthetisiert werden, alle Arten von Artefakten einführt: Blockieren, Einfrieren, Unschärfe, Ruckeln und nicht-synchroner Ton. Diese Störungen, von denen einige unterhalb unserer bewussten Wahrnehmung liegen, verwirren die Wahrnehmung und bringen subtile soziale Hinweise durcheinander.»

Diese Elemente der «Zoom fatigue», zu der noch weitere wie fehlende Bewegung vor dem Bildschirm, die ewige Wiederkehr der immergleichen User-Interfaces und die Potenzierung «der ‹Bullshit-Job›-Realität unserer Büroexistenzen» (Lovink) gehören, schließen etwas auf. Sie führen zur Eigenart dieser Technologie – zu Bedingungen der Computer-Verschaltungen und jenen Prozessen, die dabei üblicherweise nicht betont und bemerkt werden. Wovon «Zoom fatigue» zeugt und worüber deshalb nun auch gesprochen wird, sind jene Prozesse der Vernetzungen und Relationen von Soft- und Hardware, die sonst unmerklich effektiv wirken sollen. Ihr Zusammenspiel soll eigentlich nur in jener Form an die Oberfläche kommen, die der exemplarische «Zoom Guide» verspricht: «consistent user interface» und «seamless, real-time interactive experience».

Dass dieses User-Interface, die stabile Kachelwelt, nur deshalb so etwas wie eine nahtlose Interaktionserfahrung in Echtzeit bieten kann, weil zahlreiche weitere Interfaces zwischen Hardware und Software vermitteln und Prozesse leiten, mag zuvor eine Erkenntnis von Disziplinen wie den Software Studies oder der Medienwissenschaft gewesen sein. Jetzt aber wird dieser Zusammenhang körperlich spürbar. Und er kommt als «Zoom fatigue», «technische Desynchronisation» und «Artefakte» zur Sprache. Denn die beschriebenen Probleme betreffen sowohl das Kachel-Interface der eingeschränkten vis-à-vis-Betrachtungen als auch Störungen und Verzögerungen in den verborgenen Interface-Prozessen von Datenverarbeitung und Datentransfer, die in und zwischen den vernetzten Computern laufen.

Gerade diese Störungen sind Effekte von Interfaces zwischen Software und Hardware, die uns ansonsten nicht interessieren müssen. Auch deshalb treten sie im allgemeinen Sprachgebrauch hinter jenem Interface-Begriff zurück, der nur unseren Zugang zu und Umgang mit Computern meint. Humans first! Nun – im Modus der Störung mit spürbar körperlichen Auswirkungen – rückt in den Vordergrund, was ansonsten unter dem Radar menschlicher Wahrnehmung wirken soll: die Abhängigkeit der Oberflächeneffekte von jenen Prozessen, die Computer und ihre Netzwerke laufen lassen.

Genau darum können diese Probleme erfahrbar machen oder zumindest einen spürbaren Hinweis darauf geben, dass Online-Meetings nicht einfach Video-Begegnungen sind, nicht einfach eine technik- und weltvergessene (Tele-)Präsenz durch Ton und Bild. Diese Verhältnisse sind vielmehr Effekte der Computerisierung – einer bestimmten Vernetzung von Computern und von Programmen, die durch diverse Interface-Prozesse realisiert werden.

Damit die Inszenierung der Kachel-Interfaces produktiv werden und mir die Videostreams meiner vielen Anderen zeigen kann, sorgen u.a. Software-Software-Interfaces dafür, dass sich Computer nach den Regeln der Internetprotokolle überhaupt miteinander verbinden und Daten austauschen. Software-Software-Interfaces bilden die Grundlage für jede Dienstleistung, die wir vom Internet erwarten – und sie öffnen zugleich auch die Türen für die bemängelten Verstöße gegen den Datenschutz. Jeder menschliche Austausch ist auch auf Zoom & Co nur dank und durch Datenaustausch möglich. Dafür braucht es nicht zuletzt Hardware-Interfaces, Schnittstellen zwischen jenen Maschinen, für die armdicke Unterseekabel die zutiefst materiellen Verbindungen des Internets bilden. Die Frage des Stromverbrauchs der so verschalteten Computer, die beim Streaming längst viel Beachtung gefunden hat, stellt sich darum bei Videokonferenzen in gleicher Weise. Nach einer aktuellen Studie der Purdue University, Yale University und des MIT kann der erhebliche CO2-Ausstoß und Wasserverbrauch um 96% gesenkt werden, wenn die Kamera in Meetings ausgeschaltet bleibt.

Worauf die Erfahrung und Diskussion der «Zoom fatigue» somit hinweisen, ist also alles andere als ein rein technisches Phänomen. Hier geht es nicht um die körperliche Bestätigung von Technostrukturen, weil wirkende Interface-Ebenen teilweise spürbar werden. Stattdessen führen Phänomen und Diskurs der «Zoom fatigue» vor, inwiefern Videokonferenzen Teil dessen sind, was als «das Digitale» den Zusammenhalt stiften soll: Sie sind Ergebnisse einer protokolllogischen Vernetzung von Computern und von laufenden Programmen, die durch diverse Interface-Prozesse realisiert werden.

Alle Begegnungen auf Zoom, Microsoft Teams, BigBlueButton und ähnlichen Diensten sind in diesem Sinne programmatische Verhältnisse. Programmatisch nicht nur, indem sie richtungsweisend wirken und auf Standards einer naheliegenden Zukunft deuten mögen. Programmatisch sind sie vor allem, weil dies Verhältnisse sind, die auf Programmierbarkeit beruhen und stets konkrete Programme realisieren. Was auf Zoom & Co möglich wird, ist nur unter den Bedingungen der jeweiligen Software (und der sie prozessierenden Hardware) möglich – ein Umstand, der die Debatten um «Zoom fatigue», Datenschutz und die Verantwortung von Institutionen (z. B. Universitäten) verbindet.

Denn die Frage, welche Software nun eigentlich lizensiert (also als Service gemietet) werden soll, um der Anforderung gerecht zu werden, «auf digitale Lehre» (Bund-Länder-Beschluss) umzustellen, ist ja gerade darum so heikel, weil jedes Programm eigene Bedingungen mitbringt. Bindende Vorschriften. Der berühmte Satz «Code is Law» ist dafür noch zu schwach, weil Code – solange er auf Rechnern läuft und nicht umgangen oder umprogrammiert wird – sowohl Gesetz als auch seine widerspruchslose Anwendung ist. Programme sind execution-Kommandos, sie laufen. Code ist «ein unmenschlich perfektes ‹Performativum›, das von niemandem vorgetragen werden muss» (Wendy Chun). Darum stellt Seda Gürses von der TU Delft in Rectangles-R-Us: What happened when the university went online? eine der wichtigsten Fragen: Wer hat eigentlich beschlossen, in Software-Lizenzen statt in öffentliche Infrastruktur zu investieren?

Auf mehreren Ebenen konfrontiert die neue Normalität von Zoom & Co massiv mit dem, worauf es bei «der Digitalisierung» und ihren vieldiskutierten Folgen (Flexibilisierung, Industrie 4.0, Surveillance/Capture Capitalism, Filterblasen, Plattformisierung, «Künstliche Intelligenz» etc.) auf besondere Weise ankommt: auf die Programmierbarkeit von Verhältnissen. Was uns hier mit neuer Dringlichkeit und Präsenz (We live in …) begegnet, ist darum eine alte Bekannte: die wirksame Wunschkonstellation einer Technik, die für alles offen sein und zugleich alles regeln soll.

Dass Computer programmierbar sind, weil sie nicht-festgelegte Maschinen (oder besser: nur zum Rechnen festgelegt) sind, war und bleibt ja der buchstäblich entscheidende Grund für ihren Erfolg. Universalität, «general purpose», soll alles möglich machen. Dass Computer für vielfältige (erträumt: alle) Zwecke entscheidungssicher und streng formalisiert festgelegt werden können, ist die Basis jener Entwicklung, die als umfassende Automatisierungsbewegung unter dem Titel «Digitalisierung» läuft.

Das kann beobachtet werden, wenn wir in Zoom sind; wenn wir tun, was wir können. Getan werden kann hier nur, was das Programm (so und nicht anders) festgelegt hat. Wenn es um aktive Teilhabe geht, kann ich z. B. mein Mikrofon aktivieren und meine Stimme erheben, eine blaue Hand heben, Emojis setzen, einen Kommentar in den Chat schreiben oder meinen Bildschirm teilen. Verfügen und Sichfügen: Wie immer im Umgang mit User-Interfaces, wie immer in programmatischen Verhältnissen, hat die Programmierung vorgesehen und vorgegeben, was wie geht. Das Besondere aber ist hier (und ähnlich auch bei BigBlueButton), dass diese Interface-Möglichkeiten je nach Status variieren.

Die leitende Instanz eines Zoom-Meetings, genannt «Host», hat andere und mehr Möglichkeiten als die Kategorie «Teilnehmer». Doch diese Interface-Optionen sind nicht nur anders und damit Ausdruck programmatischer Flexibilität. Sie können zudem meine Möglichkeiten als «Teilnehmer» einschränken und bestimmen. Wer «Host» ist, kann mich stummschalten, in den «Warteraum» schieben, umbenennen, mein Handzeichen aufheben, mich aus dem Meeting entfernen usw., während ich dem Host nichts entgegenzusetzen habe. Jean Baudrillards alte Losung, die Macht gehöre «demjenigen, der zu geben vermag und dem nicht zurückgegeben werden kann», kommt hier zur vollen Entfaltung. Zumal keine Übersicht anzeigt, welche Machtbefugnisse «Host» und «Teilnehmer» unterscheiden. Von «dem Zoom-Interface» zu sprechen, ist darum kaum möglich. Es gibt so viele, wie es Status-Gruppen und getroffene Voreinstellungen gibt.

Die Frage der Macht, die sich hier online stellt (und über Interface-Aktionen beantwortet wird), betrifft natürlich auch Seminarräume und Hörsäle. So wenig diese guten alten Präsenz-Refugien hierarchiefreie Räume waren und sind, so sehr führt die romantische «digital-vs.-analog»-Dichotomie in die Irre. Es kommt vielmehr darauf an, zu fragen, welche spezifischen Bedingungen von Macht (und auch von Störung) hier eigentlich wirken. Darum ist es so bemerkenswert, was in den Interface-Inszenierungen von Zoom & Co geht und fehlt.

Die klassische Frontalbestuhlung z. B., die in einem Hörsaal schon qua Architektur von Beginn an klärt, wer hier das Sagen haben soll, muss sich auf Zoom so nicht mitteilen. Im Kachel-Raster der «Galerie»-Ansicht sind alle gleich, kein farblicher Rahmen hebt hervor, wer hier «Host» ist. Die so unsichtbare Leitung zeigt sich anders. Sie widerfährt mir, indem ich beim Versuch meinen Bildschirm zu teilen, durch ein Dialogfenster gestoppt werde, das ich nur mit «Ok» bestätigen kann: «Der Host hat das Screen-Sharing für Teilnehmer deaktiviert.»

Die «Host»-Bestimmung, die ich nicht wie beim Erstürmen des Katheders aus eigenem Antrieb übernehmen kann, erweist sich im Prozess. Sie zeigt sich, wenn mir Interface-Optionen verwehrt sind, meine Einstellungen rückgängig gemacht werden oder ich mich – die Wege des «Host» sind unergründlich – plötzlich als «Co-Host» oder aber im «Warteraum» wiederfinde, den Neta Alexander als «zeitgemäße Metapher für den Corona-Kapitalismus» diskutiert hat. Im Unterschied zu Seminarräumen und Hörsälen (Code ist mehr als Gesetz), kann auf Zoom jede Regel unausgesprochene Existenzbedingung werden. Auch Macht wirkt hier programmatisch.

Diese besonderen Machtverhältnisse – dass sich auf Zoom & Co im Kachel-Raum der User-Interfaces keine Hierarchie ausdrücken muss, weil sie auf der Ebene der programmatischen Bestimmung immer schon wirken kann – haben Folgen. Denn gerade weil die Machtfrage auf Programmierbarkeit beruht, ist sie auch auf dieser Ebene zu entscheiden. Praktiken des Hackens, des Datenmissbrauchs und auch von «Zoom bombing» erzählen davon. Das macht die Frage, welche Institutionen mit welcher Software arbeiten und in welchem Rechtsraum die Server stehen und operieren, so dringlich. Auch was Søren Pold von der Aarhus Universitet als «Zoomoptikon» bezeichnet hat, zielt auf diesen Zusammenhang der programmatischen Verhältnisse: das Machtgefälle, das in der Ungewissheit liegt, was von mir gerade erfasst wird und Teil einer Daten-Vermittlung und -Ökonomie ist, von der ich nichts weiß.

Es kommt mir vor, als ob sich bei Zoom & Co viele grundsätzliche und durchaus bekannte Fragen aus einem einfachen Grund mit neuem Nachdruck stellen. Vielleicht werden hier das Programmatische der Computerisierung und all seine (Interface-)Effekte so deutlich und spürbar, weil sich schlicht der Vergleich mit dem aufdrängt, was Videokonferenzen kompensieren sollen. Das plötzliche, gefühlt: erzwungene, Verlagern von allen möglichen Begegnungsräumen und -formen auf Online-Plattformen setzt nicht nur die Menschen, sondern auch die Plattformen unter Druck. Der verzweifelte Versuch, etablierte und vertraute Formen von Gemeinschaften «direkt» in Internetbeziehungen zu überführen, ruft immer auch in Erinnerung, was fehlt. Er provoziert bis heute die schönen Phantomschmerzen einer Präsenz mit allen jenen Anderen, die uns nie nur lieb und teuer gewesen sein müssen, um sie nun dennoch zu vermissen.

Deshalb könnten so viele gerade (nicht zum ersten Mal) daran denken, dass diese programmatischen Verhältnisse eben zuallererst Verhältnisse in und unter Computern sind, bevor sie dadurch (dank Kamera, Mikrophon, Monitor, Touchscreen etc.) Menschen in Beziehungen bringen. Sie überwinden räumliche Grenzen zwischen Menschen, indem sie angelegte Grenzöffnungen (Interfaces) zwischen Computern nutzen, deren Formelhaftigkeit und harte Bestimmungslogik sich – zumindest ein wenig – auch auf der Ebene des menschlichen Umgangs mitteilen. Dabeisein bedeutet, nicht aus dem Raster zu fallen. Insofern ist die neue Gegenwart der Videokonferenzen auch eine unausgesprochene, aber nicht weniger dringende Einladung, sowohl grundsätzlich als auch sehr konkret das Verhältnis zur Computertechnologie zu befragen.