Die hier vorgestellte Methode wurde in einem film- und medienwissenschaftlichen Umfeld entwickelt und angewendet. Mit diesem Artikel möchten wir zur Diskussion stellen, inwiefern Grundprinzipien dieser Art der Medienanalyse auch für die praktische Arbeit im pädagogischen Bereich von Interesse sind: Indem wir das zugrunde liegende Verständnis filmischer Ausdruckskraft sowie eine vereinfachte Analysesystematik skizzieren, möchten wir neue Perspektiven für den Umgang mit und das Sprechen über audiovisuelle Bilder in der pädagogischen Arbeit eröffnen.

Die Ausdruckskraft audiovisueller Bilder

Dass es in Mobilisierungsvideos selten um sachliche Argumente geht, wird an einem Beispiel aus der Peripherie des islamistischen Extremismus deutlich: dem Video mit dem Titel „Es wird Zeit“ des YouTube-Kanals „Muslim Interaktiv“. Das Video eröffnet mit Aufnahmen aus der Vogelperspektive: Die Kamera fliegt über eine Großstadt in der Dämmerung. Statt des Rauschens des Windes ist das statische Knacken eines Radios zu hören. Immer wieder erheben sich daraus die vertrauten Stimmen von Nachrichtensprecher*innen, die über Vorfälle berichten, die in dieser Zusammenstellung allesamt einen antimuslimischen Hintergrund zu haben scheinen. Angezogen vom einzigen leuchtenden Fenster in der Glasfassade eines Wohnhauses, wechselt die Kamera schließlich in eine der Wohnungen. Dort findet sie einen jungen Mann vor, der gerade seinen Laptop schließt. Ein treibender Beat setzt ein und in einer rhythmisch und schnell geschnittenen Montagesequenz ist zu sehen, wie mehrere Männer jeweils Zeitung und Koran in Taschen packen und sich auf den Weg machen. Die Parallelmontage setzt sich über mehrere Stufen fort und zeigt, wie die Männer den eingangs etablierten urbanen Raum durchqueren, um sich schließlich im Zentrum einer deutschen Großstadt mit anderen zu versammeln. Die Gesichter der jungen Männer spart die Kamera konsequent aus und zeigt uns nur deren Körper in uniformen T-Shirts, auf denen das Logo der Organisation prangt, die hinter dem Video steht.

Die einzigen Worte, die in diesem Video zu hören sind, stammen aus den Nachrichtenmeldungen zu Beginn. Sie verstummen bald und werden geradezu weggeblasen vom treibenden Beat der Musik, dem sich die Montage rhythmisch angleicht. Immer dynamischer werden die Kamerabewegungen und Figurenchoreografien.

Was möchte dieses Video seinen Zuschauer*innen sagen? Wollte man seinen Inhalt benennen, könnte man ihn so beschreiben: Mehrere junge Männer mit sportlicher und moderner Erscheinung brechen auf, verlassen ihre Wohnungen, fahren durch die Stadt und versammeln sich auf einem Platz. Oder als „Botschaft“ gefasst: „Wir sind Muslim Interaktiv, wir sind modern, sportlich, gläubig, und wir versammeln uns“. Aus unserer Perspektive ist diese Art der inhaltlichen Vermittlung jedoch nur bedingt die Ebene, auf der audiovisuelle Bilder ihre Zuschauer*innen adressieren. Bevor man sich fragt, ob es hier eine Handlung, eine Botschaft gibt, muss man sich fragen: Was habe ich wahrgenommen? Was habe ich gesehen, gehört und gefühlt, während ich das Video gesehen habe? Die Frage ist nicht nur, wer diese Männer dort im Video sind, sondern: Wie werde ich durch mein Wahrnehmen und Empfinden zu der dargestellten Welt im Video ins Verhältnis gesetzt?

Dann wäre das Video ganz anders zu beschreiben. Wenn etwa die Männer aufbrechen, sehen wir nicht einfach ein dunkles Treppenhaus. Wir sehen einen Raum, der durch die filmischen Mittel erst konstruiert wird. Er besteht aus geometrischen Linien und klaren Kanten, und er bewegt sich: Durch die Kamerabewegung und die schnellen, rhythmischen Schnitte wird die spiralartige Kontur des Raumes zu einem kreisenden Strudel, der den Eindruck einer Sogwirkung entwickelt, die die Männer auf ihrem Weg erfasst. Auch danach sehen wir nicht einfach junge Männer auf dem Weg durch die Stadt – wir sehen Kamera- und Figurenbewegung, Schnitte, Lichter und Schatten, Farben und Räume, wir hören Geräusche und Musik. All dies fügt sich zusammen zu einer komplexen „Komposition“, aus welcher die Welt, die sich uns dort zeigt, in ihrer Spezifik, ihren räumlichen und zeitlichen Verhältnissen, überhaupt erst hervorgeht. Audiovisuelle Bilder gestalten Raum und Zeit und bringen damit eigene Perspektiven, eigene Welten hervor mit jeweils ganz eigenen sinnlichen Qualitäten und Deutungsangeboten. „Sie verändern und erweitern die dynamischen Bedingungen unseres Verstehens und Urteilens, Empfindens und Imaginierens.“ (Kappelhoff et al. 2015, www.cinepoetics.de)

Filme als ‚Melodien‘ aus Räumlichkeit und Zeitlichkeit

Dieses inszenatorische Kalkül der Bilder wird erst fassbar, wenn man alle Ebenen betrachtet, auf denen Zuschauende die Bilder erfahren: das Wahrnehmen (Perzeption), das Fühlen (Affizierung) und das Verstehen (Kognition). Unserer filmanalytischen Methode liegt die Annahme zugrunde, dass diese drei Ebenen beim Filme-Sehen in ein und demselben dynamischen Prozess ineinandergreifen. Die Inszenierung selbst ist nicht nur schmückende Verpackung eines „Inhalts“ und das emotionale Empfinden der Zuschauenden nicht nur Beiwerk oder Ergebnis rationaler Verstehensprozesse. Vielmehr bedingt die Dynamisierung der räumlichen und zeitlichen Konstruktionen durch die filmischen Ausdrucksmittel erst das Verständnis für die dargestellte Welt und ihre Sinnhaltigkeit.

Mit unseren Filmanalysen können wir keinerlei Aussagen darüber treffen, was einzelne Zuschauer*innen im Moment der Filmrezeption tatsächlich empfinden. Wir nutzen deshalb mit Blick auf die Ausdruckskraft der filmischen Bilder nicht den Begriff der „Emotion“, da dieser durch die Psychologie geprägt ist und Eigenschaften bzw. innere Zustände der Zuschauenden bezeichnet: In Reaktion auf das Gesehene entwickeln diese demnach jeweils klar abgrenzbare und punktuell auftretende Emotionen wie Freude, Angst oder Zorn. Wir sprechen hingegen von „Affekten“ und meinen damit bestimmte sinnliche Qualitäten der audiovisuellen Inszenierung, die im dynamischen Zusammenspiel der gestalterischen Mittel des Films entstehen (vgl. Bakels 2017, Kappelhoff/Bakels 2011). Sie bezeichnen keine klar differenzierbaren, punktuell auftretenden Emotionen, sondern vielschichtige und oft diffuse Stimmungen, die sich über die Dauer aufbauen, verändern oder ineinander übergehen. Affekte sind zunächst einmal nichts anderes als objektiv beschreibbare, sinnliche Eigenschaften der Bilder selbst, zielen jedoch darauf ab, im Prozess des Zuschauens erfahren und nachvollzogen zu werden. Das Verhältnis von Zuschauer*in und Film wird in dieser Perspektive nicht auf Basis eines Reiz-Reaktions-Schemas gedacht. Vielmehr gehen wir davon aus, dass die filmische Inszenierung die Wahrnehmung der Zuschauer*innen während des Filme-Sehens formt und so Gefühle beim Publikum entstehen lässt. „Gefühl“ meint hier also das Realisieren von Affekten im leiblichen Erleben der Zuschauer*innen: Indem die sinnlichen Eigenschaften eines Films mit Herzklopfen, Gähnen, Gänsehaut, Beklemmung, Freude etc. wahrgenommen werden, werden sie zum Ausdruck von Haltungen zur Welt und sich selbst gegenüber. Auf Grundlage der Filmanalyse kann man keine Behauptungen über die Gefühle einzelner Zuschauer*innen aufstellen, jedoch kann man – vergleichbar mit dem lyrischen Ich in der Gedichtanalyse – eine im jeweiligen Film angelegte Zuschauer*innen-Perspektive rekonstruieren (vgl. Kappelhoff 2018, S. 145).

Es ist deshalb die Dynamik der gestalterischen Muster audiovisueller Bilder, die bei unseren Analysen im Zentrum steht. Wir analysieren filmspezifische Gestaltungsmittel – Schnitt, Kameraperspektiven, Lichtsetzung, Musik usw. – in ihrem Zusammenspiel, in ihrer Orchestrierung im zeitlichen Verlauf. Erst gemeinsam bringen sie etwas zum Ausdruck – vergleichbar mit den unterschiedlichen Instrumenten eines Orchesters, die erst in ihrem Zusammenspiel und im Gehörtwerden zu einer Melodie werden, die Gefühle weckt und moduliert. Ausdruck wird somit nicht als persönliche Intentionalität verstanden, sondern als sinnlich wahrnehmbare Qualität von Dingen, Bewegungen, Körpern und räumlichen Verhältnissen. Die Musik-Metapher aufgreifend ließe sich also eine solche Analyse der dynamischen Entfaltung räumlicher und zeitlicher Ausdrucksmuster als das Herausarbeiten von „Melodien“ aus Räumlichkeit und Zeitlichkeit begreifen. Die hier angesprochenen Ausdrucksqualitäten umfassen zum Beispiel:

  • Beschleunigung/Verlangsamung
  • Rhythmisierung
  • Verengung/Weitung
  • Ruhe/Unruhe (Zittern, Gleiten, Wackeln etc.)
  • Gerichtete Bewegung/Schlingern, Taumeln
  • Erhellung/Verdunkelung
  • Kontrastierung/Harmonisierung

Auch hier sei der Aspekt des dynamischen Zusammenspiels betont: In der zeitlichen Entstehung und Orchestrierung entwickeln diese Ausdrucksmuster jeweils spezifische affektiv deutbare Qualitäten. Beispiele für mögliche Qualifizierungen können sein:

  • Verengung > Beklemmung/Klaustrophobie
  • Zittern, Wackeln > Unsicherheit, Angst, Zorn
  • Ruhiges Gleiten > Sicherheit, Erhabenheit
  • Beschleunigung > Stärke, Freude, Kontrollverlust

Es geht dabei nicht um feststehende Zuordnungen: Beschleunigung – etwa der Kamerabewegung oder des Schnitttempos – kann einmal ein Gefühl der Freude oder der Stärke zum Ausdruck bringen, ein anderes Mal ein Gefühl des Kontrollverlusts. Eine spezifische Qualifizierung lässt sich immer erst durch die Analyse der jeweiligen dynamischen Muster im Zusammenspiel der Gestaltungsebenen vornehmen.

Wir bezeichnen solche dynamischen Muster als „Ausdrucksbewegungen“ (Kappelhoff 2004, Kappelhoff/Bakels 2011). Diese zeichnen sich durch eine jeweils bestimmte affektive Qualität aus, die sich aus der Beschreibung der audiovisuellen Komposition in ihrer Ganzheit ableiten lässt: Ausdrucksbewegungen haben häufig einen charakteristischen dramaturgischen Verlauf, etwa mit einer sich zum Höhepunkt steigernden und dann wieder abfallenden Intensität oder sich steigernden oder kontrastierenden Wiederholungsmustern. In der Regel beträgt ihre Länge zwischen 30 Sekunden und 5 Minuten. Den Kern unseres analytischen Ansatzes bildet daher die Identifizierung und Beschreibung sogenannter „Ausdrucksbewegungseinheiten“ (kurz: ABE). Der Abschnitt im Treppenhaus etwa zeigt eine solche Einheitlichkeit bzw. Abgeschlossenheit, die sich über das dynamische Muster bestimmt: Die Gestaltungsebenen – Kameraperspektive, Montage, Bildgestaltung, Musik – wirken hier gemeinsam darauf hin, den Eindruck eines strudelartigen Sogs nach unten zu erzeugen. Dieses Muster unterscheidet sich deutlich von den Mustern der Sequenzen davor und danach; anhand der genauen Beschreibung der audiovisuellen Gestaltung lassen sich Anfang und Endpunkt des Abschnitts genau bestimmen und der dynamische Verlauf dazwischen als Ausdrucksbewegungseinheit beschreiben. Mehrere Ausdrucksbewegungseinheiten bilden in ihrem Zusammenspiel eine Szene und bestimmen deren kompositorischen Verlauf. Die Szenen bestimmen wiederum in ihrer Abfolge die sogenannte Affektdramaturgie des gesamten Films.

Anleitung zur Filmanalyse

Das Vorgehen bei der Film- und Medienanalyse nach der eMaex-Methode besteht im Wesentlichen darin, die audiovisuellen Untersuchungsgegenstände – Spielfilme, Internetvideos, Werbespots, Nachrichtensendungen etc. – in Ausdrucksbewegungseinheiten zu zerlegen, diese zu beschreiben und zu qualifizieren, um abschließend ihren Gesamtverlauf zu betrachten. Die grundlegenden Arbeitsschritte bei der Analyse sind also: Segmentierung, Beschreibung, Qualifizierung. Längere Formate werden zunächst in Szenen als größere Einheiten unterteilt, innerhalb derer dann die Beschreibung der ABEs als kleinste Einheiten erfolgt. Auf diese Weise können später die Inszenierungsmuster mehrerer Szenen zueinander ins Verhältnis gesetzt und in ihrem Gesamtverlauf als Affektdramaturgie des Films beschrieben werden. Darüber hinaus lassen sich so mehrere Filme systematisch miteinander vergleichen, etwa für die Untersuchung der Inszenierungsmerkmale eines bestimmten Genres. Die Analysesystematik lässt sich nach Bedarf anpassen und adaptieren. Wir stellen hier lediglich eine reduzierte Variante vor, die sich für eine basale Analyse kürzerer Formate eignet, ohne Unterstützung durch spezielle Software. Sie kann als Anleitung für eigene Analysen verstanden werden, oder aber schlicht als Anregung, die Ausdruckskraft audiovisueller Bilder im pädagogischen Kontext neu zu denken.

Es geht dabei ausdrücklich nicht darum, die Intention der Autor*innen zu erraten oder Behauptungen darüber aufzustellen, wie eine konkrete Menschengruppe auf diesen einen Film reagieren wird. Ausdrucksbewegungsanalyse heißt, objektiv beschreibbare Raum-Zeit-Konstruktionen und Zuschauer*innen-Adressierungen herauszuarbeiten. Diese zu deuten, ist Aufgabe weiterführender Diskussionen, die sich dann jedoch auf eine gemeinsame Beobachtungsebene stützen können.

Was heißt das nun für den Umgang mit einem Video wie Es wird Zeit? Wie kann diese Methode dabei helfen, die spezifischen Perspektivierungen und adressierten Gefühlsqualitäten des Videos herauszuarbeiten und dies für die Arbeit in pädagogischen Kontexten nutzbar zu machen?

 Wie erfasst man filmische Ausdrucksbewegungen?

Für die Auseinandersetzung mit einem neuen Video/Film ist eine erste Sichtung ohne Unterbrechung und Ablenkung ein guter Ausgangspunkt: Pausieren Sie nicht, machen Sie keine Notizen während der Sichtung, sondern lassen Sie das Video auf sich wirken. Halten Sie dann, bevor Sie in eine Analyse einsteigen, Ihre ganz individuellen Intuitionen und Reaktionen fest: Was fühlen Sie? Und wo in Ihrem Körper fühlen Sie es? Welche Details sind Ihnen im Nachhinein noch überraschend präsent? Was bewegt Sie? Was stört Sie? Und inwiefern verändert es Ihr Denken? Die Antworten auf solche Fragen sind keine filmanalytischen Befunde, aber intuitive Reaktionen können die gemeinsame Aufgabenstellung für das Analysegespräch liefern: Warum haben wir alle so darauf reagiert? Warum haben wir an dieser Stelle eine sehr abweichende Haltung dazu? Die Filmanalyse kann nun als Instrument der Dekonstruktion dienen, welches es uns ermöglicht, unsere Reaktion auf Filme besser zu verstehen.

Für den Einstieg in die qualitative Analyse sollten nun mehrere weitere Sichtungen des Videos folgen, um die dramaturgische Struktur in den Blick zu bekommen, möglicherweise erste Spezifika der Gestaltung zu erfassen und Szenenwechsel zu identifizieren. Hierbei kann es dienlich sein, zu pausieren, einzelne Teile zu wiederholen und Notizen zu machen. Bei der Identifikation und Beschreibung der ABEs und ihrer jeweiligen dynamischen Muster ist es hilfreich, nach dominanten Gestaltungsebenen (vgl. Eisenstein 1988) zu suchen: Oft wird die grundlegende Qualität des Musters von bestimmten filmischen Gestaltungsmitteln vorgegeben, etwa wenn durch den Schnitt ein bestimmter Rhythmus erzeugt wird oder Kamerabewegung und Musik gemeinsam einen Eindruck von Beschleunigung oder Intensivierung bewirken.

Im Falle unseres Beispielvideos wird dabei schnell deutlich: Das gesamte Video mit seiner Länge von 3:32 Min. bildet eine szenische Einheit, die vor allem über die Musik zusammengehalten wird und sich nicht in einzelne Szenen unterteilen lässt. Um nun die Ausdrucksbewegungseinheiten (ABEs) zu identifizieren und zu beschreiben, verengt sich der Blick auf die Detailebene der audiovisuellen Komposition: Das Video wird nicht mehr in Echtzeit gesichtet, sondern Einstellung für Einstellung beschrieben. Es empfiehlt sich, jede einzelne Einstellung genau zu betrachten und Notizen dazu zu machen – beispielsweise in Form eines sogenannten Einstellungsprotokolls in tabellarischer Form –, welche spezifischen Merkmale auf den einzelnen Gestaltungseben zu sehen sind: Handelt es sich z. B. um eine Großaufnahme oder eine halbnahe Einstellung, gibt es Kamerabewegung, markante Beleuchtung, ist die Bildgestaltung eher flächig oder tief, symmetrisch oder chaotisch? (Für einen ausführlichen Überblick über filmanalytische Grundbegriffe und deren Definition siehe: AdA-Filmontologie – Ebenen, Typen, Werte (Scherer et al. 2021).) Oft lassen sich von vornherein dominante Gestaltungsebenen identifizieren, dann beschränkt man die Beschreibung auf diese. Verfolgt man dieses detaillierte Vorgehen konsequent für einige Einstellungen, entwickelt man einen Blick für das dynamische Muster der Videosequenz und wird früher oder später darauf stoßen, dass auf bestimmten Ebenen ein Wechsel dieses Musters zu erkennen ist. Das heißt, dass man vermutlich an einen Grenzpunkt gestoßen ist, an welchem eine ABE endet und die nächste beginnt. Auf diese Weise kann man mit den verbleibenden Sequenzen fortfahren, bis alle ABEs identifiziert sind. Mit der Zeit wird der Blick für die dynamischen Muster in der Regel mehr und mehr geschärft, sodass gegebenenfalls nicht mehr jede einzelne Einstellung protokolliert werden muss.

Clip 1: Es wird Zeit. YouTube-Video des Users „Muslim Interaktiv“. Hochgeladen am 03.03.2020. Bei obigem Video handelt es sich um eine Kopie im Rahmen des Zitatrechts. Der Zugang kann für wissenschaftliche oder pädagogische Zwecke unter rise@jff.de  angefordert werden[1].

Hat man auf diese Weise die ABE-Grenzen identifiziert, hat man also schon eine Vorstellung davon, was das dynamische Muster der einzelnen ABEs ist, und kann diese nun in ihrer Gestalt beschreiben und qualifizieren. Wir veranschaulichen dies im Folgenden mit der Beschreibung der ABEs von Es Wird Zeit.

Ausdrucksbewegungseinheiten (ABEs) von ES WIRD ZEIT

Wir haben in Es wird Zeit fünf ABEs identifiziert. Die erste ABE (0:00-0:32 Min.) wird durch eine durchgehende Klangkulisse und Bewegungsrichtung zusammengehalten. Nachrichtenfragmente und Spannungsmusik fassen den Übergang vom düsteren Außen des Stadtraums zum hell erleuchteten Innen einer Wohnung ein. Als dominante Gestaltungsebenen wirken die Kamerabewegung und die Bildkomposition (Gegensatz von chaotischem, düsterem Außen und erleuchtetem Innen). Der Flug der Kamera über der Stadt versetzt die Zuschauenden in eine erhabene, schwerelose Perspektive und etabliert zugleich eine Bewegung der Anziehung: Das ruhige, stetige Gleiten auf das erleuchtete Fenster zu wirkt wie ein langsamer, aber unablässiger Sog. Mit einem Schnitt versetzt uns die Kamera in das Innere der Wohnung. Die Kamerabewegung reduziert sich auf ein angedeutetes, seitliches Kreisen um die Körper der Männer herum, die damit als hell erleuchtete Zentren bzw. als Fluchtpunkt der vorhergehenden Anziehungsbewegung gesetzt werden.

Das dynamische Muster dieser ABE ließe sich also folgendermaßen qualifizieren: Die Leichtigkeit und Erhabenheit der Flugaufnahmen geht über in ein Angezogenwerden, das den Blick aus dem düsteren, chaotischen Außen der Stadt auf stete und zielstrebige Weise zum leuchtenden Zentrum im Innern der Wohnung führt.

Abb. 2, ABE 1 von Es Wird Zeit.

Der Umbruch zur zweiten ABE (0:32-1:09 Min.) zeigt sich als ein sehr deutlicher Wechsel des dynamischen Musters und ist zugleich durch eine Schwarzblende und einen Knall markiert. Nach einem Moment der Stille setzt eine rhythmisch-treibende, elektronische Musik ein, die sofort von der Montage aufgegriffen wird: Von nun an wird jeder Schnitt vom Rhythmus der Musik bestimmt. Diese Einheit von Musik und Montage – die dominanten Gestaltungsebenen dieser ABE – ist geprägt von einem spezifischen inszenatorischen Muster: Der Beat des Musikstücks folgt einem gebrochenen Rhythmus, während die Montage von sogenannten Jump Cuts geprägt ist; d. h., der Bildausschnitt wird von Einstellung zu Einstellung kaum verändert, die Kamera springt lediglich ein kleines Stück näher an ihr Motiv heran oder weiter weg. In Verbindung mit dem Rhythmus entsteht dadurch der Eindruck eines Pulsierens des Bildes, verstärkt durch sehr kurze Schwarzbilder, die in den Rhythmus eingepasst werden. Zu diesem dynamischen Muster gesellt sich ein zweites: In einer Parallelmontage werden die Tätigkeiten der drei Männer gewissermaßen synchronisiert. Wir sehen sie jeweils Zeitungen und Koranausgaben in Taschen packen, Jacken anziehen, die Wohnungstür öffnen und hinausgehen – stets, ohne dass die Gesichter sichtbar sind. Über Match Cuts – Schnitte, die eigentlich räumlich/zeitlich abweichende Perspektiven in eine durchgehende Bewegung einpassen – entsteht zeitweise sogar der Eindruck einer Verschmelzung der Figuren.

Betrachtet man diese zwei Ebenen der Inszenierung zusammen, lässt sich das dynamische Muster der ABE 2 folgendermaßen qualifizieren: Mit der Parallelmontage der synchronisierten Männerkörper wird eine Dynamik des Aufbruchs inszeniert, die durch die betonte Rhythmisierung eine mechanisch anmutende Taktung der ausgestellten Männerkörper suggeriert. Die Bewegungen erscheinen so nicht als individuelle Handlungen, vielmehr entsteht der Eindruck, als würde ein Programm ablaufen. Durch den pulsierenden Rhythmus und den Fokus auf die muskulösen Körper der Männer behält sich diese „Maschine“ jedoch etwas sehr Organisches: Hier werden nicht zwei oder drei einzelne Körper inszeniert, sondern ihr Zusammenschluss zu einer organischen Einheit, die sich über eine entschlossene und mitreißende Dynamik bestimmt.

Abb. 3, ABE 2 von Es Wird Zeit.

Eine weitere Schwarzblende markiert den nächsten ABE-Übergang. In der dritten ABE (1:09-1:43 Min.) hält die zuvor etablierte organische Dynamik für einen Moment inne und eine statische Einstellung, die einen der Männerkörper im Dunkeln vor einem erleuchteten Fahrstuhl zeigt, eröffnet diese Sequenz. Mit der Fahrstuhlbewegung wird nun eine Abwärtsdynamik etabliert; sie geht über in die eingangs beschriebene Einstellungsfolge der Treppenhäuser, in welchen die Kamera von oben nach unten blickt. Auch hier springt bzw. zoomt die Kamera in Jump Cuts leicht nach vorne; in Verbindung mit der leichten Drehbewegung und den spiralartigen Konturen der Treppenhäuser wird aus der Abwärtsbewegung der beschriebene Sog. Nun blickt die Kamera den Männerkörpern hinterher, wie sie jeweils durch dunkle Gänge hinausmarschieren gen Tageslicht; als würde die vorherige Sogbewegung nun kanalisiert in Richtung draußen.

Das dynamische Muster dieser ABE dient also der Entwicklung einer Sogwirkung nach unten-draußen, die die Männerkörper bei ihren nach wie vor gleichgeschalteten Bewegungen erfasst. Sie gibt ihrem Gang etwas Zwingendes: Ein Anhalten oder Abweichen vom Wege ist in dieser filmischen Welt nicht denkbar.

Abb. 4, ABE 3 von Es Wird Zeit.

 

Zu Beginn der vierten ABE (1:43-2:06 Min.) springt die Kamera nach draußen an eine Bushaltestelle und auf Tonebene setzen Nachrichtenstimmen und Beats wieder ein. Nun dominieren parallelisierte horizontale Bewegungen durch den Raum. So steht das Thema Mobilität im Zentrum, womit die Gleichschaltung der Körper auf einer weiteren Ebene erneut aufgegriffen wird: Ob mit Bus, Auto oder U-Bahn, diese getakteten Körper bewegen sich behände im städtischen Raum und bahnen sich geradlinig und zielsicher ihren Weg.

Abb. 5, ABE 4 von Es Wird Zeit.

Die fünfte und letzte ABE (2:06-3:32 Min.) beginnt mit Luftaufnahmen der Großstadt, ähnlich wie sie zu Beginn des Videos, und stellt damit eine inszenatorische Rahmung des Videos her. Die Kamera folgt nun den Körpern auf dem Weg durch städtische Szenerien und U-Bahntunnel, wobei die Männer ihren Gang beschleunigen. Direkt hinter den Körpern positioniert, lässt sie sich gewissermaßen von ihnen mitziehen; die Körper der Männer haben die Sogbewegung aufgenommen und selbst eine Zugkraft entwickelt. Aus der Vogelperspektive sehen wir die drei Männer auf einem großen Platz zusammenkommen, wo sie auf eine Ansammlung vieler weiterer Körper in weißen T-Shirts treffen. Nun lässt die Kamera von den drei Männern ab und taucht selbst in die Menge der Körper ein. Dabei zeigt sie stets nur Körperfragmente, auch hier keine Gesichter: Wir sehen Rücken, Arme, Schultern, manchmal einen Oberschenkel; durch die identische Kleidung ist kaum zu erkennen, wo der eine Körper beginnt und der andere aufhört. Was vorher schon in der Gleichschaltung der drei Körper auf dem Weg zum Platz angedeutet war, findet hier seinen Höhepunkt: Mit der Kamera tauchen wir ein in einen überindividuellen Körper-Verbund, einen Über- oder Gruppenkörper, in welchem jede individuelle Körperlichkeit aufgeht. Die Kamera bewegt sich spielerisch gleitend innerhalb dieses Gruppenkörpers und vermittelt Beweglichkeit und Kraft.

Das dynamische Muster dieser ABE beginnt also mit einer beschleunigenden Zugwirkung, die dann in ein Eintauchen in den Gruppenkörper mündet und in eine energische Binnenbewegung übertragen wird. In Kombination mit den rahmenden Flugaufnahmen wird dies zu einer Ersatzbewegung: Die Stimmen der Nachrichtensprecher*innen als mediale Störgeräusche sind nun endgültig weggewischt und werden durch das Bild dieses starken und beweglichen Körper-Verbunds ersetzt, der durch Blendeffekte wie eine strahlende Lichtquelle in der düsteren Stadtlandschaft ins Bild gesetzt ist.

Abb. 6, ABE 5 von Es Wird Zeit.

 

Abb. 7, Zeitstrahl mit allen ABEs von Es Wird Zeit.

Wir fassen nun diese Abfolge der ABEs mit ihren dynamischen Mustern und affektiven Qualitäten als einen Gesamtverlauf zusammen, als einen affektiven Parcours, durch den das Video seine Zuschauer*innen führt, und kommen damit zugleich zu der Frage vom Anfang zurück:

Was will uns dieses Video sagen?

Wir sehen nicht nur mehrere Männer auf ihrem Weg durch die Stadt und bei der Versammlung. Was hier vermittelt werden soll, ist der Genuss an der beschriebenen Dynamik einer Bewegung des Aufbruchs und buchstäblichen Mobilisierung, die für die Zuschauenden als ein sinnliches Erleben erfahrbar gemacht und als ein verführerisches Gegenangebot zu den „Störgeräuschen “ der Nachrichtenmeldungen inszeniert wird. In ABE 1 wird aus dem Schwebenden der gleitenden Flugaufnahmen heraus eine Dynamik der Anziehung etabliert, die über den gesamten Verlauf des Videos in Variationen fortgeführt und intensiviert wird. Mit ABE 2 setzt zugleich ein Prozess der Gleichschaltung der Körper in der Bewegung ein, der in ABE 5 in einer gloriosen Verschmelzung mit dem übergeordneten Gruppenkörper mündet (vgl. Pogodda/Gronmaier 2015, Kategorie 2).

Das Video will also gar nicht in erster Linie etwas „sagen “; vielmehr möchte es, dass die Zuschauenden etwas erfahren, dass sie eine sinnliche Erfahrung machen, nämlich die des Angezogenwerdens, des Einstimmens in den pulsierenden Rhythmus dieses Aufbruchs, des Angesaugt- und Mitgezogenseins auf dem Weg durch die Gänge und Tunnel der Stadt und schließlich des Aufgehens in einem Verbund starker Körper, der sich kraftvoll im öffentlichen urbanen Raum manifestiert und präsentiert.

Dass diese Adressierung der Zuschauenden in ihrer Spezifik erst über die Ausdrucksbewegungsanalyse fassbar wird, macht der Vergleich mit einem Video aus einem anderen Bereich extremistischer Mobilisierung deutlich, nämlich mit dem Video Heimatliebe ist kein Verbrechen: Solidarität mit der Génération identitaire (0:30 Min.) des rechtsextremistischen Kanals „Festung Ulm“ aus dem Kontext der „Identitären Bewegung“. Auch in diesem sehr kurzen Video beobachten wir mehrere junge Leute dabei, wie sie sich auf den Weg zu einer Versammlung machen. Auf Ebene der Handlung bzw. des Inhalts könnte man hier zu einer ganz ähnlichen Zusammenfassung kommen wie bei Es Wird Zeit: „Wir sind die Identitäre Bewegung, die ,Génération identitaire‘, wir sind viele, wir haben eine Überzeugung und wir versammeln uns“. Die Art und Weise, wie dies hier inszenatorisch erfahrbar wird, ist aber eine gänzlich andere. Zwar beobachten wir zu Beginn ebenfalls Menschen auf ihrem Weg zur Versammlung, doch hier entsteht keine Dynamik des Aufbruchs, obwohl die gewählte Musikuntermalung gewisse Ähnlichkeiten zum ersten Video aufweist. Das Video lässt sich als eine einzige Ausdrucksbewegungseinheit mit Höhepunkt-Dramaturgie beschreiben. Zu Beginn gleitet die Kamera in einer Drohnenaufnahme durch die Dämmerung und zeigt aus einer Vogelperspektive, wie eine Gruppe von Menschen einen Hügel erklimmt. Dann springt sie auf den Boden und zeigt aus Augenhöhe in einer Serie von Handkameranahaufnahmen Details dieser Prozession im Close-up: vermummte Gesichter, ein Aufnäher, der auf eine gegen Flüchtende gerichtete Aktion der Identitären verweist – alles nur spärlich beleuchtet vom Dämmerlicht der bereits untergegangenen Sonne.

Abb. 8, ABE 1 von Heimatliebe ist kein Verbrechen.

Plötzlich und unvermittelt steigt die Intensität des Spots auf unterschiedlichen Gestaltungsebenen gleichzeitig an: Ein treibender Beat setzt ein, eine durch ein Megaphon verzerrte Männerstimme skandiert schreiend einen Slogan der Gruppierung, und das zuvor matte Bild wird durch grelle Lichtpunkte und markante Farbakzente schlagartig belebt. Die Gruppe hat nun Position bezogen, schwenkt Fahnen und hat Leuchtfackeln entzündet, die starke Hell-Dunkel-Kontraste hervorrufen. Trotz der unruhigen Handführung der Kamera bleiben die Blickpunkte der Einstellungen weitgehend statisch. Der so inszenierte Gruppenkörper wirkt wie eine erleuchtete Festung aus Körpern, ein lebendiges Bollwerk, das sich auf einem Hügel über der Stadt erhebt. Eine blitzartig ausbrechende Demonstration von Geschlossenheit und Stärke gegenüber einem buchstäblich finsteren und bedrohlich wirkenden Außen sind die affektiven Qualitäten, die hier zum Ausdruck kommen.

Clip 2: Heimatliebe ist kein Verbrechen. YouTube-Video des Users „Identitäre Bewegung Deutschland“. Hochgeladen am 23.02.2021. Bei diesem Video handelt es sich um eine Kopie im Rahmen des Zitatrechts. Der Zugang kann für wissenschaftliche oder pädagogische Zwecke unter rise@jff.de angefordert werden (vgl. Fußnote 1).

Eine solche Dramaturgie der gedämpften Dynamik, die blitzartig in eine grelle Sichtbarkeit umschlägt, kann auch in anderen Mobilisierungsvideos der „Identitären Bewegung Deutschland“ beobachtet werden[2]: Im Handkamera-Stil gehalten, fungieren die Videos zur Dokumentation und Stilisierung öffentlichkeitswirksamer Aktionen, die sich entweder gegen die politischen Gegner oder an die „blinde“ Mehrheitsgesellschaft richten. Die Ausstellung der eigenen Präsenz wird zum „Weckruf“, zur „Mahnung“ oder zur Einschüchterung – eine Machtgeste, die mit der Sichtbarkeit des sonst Verborgenen operiert und ihren Reiz aus dem so entstehenden Spannungsverhältnis zur (sozialen) Umgebung zieht.

Abb. 9, dynamisches Profil von Heimatliebe ist kein Verbrechen.

Filmische Weltentwürfe

Man kann diese so herauspräparierten filmischen Weltentwürfe nun als Ausdruck eines ideologischen Selbst- und Weltverständnisses deuten, das sich den Zuschauenden in den räumlichen und zeitlichen Konstruktionen als sinnliche Erfahrung erschließt. Man kann darin sowohl den Grund für den Reiz dieser Videos ausmachen als auch ein Moment der Selbstentlarvung. Ob das erste Video durch sein größeres handwerkliches Geschick mit dem eindringlich gestalteten Prozess der Dynamisierung und Einverleibung oder aber das zweite Video mit seiner Inszenierung einer eruptiven Machtdemonstration das effektivere und damit „gefährlichere“ Mobilisierungsvideo ist, bleibt an dieser Stelle offen und wäre in weiterführenden Untersuchungen zu klären. Hier gälte es z. B., das mediale Umfeld der Videos, die Nutzer*innen-Interaktion und Reichweite miteinzubeziehen. Durch die detaillierte Ausdrucksbewegungsanalyse wird jedoch zunächst einmal eine Grundlage geschaffen, auf der diese und andere Fragen mit Blick auf die ästhetischen Dimensionen und affektiven Adressierungen formuliert und kritisch reflektiert werden können.

Unter anderem lässt sich nun etwa fragen, welche Ideen von Gemeinschaftsbildung hier jeweils zum Tragen kommen. Die Analyse der Videos zeigt, dass beide einen filmischen Ausdruck für eine jeweils bestimmte Idee des Zusammenkommens und des Sich-Zeigens suchen. In Es Wird Zeit kommen dabei Inszenierungsmuster zum Einsatz, die im Bereich faschistischer Propaganda schon sehr viel früher gängig waren: Die Inszenierung männlicher Körperlichkeit im triumphalen Zusammenschluss zu einem durchschlagenden Gesamtkörper durch Gleichschaltung, in der jede Individualität ausgelöscht wird, sieht man unter anderem auch in den Propagandavideos für das NS-Regime von Leni Riefenstahl (vgl. Kappelhoff 2016). Gleichzeitig werden diese Gruppeninszenierungen in beiden Fallbeispielen mit Flashmob-Ästhetiken verbunden, die als Genremuster von politischer Selbstwirksamkeitserfahrung gedeutet werden können und stilistische Verbindungen zu videoaktivistischen Formaten aus ganz anderen politischen Kontexten aufweisen. Durch die Engführung von Musik und Montage ergeben sich zudem inszenatorische Parallelen zu Musikvideos und deren Idee von durch und durch rhythmisierten Welten im Sinne eines bestimmten „Lebensgefühls“.

Aus unseren Erfahrungen aus Lehre und Filmvermittlung heraus ziehen wir die Folgerung, dass die Kenntnis filmwissenschaftlicher Grundlagen – als ein wichtiger Bestandteil von Medienkompetenz – auch in der alltäglichen Auseinandersetzung mit persuasiv-audiovisuellen Medien zur Mündigkeit und Resilienz von Zuschauer*innen, auf die diese Überzeugungsversuche abzielen, beitragen kann. In diesem Sinne handelt es sich bei diesem Text um den Versuch, filmwissenschaftliche Analyseschritte für den Gebrauch in Gesprächssituationen zu kondensieren und zu komprimieren. Ziel ist es dabei nicht, eine „richtige“ Deutung durch spezifische Verfahren vorzugeben, sondern ein Grundverständnis zu vermitteln, das den Zuschauer*innen ermöglicht, die filmischen Mittel von Propaganda, Werbung und Persuasion kompetenter zu dekonstruieren und die (Selbst-)Erfahrung des Filme-Sehens reflektieren zu können.

Literaturverzeichnis

Bakels, Jan-Hendrik: Audiovisuelle Rhythmen. Filmmusik, Bewegungskomposition und die dynamische Affizierung des Zuschauers. Berlin/Boston, MA: De Gruyter 2017. Open Access: https://www.degruyter.com/document/doi/10.1515/9783110488319/html [Zugriff: 15.10.2021].

Eisenstein, Sergej (1988). Die vierte Dimension im Film. In: ders., Das dynamische Quadrat. Schriften zum Film. Hrsg. v. Oksana Bulgakowa, Dietmar Hochmuth. Köln: Röderberg  [1929], S. 90–108.

Gallagher, Shaun (2008). Understanding others: Embodied social cognition. In: Calvo, Paco/Gomila, Antoni (Hrsg.), Handbook of Cognitive Science: An Embodied Approach. Amsterdam: Elsevier, S. 439–452.

Johnson, Mark (2007). The Meaning of the Body. Aesthetics of Human Understanding. Chicago, IL: Chicago University Press.

Kappelhoff, Hermann (2004). Matrix der Gefühle. Das Kino, das Melodrama und das Theater der Empfindsamkeit. Berlin: Vorwerk 8.

Kappelhoff, Hermann/Bakels, Jan-Hendrik: »Das Zuschauergefühl. Möglichkeiten qualitativer Medienanalyse«. In: ZfM 5(2), 2011, S. 78–95. DOI: https://doi.org/10.25969/mediarep/2623 [Zugriff: 15.10.2021].

Kappelhoff, Hermann (2016). Genre and ‚Sense of Community‘. In: mediaesthetics – Journal of Poetics of Audiovisual Images, 1. DOI: http://dx.doi.org/10.17169/mae.2016.42.

Kappelhoff, Hermann (2018). Kognition und Reflexion: Zur Theorie filmischen Denkens. Berlin/Boston, MA: De Gruyter.

Kappelhoff, Hermann/Wedel, Michael et al. (2015). Kolleg-Forschungsgruppe Cinepoetics. www.cinepoetics.de [Zugriff: 15.10.2021]

Pogodda, Cilli/Gronmaier, Danny (2015). The War Tapes and the Poetics of Affect of the Hollywood War Film Genre. In: Frames Cinema Journal, 7. https://framescinemajournal.com/article/the-war-tapes-and-the-poetics-of-affect-of-the-hollywood-war-film-genre/ [Zugriff: 15.10.2021]

Scherer, Thomas/Greifenstein, Sarah/Kappelhoff, Hermann (2014). Expressive Movements in Audiovisual Media. Modulating Affective Experience. In: Müller, Cornelia/Cienki, Alan/Fricke, Ellen/Ladewig, Silva/McNeill, David/Bressem, Jana/Tessendorf, Sedinha (Hrsg.), Body – Language – Communication. An International Handbook on Multimodality in Human Interaction, Vol. 2. Berlin/Boston, MA: De Gruyter Mouton, S. 2081–2092.

Scherer, Thomas/Stratil, Jasper/Pfeilschifter, Yvonne/Zorko, Rebecca/Buzal, Anton/Prado, João Pedro/Agt-Rickauer, Henning/Hentschel Christian/Sack, Harald/Grotkopp, Matthias/Bakels, Jan-Hendrik (2021). AdA-Filmontologie – Ebenen, Typen, Werte. In: AdA-Toolkit. www.ada.cinepoetics.fu-berlin.de/ada-toolkit [Zugriff: 15.10.2021]

Sheets-Johnstone, Maxine (2008). Getting to the heart of emotions and consciousness. In: Calvo, Paco/Gomila, Antoni (Hrsg.), Handbook of cognitive science: an embodied approach. Amsterdam: Elsevier, S. 453–465.

 

Einzelnachweise

  1. Die analysierten Videos wurden auf eine Videoplattform geladen und sind über diese für den wissenschaftlichen und pädagogischen Gebrauch abrufbar. Auf diese Weise wird verhindert, dass problematische Accounts direkt verlinkt werden, die Klickzahlen dieser Accounts erhöht werden und die Algorithmen der Plattformen den Nutzenden über die Verlinkung weitere Inhalte dieser Art vorschlagen. Zurückspringen
  2. Siehe z.B. Von wegen "Partyszene"! Europas Jugend klagt an (hochgeladen am 05.07.2020) oder »Kein zweites 2015« – Kunstaktion am Rostocker Markt (hochgeladen am 27.09.2021). YouTube-Videos des Users „Identitäre Bewegung Deutschland“. Zurückspringen