Eine kurze Einführung zum vernetzten Musizieren

Anmerkung des Autors: Ich bin wohl das, was man einen Techie nennt. Aus dieser Rolle heraus gibt es einiges an Wissen und Erfahrung, die ich mit euch teilen kann. Ich bin allerdings kein Musiker und begebe mich mit diesem Artikel etwas über die Schnittmenge zwischen Technologie und Musik hinaus. Also schreibt gern in den Kommentaren, wenn dieser Beitrag Korrektur oder Ergänzung bedarf.

Fangen wir vorne an. Bei einer Definition. Vernetztes Musizieren, oder im englischen wahlweise networked music performance oder online real-time music (ORM) genannt, meint eine Interaktion in Echtzeit über ein Computernetzwerk, dass es Künstlern an verschiedenen Orten ermöglicht, so Musik zu machen, als wären sie im selben Raum. Bildlich und der aktuellen Situation entsprechend ausgedrückt, jeder Musiker ist zu Hause und sie können über eine Tonverbindung (eventuell zusätzlich auch Video) zusammen proben oder sogar auftreten. Ebenso erlaubte eine solche Lösung das Unterrichten von Schülern und Studenten oder auch einfach eine Jam Session.

Das klingt im ersten Moment nach einer technischen Herausforderung. Nach einem der Bandbreite des Internetzugangs, einem der Synchronisierung der Audiostreams und vor allem einem der Latenz. Und das ist es sicherlich auch. Aber eben nicht nur.

Die Forschung, die es dazu bereits seit den 1950er Jahren gibt, kennt es unter dem Begriff Workplace Awarness, dem Bewusstsein, für die Umgebung, in der die Musiker sich während der Performance befinden.

Hier geht es um weit mehr als technische Fragen, sondern um Kommunikation und Raum. Die Gestik, Mimik und Bewegungen der Mitspieler ebenso wie die akustische und spürbar räumliche Verbreitung der Klänge. Schließlich auch vieles, was im Unbewussten bleibt und sich damit mancher Deutung oder Beschreibung entzieht.

Interessante Einsichten darüber lassen sich auch bei dem Versuch gewinnen, Maschinen diese Art der Wahrnehmung und des Bewusstseins beizubringen. So wie bei Shimon, dem musizierenden Roboter des Georgia Tech Center for Music Technology. Er versucht seine Mitmusiker wahrzunehmen und seine Art zu spielen, deren Musik und antizipiertem Verhalten anzupassen.

Was sollte also ein solches System leisten können? Zunächst, die Zusammenarbeit von Musikern, Dirigenten und womöglich sogar Zuhörern von entfernten Orten aus ermöglichen. Zusätzlich müsste es einen immersiven virtuellen Raum für synchrone und interaktive Aufführungen erzeugen. Immersion steht dabei für die Verschmelzung von realer und virtueller Welt, so dass der Nutzer keine Unterschiede mehr wahrnimmt. Aber damit nicht genug, eine perfekte Lösung müsste auch das Bewusstsein für den Raum und für die Handlungen anderer im virtuellen Raum unterstützen und somit jede Art der verbalen und non-verbalen Kommunikation.

Im ersten Reflex versuchten viele Musiker für diesen Zweck Videokonferenzsoftware, wie beispielsweise Zoom, einzusetzen, mussten allerdings sehr schnell feststellen, dass die Latenz für musikalische Ansprüche deutlich zu gross ist. Das liegt vor allem an der systemimanenten Architektur des Internets. Wir mögen uns das als Datenautobahn vorstellen, aber dem ist nicht so. Daten, die wir empfangen oder senden, werden in kleine Datenpakete aufgeteilt, die wild durchs Netz wandern, durcheinander geraten oder auch mal verloren gehen. Dabei kämpfen sie unablässig um Priorität. Dass wir davon wenig mitbekommen liegt an der Intelligenz der Anwendungen, die wir verwenden. Die versuchen das alles mit allerlei schlauen Algorithmen auszugleichen und schaffen es damit sogar, dass wir nicht einmal merken, wenn eines dieser Pakete verloren gegangen ist.

Software für vernetztes Musizieren muss da gänzlich anders vorgehen und viele der algorithmischen Finesse weglassen. Funktioniert das gut, dann lässt sich unter idealen Bedingungen eine fast latenzfreie Musikperformance erreichen. Entstehen Störungen, weil das Internet einen schlechten Tag hat oder ihr WiFi gerade mit dem Herunterladen von „House of Cards“ beschäftigt ist, geht nichts mehr.

Bislang fristete solche Software ein Nischendasein. Das lag vor allem daran, dass es kaum Nachfrage und kein tragbares Geschäftsmodell dafür gab. Auch die Infrastruktur, namentlich die Bandbreite und die Geschwindigkeit des Internets, lieferten keine zufriedenstellende Ergebnisse. All das ist nun anders. In Zeiten von social distancing steigt die Nachfrage rapide, sei es für Musikunterricht, Proben, Jam Sessions, Live-streams oder Produktionen.

Unabhängig von der Software gibt es einige Ratschläge, die man grundlegend beachten sollte:

  • No Wifi. Stattdessen der kabelgebundene Anschluss via Ethernet. Jeder Router besitzt diesen Anschluss, selbst wenn ihr ihn noch nie benutzt habt. Mit einem Speedtest (z.B. hier von Check24) könnt ihr ermitteln, wie hoch eure Raten für Upload und Download sind und ob euch euer Provider liefert, was er verspricht. Für Musikzwecke solltet ihr über 10Mbps für Upload und 20Mbps für Download verfügen.
  • Nähe. Die Latenz hat tatsächlich auch etwas mit räumlicher Nähe zu tun. Zumindest, ob euer Musikpartner wenige 100 km oder 2000 km entfernt ist. Je näher desto besser.
  • USB Audio Interface. Sollte für den Anschluss der Instrumten benutzt werden.
  • Details. Schaut euch die Dokumentation der App an, die ihr verwenden wollt und nehmt entsprechende Anpassungen vor, beispielsweise bei eurem Router.

Die verschiedenen Softwarelösungen schwanken zwischen Automatisierung einerseits und hohen Freiheitsgrade andererseits. Beides ist gut und schlecht. Zu viel Freiheit überfordert den ungeübten Nutzer mit unverständlichen Einstellungen. Zu viel Automatisierung funktionier unter idealen Bedingungen und frustriert schnell, wenn es denn nicht klappt.

Alle Tools verzichten aus nachvollziehbaren Gründen auf Videoübertragung. Da dies durchaus ein relevanter Aspekt ist (siehe Workplace Awareness) lässt sich diese Funktion durch zusätzliche Standardlösungen für Videokonferenzen lösen. Das betrifft auch einen Kommunikationskanal abseits der ORM Software.

Zum Schluss noch ein kleiner technischer Ausflug in die Funktion von Netzwerken. Zum einen gibt es sogenannte Peer-to-Peer Netzwerke. Hört sich kompliziert an, bedeutet aber ganz einfach, dass jeder mit jedem verbunden ist. Bei drei Musikern, die vernetzt musizieren wollen, ist also jeder individuell mit zwei anderen Musikern verbunden. Genau darin liegt schon der Nachteil, denn jeder muss seine Bandbreite auf zwei „offene Leitungen“ verteilen. Im Client Server Modell ist jeder nur mit einem zentralen Server verbunden, also hat lediglich eine „offene Leitung“. Das vereinfacht es deutlich, weitere Musiker hinzuzufügen. Allerdings hängt damit vieles von der Leistungsfähigkeit des Servers ab. Ist der zu stark ausgelastet oder weit weg, steigt die Latenz. Wie so oft gibt es eine Lösung dazwischen, den sogenannten Server-Mode. Hier wird kurzerhand einer der Musiker als privater Server verwendet. Damit wird es technisch etwas anspruchsvoller.

Weiterführende Links

Networked Music Performance auf Wikipedia

Schreibe einen Kommentar