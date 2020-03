Wir werfen einen Blick hinter die Kulissen des c’t-Videostudios und verraten Ihnen, wo Sie günstige Technik für eigene kleine Projekte finden.

Wenn Achim Barczok Sie zu c’t uplink begrüßt, muss niemand die Klappe halten: Dank ausgefeilter Technik braucht es keine Filmklappe oder andere Hilfsmittel, um Bild und Ton zu synchronisieren. Auch bei Live-Streams unserer LAN-­Partys von c't zockt aus dem Studio gibt es keinen Zeitversatz – das ist nicht selbstverständlich, wenn man sich einmal auf Streaming-Plattformen wie Twitch oder Mixer umsieht. Möglich macht das ein ausgefeiltes Setup, das den Zuschauern normalerweise ­verborgen bleibt, wir aber im Folgenden ­detailliert erklären. Außerdem verraten wir, wo Sie günstigere Alternativen finden.

Dass wir keine Filmklappe zum Synchronisieren von Bild und Ton benötigen, liegt an der Art, wie wir die verschiedenen Videoformate für c’t produzieren. Beim Interview-Format „nachgehakt“ zum Beispiel gibt es nur eine Kameraeinstellung, bei der lediglich der Gast zu sehen und Moderator und Gast zu hören sind. Dafür verwenden wir die Systemkamera Panasonic GH5 mit XLR-Mikrofon-Adapter und zwei externen Mikrofonen. Bild und Ton werden von der Kamera in derselben Videodatei auf einer SD-Karte aufgezeichnet und sind so automatisch synchron.

Voll synchron

Die klassische Herangehensweise ist hingegen, das Bild mit einer Videokamera und den Ton mit einem Mehrspur-Aufnahmegerät aufzuzeichnen, sodass man jede Signalquelle einzeln nachbearbeiten kann. Dabei sorgt eine Filmklappe dafür, dass Bild und Ton später am Schnittplatz Frame-genau synchronisiert werden können. Indem wir bei unserer Kamera gleichzeitig mit dem Bild die Signale beider ­Mikrofone als einzelne Monospur aufzeichnen, können wir ebenfalls am Schnittplatz die Signalquellen getrennt anpassen, ohne eine Filmklappe zu benötigen.

Eine günstige Alternative zur der von uns verwendeten, rund 2000 Euro teuren GH5 ist ein einfacher Camcorder mit externem Stereo-Mikrofoneingang, etwa der Panasonic HC-V777 für rund 360 Euro, der sich wie die GH5 zwischen 50 und 60 Bilder pro Sekunde umstellen lässt. Über ein zusätzliches Y-Kabel können Sie die Sprache von Moderator und Gast wie bei der GH5 getrennt als Monospur aufzeichnen und haben so ebenfalls die Möglichkeit, die ­Audiopegel beider Interviewpartner am Schnittplatz getrennt anzupassen.

Bei den Aufzeichnungen von c’t uplink verwenden wir typischerweise drei bis vier Kameraperspektiven, dazu drei bis vier Mikrofone für Moderator und Gäste. Auch hier wäre der klassische Ansatz, wie bei Filmproduktionen die Videos jeder einzelnen Kamera und den Ton jedes einzelnen Mikrofons getrennt aufzuzeichnen, um nachträglich am Schnittplatz alle Signale einzeln bearbeiten und die optimalen Einstellungen zusammenschneiden zu können. Dabei fallen riesige Datenmengen an und die Nachbearbeitung erfordert zudem sehr viel Zeit: Die Daten müssen erst auf den Schnittrechner übertragen und alle Videos und Tonspuren miteinander synchronisiert werden, bevor dann per MultiCam-Schnitt das fertige Video entsteht. Der Zeitaufwand beträgt oft ein Vielfaches der späteren Laufzeit des Videos.

Live produziert

Deshalb ähneln Aufbau und Ausstattung unseres Videostudios dem eines Fernsehstudios, wie es auch für Sendungsformate wie „Wetten dass?“ oder die Tagesschau benutzt wird: Die Videos aller Kameras und alle Mikrofone landen bei einem Bildmischer im Regie-Pult, wo dann in Echtzeit zwischen den Kameras umgeschaltet wird. Auch Einblendungen wie Name oder E-Mail-Adresse erfolgen wie beim Fernsehen in Echtzeit durch die Regie.

Der Vorteil dieses Ansatzes ist, dass am Ende der Aufzeichnung praktisch das sendefähige Video vorliegt – am Schnittplatz werden allenfalls noch Anfang und Ende nachbearbeitet. Es gibt aber auch erhebliche Nachteile: Die Bildauswahl lässt sich später nicht mehr ändern, denn es wird lediglich das Ausgabesignal des Bildmischers nebst Ton aufgezeichnet. Hat die Regie einen Einstellungswechsel verschlafen, gibt es keine Möglichkeit, den Fehler nachträglich auszubügeln.

Als Kameras verwenden wir überwiegend Blackmagic Studio Cameras von Blackmagic Design. Die semiprofessionellen Kameras sind für kleinere Studios konzipiert und übertragen das Bild per SDI (Serial Digital Interface, praktisch HDMI über Koax-Kabel) an den Bildmischer – selbst aufzeichnen können die Kameras nicht. Ihr Aufbau ähnelt einem Tablet mit Objektivanschluss auf der Rückseite. Der große Bildschirm dient nicht nur zur Ausrichtung der Kamera, sondern auch zur Fokussierung, wenn man herkömmliche Objektive verwendet.

Über den SDI-Eingang der Kameras lassen sich fast alle Parameter auch aus der Ferne steuern, bei motorisierten Objektiven sogar Zoom und Fokus. So können wir bei c’t uplink mit der an der Decke des Studios montierten Detailkamera, eine kompakte Blackmagic Micro Studio Camera 4K ohne Bildschirm, auf Gegenstände auf dem Tisch zoomen. Ein direkt an der Kamera montierter motorisierter Stativkopf erlaubt es uns außerdem, die Kamera vom Regiepult aus nachzuführen.

Sammelbilder

Beim Bildmischer, ein Blackmagic Atem 4 M/E Broadcast Studio 4K, laufen dann die Bild- und Tonsignale aller Kameras zusammen. Insgesamt verfügt er über 20 SDI-­Eingänge, sodass wir auch selten genutzte Bildquellen wie ein MacBook Pro, mit dem wir bei der #heiseshow externe Gäste via Skype einblenden, ständig angeschlossen lassen können. Das spart Umbauzeit und reduziert die Fehleranfälligkeit. Neben Kameras und Notebooks ist auch ein einfacher Medienplayer mit dem Bildmischer verbunden, der bei c’t uplink das Logo mit der Pixelanimation auf dem TV im Hintergrund zuspielt. Dessen Signal wird über einen der sechs SDI-Ausgänge des Bild­mischers an den Fernseher geschickt.

Natürlich könnten wir den Medienplayer auch direkt an den Fernseher anschließen. Indem wir den Bildmischer zwischenschalten, kann man aus der Regie heraus dem Fernseher auch ein beliebiges anderes Signal zuteilen, etwa das der ­Detailkamera oder des Notebooks. Dabei wandeln Blackmagic MicroConverter von HDMI auf SDI um und umgekehrt.

Generell setzen wir bei der Signalübertragung in unserem Studio auf SDI, entsprechend zahlreich sind die HDMI-SDI-Konverter. Die SDI-Konverter sind durchaus erschwinglich und eignen sich beispielsweise auch, um ein langes HDMI-Kabel zum Beamer an der Decke zu ersetzen – so wie bei unserem Beamer im Studio. Hat die Bildquelle anders als unser Bildmischer keinen SDI-Ausgang, schließt man dort einfach einen HDMI-­SDI-Konverter für knapp 50 Euro an. Der Beamer bekommt einen SDI-HDMI-­Konverter für knapp 60 Euro vorge­schaltet. Die Standard-Konverter mit ­3G-SDI von Blackmagic Design über­tragen bis zu Full HD, Mini-Konverter mit 4K-Unterstützung (6G-SDI) sind mit 150 bis 200 Euro deutlich teurer.

Der Bildmischer Atem 4 M/E Broadcast Studio 4K enthält keine Konverter, weshalb alle Zuspieler die bei ihm ausgewählte Videonorm einhalten müssen. Standard ist in unserem Studio 1080p59.94, also Full HD mit 59,94 fps. Geräte, die sich nicht darauf einstellen lassen, schalten wir vor einen Cross-Konverter MD-HX von Decimator Design, der die Framerate in Echtzeit konvertiert. In der Vergangenheit war das vor allem bei Linux-Notebooks erforderlich.

Fernbedient

Die Bedienung des Bildmischers erfolgt fast ausschließlich via Ethernet mit der Software Blackmagic Atem Control. Das Gerät besitzt nämlich nur ein Tastenfeld für die Steuerung der Aux-Ausgänge, außerdem ein Display, auf dem eins der Bildsignale der Aux-Ausgänge angezeigt wird. Atem Control stellt ein virtuelles Sendepult mit Dutzenden Tasten zur Signalauswahl und -umschaltung dar. Auch die Steuerung der HyperDeck-Rekorder, der Mediaplayer des Bildmischers und Effekte wie Einblendungen, Bild-in-Bild, Greenscreen und Umschaltanimationen werden mit Atem Control gesteuert.

Im Regiepult laufen Bild und Ton zusammen. Um Zeit bei der Nachbearbeitung zu sparen, wird auch bei Aufzeichnungen in Echtzeit zwischen den Kamera­einstellungen umgeschaltet und nur das Mastersignal aufgenommen – ganz so, als würde die Sendung live ins Internet gestreamt.

Mit über 5000 Euro ist der Atem 4 M/E für kleine Studios und Privatanwender unerschwinglich, es gibt aber günstigere Alternativen. Der neue Atem Mini ist mit 300 Euro geradezu ein Schnäppchen: Er hat vier HDMI-Eingänge mit inte­grierten Cross-Konvertern und einen HDMI-Ausgang für das Mastersignal. Man kann also problemlos und ohne jegliche Konverter jeden Rechner, jeden Camcorder, jede Digitalkamera und jedes Smartphone mit HDMI-Adapter direkt mit dem Atem Mini verbinden. Das integrierte Bedienpult erlaubt außerdem die Steuerung des Atem Mini ohne einen Rechner mit Atem Control – das Programm benötigt man nur für komplexere Setups mit Greenscreen oder Einblendungen. Außerdem hat der Atem Mini einen USB-C-Anschluss, über den er sich als Webcam beim Rechner anmeldet und sich leicht etwa in OBS Studio oder jede andere Streaming- und Recording-Software einbinden lässt.

Die zweite günstige Alternative ist der Atem Television Studio HD für rund 900 Euro. Er bietet vier HDMI- und vier SDI-Eingänge, außerdem vier SDI-Ausgänge zur Steuerung von Kameras, einen Aux-Ausgang und eine MultiView-Anschluss für einen Monitor, der alle Eingangssignale sowie Preview- und Mastersignal verkleinert in einer Übersicht anzeigt. Der Atem Studio lässt sich weitestgehend ohne Software über das Frontpanel bedienen. Das Mastersignal selbst wird wie auch beim Atem 4 M/E über SDI ausgegeben, ein Webcam-Interface wie beim Atem Mini gibt es beim Atem Studio aber nicht. Man benötigt hier also zusätzlich einen SDI-HDMI-Konverter und einen USB-­Framegrabber, um das Mastersignal in OBS oder eine andere Software zu importieren, oder einen dedizierten Streaming-Server mit HDMI- oder SDI-Eingang.

Das Mastersignal unseres Bildmischers landet zunächst bei einem Recorder, einem Blackmagic HyperDeck Mini, mit dem wir die Sendungen auf SD-Karten aufzeichnen. Wir haben gleich zwei ­HyperDecks: Den zweiten benutzen wir vorwiegend als Mediaplayer, er kann aber auch über einen der Aux-Ausgänge des Bildmischers als Rekorder benutzt werden. Ein Vorteil des HyperDeck Mini ist, dass er als Mediaplayer den Alphakanal eines entsprechend kodierten Videos über einen zweiten SDI-Ausgang an den Bildmischer übertragen kann – so lassen sich transparente animierte Logos in Videos einblenden.

Animierte Logos

Für statische Logos und sonstige Einblendungen mit oder ohne Alphakanal haben die Atem-Bildmischer eine integrierte Mediathek. Für Adobe Photoshop gibt es ein spezielles Plug-in, ansonsten können Grafiken über Atem Control in die Mediathek hochgeladen und dann eingeblendet werden. Um komplexe Einblendungen wie den Countdown zur #heiseshow zu generieren, benutzen wir seit einem halben Jahr das Programm Mimo Live auf unserem iMac aus 2013. Das Programm kann mehr, es könnte ähnlich wie OBS auch mehrere ­Signale und Einblendungen verarbeiten und sogar konvertieren und streamen. ­Allerdings gab es damit Stabilitätsprobleme auf unserem iMac, sodass wir aktuell nur Einblendungen über einen HDMI-Adapter und einen SDI-Konverter an den Bild­mischer übertragen, der Schwarz per ­Alpha-Blending transparent darstellt. Für transparente mehrfarbige Logos müsste Mimo einen zweiten HDMI-Ausgang als separaten Alphakanal ansteuern, so wie es das HyperDeck Mini tut.

Eine kostengünstige Variante zum HyperDeck Mini sind ein USB-Framegrabber und ein Rechner mit OBS oder einer beliebigen anderen Recording-Software. Wir nutzen diese Konfiguration gelegentlich als Backup. Der HyperDeck Mini dient uns gleichzeitig als SDI-HDMI-Cross-Konverter, am HDMI-Ausgang betreiben wir einen Teradek VidiU Pro Streaming-Server. Dieser verarbeitet das Full-HD-Eingangssignal mit maximal 30 fps zu einem H.264-Stream und überträgt ihn ins Internet.

Mit fast 1000 Euro ist der VidiU Pro für Privatanwender und kleine Studios ziemlich teuer. Die Alternative ist wieder einmal OBS. Allerdings muss der Rechner respektive dessen Grafikkarte ziemlich leistungsfähig sein, um das Signal des Atem Mini oder eines USB-Framegrabbers in Echtzeit mit 30 oder 60 fps konvertieren zu können. Viele YouTuber und Twitcher installieren OBS deshalb auf einem separaten Rechner und nicht auf ihrem Spiele-PC.

Meist lassen wir unseren Streaming-­Server die Daten an den Streaming-Dienst Restream.io senden. Dort können wir den Stream parallel an mehrere Plattformen wie YouTube, Twitch oder Facebook zu verteilen. Außerdem erlaubt uns Restream in der kostenpflichtigen ­Variante, den ­Stream vorab zu begutachten – das ist vor allem bei der Fehlersuche ­äußerst wertvoll.

Guter Ton

Während die Bildsignale beim Bildmischer zusammenlaufen, landet der Ton ganz klassisch bei einem großen Mischpult – einem Behringer X32. Das Digitalpult besitzt 32 Eingänge und 8 Ausgänge, sodass wir auch hier alle Quellen und Ziele dauerhaft verkabelt lassen können.

Digitale Mischpulte haben den Vorteil, dass sich die Signalwege einfach umkonfigurieren lassen, ohne die Verkabelung ändern zu müssen. Das ist besonders praktisch, wenn mehrere Ein- und Ausgänge gleichzeitig betroffen sind. Bei der #heise­show zum Beispiel darf vor Beginn der Sendung für die Zuschauer nur die Pausen­musik zu hören sein. Der Moderator und die Gäste, die möglicherweise auch per Skype zugeschaltet werden, sollen sich aber vorab bereits unterhalten können – ohne störende Musik im Hintergrund. Dazu wird allein der Skype-Ton auf einen Studiolautsprecher ­gelegt. Der Skype-Gast wiederum soll sich nicht selbst zurück hören, er bekommt nur das Signal der Studiomikrofone. Fängt die Sendung an, soll das Intro aber für alle zu hören sein. Das ist nur leistbar, weil sich die Signalwege auf Knopfdruck respektive per Makro dynamisch ändern lassen.

Wer auf solch komplexe Szenarien ­verzichten kann, kommt aber mit einem analogen Mischpult ab 50 Euro aus. Für etwas mehr Geld findet man auch Modelle mit USB-Anschluss, über den sich etwa der Spiele-Sound auf das Mischpult über­tragen oder das Mastersignal abgreifen und etwa in OBS einbetten lässt. Eine ­andere Alternative ist, ganz auf ein Mischpult zu verzichten und stattdessen mit einem USB-Mikrofon oder einem USB-­Audio-Konverter zu arbeiten. Die Pegel stellen Sie dann direkt in OBS ein. Der Nachteil von USB-Audiogeräten ist aber, dass es stets zu Latenzen kommt, die Sie etwa in OBS korrigieren müssen, damit Bild und Ton wieder synchron sind.

Statt der bei Podcasts üblichen Großmembranmikrofone verwenden wir Nackenbügelmikrofone. Das lässt mehr Platz auf dem Tisch und ist einfacher zu handhaben als typische Studiomikrofone, bei denen man darauf achten muss, den ­Abstand zwischen Sprecher und Mikro möglichst konstant zu halten.

Neben den Mikros laufen im Mischpult auch die Wartemusik, bei den LAN-Partys von c’t zockt der Spiele-Sound und andere Audioquellen zusammen. Wo nötig, werden die Signale mit Kompressoren, Limitern und Equalizern bearbeitet; zu den jeweiligen Zielen gelangt nur die Audiosumme. Das Mastersignal des Audiomischers, das im Stream zu hören sein soll, läuft zum Bildmischer und wird von diesem synchron zum Bild in den Masterausgang des Bildmischers eingefügt.

Geräteübergreifende Makros

Nicht nur der Bildmischer, auch das Mischpult, der Intro-Zuspieler und sogar die Studio-Uhr lassen sich über das Netzwerk steuern. Dazu gibt es für jedes Gerät entsprechende Software oder ein Web-Front­end, doch mehrere Fenster parallel lassen sich von einer Person am Regiepult kaum bedienen. Deshalb setzen wir seit einigen Wochen Bitfocus Companion erfolgreich ein: Das Open-Source-Projekt beherrscht die Protokolle verschiedener Geräte und Programme, darunter die der Bildmischer von Blackmagic Design, der HyperDeck Recorder, des Mischpults Behringer X32 und der Streaming-Software OBS. Damit lassen sich hochkomplexe, geräteüber­greifende Makros programmieren. Auch wenn die Entwickler derzeit noch vom produktiven Einsatz der Version 2.0 abraten, hat sie sich bei uns als stabil und ­alltagstauglich erwiesen. Die Bedienung erfolgt über frei programmierbare Tastenfelder Elgato Stream Deck XL mit jeweils 32 mit Displays ausgestatteten Tasten.

Bildmischer, Mischpult, Rekorder und verschiedene andere Studiogeräte lassen sich per Netzwerk ansteuern. Mit der Open-Source-Software Bitfocus Companion und drei frei belegbaren Tastenfeldern lassen sich hoch komplexe, geräteübergreifende Makros programmieren.

Mit rund 250 Euro ist das Stream Deck XL ziemlich kostspielig, die kleinere ­Version mit 15 Tasten gibt es schon für 150 Euro. Wer privat streamt, kommt ­vielleicht aber auch mit der kleinsten Version mit 6 Tasten für 100 Euro aus. Der große Vorteil gegenüber einem virtuellen Tastenfeld etwa auf einem Tablet ist, dass sich die Tasten des Stream Deck auch zuverlässig blind bedienen lassen, wenn man etwa bei Spiele-Streams schnell zwischen den ­Kameraeinstellungen umschalten muss.

Apropos Kameraeinstellungen: In der Regel filmen wir #heiseshow, c’t uplink und c’t zockt mit drei Kameras: Eine für die Totale, eine für die Gäste auf der linken und eine für die auf der rechten Seite. Das Hintergrundbild der #heiseshow, ein ­Leiterbahnmuster, entsteht dabei nicht wie oft vermutet in Greenscreen-Technik durch Überblendung und Chroma-Keying. Bei drei Kameraeinstellungen müssten wir sonst auch drei miteinander synchronisierte, an den jeweiligen Blickwinkel angepasste Hintergrundanimationen verwenden. Deshalb wird der Hintergrund mittels Kurzdistanzbeamer, der über einen SDI-HDMI-Adapter mit dem Bildmischer verbunden ist, an eine weiße Wand hinter den Gästen projiziert. Ein solcher Beamer ­eignet sich mit einem einfarbig grünen Bild auch gut als Greenscreen-Ersatz, denn die Ausleuchtung ist sehr gleichmäßig, was ein sauberes Chroma-Keying ermöglicht. Außerdem lässt sich der Greenscreen so leicht in einen Bluescreen verwandeln, falls ein Gast etwas Grünes tragen sollte.

c’t uplink und c’t zockt haben wir ­bislang traditionell an einem einfachen Holztisch mit einer blau hinterleuchteten Gardine, einem Fernseher und einem alten Flipper als Deko im Hintergrund gefilmt. Nach über 300 Folgen c't uplink und über 50 Folgen c’t zockt steht hier ein Neubau auf dem Plan, den Sie in den nächsten ­Wochen auf dem YouTube-Kanal von heise online begutachten können. (mid)



