Blog Strategie 29. Juni 2026 10 min Lesezeit

Ihr Konkurrent
ist keine Zeitung.
Es ist der Feed.

Redaktionen messen sich an der Zeitung von nebenan. Der Leser tut das nie. Der Leser hat fast sieben Stunden täglich online, siebenundvierzig Sekunden Geduld und einen endlosen Feed, der darauf gebaut ist, beides zu binden. Der Konkurrent ist kein anderer Verlag — es ist der Feed. Audio ist die einzige Fläche, die die Minuten erreicht, die er nicht erreicht.

Jede Redaktion führt ein Wettbewerbsfeld. Die rivalisierende Zeitung. Die rivalisierende Website. Das Medium, das die Story zuerst gebracht hat. Die Morgenkonferenz misst den Tag an ihnen. Es ist die falsche Anzeigetafel.

Der Leser entscheidet sich nicht für Ihren Artikel anstelle eines Rivalen-Artikels. Der Leser entscheidet sich für Ihren Artikel anstelle eines Videos, eines Gruppenchats, eines Spiels und eines Feeds, der von einigen der bestfinanzierten Engineering-Teams der Erde so gebaut wurde, dass er niemals endet. Die durchschnittliche Aufmerksamkeit auf irgendeinem Bildschirm liegt heute bei 47 Sekunden[1], bevor weitergewischt wird. Der durchschnittliche Nachrichtenartikel braucht dreieinhalb Minuten. Der Konkurrent ist nicht die andere Zeitung. Der Konkurrent ist das Scrollen.

Das ist es, was die Aufmerksamkeitsökonomie für einen Verlag tatsächlich bedeutet. Kein Slogan — eine Marktstruktur. Ihre Inhalte konkurrieren um ein festes, schrumpfendes Budget menschlicher Aufmerksamkeit gegen Gegner, die nicht nach redaktionellen Regeln spielen. Die einzige ehrliche Frage ist, welche Minuten des Lesertags Sie noch gewinnen können. Geschrieben aus dem Inneren von BotTalk, der Orchestrierungsschicht, die heute Audio für dreißig europäische Redaktionen betreibt.

Sie verlieren keine Leser an andere Verlage

Die beruhigende Erzählung lautet, dass sich Publika über mehr Medien verteilen. Die wahre Erzählung lautet, dass Publika den Text ganz verlassen. 44 % der 18- bis 24-Jährigen nennen heute Social Media oder Video-Plattformen — nicht eine News-Marke — als ihre Hauptnachrichtenquelle[2]. Das Wettbewerbsfeld ist keine Liste von Titelköpfen. Es ist eine Liste von Apps: TikTok, YouTube, Instagram, ein Messaging-Thread. Und die Größenordnung des Gegners ist der Teil, den Chefredaktionen unterschätzen — der durchschnittliche TikTok-Nutzer verbringt heute rund 40 Stunden pro Monat in einer einzigen App, mehr als dreizehn Stunden mehr als bei YouTube[5]. Das ist die Schwerkraft, gegen die Ihr dreieinhalbminütiger Artikel zieht.

Der Leser bringt fast keine Geduld in diesen Kampf mit. Menschen verbringen knapp sieben Stunden täglich online, davon fast vier auf dem Telefon[4], und geben jedem einzelnen Bildschirm etwa siebenundvierzig Sekunden, bevor der Daumen weiterzieht. Schlimmer für einen Verlag, der diesem Bildschirm hinterherjagt: bis zu 85 % der Mobile-Feed-Videos werden mit ausgeschaltetem Ton geschaut[3]. Die Aufmerksamkeit dort ist seicht, mit Untertiteln versehen, stumm und nach einem Wisch verschwunden.

TikTok mit einer schneller ladenden Artikelseite wegzuscrollen heißt, mit einer Zeitung zu einem Feed-Kampf anzutreten. Den Bildschirmkrieg gewinnt man nicht. Man verlegt das Schlachtfeld.

Der Bildschirmkrieg gegen den Hintergrund Zwei Flächen der Aufmerksamkeit. Die obere Fläche, der Bildschirm, ist ein einziger Balken, aufgeteilt zwischen TikTok, YouTube, Instagram, Messaging und Spielen, mit News reduziert auf einen dünnen Korallen-Splitter am Ende — der Krieg, den jeder Verlag führt und verliert, in dem 85 % der Videos stumm sind und die Geduld nach 47 Sekunden endet. Die untere Fläche, der Hintergrund, ist eine offene Spur durch die Momente, in denen der Bildschirm aus ist — Arbeitsweg, Küche, Fitnessstudio, Spaziergang, Haushalt — wo der Feed kein Produkt hat und Audio unangefochten gewinnt. DER BILDSCHIRM · WO JEDER VERLAG KÄMPFT — UND VERLIERT TIKTOK YOUTUBE INSTAGRAM CHAT SPIELE NEWS — DAS SIND SIE AUGEN FIXIERT · 85 % STUMM · 47 SEKUNDEN GEDULD DER HINTERGRUND · WO AUDIO UNANGEFOCHTEN GEWINNT AUDIO ARBEITSWEG KÜCHE FITNESSSTUDIO SPAZIERGANG HAUSHALT TELEFON UNTEN · OHREN OFFEN · DER FEED HAT HIER KEIN PRODUKT AUFHÖREN, UM DEN SPLITTER ZU KÄMPFEN · DIE OFFENE FLÄCHE BESETZEN
Abbildung 1 · Zwei Flächen der Aufmerksamkeit. Oben: der Bildschirm, wo News ein Korallen-Splitter gegen TikTok, YouTube und den Feed sind. Unten: der Hintergrund, die Stunden mit Bildschirm aus, in denen Audio unangefochten läuft.

Audio gewinnt die Stunden, die der Feed nicht erreicht

Hier ist die Asymmetrie, die der Feed nicht schließen kann: Der Bildschirm verlangt Augen. Audio braucht nur Ohren. Und der Leser hat täglich Stunden, in denen seine Augen beschäftigt und seine Ohren frei sind.

Der Arbeitsweg. Die Küche. Das Fitnessstudio. Der Schulweg. Der Weg zum Bahnhof. Das Telefon steckt in der Tasche, Display nach unten, Bildschirm dunkel — und der stumme Feed hat einem dunklen Bildschirm nichts zu sagen. Das sind die Hintergrundstunden. TikTok kann sie nicht füllen. YouTube kann sie nicht füllen. Ein Textartikel erst recht nicht. Audio kann es.

Deshalb ist Audio keine kleinere Version des Bildschirmkriegs. Es ist eine ganz andere Fläche — eine, die der Verlag noch komplett besitzen kann. Nicht Google. Nicht Meta. Nicht OpenAI. Der Leser, der nach siebenundvierzig Sekunden aus Ihrem Artikel ausgestiegen ist, hört denselben Artikel vier Minuten lang, wenn er ihm im Auto vorgelesen wird. Der Konkurrent ist ihm dorthin nie gefolgt.

Drei Züge, um den Hintergrund zu gewinnen

1. Hören Sie auf, den Bildschirm zu benchmarken. Benchmarken Sie den Tag.

Der erste Zug ist ein Wechsel der Anzeigetafel. Hören Sie auf zu fragen „haben wir die Pageviews der Rival-Seite geschlagen“ und fangen Sie an zu fragen „wie viele der bildschirm-freien Stunden des Lesers haben wir erreicht.“ Das sind verschiedene Fragen mit verschiedenen Antworten. Pageviews messen den Krieg, den Sie verlieren. Hörstunden messen den, den Sie gewinnen können.

Ein Verlag mit Audio-Artikeln und einem Podcast-Feed konkurriert um den Arbeitsweg, das Workout und den Haushalt — Flächen, in denen der Feed gar kein Produkt hat. Das ist kein marginaler Gewinn auf dem bestehenden Schlachtfeld. Es ist eine zweite Front, an der der Konkurrent nicht kämpft.

2. Machen Sie den Artikel überall hörbar, wo der Leser ohnehin ist

Hintergrund-Aufmerksamkeit ist mobil. Ihr Audio muss es auch sein. Ein Audio-Player, eingesperrt auf der Artikelseite, gewinnt nur die Minute auf der Seite. Um den Hintergrund zu gewinnen, muss derselbe Artikel dort verfügbar sein, wo die Ohren des Lesers tatsächlich sind: ein Podcast-Feed pro Verlag, automatisch erzeugt, ausgeliefert an Apple Podcasts, Spotify und das offene Ökosystem.

Der Leser, der zwei Beiträge auf Ihrer Seite gehört hat, abonniert den Feed. Am nächsten Morgen ist die Stimme Ihres Redakteurs das Erste in seinem Auto. Das ist der Moment, in dem der Verlag TikTok schlägt — nicht auf dem Bildschirm, sondern in den fünfzehn Minuten, in denen TikTok nie im Raum war. Und die Fläche ist real und wächst: 40 % der Menschen hören inzwischen wöchentlich einen Podcast, gegenüber 15 % im Jahr 2017[6]. Der Hintergrund ist keine Nische. Er ist der am schnellsten wachsende Block an Aufmerksamkeit, den es noch gibt. Zu den Engagement-Mechaniken dahinter siehe unseren Beitrag über lange Sessions mit Audio-Artikeln.

3. Machen Sie die Stimme so, dass man bleiben will

Hintergrund-Hören verzeiht Ablenkung, verzeiht aber keine Reibung. Ein falsch ausgesprochener Name, eine roboterhafte Kadenz, ein tonaler Bruch — jedes ist ein Signal, zum Telefon zu greifen und den Feed zu öffnen. Lange Sessions sind eine Funktion davon, wie selten der Hörer dem Audio etwas verzeihen muss.

Das heißt zweierlei. Eine namentlich genannte, vertraute Stimme — der Redakteur, wegen dem der Leser gekommen ist, nicht ein generischer Anbieter-Default — und eine Qualitäts-Engine vor der Synthese, die Zahlen, Namen und Dialekt-Fehler abfängt, bevor ein einziges Stimm-Modell spricht. Der Leser bleibt, weil das Audio das Bleiben wert ist. Die Session wächst. Der Feed wartet, ungeöffnet.

Der Feed besitzt die Augen. Audio besitzt die Ohren. Hören Sie auf, um den falschen Sinn zu kämpfen.

Was der Hintergrund wert ist

Das ist kein Gedankenexperiment. Es ist die Betriebsrealität im BotTalk-Netzwerk. Zahlen vom Juni 2026:

47s
Aufmerksamkeit vor dem Wisch (UC Irvine)
44%
Unter-25-Jährige mit Social oder Video als Hauptnachrichtenquelle (Reuters)
24K
Stunden Aufmerksamkeit, die BotTalk täglich einfängt — im Hintergrund
20M
Monatliche Hörer, die das Ohr dem Scrollen vorgezogen haben
  • 24.000 Stunden Aufmerksamkeit pro Tag eingefangen im Netzwerk — fast alles in den Hintergrundstunden, die der Feed nie erreicht.
  • 6.000 Artikel pro Tag vertont bei 30 Verlagen, jeder einzelne nun hörbar im Auto, in der Küche, im Fitnessstudio.
  • 20 Mio. monatliche Hörer, die das Ohr dem Scrollen vorgezogen haben.
  • 5 KI-Stimm-Anbieter orchestriert hinter einer Policy, damit die Stimme immer zum Moment passt — und dem Hörer nie einen Grund gibt, nach dem Feed zu greifen.

Das sind BotTalk-Produktionszahlen, Juni 2026 — auf Anfrage verifizierbar unter der Standard-Audit-Klausel in unseren Kundenverträgen.

Audio ersetzt den Bildschirm nicht. Eilmeldungen, der Live-Blog, der visuelle Scoop — das gehört weiter zur Heimat des Feeds, und Audio dort hinterherzujagen ist der falsche Kampf. Der Bildschirmkrieg ist real, und Verlage verlieren ihn. Aber der Hintergrund ist offen, kaum jemand bestreitet ihn, und es ist eine Fläche, die der Verlag noch besitzen kann. Die Aufmerksamkeitsökonomie hat das Verlagsgeschäft nicht beendet. Sie hat es verlegt.

Zwei Redaktionen, die die Anzeigetafel gewechselt haben

Lena Kaiser, Head of Product bei taz

“Audio hat der digitalen App ein menschliches Gesicht gegeben. Wir haben die Stimmen unserer eigenen Kollegen geklont — und TTS wurde zum Killer-Argument, die App zu behalten. Siebzig Prozent unserer Leser hören jetzt, statt zu lesen.”

Lena Kaiser Head of Product · taz
Die taz-Case-Study lesen
Alexander Ottitzky, CTO bei heute.at

“Plug-and-play vom ersten Tag — keine aufwändige Konfiguration. Der österreichische Akzent war für uns entscheidend, und BotTalk hat ihn richtig hinbekommen. Die Preise sind kalkulierbar geblieben — anders als bei den anderen Anbietern, die wir getestet haben.”

Alexander Ottitzky CTO · heute.at
Die heute.at-Case-Study lesen

Zwei Redaktionen. Beide haben aufgehört, den Feed wegzuscrollen. Beide sind dorthin gegangen, wo der Feed nicht folgen konnte.

Ein Audit in vier Fragen für Ihr Wettbewerbsfeld

Bevor das nächste Strategiemeeting Sie am falschen Gegner misst:

  1. Wer nimmt dem Leser tatsächlich die Zeit? Wenn die Antwort „die Rival-Seite“ lautet, schauen Sie noch einmal hin. Es ist der Feed. Planen Sie für den wahren Konkurrenten.
  2. Welche bildschirm-freien Stunden erreichen Sie heute? Den Arbeitsweg, die Küche, das Fitnessstudio. Wenn die Antwort „keine“ lautet, ist das die offene Front.
  3. Ist der Artikel außerhalb Ihrer Seite hörbar? Kein Podcast-Feed heißt, Sie kämpfen weiter auf dem Bildschirm, wo Sie verlieren. Liefern Sie den Feed aus.
  4. Ist die Stimme das Bleiben wert? Eine generische Standardstimme und Rohtext direkt in ein Modell gibt dem Hörer einen Grund, stattdessen den Feed zu öffnen.

Vier Fragen. Zehn Minuten. Die meisten „wie konkurrieren wir mit TikTok“-Strategien stellen die eine Frage nie, auf die es ankommt: um welchen Sinn Sie eigentlich kämpfen.

Häufig gefragt

Sechs Fragen, bevor Sie den falschen Konkurrenten benchmarken.

Wer ist der wahre Konkurrent eines Verlags in der Aufmerksamkeitsökonomie?

Keine andere Redaktion. Die Aufmerksamkeit des Lesers ist ein festes, schrumpfendes Budget, das größtenteils auf TikTok, YouTube, Instagram, Messaging und Spielen ausgegeben wird — nicht auf der Wahl zwischen zwei News-Marken. Bis zu 44 % der 18–24-Jährigen nennen soziale oder Video-Plattformen, nicht einen Verlag, als ihre Hauptnachrichtenquelle. Das Wettbewerbsfeld ist eine Liste von Apps, keine Liste von Titelköpfen.

Warum können Verlage nicht einfach am Bildschirm gegen TikTok und YouTube antreten?

Weil die Bildschirm-Aufmerksamkeit bereits verloren und seicht ist — bis zu 85 % der Mobile-Feed-Videos werden stumm geschaut, und die Feeds werden von einigen der bestfinanzierten Teams der Tech-Welt darauf gebaut, endlos zu sein. Sie wegzuscrollen mit einer schnelleren Artikelseite funktioniert nicht. Audio verlagert das Schlachtfeld auf einen Sinn, um den der Feed nicht kämpft.

Was sind Hintergrundstunden und warum sind sie für Verlage wichtig?

Hintergrundstunden sind die Teile des Tages, in denen die Augen des Lesers beschäftigt, aber die Ohren frei sind: der Arbeitsweg, die Küche, das Fitnessstudio, der Spaziergang, der Haushalt. Der Feed kann sie nicht füllen — sein Produkt braucht einen Bildschirm. Audio kann es. Es ist der eine große Block täglicher Aufmerksamkeit, den ein Verlag noch komplett gewinnen kann.

Wie hilft Audio einem Verlag, Aufmerksamkeit vom Feed zurückzugewinnen?

Ein Leser, der nach 47 Sekunden aus einem Textartikel aussteigt, hört denselben Artikel rund vier Minuten lang, wenn er vertont ist. Ein Podcast-Feed erreicht ihn dann im Auto oder im Fitnessstudio, wo der Feed keine Präsenz hat. Im BotTalk-Netzwerk werden so täglich rund 24.000 Stunden Aufmerksamkeit eingefangen, fast alles in diesen Hintergrundmomenten.

Braucht ein Verlag einen Podcast-Feed, oder reicht ein Player auf der Seite?

Beides, aber der Feed ist es, der den Hintergrund gewinnt. Ein Seiten-Player gewinnt die Minute auf der Seite; der Podcast-Feed gewinnt den Arbeitsweg und das Workout — deutlich längere Sessions in Flächen, die der Feed nie erreicht. Da inzwischen 40 % der Menschen wöchentlich einen Podcast hören, lässt der Verlag mit dem bloßen Seiten-Player den größten Block gewinnbarer Aufmerksamkeit liegen.

Warum ist Stimmqualität entscheidend, um Aufmerksamkeit zu gewinnen?

Hintergrund-Hören verzeiht keine Reibung. Ein falsch ausgesprochener Name oder eine roboterhafte Kadenz ist ein Signal, zum Telefon zu greifen und den Feed zu öffnen. Eine namentlich genannte, vertraute Stimme plus eine Qualitäts-Engine vor der Synthese hält den Hörer in der Session, statt ihn an den Konkurrenten zurückzugeben.

Quellen

Die Forschung hinter den Zahlen.

  1. [1] · UC Irvine · 2023

    Gloria Mark, Can’t pay attention? You’re not alone (University of California), angelehnt an ihr Buch Attention Span. Zwanzig Jahre Protokollierung von Bildschirm-Aufmerksamkeit: Die durchschnittliche Aufmerksamkeit auf jedem Bildschirm fiel von ~2,5 Minuten 2004 auf 75 Sekunden 2012 auf 47 Sekunden in den letzten Jahren.

    universityofcalifornia.edu ↗
  2. [2] · Reuters Institute · 2025

    Reuters Institute for the Study of Journalism, Oxford, Digital News Report 2025. In 48 Märkten nennen 44 % der 18–24-Jährigen Social Media und Video-Netzwerke als ihre Hauptnachrichtenquelle; in den USA haben Social und Video (54 %) erstmals TV (50 %) und News-Sites (48 %) überholt.

    reutersinstitute.politics.ox.ac.uk ↗
  3. [3] · Digiday · 2016

    Digiday, 85 percent of Facebook video is watched without sound. Von Verlagen berichteter Befund von 2016: Bis zu 85 % der Mobile-Feed-Video-Aufrufe erfolgen mit ausgeschaltetem Ton — die kanonische Quelle für das stumme Video-Muster, das den Feed-Konsum bis heute prägt.

    digiday.com ↗
  4. [4] · DataReportal · 2025

    DataReportal (Kepios, mit GWI-Daten), Digital 2025: Global Overview Report. Internetnutzer verbringen im Schnitt 6 Stunden 38 Minuten täglich online, davon rund 3 Stunden 46 Minuten auf dem Mobilgerät — die am besten belegte Zahl für tägliche Onlinezeit und den Mobile-Anteil.

    datareportal.com ↗
  5. [5] · data.ai / Sensor Tower · 2024

    data.ai (heute Sensor Tower), State of Mobile 2024. Der durchschnittliche TikTok-Nutzer verbringt ~40 Stunden pro Monat in der App — gegenüber 11 Stunden/Monat Anfang 2020 und rund 13 Stunden/Monat mehr als der durchschnittliche YouTube-Nutzer.

    sensortower.com ↗
  6. [6] · Edison Research · 2025

    Edison Research, The Infinite Dial 2025. 70 % der Amerikaner ab 12 haben einen Podcast gehört; 55 % sind monatliche und 40 % wöchentliche Hörer — die Wochenzahl gegenüber 15 % im Jahr 2017, ein Rekordhoch in der längstlaufenden Verbraucher-Audio-Studie der Branche.

    edisonresearch.com ↗
Dr. Andrey Esaulov, Mitgründer und CEO von BotTalk

Über den Autor

Dr. Andrey Esaulov

Mitgründer & CEO · BotTalk

Andrey hat einen Doktortitel in Linguistik, und vor der Gründung von BotTalk hat er mehr als sechs Jahre lang eine Abteilung bei Axel Springer geleitet — einem der größten Verlagshäuser Europas. BotTalk betreibt heute Audio-Produktion für mehr als 30 europäische Redaktionen, darunter taz, heute.at, Tamedia und Mediengruppe Pressedruck. Andrey schreibt über die Aufmerksamkeitsökonomie, Sprach-Infrastruktur und die Orchestrierungsschicht über kommerzieller KI.

Andrey direkt erreichen: [email protected] · LinkedIn.

Artikel zuletzt vom Autor geprüft am: . Die Verweise auf Aufmerksamkeitsökonomie, Nachrichtenkonsum und Podcast-Adaption im Abschnitt Quellen werden bei jeder inhaltlichen Aktualisierung erneut verifiziert.

Den richtigen Konkurrenten benchmarken

Sprechen Sie mit Andrey.

Keine Slides. Keine Pitch-Show. Ihr CMS, Ihr Publikum, Ihre redaktionelle Stimme. Der Hintergrundstunden-Walkthrough auf Ihren eigenen Artikeln. Dreißig Minuten. Ein Gespräch.