Es ist mal Zeit für einen Lagebericht. Ein Bericht aus einem Kampf gegen nicht eingehaltene und nie vorhandene Standards. Probleme an die eben nie jemand gedacht hat.

Aber machen wir es konkret: Ich arbeite gerade an einem hübschen Sendeplan für das ReliveRadio. Hier läuft momentan eine Alpha Demo. Es sollen die aktuellen Sendungen angezeigt werden mit möglichst vielen Metadaten:

  • Sendungstitel
  • Folgentitel
  • Folgenbeschreibung
  • Allgemeine Beschreibung des Podcasts
  • Link zur Webseite des Podcasts
  • Link zur Folge des Podcasts (oder Downloadmöglichkeit der Folge)
  • Link zu Shownotes
  • Kapitelmarken
  • Podcastlogo
  • Sendezeit
  • Flattr-Button
  • Twitter-Button
  • Subscribe-Button
  • Hoersuppe Infoseite

Hierbei entstehen Probleme auf mehreren Ebenen. Hier hat Markus mal beschrieben, wo das mit den Problemen anfängt.

Es fängt also beim Einbinden der Dateien ins System schon an: Die Audiodateien enthalten keine Informationen.

Ideal wäre, wenn es einen Podcatcher gäbe, der nach dem Download der Folge die Metainformationen aus dem Feed liest und diese als Tags in die Datei schreibt. Optimalerweise sogar unabhängig vom Dateiformat (mp3, ogg, acc). Aber auch, wenn dies nur bei mp3 Dateien ginge, wäre das schon eine extreme Zeitersparnis.

Alternativ vielleicht ein Script, dass nach dem Download mit dem herkömmlichen Podcatcher die Infos aus den Feed-Metadaten liest und anschließend die Tags für die Podcast-Dateien setzt.

Allerdings hilft das auch nur kurzfristig für die wichtigsten Metadaten. Ganze Folgenbeschreibungen kann man nicht in eine mp3 packen.

Nun ist es so, dass ich über die API der Radioautomation das Programm des aktuellen Tages abrufen kann:

  • artist_name
  • track_title
  • start_time
  • end_time

Mehr geben die Tags der mp3s nicht her. Die meisten sind von Hand eingetragen.

Ich habe dann versucht die Feeds des Podcasts abzurufen und dort alle nötigen Informationen herauszuholen. Allerdings ist das kaum zu machen. Denn viele Podcasts haben nicht mehr alle Folgen in ihrem Feed. Somit kommt man nicht mehr an die Informationen heran.

Dazu kommt, dass die Infos im Feed nicht richtig eingetragen sind. Zu jeder Folge im Podcast sollte es einmal eine “Description” der Folge geben und “Content”. Dabei ist “Description” eine kurze Beschreibung der Folge. Dort haben viele Podcaster aber das Gleiche drin stehen wie in “Content”. Inklusive Bilder und Shownotes. Das lässt sich dann als Kurzbeschreibung nicht mehr verwenden.

Abgesehen von all dem gibt es im Feed keine Informationen zu Twitter Account usw.

Das Problem

Das Problem ist generell: Es ist nicht möglich aus einer Podcast Audio Datei irgendwie sinnvoll auf die Metadaten dazu zurückzuschließen. Das Feed-System geht davon aus, dass man immer den Feed zur Verfügung hat. Das ist aber nicht der Fall. Besonders wenn Folgen aus dem Feed gelöscht werden (aus Platzgründen).

Wunsch

Eine GUID für die Episode eines Podcast und eine API-URL in jedem Audio File. Dann kann man sich an diese API wenden und alle Informationen zu diesem Podcast abrufen (Sammlung siehe oben).

Momentan tut sich sehr viel durch das Podlove Projekt. Vielleicht ist es ja in diesem Rahmen möglich so etwas zu bauen. Die nötigen Informationen verwaltet das Plugin ohnehin schon.


Weitere Artikel