MediathekViewWeb.de RSS-Feed Downloader

Wer es noch nicht kennt: https://mediathekviewweb.de/ scant regelmäßig die Mediatheken der öffentlich rechtlichen und bietet das Ergebnis in einer Art Suchmaschine an. So kommt man gezielt an neue, gute und vor allem legale Inhalte, für die wir immerhin alle bezahlen. Die Suchanfragen lassen sich über spezielle Tokens gezielt auf Titel, Thema, Sender, Beschreibung eingrenzen.

Tokens zur Suche

Aus einer Suchanfrage kann man sich auch einen RSS-Feed erstellen lassen - für Serien und regelmäßige Sendungen sehr praktisch. An diesem Punkt beginnt auch meine Idee für folgendes Werkzeug. Unter https://mediathekviewweb.de/feed?query=%23l%C3%B6wenzahn finde ich z.B. immer alle aktuell verfügbaren Inhalte zum Thema (Themen werden mit # eingegrenzt) Löwenzahn. Dazu hab ich mir dann mal eine Shellzeile einfallen lassen, die alle Videos aus dem RSS-Feed parst und mit wget runterlädt:

wget -q -O- <RSS_FEED_URL> | egrep -o '(https?:\/\/).*.mp4' | xargs wget -nc

Das ist schon ganz praktisch, kann man auch in die crontab legen und man hat immer alles aktuell. Nur sind die Metainformationen die im Feed enthalten sind, nicht vorhanden. Allein schon die Dateinamen sind gruselig. Also rangesetzt und ein kleines Tool in GO geschrieben. Dieses parst den kompletten RSS-Feed und baut in erster Linie lesbare Dateinamen im Format "Sendung+Folge.Dateiendung". Füttern tut man es mit einer XML-Datei im Format

<config>
     <feed>
         <url>https://mediathekviewweb.de/feed?query=%23yakari%20%2BFolge</url>
         <destination>/home/dude/mediathekRSS</destination>
     </feed>
</config>

Es werden also die RSS-Feeds und deren Speicherorte definiert. Beim starten übergibt man dem Tool den Pfad zur Config-Datei und es legt los. Das ganze täglich/regelmäßig in der crontab und gut is.

./mediathekRSS config.xml

Bereits vorhandene Dateien werden übersprungen. Ausgabe in der Shell/CMD ist verbesserungswürdig, steht auf der TODO-Liste. Konnte es bisher nur unter Linux testen, sollte auch unter Windows laufen.

Download Source und Binary


Author: dude

keep it simple