You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Erste Analyse:
Der Crawler findet nur Filme, die auf den Subkategorie-Seiten unter "Alle Videos" aufgeführt sind. Es gibt anscheinend auch Filme, die nur im oberen Banner verlinkt sind. Diese werden nicht gefunden.
Da der Crawler aktuell über die API sucht, wird das schwierig werden, außer wir schreiben den Crawler um auf HTML parsen.
P.S. ARTE scheint keine API-Calls mehr auf der Webseite zu machen, um die Übersichtsseiten aufzubauen. Einzig für die Video-Infos wird noch ein API-Call durchgeführt (mittlerweile in einer v2 statt v1)
Betrifft sowohl Master als auch Develop.
Weiteres Beispiel:
die Kurzfilme von Georges Méliès Forumseintrag
The text was updated successfully, but these errors were encountered:
Nur zu meinem Verständnis: Wenn der Crawler auf HTML parsen umgeschrieben werden würde, und gleichzeitig die Banner aber offensichtlich ip-abhängig/geo-abhängig gestaltet werden, würden damit immer noch Filme fehlen. Weniger als jetzt, aber doch der eine oder andere. Versteh ich das richtig?
@DaDirnbocher Der crawler würde dann deutlich länger brauchen und insgesamt noch weniger finden. Wir nutzen, mittlerweile, die API genau deshalb. Ist ja auch klar von einer API recht direkt die Informationen erhalten die man braucht ist einfacher und schneller als zig Seiten HTML zu laden und zu parsen.
Idee: Android-App lädt für jede Kategorie ein JSON, dass die ProgramIds beinhaltet. Darin sind die Banners enthalten. Wäre eine Überlegung, sich das anzusehen.
Im Forum wurde ein fehlender Film gemeldet.
Erste Analyse:
Der Crawler findet nur Filme, die auf den Subkategorie-Seiten unter "Alle Videos" aufgeführt sind. Es gibt anscheinend auch Filme, die nur im oberen Banner verlinkt sind. Diese werden nicht gefunden.
Da der Crawler aktuell über die API sucht, wird das schwierig werden, außer wir schreiben den Crawler um auf HTML parsen.
P.S. ARTE scheint keine API-Calls mehr auf der Webseite zu machen, um die Übersichtsseiten aufzubauen. Einzig für die Video-Infos wird noch ein API-Call durchgeführt (mittlerweile in einer v2 statt v1)
Betrifft sowohl Master als auch Develop.
Weiteres Beispiel:
die Kurzfilme von Georges Méliès Forumseintrag
The text was updated successfully, but these errors were encountered: