So holt man Daten aus Tabellen und Pseudo-Tabellen im Web ab

Im Web sind viele nützliche Informationen zu finden. Insbesondere in zahlreichen Tabellen lassen sich sehr viele Daten finden, die man für alle möglichen Dinge gut gebrauchen kann. Und um diese aus dem Web in eine Tabellenkalkulation zu bekommen, muss man sie keineswegs abtippen oder einzeln kopieren. Wie die Kollegen von Sempervideo hier zeigen, geht das einfacher als man erst einmal denken würde.

Zwei Varianten

Wenn der Betreiber der jeweiligen Webseite Tabellen so darstellt, wie es im HTML-Standard vorgesehen ist, hat man die geringsten Probleme. Hier bieten die Tabellenkalkulationen den Formel-Befehl IMPORTHTML an, dem dann die URL der jeweiligen Seite und die Nummer der gewünschten Tabelle mitgegeben werden. So hat man direkt alle Daten ordentlich sortiert in der jeweiligen Office-Software vorliegen.

Etwas schwieriger wird es, wenn die Daten über eine XML-Schnittstelle in die Seite eingefügt und nur per CSS formatiert werden. Dann sieht es zwar aus, als gäbe es eine Tabelle, im Code ist eine solche aber nicht zu finden. Der Import der Daten wird dann zwar etwas aufwendiger, ist mit IMPORTXML aber weiterhin möglich und wesentlich einfacher und schneller, als das Abtippen. Wie es genau funktioniert, seht ihr euch am besten im Video an, wo es detailliert am Praxisbeispiel demonstriert wird.

Mehr von SemperVideo: Auf YouTube
Dieses Video empfehlen
Jetzt einen Kommentar schreiben
 
Öhm? Strg C Strg V ... funktioniert aus Wikipedia und den meisten seiten. Die Bet365 muss man dazu noch kurz javascript deaktivieren damit man text markieren kann ... oder man nutzt ein OCR-Tool. Beides einfacher finde ich.
Kommentar abgeben Netiquette beachten!
Einloggen