Daten aus Tabelle einer Webseite importieren

Der nachfolge Artikel zeigt wie man den Quelltext einer Webseite erhält, mittels DOM Bereiche im Quelltext ermittelt und wie man aus einer HTML-Tabelle Daten auch Formatiert ausliest.
Zuerst also benötigen wir den Seitenquelltext einer bestimmten Webseite. Dazu muss zuerst ein Verweiss auf die Microsoft HTML Object Library gesetzt werden, damit die entsprechenden Objekte und Funktionen zur Verfügung stehen:
1. Objekte deklarieren:
Dim objHTML As New HTMLDocument Dim objDoc As New HTMLDocument Dim objBody As HTMLBody
2. Seitenquelltext laden und Body extrahieren:
Set objDoc = objHTML.createDocumentFromUrl("http://yourwebsite.com/table1.htm", vbNullString) Warten 1 Set objBody = objDoc.body
Es sieht vieleicht etwas merkwürdig aus, 2 gleiche Objekte und dann noch eine Warten-Funktion.
Man denkt sich vieleicht das man doch direkt
Set objBody = objHTML.createDocumentFromUrl(„http://yourwebsite.com/table1.htm“, vbNullString).body
schreiben könnte, aber das haut nicht hin. Der Grund liegt an der Ladezeit wie die Webseite den Seitenquelltext liefert. Dieser muss zuerst komplett geladen sein, bevor davon der Body extrahiert werden kann. Auch die zwei HTMLDocument Objekte sind notwendig, die Zuweisung ins selbe Objekt wäre hier nicht zulässig.
Read more »