Posts tagged: DOM

Daten aus Tabelle einer Webseite importieren

By , 5. Mai 2011

Der nachfolge Artikel zeigt wie man den Quelltext einer Webseite erhält, mittels DOM Bereiche im Quelltext ermittelt und wie man aus einer HTML-Tabelle Daten auch Formatiert ausliest.

Zuerst also benötigen wir den Seitenquelltext einer bestimmten Webseite. Dazu muss zuerst ein Verweiss auf die Microsoft HTML Object Library gesetzt werden, damit die entsprechenden Objekte und Funktionen zur Verfügung stehen:

1. Objekte deklarieren:

Dim objHTML As New HTMLDocument
Dim objDoc As New HTMLDocument
Dim objBody As HTMLBody

2. Seitenquelltext laden und Body extrahieren:

Set objDoc = objHTML.createDocumentFromUrl("http://yourwebsite.com/table1.htm", vbNullString)
Warten 1
Set objBody = objDoc.body

Es sieht vieleicht etwas merkwürdig aus, 2 gleiche Objekte und dann noch eine Warten-Funktion.
Man denkt sich vieleicht das man doch direkt
Set objBody = objHTML.createDocumentFromUrl(„http://yourwebsite.com/table1.htm“, vbNullString).body
schreiben könnte, aber das haut nicht hin. Der Grund liegt an der Ladezeit wie die Webseite den Seitenquelltext liefert. Dieser muss zuerst komplett geladen sein, bevor davon der Body extrahiert werden kann. Auch die zwei HTMLDocument Objekte sind notwendig, die Zuweisung ins selbe Objekt wäre hier nicht zulässig.
Read more »

OfficeFolders theme by Themocracy