Bonjour,
Une solution possible est d'utiliser HtmlAgilityPack. Cette librairie permet de transformer du html en XML. Elle est très tolérante au html mal formé.
Avec cette librairie, il suffit de :
- Charger la page
[ Lien ]
using
System;using
HtmlAgilityPack;using
System.Net;using
System.IO;namespace
HtmlDir{
class Program {
static void Main(string[] args) {
string url = @"http://www.mon-site.com/mon_dossier/"; WebRequest wr = HttpWebRequest.Create(url); using (WebResponse myWebResponse = wr.GetResponse()) {
using (Stream receiveStream = myWebResponse.GetResponseStream()) {
HtmlDocument doc = new HtmlDocument(); doc.Load(receiveStream);
doc.OptionOutputAsXml =
true; HtmlNodeCollection links = doc.DocumentNode.SelectNodes("//a");
if (links != null) {
foreach (HtmlNode link in links) {
if (!link.InnerText.Trim().StartsWith("[")) {
Console.WriteLine("{0} ({1})", link.InnerText, link.Attributes["href"].Value); }
}
}
}
}
Console.ReadLine(); }
}
}
Pascal