Vous ne trouvez pas de réponse à votre problème ? Alors posez la question dans le forum. Souvenez-vous qu'il n'y a jamais de question bête, mais rester dans l'ignorance parce que l'on n'ose pas poser une question, ça c'est une erreur !

PARSEUR HTML


Information sur la source



Description

Cliquez pour voir la capture en taille normale
Je mets ce ptit bout de code en vue de remarques...

Ca parse le Html, j'ai fais quelques tests sur des pages bien codées et sur des très mal codés... ca à l'air de marcher.
Ca parse, mais ca ne créer pas un arbre DOM, le parseur renvoie par itération une liste d'objet Tag.
Y a aussi du gadjet au niveau du constructeur pour envoyer soit un fichier, soit un url à parser, une fonction pour construire une url à partir de l'url de la page, et le reconstructeur de page(propre et pas mal optimisé en taille).

J'ai fais ca dans le cadre de la refonte de mon ptit logiciel dont j'ai honte d'en parler (e-rus sitemap)... qui marche pas, ou pas bien, pas partout... une saloperie quoi.
Etant donné qu'en ce moment mon site est arrêté(pour cause de transit), j'en profite pour vous présenter ce qui me servirait de "moteur" d'exploration.

Je veux optimiser ca encore, soit par l'unsafe ou le refaire en c++ pour le traitement de la chaine Html, mais je sais pas si ca vaut le coup à ce niveau la.
 

Source

  • Voir le zip, la classe intéressante est trop longue pour être ici
Voir le zip, la classe intéressante est trop longue pour être ici

Conclusion

Merci de vos remarques, ne soyez pas trop dur quand même
 

Fichier Zip

Pour les "Membres Club", vous pouvez télécharger directement un fichier contenu dans le zip sans télécharger le zip en entier !

Télécharger le zip

Commentaires et avis

signaler à un administrateur
Commentaire de Bidou le 22/06/2007 09:02:55 administrateur CS

J'ai seulement survolé le code... J'ai vu que tu avais fait une classe UriBuilder. J'ai pas regardé en détail ce qu'elle faisait, mais y'a une class dans le framework qui fait peut-être ce dont tu as besoin: System.UriBuilder

signaler à un administrateur
Commentaire de Yxion le 22/06/2007 09:22:21

J'ai regardé, et UriBuilder à l'air d'etre simplement une classe de champs pour stocker IP, Port, Uri, etc. sans méthodes particulières non plus. Il y aussi que cette procédure me plait parce qu'elle est static...

signaler à un administrateur
Commentaire de morad_smi le 18/06/2008 16:29:50

bonjour!!! c'est intéressant ce que t'as fait, toutefois elle n'accepte pas un fichier html en entrée !!
c normal ?

signaler à un administrateur
Commentaire de Yxion le 18/06/2008 19:50:34

Il y a une surcharge avec un StreamReader, je pense que ca suffit.

Ajouter un commentaire

Discussions en rapport avec ce code source dans le forum

Question con? [ par SoyYo ] SalutJuste une question qui va peut etre vous paraitre un peu con!!En fait je fasi des recherches depuis quelques jours a propose d'un parseur HTML, e chargement d(une page html à partir d'un controle [ par nehla ] salut j'ai crée une interface qui contient un menu parmi les items du menu j'ai un menu qui s'appelle aide je veux lorsque je clique sur cet item il s html entities [ par sh4gm4 ] Salut,j'ouvre un xml qui contient certains &lt; et &gt; encodé en html : &amp;lt; et &amp;gt;sample: &lt;tu changedate="20080807T140037Z" changeid="ad Fichier d'aide html compilé [ par olivierbalagizi ] Bonjour à tous,Je cherche à créer un fichier d'aide (Fichier Html compilé) mais je ne sais pas comment m'y prendre. Je sais créer le fichier html mais Pb d'affichage de code C# en HTML via un XML [ par jbhee ] Bonjour,J'ai un fichier XML avec des balises contenant du code en C#. ex : &lt;formula&gt;        private float Code_1()        {            if (Code_ Design Surface (mais pour le html) [ par veler ] Salut, Vous connaissez sûrement le Design Surface qui nous permet, en .Net, d'avoir le fameux concepteur de fenêtre, comme dans Visual Studio. Mais ma Visual Studio 2005 (C#) et champ HTML (<object><embed>) [ par yannickG187 ] Bonjour,Je développe une petite application sous Visual Studio 2005  et j'aimerais savoir si c'est possible (et alors comment ^^) de mettre du code HT envoi mail html [ par titi66 ] bonjour Dans une appli en c#, je dois envoyer une page html dans le corps d'un mail (pas en pièce jointe...) . Comment faire ?merci utilisation des iterator [ par thmatew ] Bonjour à tous,J'ai un petit souci avec une dll qui utilise std::list.je n'arrive pas à l'utiliser avec visual studio.NET 2003, que ce soit en C/C++ o


Nos sponsors

Sondage...

CalendriCode

Décembre 2008
LMMJVSD
1234567
891011121314
15161718192021
22232425262728
293031    

Consulter la suite du CalendriCode

Téléchargements

Logiciels à télécharger sur le même thème :



Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel BAÏSE, Merci à Vincent pour ses précieux conseils
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés
Temps d'éxécution de la page : 0,374 sec

Google Coop CodeS-SourceS Google Coop CodeS-SourceS


Certaines images présentes sur le site (notament certains avatars) sont issues des collections IconShock, donc si vous souhaitez utiliser ces icons vous devez les acheter, ne les copiez pas et ne utilisez pas dans vos sites et applications sans les avoir commandé.