begin process at 2010 02 10 12:38:17
  Trouver un code source :
 
dans
 
Accueil > 

Code

 > 

.NET

 > PARSEUR HTML

PARSEUR HTML


 Information sur la source

Note :
Aucune note
Catégorie :.NET Source .NET ( DotNet ) Classé sous :paseur, parser, html, iterator Niveau :Débutant Date de création :21/06/2007 Vu / téléchargé :9 495 / 548

Auteur : Yxion

Ecrire un message privé
Ce membre participe au partage de revenus publicitaires
Commentaire sur cette source (4)
Ajouter un commentaire et/ou une note


 Description

Cliquez pour voir la capture en taille normale
Je mets ce ptit bout de code en vue de remarques...

Ca parse le Html, j'ai fais quelques tests sur des pages bien codées et sur des très mal codés... ca à l'air de marcher.
Ca parse, mais ca ne créer pas un arbre DOM, le parseur renvoie par itération une liste d'objet Tag.
Y a aussi du gadjet au niveau du constructeur pour envoyer soit un fichier, soit un url à parser, une fonction pour construire une url à partir de l'url de la page, et le reconstructeur de page(propre et pas mal optimisé en taille).

J'ai fais ca dans le cadre de la refonte de mon ptit logiciel dont j'ai honte d'en parler (e-rus sitemap)... qui marche pas, ou pas bien, pas partout... une saloperie quoi.
Etant donné qu'en ce moment mon site est arrêté(pour cause de transit), j'en profite pour vous présenter ce qui me servirait de "moteur" d'exploration.

Je veux optimiser ca encore, soit par l'unsafe ou le refaire en c++ pour le traitement de la chaine Html, mais je sais pas si ca vaut le coup à ce niveau la.

Source

  • Voir le zip, la classe intéressante est trop longue pour être ici
Voir le zip, la classe intéressante est trop longue pour être ici

 Conclusion

Merci de vos remarques, ne soyez pas trop dur quand même

 Fichier Zip

Les Membres Club peuvent télécharger directement un fichier contenu dans le zip sans télécharger le zip en entier !

Télécharger le zip


 Sources du même auteur

Source avec Zip Source avec une capture Source .NET (Dotnet) GRAPHIQUE TYPE SECTEUR
Source .NET (Dotnet) REFLECTION .NET
Source avec Zip Source .NET (Dotnet) WEBBROWSER GÉRANT POPUP, ONGLETS, BOUTONS SOURIS...
Source avec Zip Source .NET (Dotnet) DOWNLOADMANAGER ASYNCHRONE RÉUTILISABLE
Source avec Zip Source avec une capture Source .NET (Dotnet) CONTROLE D'ONGLET PERSONNALISABLE

 Sources de la même categorie

Source avec Zip CHAT SERVER-CLIENT par abderrahmenbilog
Source avec Zip Source avec une capture Source .NET (Dotnet) SIMULATION DE CONSOLE POUR WINDOWS MOBILE par originalcompo
Source avec Zip Source .NET (Dotnet) BASE DE DONNÉES EN XML par DanMor498
Source avec Zip Source avec une capture Source .NET (Dotnet) SIMPLECONV - APPLICATION DE CONVERSION MONÉTAIRE AVEC TAUX E... par Jeffrey_
Source avec Zip Source .NET (Dotnet) TRAITEUR D'IMAGE (MINI) par ycyril

 Sources en rapport avec celle ci

Source avec Zip Source avec une capture Source .NET (Dotnet) SCRUTER UNE PAGE WEB À LA RECHERCHE DES LIENS ET DES ADRESSE... par developper_man
Source avec Zip Source avec une capture Source .NET (Dotnet) PARSER HTML par thiosyiasar
Source avec Zip Source avec une capture Source .NET (Dotnet) TRANSFORMATION D'UN XML À L'AIDE DE XSLT VERS HTML par EMSIEN
Source avec Zip Source avec une capture Source .NET (Dotnet) UN BROWSER AVANCÉ par leproc
Source avec Zip Source .NET (Dotnet) TRANSFERT RAPIDE DE PAGE WEB (ASPX, HTML, HTM..) AVEC LEUR C... par uzmenaz

Commentaires et avis

Commentaire de Bidou le 22/06/2007 09:02:55 administrateur CS

J'ai seulement survolé le code... J'ai vu que tu avais fait une classe UriBuilder. J'ai pas regardé en détail ce qu'elle faisait, mais y'a une class dans le framework qui fait peut-être ce dont tu as besoin: System.UriBuilder

Commentaire de Yxion le 22/06/2007 09:22:21

J'ai regardé, et UriBuilder à l'air d'etre simplement une classe de champs pour stocker IP, Port, Uri, etc. sans méthodes particulières non plus. Il y aussi que cette procédure me plait parce qu'elle est static...

Commentaire de morad_smi le 18/06/2008 16:29:50

bonjour!!! c'est intéressant ce que t'as fait, toutefois elle n'accepte pas un fichier html en entrée !!
c normal ?

Commentaire de Yxion le 18/06/2008 19:50:34

Il y a une surcharge avec un StreamReader, je pense que ca suffit.

 Ajouter un commentaire


Discussions en rapport avec ce code source dans le forum

Question con? [ par SoyYo ] SalutJuste une question qui va peut etre vous paraitre un peu con!!En fait je fasi des recherches depuis quelques jours a propose d'un parseur HTML, e envoi mail html [ par titi66 ] bonjour Dans une appli en c#, je dois envoyer une page html dans le corps d'un mail (pas en pièce jointe...) . Comment faire ?merci utilisation des iterator [ par thmatew ] Bonjour à tous,J'ai un petit souci avec une dll qui utilise std::list.je n'arrive pas à l'utiliser avec visual studio.NET 2003, que ce soit en C/C++ o Récupérer une adresse IP dans une page HTML [ par r4z3r ] Bonjour à tous,J'ai fais un programme pour renouveller l'ip de ma livebox sans le reboot éléctrique (avec un cgi ) , mais j'aimerais maintenant ajoute Regexp: optimiser un parser [ par bubbathemaster ] Bonjour, j'écris un parser de log et l'algorithme a cette forme:if(monRegexp1.IsMatch(ligne)){    Match match = monRegexp1.match(line);    //traitemen Html et label ou autres [ par tigroux ] Salut quelqu'un sait comment faire pour que un label, un textbox ou autre puisse traiter du html.En gors je veux pouvoir faire <b>Coucou</b&g Parser de XML [ par bubbathemaster ] Bonjour,Je recherche un parser de XML simple capable de lire node par node un fichier.En effet, je dois travailler avec des fichiers XML pas toujours traitement d'un fichier html [ par morad_smi ] bonjour chers developpeurs je voudrais un truc qui puisse m'aider pour le traitement d'un fichier html (ouverture, extraction du contenu ( texte, imag découpage fichier html [ par morad_smi ] bonjour!! j'ai un problème très tordu, qui pourra m'aider ? en fait il me faut un truc pour découper un fichier html en plusieurs parties, ces par


Nos sponsors


Sondage...

CalendriCode

Février 2010
LMMJVSD
1234567
891011121314
15161718192021
22232425262728

Consulter la suite du CalendriCode

 
Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils.
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés

Google Coop CodeS-SourceS Google Coop CodeS-SourceS
Temps d'éxécution de la page : 0,328 sec (4)

Nous contacter | Annoncer sur CodeS-SourceS | Mentions légales