begin process at 2012 02 08 05:35:32
  Trouver un code source :
 
dans
 
Accueil > 

Code

 > 

.NET

 > PARSEUR HTML

PARSEUR HTML


 Information sur la source

Note :
Aucune note
Catégorie :.NET Source .NET ( DotNet ) Classé sous :paseur, parser, html, iterator Niveau :Débutant Date de création :21/06/2007 Vu / téléchargé :12 083 / 698

Auteur : Yxion

Ecrire un message privé
Ce membre participe au partage de revenus publicitaires
Commentaire sur cette source (4)
Ajouter un commentaire et/ou une note


 Description

Cliquez pour voir la capture en taille normale
Je mets ce ptit bout de code en vue de remarques...

Ca parse le Html, j'ai fais quelques tests sur des pages bien codées et sur des très mal codés... ca à l'air de marcher.
Ca parse, mais ca ne créer pas un arbre DOM, le parseur renvoie par itération une liste d'objet Tag.
Y a aussi du gadjet au niveau du constructeur pour envoyer soit un fichier, soit un url à parser, une fonction pour construire une url à partir de l'url de la page, et le reconstructeur de page(propre et pas mal optimisé en taille).

J'ai fais ca dans le cadre de la refonte de mon ptit logiciel dont j'ai honte d'en parler (e-rus sitemap)... qui marche pas, ou pas bien, pas partout... une saloperie quoi.
Etant donné qu'en ce moment mon site est arrêté(pour cause de transit), j'en profite pour vous présenter ce qui me servirait de "moteur" d'exploration.

Je veux optimiser ca encore, soit par l'unsafe ou le refaire en c++ pour le traitement de la chaine Html, mais je sais pas si ca vaut le coup à ce niveau la.

Source

  • Voir le zip, la classe intéressante est trop longue pour être ici
Voir le zip, la classe intéressante est trop longue pour être ici

 Conclusion

Merci de vos remarques, ne soyez pas trop dur quand même

 Fichier Zip

Les Membres Club peuvent télécharger directement un fichier contenu dans le zip sans télécharger le zip en entier !

Télécharger le zip


 Sources du même auteur

Source avec Zip Source avec une capture Source .NET (Dotnet) GRAPHIQUE TYPE SECTEUR
Source .NET (Dotnet) REFLECTION .NET
Source avec Zip Source .NET (Dotnet) WEBBROWSER GÉRANT POPUP, ONGLETS, BOUTONS SOURIS...
Source avec Zip Source .NET (Dotnet) DOWNLOADMANAGER ASYNCHRONE RÉUTILISABLE
Source avec Zip Source avec une capture Source .NET (Dotnet) CONTROLE D'ONGLET PERSONNALISABLE

 Sources de la même categorie

Source avec Zip Source avec une capture Source .NET (Dotnet) ORIONBANQUE par toutphp
Source avec Zip Source avec une capture Source .NET (Dotnet) ORIONAPPLICATION par toutphp
Source avec Zip SOCKET CONNEXION CLIENT & SERVEUR par ziedto83
Source avec Zip Source .NET (Dotnet) FFMPEG.NET : WRAPPER .NET DE FFMPEG par MasterShadows
Source avec Zip Source .NET (Dotnet) ATTACHER, CRÉER ET SAUVEGARDER UNE BASE DE DONNÉES SQL SERVE... par Alvepinai

 Sources en rapport avec celle ci

Source avec Zip Source avec une capture Source .NET (Dotnet) SCRUTER UNE PAGE WEB À LA RECHERCHE DES LIENS ET DES ADRESSE... par developper_man
Source avec Zip Source avec une capture Source .NET (Dotnet) PARSER HTML par thiosyiasar
Source avec Zip Source avec une capture Source .NET (Dotnet) TRANSFORMATION D'UN XML À L'AIDE DE XSLT VERS HTML par EMSIEN
Source avec Zip Source avec une capture Source .NET (Dotnet) UN BROWSER AVANCÉ par leproc
Source avec Zip Source .NET (Dotnet) TRANSFERT RAPIDE DE PAGE WEB (ASPX, HTML, HTM..) AVEC LEUR C... par uzmenaz

Commentaires et avis

Commentaire de Bidou le 22/06/2007 09:02:55 administrateur CS

J'ai seulement survolé le code... J'ai vu que tu avais fait une classe UriBuilder. J'ai pas regardé en détail ce qu'elle faisait, mais y'a une class dans le framework qui fait peut-être ce dont tu as besoin: System.UriBuilder

Commentaire de Yxion le 22/06/2007 09:22:21

J'ai regardé, et UriBuilder à l'air d'etre simplement une classe de champs pour stocker IP, Port, Uri, etc. sans méthodes particulières non plus. Il y aussi que cette procédure me plait parce qu'elle est static...

Commentaire de morad_smi le 18/06/2008 16:29:50

bonjour!!! c'est intéressant ce que t'as fait, toutefois elle n'accepte pas un fichier html en entrée !!
c normal ?

Commentaire de Yxion le 18/06/2008 19:50:34

Il y a une surcharge avec un StreamReader, je pense que ca suffit.

 Ajouter un commentaire


Discussions en rapport avec ce code source dans le forum

Question con? [ par SoyYo ] SalutJuste une question qui va peut etre vous paraitre un peu con!!En fait je fasi des recherches depuis quelques jours a propose d'un parseur HTML, e C#: meilleure façon de parser rapidement une page html [ par Karibot ] Bonjour, quelle est la meilleure façon de parser une page html et récupérer les liens qu'elle contient? j'utilise httpwebrequest pour parser la page e html agility [ par Karibot ] Bonjour, je cherche à récupérer tous les liens href d'une page html, je le fais actuellement en utilisant l'objet Regex, j'ai apris qu'on pouvait pars Application MVC - class="editor-field" et Html.EditorFor [ par artichomaske ] Bonjour, Je créer une application MVC qui doit permettre l'édition de valeurs dans des [i]editor-field[/i]. Une question bête à laquelle j'ai du mal [html]agilityPack [ par saratsdi ] [b][color=purple]Bonjour tout le monde, je travaille sur un projet ou j ai commencé à utiliser " html Agility pack " mon probleme c'est que je veux un menu horizontal pour ma page html, mais.............; [ par R1info ] Slt, S'il vous plait, je viens d'ajouter un menu horizontal dans ma page html. mais, ce que je veux moi, c'est: quand je suis dans une page de mon sit supprimer 1 ligne <tr> d'un tableau HTML avec un bouton C# [ par mimijesss ] Bonjour tout le monde, Je travaille actuellement sur le développement d'un formulaire en ligne à l'aide d'une Web Part C# avec le moteur WSS 3.0 sp2 e Comment remplir un formulaire d'une page html (Login et MDP) ? [ par miminooze ] Bonjour, Après quelques recherche sur internet, je cherche à remplir un formulaire d'une page html avec un webBrowser sous Visual Studio 2010, plus p Extraire des informations d'une page HTML [ par xmustapha ] bonjour voila, je cherche un moyen pour extraire des infos depuis cette page: http://www.google.com/finance/converter?a=15&from=ARS&to=AUD voici l


Nos sponsors


Sondage...

CalendriCode

Février 2012
LMMJVSD
  12345
6789101112
13141516171819
20212223242526
272829    

Consulter la suite du CalendriCode

Photothèque

 
Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils.
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés

Google Coop CodeS-SourceS Google Coop CodeS-SourceS
Temps d'éxécution de la page : 3,354 sec (3)

Nous contacter | Annoncer sur CodeS-SourceS | Mentions légales