begin process at 2012 02 11 11:08:47
  Trouver un code source :
 
dans
 
Accueil > Forum > 

Archive C#

 > 

Archives

 > 

.NET

 > 

Detaguer une page html et obtenir un simple texte


Derniers messages déposésPoser une question dans le forum ou lancer une discussion

Detaguer une page html et obtenir un simple texte

mardi 14 octobre 2003 à 18:00:41 | Detaguer une page html et obtenir un simple texte

ttornade

Bjr la liste,

je convertir une page html en format txt. Mon objectif serait de "nétoyer" tout ce qui est script, option *.css ect. Par exple: <html><head>HHHH<head><script language=javascript>function(){ffff}</script><body>je suis néo en C#jksfjksdfjkfkfj</body></html>
Je voudrais rècupérer seulement la partie "je suis néo en C#jksfjksdfjkfkfj". dans mon code j'ai utilisé:
string pattern = @"(?i)<script([^>])*>(\w|\W)*</script([^>])*>|(?<gt>(<(""[^""]""|'[^']'|[^>])+)?>)";
strParsed = Regex.Replace(contenuHtml, pattern, " ");
Mais le rèsultat que j'obtiens n'est pas satisfaisant en ce sens que je retrouve par exple: ".maillink{color:white;text-decoration:none;}" et tant d'autres.
Quelqu'un saurait me donner des indications pr resoudre mon problème? Merci infiniment.

TT
mardi 14 octobre 2003 à 19:27:32 | Re : Detaguer une page html et obtenir un simple texte

jesusonline

Membre Club Administrateur CodeS-SourceS
Moi je pense plutot qu'il faudrait considerer ton fichier HTML comme un Fichier XML et ensue tu peux lire ce que tu veux dans les balises, le pb c'est qu'il faut que ton HTML soit très bien formé :)


Cette discussion est classée dans : page, simple, html, obtenir, detaguer


Répondre à ce message

Sujets en rapport avec ce message

problème en DotNet pour rècupèrer le contenu d'une page html complète [ par ttornade ] Bjr la liste,Existe-t'il un moyen ave les outils .Net de faire la requete HttpWebRequest d'un site(dont la page est construite avec des frames) et rec savoir le titre d'une page html [ par Fildomen ] Saluten utilisant le Navigateur Web Microsoft , comment savoir le titre d'une page?http://www.devportail.tk Récuperer mail dans une page html [ par Kain13 ] Bonjour,Comment vérifier si lors d'un traitement d'un formulaire, l'utilisateur a bien mis une adresse mail valide : Pseudo@FAI.comJe sais le faire en Convertir une page format html en format texte [ par ttornade ] Bjr le monde,je voudrais developper en C sharp ou visualBun programme qui devra recevoir une page html et restituer en sortie un fichier format texte Récupérer code html page web [ par moihenry ] Bonjour, quelle est le moyen le plus rapide pour récupérer le code html d'une page web ? MerciC# top!! [application console] lancer une page html [ par engelho ] Bonjour,Je viens de faire migrer une partire d'un projet. Une page html est devenue une application console. Bien évidement, la fonction "server.execu Créer une page html avec un editeur de texte format RTF [ par astuces_jeux ] Bonjour, je cherche comment créer une page de format RTFplus d'info : créer un editeur de texte sur une page HTML avec format RTF ( Convertir une page HTML en doc WOrd [ par bolo ] Bonjour,j'aimerais trouver un composant permettant de convertir un composant ou une class permettant de convertir une page HTML en document wordPeut o comment inserer une page web (html ou php etc...) sur un tabcontrol [ par Oziris ] bonjour,je recherche la fonction qui permet d'insérer un page web (php ou html) dans un onglet d'un tabcontrolmerci de vos reponse et de votre aides O RegEx [ par Bidou ] Bonjour,J'ai une question pas très compliquée sur les expressions régulières, mais voilà je ne connais pas tellement ce sujet alors si quelqu'un veut


Nos sponsors


Sondage...

Comparez les prix

CalendriCode

Février 2012
LMMJVSD
  12345
6789101112
13141516171819
20212223242526
272829    

Consulter la suite du CalendriCode

Photothèque

 
Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils.
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés

Google Coop CodeS-SourceS Google Coop CodeS-SourceS
Temps d'éxécution de la page : 0,406 sec (3)

Nous contacter | Annoncer sur CodeS-SourceS | Mentions légales