Vous ne trouvez pas de réponse à votre problème ? Alors posez la question dans le forum. Souvenez-vous qu'il n'y a jamais de question bête, mais rester dans l'ignorance parce que l'on n'ose pas poser une question, ça c'est une erreur !

Sujet : Detaguer une page html et obtenir un simple texte [ Archives / .NET ] (ttornade)

mardi 14 octobre 2003 à 18:00:41 | Detaguer une page html et obtenir un simple texte

ttornade

Bjr la liste,

je convertir une page html en format txt. Mon objectif serait de "nétoyer" tout ce qui est script, option *.css ect. Par exple: <html><head>HHHH<head><script language=javascript>function(){ffff}</script><body>je suis néo en C#jksfjksdfjkfkfj</body></html>
Je voudrais rècupérer seulement la partie "je suis néo en C#jksfjksdfjkfkfj". dans mon code j'ai utilisé:
string pattern = @"(?i)<script([^>])*>(\w|\W)*</script([^>])*>|(?<gt>(<(""[^""]""|'[^']'|[^>])+)?>)";
strParsed = Regex.Replace(contenuHtml, pattern, " ");
Mais le rèsultat que j'obtiens n'est pas satisfaisant en ce sens que je retrouve par exple: ".maillink{color:white;text-decoration:none;}" et tant d'autres.
Quelqu'un saurait me donner des indications pr resoudre mon problème? Merci infiniment.

TT

mardi 14 octobre 2003 à 19:27:32 | Re : Detaguer une page html et obtenir un simple texte

jesusonline

Membre Club Administrateur CodeS-SourceS
Moi je pense plutot qu'il faudrait considerer ton fichier HTML comme un Fichier XML et ensue tu peux lire ce que tu veux dans les balises, le pb c'est qu'il faut que ton HTML soit très bien formé :)



Cette discussion est classé dans : page, simple, html, obtenir, detaguer


Répondre à ce message

Sujets en rapport avec ce message

problème en DotNet pour rècupèrer le contenu d'une page html complète [ par ttornade ] Bjr la liste,Existe-t'il un moyen ave les outils .Net de faire la requete HttpWebRequest d'un site(dont la page est construite avec des frames) et rec savoir le titre d'une page html [ par Fildomen ] Saluten utilisant le Navigateur Web Microsoft , comment savoir le titre d'une page?http://www.devportail.tk Récuperer mail dans une page html [ par Kain13 ] Bonjour,Comment vérifier si lors d'un traitement d'un formulaire, l'utilisateur a bien mis une adresse mail valide : Pseudo@FAI.comJe sais le faire en Convertir une page format html en format texte [ par ttornade ] Bjr le monde,je voudrais developper en C sharp ou visualBun programme qui devra recevoir une page html et restituer en sortie un fichier format texte Récupérer code html page web [ par moihenry ] Bonjour, quelle est le moyen le plus rapide pour récupérer le code html d'une page web ? MerciC# top!! [application console] lancer une page html [ par engelho ] Bonjour,Je viens de faire migrer une partire d'un projet. Une page html est devenue une application console. Bien évidement, la fonction "server.execu Créer une page html avec un editeur de texte format RTF [ par astuces_jeux ] Bonjour, je cherche comment créer une page de format RTFplus d'info : créer un editeur de texte sur une page HTML avec format RTF ( Convertir une page HTML en doc WOrd [ par bolo ] Bonjour,j'aimerais trouver un composant permettant de convertir un composant ou une class permettant de convertir une page HTML en document wordPeut o comment inserer une page web (html ou php etc...) sur un tabcontrol [ par Oziris ] bonjour,je recherche la fonction qui permet d'insérer un page web (php ou html) dans un onglet d'un tabcontrolmerci de vos reponse et de votre aides O RegEx [ par Bidou ] Bonjour,J'ai une question pas très compliquée sur les expressions régulières, mais voilà je ne connais pas tellement ce sujet alors si quelqu'un veut


Nos sponsors

Sondage...

CalendriCode

Juillet 2009
LMMJVSD
  12345
6789101112
13141516171819
20212223242526
2728293031  

Consulter la suite du CalendriCode

Téléchargements

Logiciels à télécharger sur le même thème :

Comparez les prix Nouvelle version

Photothèque Nouveau !



Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés
Temps d'éxécution de la page : 0,312 sec

Google Coop CodeS-SourceS Google Coop CodeS-SourceS


Certaines images présentes sur le site (notament certains avatars) sont issues des collections IconShock, donc si vous souhaitez utiliser ces icons vous devez les acheter, ne les copiez pas et ne utilisez pas dans vos sites et applications sans les avoir commandé.