Remover Tags HTML do texto em C#

Quinta-feira, 03 de Maio de 2007. 11:38:37
Programação, .Net |

Hoje vou documentar a solução para um problema simples, mas que está pouco documentado na web. Um determinado projeto da empresa precisava exibir conteúdos texto que continham formatação HTML. até aí tudo bem, usamos o componente FreeTextBox e o problema foi resolvido. O problema de verdade começou quando pintou a necessidade de remover a formatação e exibir apenas texto puro (em buscas, exibir trechos, etc). Em textos sem formatação bastava pegar x caracteres (ou palavras) antes e depois da palavra pesquisada, porém este mesmo procedimento não se aplica quando se tem as tags htmls. Para evitar ter que reescrecer uma função que já funcionava, a solução foi eliminar todas as tags antes de fazer a busca.


Para isso usamos Expressões regulares. Segue abaixo o código:

// Declara uma variável que armazenará a expressão regular a ser comparada.
// RegexOptions.IgnoreCase indica que não será CaseSensitive
Regex strHtml=new Regex("< [^>]*>", RegexOptions.IgnoreCase);

// Cria uma coleção contendo todos os textos que bateram com a er
MatchCollection MatchList = strHtml.Matches(texto);

//Percorre a Coleção
for(int i=0;i
{
// Substitui cada tag por espaços
texto = texto.Replace(MatchList[i].ToString(),” “);
}

Espero ter ajudado.

[bl]livros sobre .net, livros sobre expressões regulares, livros sobre programação[/bl]

Posts Semelhantes:

BoxOver - Insira Dicas (ToolTips) sem complicação
FreeTextBox - Componente para .net
Modificando o phpBB 2.0.x - Instalação de MODs
Como escolher um Serviço de hospedagem - Parte 1 - Como funcionam
phpBB 2.0.x - MODs - Envio de Arquivos

Compartilhe este Post:

6 Comentários »

RSS Feeds de comentários. Fazer um TrackBack

  1. Muito válido, é sempre importante validar as entradas do usuário e bloquear toda e qualquer ação maliciosa.

    Comentário por Thiago Bohn — 4/05/2007 #

  2. Comentário do Autor:

    Olá Thiago. A idéia é também essa, como o usuário pode entrar com qualquer tag html, filtra-la em alguns pontos da aplicação evita problemas. Obrigado pela visita.

    Comentário por Gustavo Montes — 4/05/2007 #

  3. Muito obrigado…

    Comentário por Juan Santiago — 21/08/2007 #

  4. Muito bom …

    só cuidado com a visualização do código, no firefox o código esta “incompleto”.

    Comentário por Luis Filipe — 13/01/2008 #

  5. manda o código completo….

    Comentário por Andre — 24/04/2008 #

  6. Obrigado!
    isso me Ajudou mto…

    Comentário por Jesse — 26/08/2008 #

Comente

XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>

 

Blog Sys.GSM é parte integrante do site Sys.GSM desenvolvido por Gustavo Montes - 2006-2007
Google PageRank 
Checker - Page Rank Calculator
27 consultas em 0.356 segundos.


Política de Privacidade