Если вы не можете использовать ориентированное на парсер HTML

  • Михаил
  • 12 мин. на прочтение
  • 92
  • 20 Jun 2022
  • 20 Jun 2022

Если вы не можете использовать ориентированное на парсер HTML решение для фильтрации тегов, для этого простое регулярное выражение.


string noHTML = Regex.Replace(inputHTML, @"<[^>]+>| ", "").Trim();

Вы должны в идеале сделать еще один проход через фильтр регулярных выражений, который превратит множественные пробелы в одиночные.


string noHTMLNormalised = Regex.Replace(noHTML, @"\s{2,}", " ");