Замена / удаление символов, не соответствующих регулярному выражению (.NET)
У меня есть регулярное выражение для проверки строки. Но теперь я хочу удалить все символы,которые не соответствуют моему регулярному выражению.
Э. Г.
regExpression = @"^([w'-+])"
text = "This is a sample text with some invalid characters -+%&()=?";
//Remove characters that do not match regExp.
result = "This is a sample text with some invalid characters -+";
любые идеи о том, как я могу использовать RegExpression для определения допустимых символов и удаления всех других.
большое спасибо
3 ответов
Я считаю, что вы можете сделать это (символы белого списка и заменить все остальное) в одной строке:
var result = Regex.Replace(text, @"[^\w\s\-\+]", "");
технически он произведет это: - Это образец текста с недопустимыми символами ... " что немного отличается от вашего примера (дополнительное пространство между - и +).
просто:
var match = Regex.Match(text, regExpression);
string result = "";
if(match.Success)
result = match.Value;
удаление несоответствующих символов-это то же самое, что и сохранение совпадающих. Вот что мы здесь делаем.
Если это возможно, что выражение соответствует несколько раз в вашем тексте, вы можете использовать это:
var result = Regex.Matches(text, regExpression).Cast<Match>()
.Aggregate("", (s, e) => s + e.Value, s => s);
спасибо заменить символы, если не совпадают ответ, который я создал вспомогательный метод для полос недопустимых символов .
разрешенный шаблон должен быть в формате Regex, ожидайте, что они завернуты в квадратные скобки. Функция вставит Тильду после открытия кронштейна squere. Я предполагаю,что он может работать не для всех регулярных выражений, описывающих допустимые наборы символов, но он работает для относительно простых наборов, которые мы используем.
/// <summary>
/// Replaces not expected characters.
/// </summary>
/// <param name="text"> The text.</param>
/// <param name="allowedPattern"> The allowed pattern in Regex format, expect them wrapped in brackets</param>
/// <param name="replacement"> The replacement.</param>
/// <returns></returns>
/// // https://stackoverflow.com/questions/4460290/replace-chars-if-not-match.
//https://stackoverflow.com/questions/6154426/replace-remove-characters-that-do-not-match-the-regular-expression-net
//[^ ] at the start of a character class negates it - it matches characters not in the class.
//Replace/Remove characters that do not match the Regular Expression
static public string ReplaceNotExpectedCharacters( this string text, string allowedPattern,string replacement )
{
allowedPattern = allowedPattern.StripBrackets( "[", "]" );
//[^ ] at the start of a character class negates it - it matches characters not in the class.
var result = Regex .Replace(text, @"[^" + allowedPattern + "]", replacement);
return result;
}
static public string RemoveNonAlphanumericCharacters( this string text)
{
var result = text.ReplaceNotExpectedCharacters(NonAlphaNumericCharacters, "" );
return result;
}
public const string NonAlphaNumericCharacters = "[a-zA-Z0-9]";