Как извлечь содержимое квадратных скобок в строке текста в c# с помощью Regex

если у меня есть строка текста, как показано ниже, как я могу собрать содержимое скобок в коллекции в C# даже если это идет за разрывы строк?

например...

string s = "test [4df] test [5yu] test [6nf]";

должен дать мне..

коллекция[0] = 4df

коллекция[1] = 5yu

коллекция[2] = 6nf

4 ответов


вы можете сделать это с помощью регулярных выражений и немного Linq.

    string s = "test [4df] test [5y" + Environment.NewLine + "u] test [6nf]";

    ICollection<string> matches =
        Regex.Matches(s.Replace(Environment.NewLine, ""), @"\[([^]]*)\]")
            .Cast<Match>()
            .Select(x => x.Groups[1].Value)
            .ToList();

    foreach (string match in matches)
        Console.WriteLine(match);

выход:

4df
5yu
6nf

вот что означает регулярное выражение:

\[   : Match a literal [
(    : Start a new group, match.Groups[1]
[^]] : Match any character except ]
*    : 0 or more of the above
)    : Close the group
\]   : Literal ]

Regex regex = new Regex(@"\[[^\]]+\]", RegexOptions.Multiline);

ключ, чтобы правильно выйти из специальных символов, используемых в регулярных выражениях, например вы можете соответствовать [ персонажа таким образом: @"\["


Regex rx = new Regex(@"\[.+?\]");
var collection = rx.Matches(s);

вам нужно будет обрезать квадратные скобки, важной частью является ленивый оператор.