Подсчет слов и пробелов в строке C#

Я хочу подсчитать слова и пробелы в моей строке. Строка выглядит так:

Command do something ptuf(123) and bo(1).ctq[5] v:0,

у меня есть что-то вроде этого до сих пор

int count = 0;
string mystring = "Command do something ptuf(123) and bo(1).ctq[5] v:0,";
foreach(char c in mystring) 
{
if(char.IsLetter(c)) 
  {
     count++;
  }
}

что я должен сделать, чтобы подсчитать пробелы?

8 ответов


int countSpaces = mystring.Count(Char.IsWhiteSpace); // 6
int countWords = mystring.Split().Length; // 7

обратите внимание, что оба используют Char.IsWhiteSpace, который предполагает другие символы, чем " " как пробел(как newline). Посмотрите на раздел Примечания, чтобы увидеть, что именно .


вы можете использовать string.Разделить пробелом http://msdn.microsoft.com/en-us/library/system.string.split.aspx

когда вы получаете массив строк, количество элементов - это количество слов, а количество пробелов-это количество слов -1


Это будет учитывать:

  • строки, начинающиеся или заканчивающиеся на место.
  • двойной/тройной/... пространства.

предполагая, что единственными разделителями слов являются пробелы и что ваша строка не равна null.

private static int CountWords(string S)
{
    if (S.Length == 0)
        return 0;

    S = S.Trim();
    while (S.Contains("  "))
        S = S.Replace("  "," ");
    return S.Split(' ').Length;
}

Примечание: цикл while также может быть выполнен с регулярным выражением:как заменить несколько пробелов одним пробелом в C#?


Если вы хотите подсчитать пробелы, вы можете использовать LINQ:

int count = mystring.Count(s => s == ' ');

У меня есть готовый код для получения списка слов в строке: (методы расширения должны быть в статическом классе)

    /// <summary>
    /// Gets a list of words in the text. A word is any string sequence between two separators.
    /// No word is added if separators are consecutive (would mean zero length words).
    /// </summary>
    public static List<string> GetWords(this string Text, char WordSeparator)
    {
        List<int> SeparatorIndices = Text.IndicesOf(WordSeparator.ToString(), true);

        int LastIndexNext = 0;


        List<string> Result = new List<string>();
        foreach (int index in SeparatorIndices)
        {
            int WordLen = index - LastIndexNext;
            if (WordLen > 0)
            {
                Result.Add(Text.Substring(LastIndexNext, WordLen));
            }
            LastIndexNext = index + 1;
        }

        return Result;
    }

    /// <summary>
    /// returns all indices of the occurrences of a passed string in this string.
    /// </summary>
    public static List<int> IndicesOf(this string Text, string ToFind, bool IgnoreCase)
    {
        int Index = -1;
        List<int> Result = new List<int>();

        string T, F;

        if (IgnoreCase)
        {
            T = Text.ToUpperInvariant();
            F = ToFind.ToUpperInvariant();
        }
        else
        {
            T = Text;
            F = ToFind;
        }


        do
        {
            Index = T.IndexOf(F, Index + 1);
            Result.Add(Index);
        }
        while (Index != -1);

        Result.RemoveAt(Result.Count - 1);

        return Result;
    }


    /// <summary>
    /// Implemented - returns all the strings in uppercase invariant.
    /// </summary>
    public static string[] ToUpperAll(this string[] Strings)
    {
        string[] Result = new string[Strings.Length];
        Strings.ForEachIndex(i => Result[i] = Strings[i].ToUpperInvariant());
        return Result;
    }

в дополнение к записи Тима, если у вас есть заполнение с обеих сторон или несколько пробелов рядом друг с другом:

Int32 words = somestring.Split(           // your string
    new[]{ ' ' },                         // break apart by spaces
    StringSplitOptions.RemoveEmptyEntries // remove empties (double spaces)
).Length;                                 // number of "words" remaining

вот метод, использующий регулярное выражение. Просто нужно еще кое-что обдумать. Лучше, если у вас есть длинные строки с большим количеством различных типов пробелов. Подобно WordCount от Microsoft Word.

var str = "Command do something ptuf(123) and bo(1).ctq[5] v:0,";
int count = Regex.Matches(str, @"[\S]+").Count; // count is 7

Для сравнения:

var str = "Command     do    something     ptuf(123) and bo(1).ctq[5] v:0,";

str.Count(char.IsWhiteSpace) - 17, в то время как количество регулярных выражений все еще 7.


using namespace;
namespace Application;
class classname
{
    static void Main(string[] args)
    {
        int count;
        string name = "I am the student";
        count = name.Split(' ').Length;
        Console.WriteLine("The count is " +count);
        Console.ReadLine();
    }
}