Подсчет слов и пробелов в строке C#
Я хочу подсчитать слова и пробелы в моей строке. Строка выглядит так:
Command do something ptuf(123) and bo(1).ctq[5] v:0,
у меня есть что-то вроде этого до сих пор
int count = 0;
string mystring = "Command do something ptuf(123) and bo(1).ctq[5] v:0,";
foreach(char c in mystring)
{
if(char.IsLetter(c))
{
count++;
}
}
что я должен сделать, чтобы подсчитать пробелы?
8 ответов
int countSpaces = mystring.Count(Char.IsWhiteSpace); // 6
int countWords = mystring.Split().Length; // 7
обратите внимание, что оба используют Char.IsWhiteSpace
, который предполагает другие символы, чем " "
как пробел(как newline
). Посмотрите на раздел Примечания, чтобы увидеть, что именно .
вы можете использовать string.Разделить пробелом http://msdn.microsoft.com/en-us/library/system.string.split.aspx
когда вы получаете массив строк, количество элементов - это количество слов, а количество пробелов-это количество слов -1
Это будет учитывать:
- строки, начинающиеся или заканчивающиеся на место.
- двойной/тройной/... пространства.
предполагая, что единственными разделителями слов являются пробелы и что ваша строка не равна null.
private static int CountWords(string S)
{
if (S.Length == 0)
return 0;
S = S.Trim();
while (S.Contains(" "))
S = S.Replace(" "," ");
return S.Split(' ').Length;
}
Примечание: цикл while также может быть выполнен с регулярным выражением:как заменить несколько пробелов одним пробелом в C#?
Если вы хотите подсчитать пробелы, вы можете использовать LINQ:
int count = mystring.Count(s => s == ' ');
У меня есть готовый код для получения списка слов в строке: (методы расширения должны быть в статическом классе)
/// <summary>
/// Gets a list of words in the text. A word is any string sequence between two separators.
/// No word is added if separators are consecutive (would mean zero length words).
/// </summary>
public static List<string> GetWords(this string Text, char WordSeparator)
{
List<int> SeparatorIndices = Text.IndicesOf(WordSeparator.ToString(), true);
int LastIndexNext = 0;
List<string> Result = new List<string>();
foreach (int index in SeparatorIndices)
{
int WordLen = index - LastIndexNext;
if (WordLen > 0)
{
Result.Add(Text.Substring(LastIndexNext, WordLen));
}
LastIndexNext = index + 1;
}
return Result;
}
/// <summary>
/// returns all indices of the occurrences of a passed string in this string.
/// </summary>
public static List<int> IndicesOf(this string Text, string ToFind, bool IgnoreCase)
{
int Index = -1;
List<int> Result = new List<int>();
string T, F;
if (IgnoreCase)
{
T = Text.ToUpperInvariant();
F = ToFind.ToUpperInvariant();
}
else
{
T = Text;
F = ToFind;
}
do
{
Index = T.IndexOf(F, Index + 1);
Result.Add(Index);
}
while (Index != -1);
Result.RemoveAt(Result.Count - 1);
return Result;
}
/// <summary>
/// Implemented - returns all the strings in uppercase invariant.
/// </summary>
public static string[] ToUpperAll(this string[] Strings)
{
string[] Result = new string[Strings.Length];
Strings.ForEachIndex(i => Result[i] = Strings[i].ToUpperInvariant());
return Result;
}
в дополнение к записи Тима, если у вас есть заполнение с обеих сторон или несколько пробелов рядом друг с другом:
Int32 words = somestring.Split( // your string
new[]{ ' ' }, // break apart by spaces
StringSplitOptions.RemoveEmptyEntries // remove empties (double spaces)
).Length; // number of "words" remaining
вот метод, использующий регулярное выражение. Просто нужно еще кое-что обдумать. Лучше, если у вас есть длинные строки с большим количеством различных типов пробелов. Подобно WordCount от Microsoft Word.
var str = "Command do something ptuf(123) and bo(1).ctq[5] v:0,";
int count = Regex.Matches(str, @"[\S]+").Count; // count is 7
Для сравнения:
var str = "Command do something ptuf(123) and bo(1).ctq[5] v:0,";
str.Count(char.IsWhiteSpace)
- 17, в то время как количество регулярных выражений все еще 7.
using namespace;
namespace Application;
class classname
{
static void Main(string[] args)
{
int count;
string name = "I am the student";
count = name.Split(' ').Length;
Console.WriteLine("The count is " +count);
Console.ReadLine();
}
}