Как подсчитать вхождение строки в строку?
Как я могу подсчитать количество раз, когда определенная строка возникает в другой строке. Например, это то, что я пытаюсь сделать в Javascript:
var temp = "This is a string.";
alert(temp.count("is")); //should output '2'
25 ответов
на g
в регулярном выражении (сокращенно глобальные) говорит, чтобы искать всю строку, а не просто найти первое вхождение:
var temp = "This is a string.";
var count = (temp.match(/is/g) || []).length;
console.log(count);
Это is
два раза. И, если нет совпадений, он возвращает 0
.
var temp = "Hello World!";
var count = (temp.match(/is/g) || []).length;
console.log(count);
/** Function that count occurrences of a substring in a string;
* @param {String} string The string
* @param {String} subString The sub string to search for
* @param {Boolean} [allowOverlapping] Optional. (Default:false)
*
* @author Vitim.us https://gist.github.com/victornpb/7736865
* @see Unit Test https://jsfiddle.net/Victornpb/5axuh96u/
* @see http://stackoverflow.com/questions/4009756/how-to-count-string-occurrence-in-string/7924240#7924240
*/
function occurrences(string, subString, allowOverlapping) {
string += "";
subString += "";
if (subString.length <= 0) return (string.length + 1);
var n = 0,
pos = 0,
step = allowOverlapping ? 1 : subString.length;
while (true) {
pos = string.indexOf(subString, pos);
if (pos >= 0) {
++n;
pos += step;
} else break;
}
return n;
}
использование
occurrences("foofoofoo", "bar"); //0
occurrences("foofoofoo", "foo"); //3
occurrences("foofoofoo", "foofoo"); //1
allowOverlapping
occurrences("foofoofoo", "foofoo", true); //2
матчи:
foofoofoo
1 `----´
2 `----´
Единица Теста
Benchmark
СутьЯ сделал тестовый тест, и моя функция более 10 раз быстрее, чем функция regexp match, опубликованная gumbo. В моих тестах строка длиной 25 символов. с 2 появлениями символа "o". Я выполнено 1 000 000 раз в Safari.
сафари 5.1
Benchmark> Общее время выполнения: 5617 МС (regexp)
Benchmark> Общее время выполнения: 881 МС (моя функция 6.4 x быстрее)
Firefox 4
Benchmark> Общее время выполнения: 8547 МС (Rexexp)
Benchmark> Общее время выполнения: 634 МС (моя функция 13.5 x быстрее)
изменить: изменения, которые я сделал
кэшированная длина подстроки
добавлен тип-кастинг в строку.
добавлен необязательный параметр "allowOverlapping"
исправлен правильный вывод для пустого случая подстроки"".
вы можете попробовать это:
var theString = "This is a string.";
console.log(theString.split("is").length - 1);
мое решение:
var temp = "This is a string.";
function countOcurrences(str, value) {
var regExp = new RegExp(value, "gi");
return (str.match(regExp) || []).length;
}
console.log(countOcurrences(temp, 'is'));
можно использовать match
определить такую функцию:
String.prototype.count = function(search) {
var m = this.match(new RegExp(search.toString().replace(/(?=[.\+*?[^\]$(){}\|])/g, "\"), "g"));
return m ? m.length:0;
}
вот самая быстрая функция!
почему это быстрее?
- не проверяет char на char (за исключением 1)
- использует некоторое время и увеличивает 1 var (количество символов var) против цикла для проверки длины и увеличения 2 var (обычно var i и var с количеством символов)
- использует путь меньше vars
- не использовать regex!
- использует (надеюсь) высоко оптимизированную функцию
-
все операции объединены так, как они могут быть, избегая замедления из-за нескольких операций
String.prototype.timesCharExist=function(c){var t=0,l=0,c=(c+'')[0];while(l=this.indexOf(c,l)+1)++t;return t};
вот более медленная и более читаемая версия:
String.prototype.timesCharExist = function ( chr ) {
var total = 0, last_location = 0, single_char = ( chr + '' )[0];
while( last_location = this.indexOf( single_char, last_location ) + 1 )
{
total = total + 1;
}
return total;
};
этот медленнее из-за счет счетчика, длинных имен var и неправильного использования 1 var.
чтобы использовать его, вы просто сделать это:
'The char "a" only shows up twice'.timesCharExist('a');
Edit: (2013/12/16)
Не используйте с Opera 12.16 или старше! потребуется почти в 2,5 раза больше, чем регулярное выражение решение!
в chrome это решение займет от 14 мс до 20 мс для 1 000 000 символов.
решение regex занимает 11-14ms за ту же сумму.
использование функции (вне String.prototype
) займет около 10-13ms.
вот код:
String.prototype.timesCharExist=function(c){var t=0,l=0,c=(c+'')[0];while(l=this.indexOf(c,l)+1)++t;return t};
var x=Array(100001).join('1234567890');
console.time('proto');x.timesCharExist('1');console.timeEnd('proto');
console.time('regex');x.match(/1/g).length;console.timeEnd('regex');
var timesCharExist=function(x,c){var t=0,l=0,c=(c+'')[0];while(l=x.indexOf(c,l)+1)++t;return t;};
console.time('func');timesCharExist(x,'1');console.timeEnd('func');
результат всех решений должен быть 100,000!
Примечание: Если вы хотите, чтобы эта функция насчитывала более 1 символа, измените где c=(c+'')[0]
в c=c+''
версия без регулярных выражений:
var string = 'This is a string',
searchFor = 'is',
count = 0,
pos = string.indexOf(searchFor);
while (pos > -1) {
++count;
pos = string.indexOf(searchFor, ++pos);
}
console.log(count); // 2
просто код-гольф Ребекка Чернофф ' s решение : -)
alert(("This is a string.".match(/is/g) || []).length);
Я думаю, что цель regex сильно отличается от indexOf
.
indexOf
просто найдите возникновение определенной строки, а в регулярном выражении вы можете использовать подстановочные знаки, такие как [A-Z]
что означает, что он будет найти любой заглавный символ в слове без указания фактического характера.
пример:
var index = "This is a string".indexOf("is");
console.log(index);
var length = "This is a string".match(/[a-z]/g).length;
// where [a-z] is a regex wildcard expression thats why its slower
console.log(length);
String.prototype.Count = function (find) {
return this.split(find).length - 1;
}
"This is a string.".Count("is");
это вернет 2.
супер пупер старый, но мне нужно было сделать что-то подобное сегодня и только думал проверить это позже. Работает довольно быстро для меня.
String.prototype.count = function(substr,start,overlap) {
overlap = overlap || false;
start = start || 0;
var count = 0,
offset = overlap ? 1 : substr.length;
while((start = this.indexOf(substr, start) + offset) !== (offset - 1))
++count;
return count;
};
var myString = "This is a string.";
var foundAtPosition = 0;
var Count = 0;
while (foundAtPosition != -1)
{
foundAtPosition = myString.indexOf("is",foundAtPosition);
if (foundAtPosition != -1)
{
Count++;
foundAtPosition++;
}
}
document.write("There are " + Count + " occurrences of the word IS");
обозначения :- count подстрока появляется в строке для пошагового объяснения.
построение на @Vittim.ответ США выше. Мне нравится контроль, который дает мне его метод, что облегчает его расширение, но мне нужно было добавить нечувствительность к регистру и ограничить совпадения целыми словами с поддержкой пунктуации. (например, " ванна "находится в" принять ванну."но не "купание")
регулярное выражение пунктуации пришло из: https://stackoverflow.com/a/25575009/497745 (как я могу удалить всю пунктуацию из строки в JavaScript, используя регулярное выражение?)
function keywordOccurrences(string, subString, allowOverlapping, caseInsensitive, wholeWord)
{
string += "";
subString += "";
if (subString.length <= 0) return (string.length + 1); //deal with empty strings
if(caseInsensitive)
{
string = string.toLowerCase();
subString = subString.toLowerCase();
}
var n = 0,
pos = 0,
step = allowOverlapping ? 1 : subString.length,
stringLength = string.length,
subStringLength = subString.length;
while (true)
{
pos = string.indexOf(subString, pos);
if (pos >= 0)
{
var matchPos = pos;
pos += step; //slide forward the position pointer no matter what
if(wholeWord) //only whole word matches are desired
{
if(matchPos > 0) //if the string is not at the very beginning we need to check if the previous character is whitespace
{
if(!/[\s\u2000-\u206F\u2E00-\u2E7F\'!"#$%&\(\)*+,\-.\/:;<=>?@\[\]^_`{|}~]/.test(string[matchPos - 1])) //ignore punctuation
{
continue; //then this is not a match
}
}
var matchEnd = matchPos + subStringLength;
if(matchEnd < stringLength - 1)
{
if (!/[\s\u2000-\u206F\u2E00-\u2E7F\'!"#$%&\(\)*+,\-.\/:;<=>?@\[\]^_`{|}~]/.test(string[matchEnd])) //ignore punctuation
{
continue; //then this is not a match
}
}
}
++n;
} else break;
}
return n;
}
пожалуйста, не стесняйтесь изменять и рефакторинг этот ответ, если вы заметили ошибки или улучшения.
для тех, кто найдет этот поток в будущем, обратите внимание, что принятый ответ не всегда вернет правильное значение, если вы его обобщите, так как он будет подавляться операторами регулярных выражений, такими как $
и .
. Вот лучшая версия, которая может справиться любой игла:
function occurrences (haystack, needle) {
var _needle = needle
.replace(/\[/g, '\[')
.replace(/\]/g, '\]')
return (
haystack.match(new RegExp('[' + _needle + ']', 'g')) || []
).length
}
function get_occurrence(varS,string){//Find All Occurrences
c=(string.split(varS).length - 1);
return c;
}
temp="This is a string.";
console.log("Total Occurrence is "+get_occurrence("is",temp));
используйте get_occurrence (varS,string), чтобы найти вхождение как символов, так и строки в строке.
попробуй
<?php
$str = "33,33,56,89,56,56";
echo substr_count($str, '56');
?>
<script type="text/javascript">
var temp = "33,33,56,89,56,56";
var count = temp.match(/56/g);
alert(count.length);
</script>
простая версия без regex:
var temp = "This is a string.";
var count = (temp.split('is').length - 1);
alert(count);
теперь это очень старый поток, с которым я столкнулся, но так как многие толкнули свой ответ, вот мой в надежде помочь кому-то с этим простым кодом.
var search_value = "This is a dummy sentence!";
var letter = 'a'; /*Can take any letter, have put in a var if anyone wants to use this variable dynamically*/
letter = letter[letter.length - 1];
var count;
for (var i = count = 0; i < search_value.length; count += (search_value[i++] == letter));
console.log(count);
Я не уверен, что это самое быстрое решение, но я предпочел его для простоты и не использовать regex (мне просто не нравится их использовать!)
ответ для Леандро Батиста : просто проблема с выражением regex.
"use strict";
var dataFromDB = "testal";
$('input[name="tbInput"]').on("change",function(){
var charToTest = $(this).val();
var howManyChars = charToTest.length;
var nrMatches = 0;
if(howManyChars !== 0){
charToTest = charToTest.charAt(0);
var regexp = new RegExp(charToTest,'gi');
var arrMatches = dataFromDB.match(regexp);
nrMatches = arrMatches ? arrMatches.length : 0;
}
$('#result').html(nrMatches.toString());
});
<script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js"></script>
<div class="main">
What do you wanna count <input type="text" name="tbInput" value=""><br />
Number of occurences = <span id="result">0</span>
</div>
var countInstances = function(body, target) {
var globalcounter = 0;
var concatstring = '';
for(var i=0,j=target.length;i<body.length;i++){
concatstring = body.substring(i-1,j);
if(concatstring === target){
globalcounter += 1;
concatstring = '';
}
}
return globalcounter;
};
console.log( countInstances('abcabc', 'abc') ); // ==> 2
console.log( countInstances('ababa', 'aba') ); // ==> 2
console.log( countInstances('aaabbb', 'ab') ); // ==> 1
var s = "1";replaced word
var a = "HRA"; //have to replace
var str = document.getElementById("test").innerHTML;
var count = str.split(a).length - 1;
for (var i = 0; i < count; i++) {
var s = "1";
var a = "HRA";
var str = document.getElementById("test").innerHTML;
var res = str.replace(a, s);
document.getElementById("test").innerHTML = res;
}
<input " type="button" id="Btn_Validate" value="Validate" class="btn btn-info" />
<div class="textarea" id="test" contenteditable="true">HRABHRA</div>
немного поздно, но, предполагая, что у нас есть следующая строка:
var temp = "This is a string.";
Сначала мы разделимся на все, что вы ищете, чтобы соответствовать, это вернет массив строк.
var array = temp.split("is");
затем мы получаем его длину и вычитаем 1 к нему, так как split по умолчанию имеет массив размера 1 и, следовательно, увеличивает его размер каждый раз, когда он находит вхождение.
var occurrenceCount = array.length - 1;
alert(occurrenceCount); //should output '2'
вы также можете сделать все это в одну строку следующим образом:
alert("This is a string.".split("is").length - 1); //should output '2'
надеюсь, это поможет : D
попробуйте это:
function countString(str, search){
var count=0;
var index=str.indexOf(search);
while(index!=-1){
count++;
index=str.indexOf(search,index+1);
}
return count;
}