Как разбить строку с несколькими разделителями в javascript?

Как разбить строку с несколькими разделителями в JavaScript? Я пытаюсь разделить как запятые, так и пробелы, но, AFAIK, функция разделения JS поддерживает только один разделитель.

16 ответов


передать регулярное выражение в качестве параметра:

js> "Hello awesome, world!".split(/[\s,]+/)
Hello,awesome,world!

редактировать, чтобы добавить:

вы можете получить последний элемент, выбрав длину массива минус 1:

>>> bits = "Hello awesome, world!".split(/[\s,]+/)
["Hello", "awesome", "world!"]
>>> bit = bits[bits.length - 1]
"world!"

... и если шаблон не соответствует:

>>> bits = "Hello awesome, world!".split(/foo/)
["Hello awesome, world!"]
>>> bits[bits.length - 1]
"Hello awesome, world!"

вы можете передать регулярное выражение в оператор разделения Javascript. Например:

"1,2 3".split(/,| /) 
["1", "2", "3"]

или, если вы хотите разрешить нескольким разделителям вместе действовать только как один:

"1, 2, , 3".split(/(?:,| )+/) 
["1", "2", "3"]

(вы должны использовать non-capturing (?:) parens, потому что в противном случае он возвращается в результат. Или вы можете быть умным, как Аарон, и использовать класс символов.)

(примеры протестированы в Safari + FF)


еще один простой, но эффективный метод-использовать split + join повторно.

"a=b,c:d".split('=').join(',').split(':').join(',').split(',')

по существу, выполнение разделения с последующим объединением похоже на глобальную замену, поэтому это заменяет каждый разделитель запятой, а затем, как только все будут заменены, он делает окончательное разделение на запятую

результат выше выражение:

['a', 'b', 'c', 'd']

расширение на этом вы также можете поместить его в функцию:

function splitMulti(str, tokens){
        var tempChar = tokens[0]; // We can use the first token as a temporary join character
        for(var i = 1; i < tokens.length; i++){
            str = str.split(tokens[i]).join(tempChar);
        }
        str = str.split(tempChar);
        return str;
}

использование:

splitMulti('a=b,c:d', ['=', ',', ':']) // ["a", "b", "c", "d"]

если вы используете эту функций много это может быть даже стоит рассмотреть упаковки String.prototype.split для удобства (я думаю, что моя функция довольно безопасна - единственное соображение-это дополнительные накладные расходы условных (минорных) и тот факт, что ему не хватает реализации предельного аргумента, если массив передается).

обязательно:splitMulti функция, если использовать этот подход к ниже, просто обертывает его :). Также стоит отметить, что некоторые люди хмурятся на расширение встроенных модулей (как и многие люди это неправильно и могут возникнуть конфликты) поэтому, если сомневаетесь, поговорите с кем-то более старшим перед использованием этого или спросите так:)

    var splitOrig = String.prototype.split; // Maintain a reference to inbuilt fn
    String.prototype.split = function (){
        if(arguments[0].length > 0){
            if(Object.prototype.toString.call(arguments[0]) == "[object Array]" ) { // Check if our separator is an array
                return splitMulti(this, arguments[0]);  // Call splitMulti
            }
        }
        return splitOrig.apply(this, arguments); // Call original split maintaining context
    };

использование:

var a = "a=b,c:d";
    a.split(['=', ',', ':']); // ["a", "b", "c", "d"]

// Test to check that the built-in split still works (although our wrapper wouldn't work if it didn't as it depends on it :P)
        a.split('='); // ["a", "b,c:d"] 

наслаждайтесь!


давайте держать его простым: (добавить "[ ]+" в регулярное выражение означает "1 или больше")

это означает, что " + "и" {1,} " одинаковы.

var words = text.split(/[ .:;?!~,`"&|()<>{}\[\]\r\n/\]+/); // note ' and - are kept

хитрый способ:

var s = "dasdnk asd, (naks) :d skldma";
var a = s.replace('(',' ').replace(')',' ').replace(',',' ').split(' ');
console.log(a);//["dasdnk", "asd", "naks", ":d", "skldma"]

для тех из вас, кто хочет больше настройки в своей функции разделения, я написал рекурсивный алгоритм, который разбивает заданную строку со списком символов для разделения. Я написал это, прежде чем увидел вышеуказанный пост. Надеюсь, это поможет некоторым разочарованным программистам.

splitString = function(string, splitters) {
    var list = [string];
    for(var i=0, len=splitters.length; i<len; i++) {
        traverseList(list, splitters[i], 0);
    }
    return flatten(list);
}

traverseList = function(list, splitter, index) {
    if(list[index]) {
        if((list.constructor !== String) && (list[index].constructor === String))
            (list[index] != list[index].split(splitter)) ? list[index] = list[index].split(splitter) : null;
        (list[index].constructor === Array) ? traverseList(list[index], splitter, 0) : null;
        (list.constructor === Array) ? traverseList(list, splitter, index+1) : null;    
    }
}

flatten = function(arr) {
    return arr.reduce(function(acc, val) {
        return acc.concat(val.constructor === Array ? flatten(val) : val);
    },[]);
}

var stringToSplit = "people and_other/things";
var splitList = [" ", "_", "/"];
splitString(stringToSplit, splitList);

выше пример возвращает: ["people", "and", "other", "things"]

Примечание: flatten функция была взята из Розетта Код


вы можете просто сгруппировать все символы, которые вы хотите использовать в качестве разделителей, либо сингулярно, либо коллективно в регулярное выражение и передать их функции split. Например, вы можете написать:

console.log( "dasdnk asd, (naks) :d skldma".split(/[ \(,\)]+/) );

и выход будет:

["dasdnk", "asd", "naks", ":d", "skldma"]

Возможно, вам следует сделать какую-то замену строки, чтобы превратить один разделитель в другой разделитель, чтобы у вас был только один разделитель для разбиения.


Привет, например, если у вас есть разделение и замена в строке 07:05: 45PM

var hour = time.replace("PM", "").split(":");

результат

[ '07', '05', '45' ]

начиная с решения @stephen-sweriduk (это было тем интереснее для меня!), Я немного изменил его, чтобы сделать более общим и многоразовым:

/**
 * Adapted from: http://stackoverflow.com/questions/650022/how-do-i-split-a-string-with-multiple-separators-in-javascript
*/
var StringUtils = {

  /**
   * Flatten a list of strings
   * http://rosettacode.org/wiki/Flatten_a_list
   */
  flatten : function(arr) {
    var self=this;
    return arr.reduce(function(acc, val) {
        return acc.concat(val.constructor === Array ? self.flatten(val) : val);
    },[]);
  },

  /**
   * Recursively Traverse a list and apply a function to each item
   * @param list array
   * @param expression Expression to use in func
   * @param func function of (item,expression) to apply expression to item
   *
   */
  traverseListFunc : function(list, expression, index, func) {
    var self=this;
    if(list[index]) {
        if((list.constructor !== String) && (list[index].constructor === String))
            (list[index] != func(list[index], expression)) ? list[index] = func(list[index], expression) : null;
        (list[index].constructor === Array) ? self.traverseListFunc(list[index], expression, 0, func) : null;
        (list.constructor === Array) ? self.traverseListFunc(list, expression, index+1, func) : null;
    }
  },

  /**
   * Recursively map function to string
   * @param string
   * @param expression Expression to apply to func
   * @param function of (item, expressions[i])
   */
  mapFuncToString : function(string, expressions, func) {
    var self=this;
    var list = [string];
    for(var i=0, len=expressions.length; i<len; i++) {
        self.traverseListFunc(list, expressions[i], 0, func);
    }
    return self.flatten(list);
  },

  /**
   * Split a string
   * @param splitters Array of characters to apply the split
   */
  splitString : function(string, splitters) {
    return this.mapFuncToString(string, splitters, function(item, expression) {
      return item.split(expression);
    })
  },

}

а то

var stringToSplit = "people and_other/things";
var splitList = [" ", "_", "/"];
var splittedString=StringUtils.splitString(stringToSplit, splitList);
console.log(splitList, stringToSplit, splittedString);

Это возвращает как оригинал:

[ ' ', '_', '/' ] 'people and_other/things' [ 'people', 'and', 'other', 'things' ]

простой способ сделать это, чтобы обработать каждый символ строки с каждым разделителем и построить массив на шпагат:

splix = function ()
{
  u = [].slice.call(arguments); v = u.slice(1); u = u[0]; w = [u]; x = 0;

  for (i = 0; i < u.length; ++i)
  {
    for (j = 0; j < v.length; ++j)
    {
      if (u.slice(i, i + v[j].length) == v[j])
      {
        y = w[x].split(v[j]); w[x] = y[0]; w[++x] = y[1];
      };
    };
  };

  return w;
};

console.logg = function ()
{
  document.body.innerHTML += "<br>" + [].slice.call(arguments).join();
}

splix = function() {
  u = [].slice.call(arguments);
  v = u.slice(1);
  u = u[0];
  w = [u];
  x = 0;
  console.logg("Processing: <code>" + JSON.stringify(w) + "</code>");

  for (i = 0; i < u.length; ++i) {
    for (j = 0; j < v.length; ++j) {
      console.logg("Processing: <code>[\x22" + u.slice(i, i + v[j].length) + "\x22, \x22" + v[j] + "\x22]</code>");
      if (u.slice(i, i + v[j].length) == v[j]) {
        y = w[x].split(v[j]);
        w[x] = y[0];
        w[++x] = y[1];
        console.logg("Currently processed: " + JSON.stringify(w) + "\n");
      };
    };
  };

  console.logg("Return: <code>" + JSON.stringify(w) + "</code>");
};

setTimeout(function() {
  console.clear();
  splix("1.23--4", ".", "--");
}, 250);
@import url("http://fonts.googleapis.com/css?family=Roboto");

body {font: 20px Roboto;}

использование: splix(string, delimiters...)

пример: splix("1.23--4", ".", "--")

возвращает: ["1", "23", "4"]


Я считаю, что одна из основных причин, по которой мне это нужно, - разделить пути к файлам на обоих / и \. Это немного хитрое регулярное выражение, поэтому я опубликую его здесь для справки:

var splitFilePath = filePath.split(/[\/\]/);

Я думаю, что проще, если вы укажете, что вы хотите оставить, а не то, что вы хотите удалить.

а если вы хотите иметь только английские слова, вы можете использовать что-то вроде этого:

text.match(/[a-z'\-]+/gi);

примеры (запустить фрагмент):

var R=[/[a-z'\-]+/gi,/[a-z'\-\s]+/gi];
var s=document.getElementById('s');
for(var i=0;i<R.length;i++)
 {
  var o=document.createElement('option');
  o.innerText=R[i]+'';
  o.value=i;
  s.appendChild(o);
 }
var t=document.getElementById('t');
var r=document.getElementById('r');

s.onchange=function()
 {
  r.innerHTML='';
  var x=s.value;
  if((x>=0)&&(x<R.length))
   x=t.value.match(R[x]);
  for(i=0;i<x.length;i++)
   {
    var li=document.createElement('li');
    li.innerText=x[i];
    r.appendChild(li);
   }
 }
<textarea id="t" style="width:70%;height:12em">even, test; spider-man

But saying o'er what I have said before:
My child is yet a stranger in the world;
She hath not seen the change of fourteen years,
Let two more summers wither in their pride,
Ere we may think her ripe to be a bride.

—Shakespeare, William. The Tragedy of Romeo and Juliet</textarea>

<p><select id="s">
 <option selected>Select a regular expression</option>
 <!-- option value="1">/[a-z'\-]+/gi</option>
 <option value="2">/[a-z'\-\s]+/gi</option -->
</select></p>
 <ol id="r" style="display:block;width:auto;border:1px inner;overflow:scroll;height:8em;max-height:10em;"></ol>
</div>

Я не знаю производительности RegEx, но вот еще одна альтернатива для RegEx использует собственный HashSet и работает в O (max (str.длина, разделитель.длина)) сложность вместо:

var multiSplit = function(str,delimiter){
    if (!(delimiter instanceof Array))
        return str.split(delimiter);
    if (!delimiter || delimiter.length == 0)
        return [str];
    var hashSet = new Set(delimiter);
    if (hashSet.has(""))
        return str.split("");
    var lastIndex = 0;
    var result = [];
    for(var i = 0;i<str.length;i++){
        if (hashSet.has(str[i])){
            result.push(str.substring(lastIndex,i));
            lastIndex = i+1;
        }
    }
    result.push(str.substring(lastIndex));
    return result;
}

multiSplit('1,2,3.4.5.6 7 8 9',[',','.',' ']);
// Output: ["1", "2", "3", "4", "5", "6", "7", "8", "9"]

multiSplit('1,2,3.4.5.6 7 8 9',' ');
// Output: ["1,2,3.4.5.6", "7", "8", "9"]

не лучший способ, но работает, чтобы разделить с несколькими и различными разделителями / разделителями

HTML-код

<button onclick="myFunction()">Split with Multiple and Different seperators/delimiters</button>
<p id="demo"></p>

в JavaScript

<script>
function myFunction() {

var str = "How : are | you doing : today?";
var res = str.split(' | ');

var str2 = '';
var i;
for (i = 0; i < res.length; i++) { 
    str2 += res[i];

    if (i != res.length-1) {
      str2 += ",";
    }
}
var res2 = str2.split(' : ');

//you can add countless options (with or without space)

document.getElementById("demo").innerHTML = res2;
</script>

Я использую regexp:

str =  'Write a program that extracts from a given text all palindromes, e.g. "ABBA", "lamal", "exe".';

var strNew = str.match(/\w+/g);

// Output: ["Write", "a", "program", "that", "extracts", "from", "a", "given", "text", "all", "palindromes", "e", "g", "ABBA", "lamal", "exe"]