Regex для извлечения домена и видео id из youtube / Vimeo url

я копирую функцию, которая будет принимать url youtube/vimeo и возвращать, с какого сайта пришло видео (vimeo/yt), а также идентификатор видео.

вот что у меня пока есть: http://jsfiddle.net/csjwf/181/

<strong>Result:</strong>
<div id="result"></div>
function parseVideoURL(url) {

    url.match(/^http://(?:.*?).?(youtube|vimeo).com/(watch?[^#]*v=(w+)|(d+)).+$/);
    return {
        provider : RegExp.,
        id : RegExp. == 'vimeo' ? RegExp. : RegExp.
    }
}

var result = document.getElementById("result");
var video = parseVideoURL("http://www.youtube.com/watch?v=PQLnmdOthmA&feature=feedrec_grec_index");
result.innerHTML = "Provider: " + video.provider + "<br>ID: " + video.id;

var video = parseVideoURL("http://vimeo.com/22080133");

result.innerHTML += "<br>--<br>Provider: " + video.provider + "<br>ID: " + video.id;

выход:

Result:
Provider: youtube
ID: PQLnmdOthmA
--
Provider: vimeo
ID: 2208013

однако обратите внимание, как для Vimeo vids, если url заканчивается идентификатором, последнее число всегда отрезается. Если вы добавите косую черту в конец url-адреса vimeo, идентификатор будет полностью извлечен.

6 ответов


на .+$ В конце требует по крайней мере один символ после последней цифры, записанные в виде строки цифр. Это отрубит одну цифру от того, что будет захвачено. Есть ли причина, по которой у вас это есть?

вы можете изменить последние + до * такой:

/^http:\/\/(?:.*?)\.?(youtube|vimeo)\.com\/(watch\?[^#]*v=(\w+)|(\d+)).*$/

или даже лучше, избавиться от конечной части полностью, так как это не похоже на то, что это необходимо:

/^http:\/\/(?:.*?)\.?(youtube|vimeo)\.com\/(watch\?[^#]*v=(\w+)|(\d+))/

вот немного более безопасный способ написать свою функцию, которая позволяет любой порядок параметров запроса в URL youtube и не помещает материал в регулярное выражение, которое не должно быть там. Код длиннее, но он намного надежнее и будет намного проще добавить больше поставщиков:

function parseVideoURL(url) {

    function getParm(url, base) {
        var re = new RegExp("(\?|&)" + base + "\=([^&]*)(&|$)");
        var matches = url.match(re);
        if (matches) {
            return(matches[2]);
        } else {
            return("");
        }
    }

    var retVal = {};
    var matches;

    if (url.indexOf("youtube.com/watch") != -1) {
        retVal.provider = "youtube";
        retVal.id = getParm(url, "v");
    } else if (matches = url.match(/vimeo.com\/(\d+)/)) {
        retVal.provider = "vimeo";
        retVal.id = matches[1];
    }
    return(retVal);
}

рабочая версия здесь:http://jsfiddle.net/jfriend00/N2hPj/


вот обновленная версия, которая также работает с youtu.быть и youtube.com/embed URL-адреса, использующие код @jfriend00 и некоторый код, найденный здесь:регулярное выражение JavaScript: как получить идентификатор Видео YouTube из URL-адреса?.

EDIT: обновлен мой ответ (и скрипка) с функцией, которая на самом деле работает. : -)

function parseVideoURL(url) {

    function getParm(url, base) {
            var re = new RegExp("(\?|&)" + base + "\=([^&]*)(&|$)");
            var matches = url.match(re);
            if (matches) {
                return(matches[2]);
            } else {
                return("");
            }
        }

        var retVal = {};
        var matches;
        var success = false;

        if ( url.match('http(s)?://(www.)?youtube|youtu\.be') ) {
          if (url.match('embed')) { retVal.id = url.split(/embed\//)[1].split('"')[0]; }
            else { retVal.id = url.split(/v\/|v=|youtu\.be\//)[1].split(/[?&]/)[0]; }
            retVal.provider = "youtube";
            var videoUrl = 'https://www.youtube.com/embed/' + retVal.id + '?rel=0';
            success = true;
        } else if (matches = url.match(/vimeo.com\/(\d+)/)) {
            retVal.provider = "vimeo";
            retVal.id = matches[1];
            var videoUrl = 'http://player.vimeo.com/video/' + retVal.id;
            success = true;
        }

      if (success) {
        return retVal;
      }
      else { alert("No valid media id detected"); }
}

и рабочий jsfiddle:http://jsfiddle.net/9n8Nn/3/

из двух ответов stackexchange это это код, который работал лучше для меня.


чтобы упростить ваше регулярное выражение, я бы использовал стог сена.indexOf (игла), чтобы определить, является ли url-адрес vimeo или youtube, а затем применить регулярное выражение для конкретного сайта. Гораздо проще, и позже вы можете добавлять видео сайты, не слишком усложняя регулярное выражение.


последнее число отключается, потому что вы используете ".+ "в конце, что означает "один или несколько символов". Заменить + на *, что означает "ноль или более".


url.match(/^http:\/\/(?:.*?)\.?(youtube|vimeo)\.com\/(watch\?[^#]*v=(\w+).+|(\d+))$/);


удалить последние . и конец соответствия

url.match(/^http:\/\/(?:.*?)\.?(youtube|vimeo)\.com\/(watch\?[^#]*v=(\w+)|(\d+))/);