Regex для извлечения домена и видео id из youtube / Vimeo url
я копирую функцию, которая будет принимать url youtube/vimeo и возвращать, с какого сайта пришло видео (vimeo/yt), а также идентификатор видео.
вот что у меня пока есть: http://jsfiddle.net/csjwf/181/
<strong>Result:</strong>
<div id="result"></div>
function parseVideoURL(url) {
url.match(/^http://(?:.*?).?(youtube|vimeo).com/(watch?[^#]*v=(w+)|(d+)).+$/);
return {
provider : RegExp.,
id : RegExp. == 'vimeo' ? RegExp. : RegExp.
}
}
var result = document.getElementById("result");
var video = parseVideoURL("http://www.youtube.com/watch?v=PQLnmdOthmA&feature=feedrec_grec_index");
result.innerHTML = "Provider: " + video.provider + "<br>ID: " + video.id;
var video = parseVideoURL("http://vimeo.com/22080133");
result.innerHTML += "<br>--<br>Provider: " + video.provider + "<br>ID: " + video.id;
выход:
Result: Provider: youtube ID: PQLnmdOthmA -- Provider: vimeo ID: 2208013
однако обратите внимание, как для Vimeo vids, если url заканчивается идентификатором, последнее число всегда отрезается. Если вы добавите косую черту в конец url-адреса vimeo, идентификатор будет полностью извлечен.
6 ответов
на .+$
В конце требует по крайней мере один символ после последней цифры, записанные в виде строки цифр. Это отрубит одну цифру от того, что будет захвачено. Есть ли причина, по которой у вас это есть?
вы можете изменить последние +
до *
такой:
/^http:\/\/(?:.*?)\.?(youtube|vimeo)\.com\/(watch\?[^#]*v=(\w+)|(\d+)).*$/
или даже лучше, избавиться от конечной части полностью, так как это не похоже на то, что это необходимо:
/^http:\/\/(?:.*?)\.?(youtube|vimeo)\.com\/(watch\?[^#]*v=(\w+)|(\d+))/
вот немного более безопасный способ написать свою функцию, которая позволяет любой порядок параметров запроса в URL youtube и не помещает материал в регулярное выражение, которое не должно быть там. Код длиннее, но он намного надежнее и будет намного проще добавить больше поставщиков:
function parseVideoURL(url) {
function getParm(url, base) {
var re = new RegExp("(\?|&)" + base + "\=([^&]*)(&|$)");
var matches = url.match(re);
if (matches) {
return(matches[2]);
} else {
return("");
}
}
var retVal = {};
var matches;
if (url.indexOf("youtube.com/watch") != -1) {
retVal.provider = "youtube";
retVal.id = getParm(url, "v");
} else if (matches = url.match(/vimeo.com\/(\d+)/)) {
retVal.provider = "vimeo";
retVal.id = matches[1];
}
return(retVal);
}
рабочая версия здесь:http://jsfiddle.net/jfriend00/N2hPj/
вот обновленная версия, которая также работает с youtu.быть и youtube.com/embed URL-адреса, использующие код @jfriend00 и некоторый код, найденный здесь:регулярное выражение JavaScript: как получить идентификатор Видео YouTube из URL-адреса?.
EDIT: обновлен мой ответ (и скрипка) с функцией, которая на самом деле работает. : -)
function parseVideoURL(url) {
function getParm(url, base) {
var re = new RegExp("(\?|&)" + base + "\=([^&]*)(&|$)");
var matches = url.match(re);
if (matches) {
return(matches[2]);
} else {
return("");
}
}
var retVal = {};
var matches;
var success = false;
if ( url.match('http(s)?://(www.)?youtube|youtu\.be') ) {
if (url.match('embed')) { retVal.id = url.split(/embed\//)[1].split('"')[0]; }
else { retVal.id = url.split(/v\/|v=|youtu\.be\//)[1].split(/[?&]/)[0]; }
retVal.provider = "youtube";
var videoUrl = 'https://www.youtube.com/embed/' + retVal.id + '?rel=0';
success = true;
} else if (matches = url.match(/vimeo.com\/(\d+)/)) {
retVal.provider = "vimeo";
retVal.id = matches[1];
var videoUrl = 'http://player.vimeo.com/video/' + retVal.id;
success = true;
}
if (success) {
return retVal;
}
else { alert("No valid media id detected"); }
}
и рабочий jsfiddle:http://jsfiddle.net/9n8Nn/3/
из двух ответов stackexchange это это код, который работал лучше для меня.
чтобы упростить ваше регулярное выражение, я бы использовал стог сена.indexOf (игла), чтобы определить, является ли url-адрес vimeo или youtube, а затем применить регулярное выражение для конкретного сайта. Гораздо проще, и позже вы можете добавлять видео сайты, не слишком усложняя регулярное выражение.
последнее число отключается, потому что вы используете ".+ "в конце, что означает "один или несколько символов". Заменить + на *, что означает "ноль или более".
удалить последние . и конец соответствия
url.match(/^http:\/\/(?:.*?)\.?(youtube|vimeo)\.com\/(watch\?[^#]*v=(\w+)|(\d+))/);