Python « Аналог preg replace в питоне

Всем привет! Есть у меня на PHP вот такое выражение:
/** * GeSHi (C) 2004 - 2007 Nigel McNie, 2007 - 2008 Benny Baumann * (http://qbnz.com/highlighter/ and http://geshi.org/) */ .php.geshi_code {font-family:monospace;} .php.geshi_code .imp {font-weight: bold; color: red;} .php.geshi_code .kw1 {color: #b1b100;} .php.geshi_code .kw2 {color: #000000; font-weight: bold;} .php.geshi_code .kw3 {color: #990000;} .php.geshi_code .co1 {color: #666666; font-style: italic;} .php.geshi_code .co2 {color: #666666; font-style: italic;} .php.geshi_code .co3 {color: #0000cc; font-style: italic;} .php.geshi_code .co4 {color: #009933; font-style: italic;} .php.geshi_code .coMULTI {color: #666666; font-style: italic;} .php.geshi_code .es0 {color: #000099; font-weight: bold;} .php.geshi_code .es1 {color: #000099; font-weight: bold;} .php.geshi_code .es2 {color: #660099; font-weight: bold;} .php.geshi_code .es3 {color: #660099; font-weight: bold;} .php.geshi_code .es4 {color: #006699; font-weight: bold;} .php.geshi_code .es5 {color: #006699; font-weight: bold; font-style: italic;} .php.geshi_code .es6 {color: #009933; font-weight: bold;} .php.geshi_code .es_h {color: #000099; font-weight: bold;} .php.geshi_code .br0 {color: #009900;} .php.geshi_code .sy0 {color: #339933;} .php.geshi_code .sy1 {color: #000000; font-weight: bold;} .php.geshi_code .st0 {color: #0000ff;} .php.geshi_code .st_h {color: #0000ff;} .php.geshi_code .nu0 {color: #cc66cc;} .php.geshi_code .nu8 {color: #208080;} .php.geshi_code .nu12 {color: #208080;} .php.geshi_code .nu19 {color:#800080;} .php.geshi_code .me1 {color: #004000;} .php.geshi_code .me2 {color: #004000;} .php.geshi_code .re0 {color: #000088;} .php.geshi_code span.xtra { display:block; }

$search = array("'<(script|noscript|style|noindex)[^>]*?>.*?</(script|noscript|style|noindex)>'si",
        "'<!--.*?-->'si",
        "'<[/!]*?[^<>]*?>'si",
        "'([rn])[s]+'",
        "'&(quot|#34);'i",
        "'&(amp|#38);'i",
        "'&(lt|#60);'i",
        "'&(gt|#62);'i",
        "'&(nbsp|#160);'i",
        "'&(iexcl|#161);'i",
        "'&(cent|#162);'i",
        "'&(pound|#163);'i",
        "'&(copy|#169);'i",
        "'&(times|#215);'i",
        "'&#(d+);'e");

    $replace = array ("",
      "",
      " ",
        "1 ",
        """,
        "&",
        "<",
        ">",
        " ",
        chr(161),
        chr(162),
        chr(163),
        chr(169),
        "X",
        "chr(1)");

$text = preg_replace($search, $replace, $this->pageHtml);
 

Вот как бы его провернуть на питоне? re.sub, насколько я знаю, поволяет использовать только один паттерн для замены, а мне нужно по нескольким заменить. Как в итоге, быть?

1 ответов


Использовать непосредственно цикл.



for i, r in enumerate(regex_list):
    text = re.sub(r, repl_list(i), text, re.I)
 

Где, repl_list - список для замены, а regex_list - соответствено регулярки.
Впрочем, если нужно использовать иные флаги, то можно использовать другой форматы вводных данных (типа кортежа кортежей)


import re
text = '<html><script>//dfgdsfg</script><!--gdgdsfgdsfgdsfgsdf--></html>'
replaced_data = (
    ('', r'<(script|noscript|style|noindex)[^>]*?>.*?</(script|noscript|style|noindex)>', re.I),
    (' ', r'<\!--.*?-->', re.I),
    ('\" ', r'([\r\n])[\s]+', 0),
)

for (r, p, f) in replaced_data:
    text = re.sub(p, r, text, flags=f)
 

P.S. остается корректировать под нужды