удаление определенных атрибутов из тегов HTML

Как удалить определенные атрибуты, такие как id, style, class и т. д. из HTML-кода?

Я думал, что смогу использовать библиотека lxml.формат html.чистый модуль, но, как оказалось, я могу удалить атрибуты стиля только с Clean(style=True).clean_html(code). Я бы предпочел не использовать регулярные выражения для этой задачи (атрибуты могут измениться).

что я хотел бы иметь:

from lxml.html.clean import Cleaner

code = '<tr id="ctl00_Content_AdManagementPreview_DetailView_divNova" class="Extended" style="display: none;">'

cleaner = Cleaner(style=True, id=True, class=True)
cleaned = cleaner.clean_html(code)

print cleaned
'<tr>'

спасибо заранее!

1 ответов


cleaner.Cleaner.__call__ есть