JSDOM в nodeJS: как вернуть управляемый html?

Я пытаюсь управлять удаленным HTML и возвращать его управляемым. Я решил использовать JSDOM, но не могу понять, как вернуть управляемый HTML. Есть идеи?

  jsdom.env({
        url: "http://www.cnn.com",
        scripts: ["http://code.jquery.com/jquery.js"],
        done: function (err, window) {
            var $ = window.$;
            console.log("HN Links");
            var src = $(".ghciTopStoryImage1 img").attr('src','http://lorempixel.com/396/220/');
            var headline = $(".blkbigheader span").html('header');
            var description = $(".blkbigheader").parent().find("p a:eq(0)").html('text');

           // not working....
            content =$(window.document).html();

        }
    });

2 ответов


из jsdom readme:

var jsdom = require("jsdom").jsdom;
var serializeDocument = require("jsdom").serializeDocument;

var doc = jsdom("<!DOCTYPE html>hello");

serializeDocument(doc) === "<!DOCTYPE html><html><head></head><body>hello</body></html>";
doc.documentElement.outerHTML === "<html><head></head><body>hello</body></html>";

адаптация вашего примера выше будет тогда просто content = serializeDocument(window.document).


иногда jQuery не ответ!--2-->

content = window.document.documentElement.outerHTML;