Как написать trycatch в R

Я хочу писать trycatch код для борьбы с ошибкой при загрузке из интернета.

url <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz")
y <- mapply(readLines, con=url)

эти два оператора выполняются успешно. Ниже я создаю несуществующий веб-адрес:

url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz")

url[1] не существует. Как написать trycatch цикл (функция) так что:

  1. когда URL неправильный, вывод будет: "веб-URL неправильный, не может получить".
  2. когда URL неправильный, код не останавливается, но продолжает загрузить до конца списка URL-адресов?

4 ответов


Ну тогда: добро пожаловать в мир R; -)

держи

настройка код

urls <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz",
    "xxxxx"
)
readUrl <- function(url) {
    out <- tryCatch(
        {
            # Just to highlight: if you want to use more than one 
            # R expression in the "try" part then you'll have to 
            # use curly brackets.
            # 'tryCatch()' will return the last evaluated expression 
            # in case the "try" part was completed successfully

            message("This is the 'try' part")

            readLines(con=url, warn=FALSE) 
            # The return value of `readLines()` is the actual value 
            # that will be returned in case there is no condition 
            # (e.g. warning or error). 
            # You don't need to state the return value via `return()` as code 
            # in the "try" part is not wrapped insided a function (unlike that
            # for the condition handlers for warnings and error below)
        },
        error=function(cond) {
            message(paste("URL does not seem to exist:", url))
            message("Here's the original error message:")
            message(cond)
            # Choose a return value in case of error
            return(NA)
        },
        warning=function(cond) {
            message(paste("URL caused a warning:", url))
            message("Here's the original warning message:")
            message(cond)
            # Choose a return value in case of warning
            return(NULL)
        },
        finally={
        # NOTE:
        # Here goes everything that should be executed at the end,
        # regardless of success or error.
        # If you want more than one expression to be executed, then you 
        # need to wrap them in curly brackets ({...}); otherwise you could
        # just have written 'finally=<expression>' 
            message(paste("Processed URL:", url))
            message("Some other message at the end")
        }
    )    
    return(out)
}

применение кода

> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory

расследование производства

> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"      
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"      
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"             
[5] "</head><body>"                                                          
[6] ""    

> length(y)
[1] 3

> y[[3]]
[1] NA

дополнительная информация

tryCatch

tryCatch возвращает значение, связанное с исполнением expr если нет ошибки или предупреждения. В этом случае определенные возвращаемые значения (см. return(NA) выше) может быть указывается путем предоставления соответствующей функции обработчика (см. аргументы error и warning на ?tryCatch). Это могут быть функции, которые уже существуют, но вы также можете определить их в tryCatch() (как я сделал выше).

последствия выбора конкретных возвращаемых значений функций обработчика

как мы уже указали, что NA должен быть возвращен в случае ошибки, третий элемент y is NA. Если бы мы выбрали NULL будет возвращаемое значение, длина y было 2 вместо 3 as lapply() будет просто "игнорировать" возвращаемые значения, которые являются NULL. Также обратите внимание, что если вы не укажете явно возвращаемое значение через return(), функции обработчика вернут NULL (т. е. в случае ошибки или предупреждения).

"нежелательных" предупреждение

As warn=FALSE кажется, не имеет никакого эффекта, альтернатива способ подавления предупреждения (которое в данном случае не представляет интереса) - использовать

suppressWarnings(readLines(con=url))

вместо

readLines(con=url, warn=FALSE)

несколько выражений

обратите внимание, что вы также можете разместить несколько выражений в " фактической части выражений "(аргумент expr of tryCatch()) если вы обернете их в фигурные скобки (так же, как я проиллюстрировал в finally часть).


R использует функции для реализации блока try-catch:

синтаксис выглядит так:

result = tryCatch({
    expr
}, warning = function(warning_condition) {
    warning-handler-code
}, error = function(error_condition) {
    error-handler-code
}, finally={
    cleanup-code
})

в tryCatch() есть два ‘условия’, которые могут быть обработаны: "предупреждения" и "ошибки". При написании каждого блока кода важно понимать состояние выполнения и область действия. @source


здесь идет простой пример:

# Do something, or tell me why it failed
my_update_function <- function(x){
    tryCatch(
        # This is what I want to do:
        y = x * 2
        return(y)
        ,
        # ... but if an error occurs, tell me what happened: 
        error=function(error_message) {
            message("My message is here!")
            message("And below is the error message from R:")
            message(error_message)
            return(NA)
        }
    )
}

Если вы также хотите захватить "предупреждение", просто добавьте warning= аналогично error= часть.


Так как я только что потерял два дня своей жизни, пытаясь решить для tryCatch для функции irr, я думал, что должен поделиться своей мудростью (и то, что отсутствует). FYI-irr является фактической функцией от FinCal в этом случае, когда получены ошибки в нескольких случаях на большом наборе данных.

  1. настройка tryCatch как части функции. Например:

    irr2 <- function (x) {
      out <- tryCatch(irr(x), error = function(e) NULL)
      return(out)
    }
    
  2. для работы ошибки (или предупреждения) вам действительно нужно создать функцию. I первоначально для ошибки часть просто написала error = return(NULL) и все значения вернулись null.

  3. не забудьте создать суб-выход (например, мой "выход") и return(out).