Как параметр " вес " (DMatrix) используется в процедуре повышения градиента (xgboost)?
в xgboost можно установить параметр weight
на DMatrix
. Это, по-видимому, список весов, в котором каждое значение является весом для соответствующего образца.
Я не могу найти никакой информации о том, как эти веса фактически используются в процедуре повышения градиента. Связаны ли они с eta
?
например, если бы я установил weight
до 0,3 для всех образцов и eta
до 1, будет ли это то же самое, что и настройка eta
до 0,3 и weight
к 1?
1 ответов
xgboost
позволяет, например, взвешивание во время строительства DMatrix
, Как вы отметили. Этот вес непосредственно связывает экземпляр и путешествует с ним на протяжении всей тренировки. Таким образом, это включено в расчеты градиентов и гессианов,и непосредственно влияет на точки разделения и traing xgboost
модель.
Вес Экземпляра Файл
XGBoost поддерживает предоставление каждому экземпляру веса для дифференциации важность примеров. Например, если мы предоставляем экземпляр вес файла для поезда".тхт" файл в примере, как показано ниже:
поезд.формат txt.вес
1
0.5
0.5
1
0.5
это означает, что XGBoost будет подчеркивать больше на первом и четвертом экземпляр, то есть положительные экземпляры во время обучения. Этот конфигурация аналогична настройке сведений о группе. Если имя файла экземпляра "xxx", XGBoost проверит, есть ли файл с именем "xxx.вес " в том же каталоге, и если есть, будет используйте веса во время тренировки моделей.
это очень отличается от eta
eta
просто говорит xgboost
сколько смеси последнее дерево, обученных в ансамбль. Мера того, насколько жадным должен быть ансамбль на каждой итерации.
например, если бы я установил
weight
до 0,3 для всех образцов иeta
для 1 это будет то же самое, что и настройкаeta
до 0,3 иweight
в 1?
постоянной
weight
1 для всех экземпляров является значением по умолчанию, поэтому изменяется на константу .3 для всех случаев все равно будет одинаковый вес, поэтому это не должно слишком сильно влиять на вещи. Однако, установкаeta
до 1, от .3, сделает обучение намного более агрессивным.