Как параметр " вес " (DMatrix) используется в процедуре повышения градиента (xgboost)?
в xgboost можно установить параметр weight на DMatrix. Это, по-видимому, список весов, в котором каждое значение является весом для соответствующего образца.
Я не могу найти никакой информации о том, как эти веса фактически используются в процедуре повышения градиента. Связаны ли они с eta ?
например, если бы я установил weight до 0,3 для всех образцов и eta до 1, будет ли это то же самое, что и настройка eta до 0,3 и weight к 1?
1 ответов
xgboost позволяет, например, взвешивание во время строительства DMatrix, Как вы отметили. Этот вес непосредственно связывает экземпляр и путешествует с ним на протяжении всей тренировки. Таким образом, это включено в расчеты градиентов и гессианов,и непосредственно влияет на точки разделения и traing xgboost модель.
Вес Экземпляра Файл
XGBoost поддерживает предоставление каждому экземпляру веса для дифференциации важность примеров. Например, если мы предоставляем экземпляр вес файла для поезда".тхт" файл в примере, как показано ниже:
поезд.формат txt.вес
1
0.5
0.5
1
0.5
это означает, что XGBoost будет подчеркивать больше на первом и четвертом экземпляр, то есть положительные экземпляры во время обучения. Этот конфигурация аналогична настройке сведений о группе. Если имя файла экземпляра "xxx", XGBoost проверит, есть ли файл с именем "xxx.вес " в том же каталоге, и если есть, будет используйте веса во время тренировки моделей.
это очень отличается от eta
eta просто говорит xgboost сколько смеси последнее дерево, обученных в ансамбль. Мера того, насколько жадным должен быть ансамбль на каждой итерации.
например, если бы я установил
weightдо 0,3 для всех образцов иetaдля 1 это будет то же самое, что и настройкаetaдо 0,3 иweightв 1?
постоянной
weight1 для всех экземпляров является значением по умолчанию, поэтому изменяется на константу .3 для всех случаев все равно будет одинаковый вес, поэтому это не должно слишком сильно влиять на вещи. Однако, установкаetaдо 1, от .3, сделает обучение намного более агрессивным.