один против всех регрессия
Я рассматривал пример из курса Эндрю Нг в машинном обучении, который я нашел в https://github.com/jcgillespie/Coursera-Machine-Learning/tree/master/ex3. В примере рассматривается логистическая регрессия и классификация "один против всех". Я сомневаюсь в этой функции:
function [all_theta] = oneVsAll(X, y, num_labels, lambda)
%ONEVSALL trains multiple logistic regression classifiers and returns all
%the classifiers in a matrix all_theta, where the i-th row of all_theta
%corresponds to the classifier for label i
% [all_theta] = ONEVSALL(X, y, num_labels, lambda) trains num_labels
% logisitc regression classifiers and returns each of these classifiers
% in a matrix all_theta, where the i-th row of all_theta corresponds
% to the classifier for label i
% Some useful variables
m = size(X, 1);
n = size(X, 2);
% You need to return the following variables correctly
all_theta = zeros(num_labels, n + 1);
% Add ones to the X data matrix
X = [ones(m, 1) X];
% ====================== YOUR CODE HERE ======================
% Instructions: You should complete the following code to train num_labels
% logistic regression classifiers with regularization
% parameter lambda.
%
% Hint: theta(:) will return a column vector.
%
% Hint: You can use y == c to obtain a vector of 1's and 0's that tell use
% whether the ground truth is true/false for this class.
%
% Note: For this assignment, we recommend using fmincg to optimize the cost
% function. It is okay to use a for-loop (for c = 1:num_labels) to
% loop over the different classes.
%
% fmincg works similarly to fminunc, but is more efficient when we
% are dealing with large number of parameters.
%
% Example Code for fmincg:
%
% % Set Initial theta
% initial_theta = zeros(n + 1, 1);
%
% % Set options for fminunc
% options = optimset('GradObj', 'on', 'MaxIter', 50);
%
% % Run fmincg to obtain the optimal theta
% % This function will return theta and the cost
% [theta] = ...
% fmincg (@(t)(lrCostFunction(t, X, (y == c), lambda)), ...
% initial_theta, options);
%
initial_theta = zeros(n + 1, 1);
options = optimset('GradObj', 'on', 'MaxIter', 50);
for i = 1:num_labels
c = i * ones(size(y));
fprintf('valores')
[theta] = fmincg (@(t)(lrCostFunction(t, X, (y == c), lambda)), initial_theta, options);
all_theta(i,:) = theta;
end
% =========================================================================
end
Я знаю, что функция lrCostFunction принимает в качестве параметров: theta, X, y и lambda, но я не могу понять, откуда значение t в код, который я разместил выше; в частности, в этой части:
[theta] = fmincg (@(t)(lrCostFunction(t, X, (y == c), lambda)), initial_theta, options);
помочь?
3 ответов
fmincg
принимает дескриптор целевой функции в качестве первого аргумента, который в этом случае является дескриптором lrCostFunction
.
если вы войдете внутрь fmincg.m
, вы найдете следующие строки:
argstr = ['feval(f, X']; % compose string used to call function
%---Code will not enter the following loop---%
for i = 1:(nargin - 3) %this will go from 1 to 0, thus the loop is skipped
argstr = [argstr, ',P', int2str(i)];
end
% following will be executed
argstr = [argstr, ')'];
в конце приведенного выше фрагмента кода результат будет,
argstr=feval(f,X');
если вы немного впереди, вы увидите,
[f1 df1] = eval(argstr); % get function value and gradient
поэтому функция handle f
будет работать с аргументом X'
. Следовательно,t=X'
, что делает тоже чувство. Инициал theta
будет сходиться, чтобы дать вам вектор конечного параметра для логистической регрессии.
вы действительно можете заменить.
for i=1 : num_labels
[theta]= fmincg (@(t)(lrCostFunction(t, X, (y == i), lambda)),initial_theta, options);
all_theta(i,:)=theta;
попробуй такое
for i = 1:num_labels,
[all_theta(i,:)] = fmincg (@(t)(lrCostFunction(t, X, (y == i), lambda)), initial_theta, options);
end;
вам также не нужно инициализировать all_theta в начале