Многоклассовый SVM (один против всех)

Я знаю, что LIBSVM допускает только классификацию one-vs-one, когда дело доходит до МНОГОКЛАССОВОГО SVM. Тем не менее, я хотел бы немного настроить его, чтобы выполнить классификацию "один против всех". Я попытался выполнить один-против-всех ниже. Это правильный подход?

код:

TrainLabel;TrainVec;TestVec;TestLaBel;
u=unique(TrainLabel);
N=length(u);
if(N>2)
    itr=1;
    classes=0;
    while((classes~=1)&&(itr<=length(u)))
        c1=(TrainLabel==u(itr));
        newClass=c1;
        model = svmtrain(TrainLabel, TrainVec, '-c 1 -g 0.00154'); 
        [predict_label, accuracy, dec_values] = svmpredict(TestLabel, TestVec, model);
        itr=itr+1;
    end
itr=itr-1;
end

возможно, я сделал несколько ошибок. Я хотел бы услышать некоторые отзывы. Спасибо.

Вторая Часть: Как сказал грапеот : Мне нужно сделать Sum-pooling (или голосование как упрощенное решение), чтобы придумать окончательный ответ. Я не знаю, как это сделать. Мне нужна помощь в этом; я видел файл python, но все еще не очень уверен. Мне нужна помощь.

3 ответов


%# Fisher Iris dataset
load fisheriris
[~,~,labels] = unique(species);   %# labels: 1/2/3
data = zscore(meas);              %# scale features
numInst = size(data,1);
numLabels = max(labels);

%# split training/testing
idx = randperm(numInst);
numTrain = 100; numTest = numInst - numTrain;
trainData = data(idx(1:numTrain),:);  testData = data(idx(numTrain+1:end),:);
trainLabel = labels(idx(1:numTrain)); testLabel = labels(idx(numTrain+1:end));
%# train one-against-all models
model = cell(numLabels,1);
for k=1:numLabels
    model{k} = svmtrain(double(trainLabel==k), trainData, '-c 1 -g 0.2 -b 1');
end

%# get probability estimates of test instances using each model
prob = zeros(numTest,numLabels);
for k=1:numLabels
    [~,~,p] = svmpredict(double(testLabel==k), testData, model{k}, '-b 1');
    prob(:,k) = p(:,model{k}.Label==1);    %# probability of class==k
end

%# predict the class with the highest probability
[~,pred] = max(prob,[],2);
acc = sum(pred == testLabel) ./ numel(testLabel)    %# accuracy
C = confusionmat(testLabel, pred)                   %# confusion matrix

из кода я вижу, что вы пытаетесь сначала превратить метки в" некоторый класс "против" не этого класса", а затем вызвать LibSVM для обучения и тестирования. Некоторые вопросы и предложения:

  1. почему вы используете оригинальный TrainingLabel для обучения? По-моему, должно быть model = svmtrain(newClass, TrainVec, '-c 1 -g 0.00154');?
  2. с измененным механизмом обучения вам также нужно настроить часть прогнозирования, например, с помощью суммирования для определения конечной метки. Используя -b переключитесь в LibSVM на включение вероятностного вывода также повысит точность.

вместо оценок вероятности вы также можете использовать значения решения следующим образом

[~,~,d] = svmpredict(double(testLabel==k), testData, model{k});
prob(:,k) = d * (2 * model{i}.Label(1) - 1);

для достижения той же цели.