В чем разница между обучением с учителем и обучение без учителя?

с точки зрения искусственного интеллекта и машинного обучения, в чем разница между обучением и без обучения? Можете ли вы дать простое, простое объяснение на примере?

22 ответов


поскольку вы задаете этот очень простой вопрос, похоже, стоит указать, что такое само машинное обучение.

машинное обучение-это класс алгоритмов, которые управляются данными, т. е. В отличие от" нормальных "алгоритмов это данные, которые" говорят", что такое" хороший ответ". Пример: гипотетический алгоритм немашинного обучения для обнаружения лица в изображениях попытается определить, что такое лицо (круглый диск цвета кожи, с темной областью, где вы ожидаете глаза и т. д.). Машина алгоритм обучения не будет иметь такого кодированного определения, но будет "учиться на примерах": вы покажете несколько изображений лиц и не-лиц, и хороший алгоритм в конечном итоге научится и сможет предсказать, является ли невидимое изображение лицом.

этот конкретный пример обнаружения лица руководил, что означает, что ваши примеры должны быть С надписью, или явно сказать, какие из них лица, а какие нет.

в без присмотра алгоритм ваши примеры не С надписью, то есть вы ничего не говорите. Конечно, в таком случае сам алгоритм не может "изобрести", что такое лицо, но он может попытаться кластер данные в разные группы, например, он может различать, что лица очень отличаются от ландшафтов, которые очень отличаются от лошадей.

поскольку другой ответ упоминает об этом (хотя и неверно): существуют "промежуточные" формы надзор, то есть полу-под наблюдением и активное обучение. Технически это контролируемые методы, в которых есть какой-то "умный" способ избежать большого количества помеченных примеров. В активном обучении алгоритм сам решает, какую вещь вы должны маркировать (например, он может быть довольно уверен в ландшафте и лошади, но он может попросить вас подтвердить, действительно ли горилла-это изображение лица). В полу-контролируемом обучении есть два разных алгоритма, которые начните с помеченных примеров, а затем "расскажите" друг другу, как они думают о большом количестве немаркированных данных. Из этой "дискуссии"они учатся.


контролируемое обучение-это когда данные, которые вы кормите своим алгоритмом, "помечены", чтобы помочь вашей логике принимать решения.

пример: фильтрация спама Bayes, где вы должны пометить элемент как спам для уточнения результатов.

неконтролируемое обучение - это типы алгоритмов, которые пытаются найти корреляции без каких-либо внешних входов, кроме необработанных данных.

пример: алгоритмы кластеризации данных.


обучающийся

приложения, в которых обучающие данные содержат примеры входных векторов вместе с соответствующими целевыми векторами, известны как контролируемые проблемы обучения.

обучение без учителя

в других задачах распознавания образов обучающие данные состоят из набора входных векторов x без соответствующих целевых значений. Цель в таких бесконтрольных проблемах обучения может заключаться в том, чтобы обнаружить группы похожих примеры внутри данных, где это называется кластеризацией

распознавание образов и машинное обучение (Bishop, 2006)


в контролируемом обучении схема предоставляется с фактическим результатом.Таким образом, результат называется классом примера.

но в бесконтрольном обучении класс примера не известен.Таким образом, бесконтрольное обучение-это попытка найти скрытую структуру в немаркированном (неизвестном классе) наборе данных.

подходы к бесконтрольному обучению включают:

  • кластеризация (K-среднее, иерархическое кластеризация)

  • Обучение Правил Ассоциации

подходы к контролируемому обучению включают в себя:

  • классификация (1R, наивный Байес, алгоритм обучения дерева решений, такой как ID3 корзина и так далее)

  • Предсказание Числового Значения


например, очень часто обучение нейронной сети контролируется обучением: вы говорите сети, какому классу соответствует вектор признаков, который вы кормите.

кластеризация-это неконтролируемое обучение: вы позволяете алгоритму решать, как группировать образцы в классы, которые имеют общие свойства.

еще один пример бесконтрольного обучения -самоорганизующиеся карты Кохонена.


Если вам нужно знать значение их так просто, я могу рассказать вам пример: в качестве примера: вам нужно узнать, какой автомобиль является автомобилем, а какой-мотоциклом? в руководил изучение ваших входных данных должно иметь метку.Это означает, что сначала вы должны назначить, что автомобиль, который имеет 2 колеса и размер мал мотоцикл.(В этом случае мы даем информацию напрямую). Но в без присмотра обучение, вы не помечаете входные данные.ты даешь что-то другое. входные сигналы к машине и машине группируют их своими подобными характеристиками.


короткий ответ::

машинное обучение можно разделить на два алгоритма обучения:

Обучающийся: вы даете различно помеченные данные примера в качестве входных данных вместе с правильными ответами. Этот алгоритм будет учиться на нем, и начать прогнозировать правильные результаты на основе входных данных после этого. пример: Email спам фильтр

Обучение Без Учителя: вы просто даете информацию и не говорите ничего-ни ярлыков, ни правильных ответов. Алгоритм автоматически анализирует паттерны в данных. пример: Google Новости


Я всегда находил различие между неконтролируемым и контролируемым обучением произвольным и немного запутанным. Между этими двумя случаями нет реального различия, вместо этого существует ряд ситуаций, в которых алгоритм может иметь более или менее "надзор". Существование полу-контролируемого обучения является очевидным примером того, где линия размыта.

Я склонен думать о надзоре как о предоставлении обратной связи алгоритму о том, какие решения должны быть предпочтительными. Для традиционной контролируемой настройки, такой как обнаружение спама, вы сообщаете алгоритм "не допускайте ошибок на тренировочном наборе"; для традиционной бесконтрольной настройки, такой как кластеризация, вы сообщаете алгоритму "точки, которые близки друг к другу, должны находиться в одном кластере". Просто так получилось, что первая форма обратной связи намного более конкретна, чем последняя.

короче говоря, когда кто-то говорит "под наблюдением", подумайте о классификации, когда они говорят, что "бесконтрольные" думают о скоплении и стараются не слишком беспокоиться об этом.


машинное обучение: Он исследует изучение и построение алгоритмов, которые могут учиться и делать прогнозы по данным.Такие алгоритмы работают путем построения модели из примеров входных данных, чтобы сделать управляемые данными прогнозы или решения,выраженные в виде выходных данных, а не следуя строго статическим инструкциям программы.

обучающийся: Это задача машинного обучения-вывести функцию из помеченных данных обучения.Обучение данные состоят из набора учебных примеров. В контролируемом обучении каждый пример представляет собой пару, состоящую из входного объекта (обычно вектора) и желаемого выходного значения (также называемого наблюдательным сигналом). Контролируемый алгоритм обучения анализирует данные обучения и создает выведенную функцию, которая может быть использована для отображения новых примеров.

компьютер представлен с входными сигналами примера и их пожеланными выходами, данными "учителем", и цель выучить а общее правило, которое сопоставляет входные данные с выходными.В частности, контролируемый алгоритм обучения принимает известный набор входных данных и известных ответов на данные (выход) и обучает модель генерировать разумные прогнозы для ответа на новые данные.

обучение без учителя: Это обучение без учителя. Одним из основных что вы можете сделать с данными, чтобы визуализировать его. Это задача машинного обучения для вывода функции для описания скрытых структура из немаркированных данных. Поскольку примеры, приведенные учащемуся, не помечены, нет сигнала ошибки или вознаграждения для оценки потенциального решения. Это отличает неконтролируемое обучение от контролируемого обучения. Неконтролируемое обучение использует процедуры, которые пытаются найти естественные разделы узоров.

при неконтролируемом обучении нет обратной связи, основанной на результатах прогнозирования, т. е. нет учителя, чтобы исправить вас.При обучении без учителя методы не приводятся помеченные примеры, и нет никакого понятия о выходе в процессе обучения. В результате, это до схемы обучения / модели, чтобы найти шаблоны или обнаружить группы входных данных

вы должны использовать бесконтрольные методы обучения, когда вам нужен большой количество данных для обучения модели, а также готовность и способность экспериментировать и исследовать, и, конечно, вызов, который не очень хорошо решается через более-установленный методы.С неконтролируемым обучением это возможно изучить более крупные и сложные модели, чем с контролируемыми обучающий.здесь является хорошим примером на нем

.


контролируемое обучение, учитывая данные с ответом.

учитывая электронную почту, помеченную как спам / не спам, изучите спам-фильтр.

учитывая набор данных пациентов с диагнозом диабета или нет, научиться классифицировать новых пациентов как диабет или нет.

бесконтрольное обучение, учитывая данные без ответа, пусть ПК группирует вещи.

дан набор новостных статей, найденных в интернете, группы в набор статей об одной и той же истории.

учитывая базу данных пользовательских данных, автоматически обнаруживать сегменты рынка и группировать клиентов в различные сегменты рынка.

ссылка


Обучающийся

в этом каждый входной шаблон, который используется для обучения сети связанный с выходным шаблоном, который является целевым или желаемым узор. Предполагается, что учитель присутствует во время обучения процесс, когда выполняется сравнение между вычисляемыми сетями вывод и правильный ожидаемый вывод, чтобы определить ошибку. Этот затем error можно использовать для изменения параметров сети, которые привести улучшение производительности.

Обучение Без Учителя

в этом методе обучения целевой результат не представляется сеть. Это как если бы не было учителя, чтобы представить желаемое паттерн и, следовательно, система учится сама по себе, открывая и адаптация к структурным особенностям входных паттернов.


Я постараюсь сделать все просто.

Обучающийся: в этой методике обучения нам дается набор данных, и система уже знает корректный вывод набора данных. Итак, здесь наша система учится, предсказывая собственную ценность. Затем он выполняет проверку точности с помощью функции затрат, чтобы проверить, насколько близко его прогноз был к фактическому выходу.

Обучение Без Учителя: в этом мы подходим с небольшим или без знания о том, что наши результат будет. Поэтому вместо этого мы получаем структуру из данных, где мы не знаем эффекта переменной. Мы делаем структуру путем кластеризации данных на основе взаимосвязи между переменной в данных. Здесь у нас нет обратной связи, основанной на нашем прогнозе.


Обучающийся

контролируемое обучение основано на обучении образцу данных из источника данных с уже назначенной правильной классификацией. Такие методы используются в прямой или многослойной Модели персептрона (MLP). Эти MLP имеют три отличительных характеристики:

  1. один или несколько слоев скрытых нейронов, не являющихся частью входа или выходные слои сети, которые позволяют сети учиться и решить любой сложные проблемы
  2. нелинейность отраженная в нейрональной деятельности дифференцируемость и
  3. модель соединения сети показывает высокую степень связь.

эти характеристики наряду с обучением через обучение решайте сложные и разнообразные задачи. Обучение через обучение в контролируемой модели ANN также называется алгоритмом обратного перемещения ошибок. Исправление ошибок-обучение алгоритм поездов на сети на входе-выходе образцы и находит сигнал ошибки, который разница выход высчитанный и пожеланный выход и регулирует синаптические веса нейронов, пропорциональные произведение сигнала ошибки и входного экземпляра синаптический вес. Основываясь на этом принципе, error back обучение распространению происходит в два прохода:

Вперед Пройти:

здесь входной вектор представлен в сеть. Этот входной сигнал распространяется вперед, нейрон за нейроном через сеть и появляется на выходном конце сеть в качестве выходного сигнала:y(n) = φ(v(n)) здесь v(n) - индуцированное локальное поле нейрона, определяемое v(n) =Σ w(n)y(n). выход, который вычисляется на выходном слое o (n), сравнивается с требуемым ответом d(n) и находит ошибки e(n) для данного нейрона. Синаптические веса сети во время этого прохода остаются неизменными.

Обратным Ходом:

в сигнал ошибки, который возникает на выходном нейроне этого слоя, распространяется назад по сети. Это вычисляет локальный градиент для каждого нейрона в каждом слое и позволяет синаптическим Весам сети претерпевать изменения в соответствии с правилом Дельта как:

Δw(n) = η * δ(n) * y(n).

это рекурсивное вычисление продолжается, с прямым проходом, за которым следует обратный проход для каждого входного шаблона, пока сеть не будет сходиться.

контролируемая парадигма обучения ANN эффективна и находит решения нескольких линейных и нелинейных задач, таких как классификация, управление растениями, прогнозирование, прогнозирование, робототехника и т. д.

Обучение Без Учителя

самоорганизующиеся нейронные сети учатся с использованием неконтролируемого алгоритма обучения для идентификации скрытых паттернов в немаркированных входных данных. Это бесконтрольное относится к способности изучать и организовывать информацию без предоставления сигнала об ошибке для оценки потенциальное решение. Отсутствие направления для алгоритма обучения в неконтролируемом обучении иногда может быть выгодным, поскольку это позволяет алгоритму оглядываться назад на шаблоны, которые ранее не рассматривались. Основными характеристиками самоорганизующихся карт (сом) являются:

  1. оно преобразовывает картину входящего сигнала произвольного размера в одна или 2-мерная карта и выполните это преобразование адаптивно
  2. сеть представляет feedforward структура с одиночным вычислительный слой, состоящий из нейронов, расположенных рядами и столбцы. На каждом этапе представления сохраняется каждый входной сигнал в надлежащем контексте и,
  3. нейроны, имеющие дело с тесно связанными частями информации, близки вместе они общаются через синаптические связи.

вычислительный слой также называется конкурентным слоем, так как нейроны в слое конкурируют друг с другом, чтобы стать активными. Следовательно, этот алгоритм обучения называется конкурентным алгоритмом. Неконтролируемый алгоритм в SOM работает в три этапа:

соревнования этапа:

для каждого входного шаблона x, представленный в сеть, внутренний продукт с синаптическим весом w вычисляется, и нейроны в конкурентном слое находят дискриминантную функцию, которая вызывает конкуренцию между нейронами и синаптическим вектором веса, близким к входному вектору в евклидовом слое дистанция объявляется победителем в конкурсе. Этот нейрон называется наилучшим подходящим нейроном,

i.e. x = arg min ║x - w║.

кооперативную фазу:

побеждающий нейрон определяет центр топологической окрестности h взаимодействующих нейронов. Это осуществляется боковым взаимодействием d среди кооперативные нейроны. Эта топологическая окрестность с течением времени уменьшает свои размеры.

адаптивная фаза:

позволяет победившему нейрону и его соседним нейронам увеличить свои индивидуальные значения дискриминантной функции по отношению к входному паттерну через соответствующие синаптические регулировки веса,

 Δw = ηh(x)(x –w).

при повторном представлении обучающих паттернов синаптические весовые векторы, как правило, следуют распределению входных паттернов из-за обновления окрестности и, таким образом, Энн учится без супервизора.

Самоорганизующаяся Модель естественно представляет нейробиологическое поведение и, следовательно, используется во многих реальных приложениях, таких как кластеризация, распознавание речи, сегментация текстуры, векторное кодирование и т. д.

ссылка.


Обучающийся: Это задача машинного обучения для вывода функции из помеченных данных обучения.

Обучение Без Учителя: Это задача машинного обучения-вывести функцию для описания скрытой структуры из "немаркированных" данных (классификация или категоризация не включены в наблюдения).


на Обучающийся мы знаем, что вход и выход должен быть. Например, дан набор автомобилей. Мы должны выяснить, какие из них красные, а какие синие.

а, обучение без учителя - это то, где мы должны найти ответ с очень небольшим или без какого-либо представления о том, как должен быть выход. Например, учащийся может построить модель, которая определяет, когда люди улыбаются, на основе корреляции моделей лица и такие слова, как " чему ты улыбаешься?".


контролируемое обучение может маркировать новый элемент в одну из обученных меток, основанных на обучении во время обучения. Необходимо предоставить большое количество обучающих наборов данных, наборов данных проверки и тестовых данных. Если вы предоставляете, скажем, пиксельные векторы изображений цифр вместе с обучающими данными с метками, то он может идентифицировать числа.

обучение без учителя не требует подготовки данных. В бесконтрольном обучении он может группировать элементы в различные кластеры на основе разность входных векторов. Если вы предоставите пиксельные векторы изображений цифр и попросите его классифицировать по 10 категориям, он может это сделать. Но он знает, как наклеить ярлыки, поскольку вы не предоставили обучающие ярлыки.


контролируемое обучение в основном там, где у вас есть входные переменные(x) и выходная переменная(y), и используйте алгоритм для изучения функции отображения от входа до выхода. Причина, по которой мы назвали это контролируемым, заключается в том, что алгоритм учится из набора данных обучения, алгоритм итеративно делает прогнозы по данным обучения. Наблюдаемые имеют два типа-классификацию и регрессию. Классификация - это когда выходная переменная является категорией, такой как yes/no, true/false. Регрессия-это когда выход реальные значения как высота человека, температура etc.

обучение под наблюдением ООН-это когда у нас есть только входные данные(X) и нет выходных переменных. Это называется обучением без учителя, потому что в отличие от контролируемого обучения выше нет правильных ответов и нет учителя. Алгоритмы предоставлены своим собственным разработкам, чтобы обнаружить и представить интересную структуру в данных.

типы неконтролируемого обучения-кластеризация и Ассоциация.


контролируемое обучение-это в основном техника, в которой обучающие данные, из которых машина учится, уже помечены, что, предположим, простой классификатор четных нечетных чисел, где вы уже классифицировали данные во время обучения . Поэтому он использует "помеченные" данные.

неконтролируемое обучение, напротив, является методом, в котором машина сама по себе помечает данные . Или вы можете сказать, что это тот случай, когда машина учится сама по себе с нуля.


В Простой обучающийся тип проблемы машинного обучения, в которой у нас есть некоторые ярлыки и с помощью меток мы реализуем алгоритм регрессии и классификации .Классификация применяется там, где наш выход похож на в виде 0 или 1, true / false, да / нет. и регрессия применяется там, где выставляется реальная стоимость такого дома цены

Обучение Без Учителя тип проблемы машинного обучения, в которых мы не наличие каких-либо меток означает, что у нас есть только некоторые данные, неструктурированные данные, и мы должны кластеризировать данные (группировку данных)с использованием различного неконтролируемого алгоритма


Контролируемое Машинное Обучение

" процесс обучения алгоритма из набора данных обучения и прогнозировать выход. "

точность предсказанного выхода прямо пропорциональная к данным по тренировки (длине)

контролируемое обучение - это когда у вас есть входные переменные (x) (учебный набор данных) и выходная переменная (Y) (тестовый набор данных), и вы используете алгоритм для изучения функции отображения с входа на выход.

Y = f(X)

основных типа:

  • классификация (дискретная ось y)
  • предиктивный (непрерывная ось y)

алгоритмы:

  • Алгоритмы Классификации:

    Neural Networks  
    Naïve Bayes classifiers  
    Fisher linear discriminant  
    KNN 
    Decision Tree 
    Super Vector Machines
    
  • Алгоритмы Предиктивного:

    Nearest  neighbor  
    Linear Regression,Multi Regression 
    

сферы применения:

  1. классификация писем как спам
  2. классификация ли пациент болезнь или нет
  3. Распознавание Голоса

  4. предсказать HR выбрать конкретного кандидата или нет

  5. прогнозировать цену фондового рынка


обучающийся

у вас есть вход x и целевой выход t. Таким образом, вы тренируете алгоритм для обобщения на недостающие части. Он контролируется, потому что цель дана. Вы-супервизор, говорящий алгоритму: Для примера x вы должны вывести t!

обучение без учителя

хотя сегментация, кластеризация и сжатие обычно учитываются в этом направлении, мне трудно придумать хорошее определение для он.

давайте авто-кодеров для сжатия в качестве примера. Хотя у вас есть только вход x, это инженер-человек, который сообщает алгоритму, что цель также x. Таким образом, в некотором смысле это не отличается от контролируемого обучения.

и для кластеризации и сегментации я не слишком уверен, что это действительно соответствует определению машинного обучения (см. другой вопрос).


контролируемое обучение: вы обозначили данные и должны учиться на этом. e.G данные дома вместе с ценой, а затем научиться прогнозировать цену

неконтролируемое обучение: вы должны найти тенденцию, а затем предсказать, без каких-либо предварительных меток. e.g разные люди в классе, а затем приходит новый человек, так к какой группе принадлежит этот новый студент.