|
Основы цифровой обработки сигналов и нейрокомпьютерные вычисления для инженеров Нейрокомпьютинг, нейросети и нейрокомпьютеры \ Королев Л. Н. |
|
Страница в стадии отладки! |
|||||||||||||||||||||||||||||||||
|
|
|
Рис. 1. Cхема i-того узла нейроподобной сети Способы вычисления Si(xi) в различных моделях нейроподобных сетей различны. Наиболее часто используются следующие функции: S(x) = Sign(x), S принимает значения +1, – 1 (либо 0); S(x) = tanh(x/2) = [1–exp(–x)]/[1+exp(–x)] – тангенс гиперболический; S(x) =
1/[1+exp(–xa)]
– сигмоида; S(x) = x – линейная. В тех моделях сетей, где функция Si(xi) принимает только два значения, используется параметр, называемый порогом, будем обозначать порог буквой n. Сигмоида и тангенс гиперболический являются непрерывными функциями, приближающими ступенчатую разрывную пороговую функцию знака. Для
ступенчатой функции активации
чаще всего полагают, что: S(x)
= +1, если S(x)>
n,
и S(x)
= –1 в противном случае. Для
ступенчатой функции активации
чаще всего полагают, что:
Одной из важных задач, решаемых с использованием нейронных сетей, к которой сводится большинство других, является задача классификации. В содержательной постановке эта задача состоит в построении непересекающихся множеств (классов) объектов, позволяющих по значению признаков, характеризующих конкретный объект, относить его к одному и только одному из непересекающихся множеств. Классы конструируются различными способами. Первый состоит в том, что по некоторой совокупности представителей, о которых точно известна их принадлежность к тому или иному классу, строятся алгоритмы, позволяющие любой объект относить к какому-то определенному классу. Второй способ состоит в построении алгоритма, способного группировать объекты по некоторым критериям близости объектов друг к другу, определяемым постановкой задачи. В качестве исходной посылки считается, что множество классифицируемых объектов, заранее не разделено на классы и они автоматически объединяются в группы (или кластеры). Критериями объединения могут быть общие характеристики объектов, например допустимый разброс совокупности некоторых выделенных признаков, характеризующих группируемые объекты, соотношение этих признаков. Эта задача носит название задачи кластеризации. Для того чтобы указанные выше содержательные постановки задачи классификации были строго сформулированы, нам потребуется формализовать понятия признаков объекта, образа объекта, множества образов объектов. Один из способов формального представления образа любого объекта живой и неживой природы состоит в перечислении количественных характеристик свойств, присущих данному объекту, таких, например, как размеры, масса, цвет и тому подобное. Любые, даже чисто качественные характеристики можно закодировать числовыми значениями. Например, свойство «хороший» можно закодировать значением 1, а «плохой» – значением 0. Это позволяет определить образ объекта, как вектор числовых значений присущих ему свойств. Математический аппарат работы с векторами хорошо разработан, и задачи классификации можно ставить в строгой математической постановке, абстрагируясь от конкретного смысла реальных свойств объекта. Векторы мы будем обозначать большими буквами латинского алфавита, например Хi; координаты вектора – соответствующими малыми латинскими буквами с порядковым индексом.
Хi= (x1i,
x2i, …, xni) Как известно, вектор можно интерпретировать как точку п-мерного пространства с соответствующими координатами. Рассмотрим
некоторые примеры, поясняющие
постановку задачи классификации,
или распознавания образов. Пусть все пространство векторов, представляющих исследуемые объекты, разбито на непересекающиеся подмножества точек, которые мы будем называть классами. Предполагается, что нам не известны границы, разделяющие эти классы, но известны некоторые представители этих классов, т. е. принадлежность к тому или иному классу ограниченного числа точек каждого класса. Задача
состоит в том, чтобы для любой
наугад выбранной точки нашего
пространства образов определить
ее принадлежность к одному из
таких классов. В тех случаях, когда нам известны характеристики классов, эта задача решается тривиально. Например, пусть нам задана некоторая гиперплоскость в евклидовом пространстве и два класса точек в нем. Также известно, что к первому классу относятся точки, расположенные по одну сторону от гиперплоскости, ко второму – точки, расположенные по ее другую сторону. В этом случае нам надо просто подставить в уравнение гиперплоскости координаты точки, класс которой мы хотим определить, и по знаку результата судить о ее принадлежности. Реально встречаются такие ситуации, когда известна только принадлежность к классам какой-то ограниченной выборки точек из классов и ничего или почти ничего неизвестно о структуре самих классов. Такая ситуация типична для задач распознавания образов. Задача распознавания образовВ общем случае задача распознавания образов может быть сформулирована так. Пусть известна выборка некоторого числа образов, принадлежащих конечному числу классов. Нам дан образ, не принадлежащий известной выборке,. Требуется определить, к какому классу относится данный образ, при условии, что структуры самих классов нам не известны. Определим структуру класса как характеристическую функцию от п переменных, обладающую тем свойством, что при подстановке в нее координат точки, относящейся к данному классу, она принимает значение 1, а при подстановке координат точек, не принадлежащих данному классу, принимает значение 0 (или –1). Заметим, что любую функцию от п переменных можно преобразовать в функцию, характеризующую структуру некоторого класса, а именно: пусть дана вычислимая функция f(x1, x2, …, xn), определенная на всем множестве рассматриваемых координат, тогда функция
|
|
ВИРТУАЛЬНАЯ ШКОЛА КОМПЬЮТЕРНЫХ ТЕХНОЛОГИЙ |
© 2002-2005 Сазанов В.М. |
||
О проекте | Курсы | Условия | Экстернат | Партнерство | Семинар | Ссылки | Контакты |