Что такое радиальная функция
Как работают радиальные базисные функции
В этом разделе
Доступно с лицензией Geostatistical Analyst.
Радиальные базисные функции (Radial basis functions) (RBF) представляют собой набор методов жесткой интерполяции; это означает, что поверхность должна проходить через каждое измеренное опорное значение. Существует пять различных базисных функций:
Каждая базисная функция имеет различную форму и позволяет получать разные интерполированные поверхности. Методы РБФ – это специальный случай сплайнов.
Концептуально, радиальные базисные функции напоминают размещение резиновой мембраны на измеренные опорные точки и одновременно уменьшение общей кривизны поверхности. Выбор базисной функции определяет то, как резиновая мембрана будет расположена между значениями. В следующей диаграмме концептуально показано нанесение поверхности радиальной базисной функции на серию опорных точек высот. Обратите внимание, что поверхность в поперечном сечении проходит через значения данных.
Иллюстрация того, как поверхность в поперечном сечении проходит через значения данных.
Являясь жесткими интерполяторами, методы РБФ отличаются от интерполяторов по методу глобального и локальных полиномов, которые являются нежесткими интерполяторами и не требуют обязательного прохождения поверхности через измеренные точки. Функция обратных взвешенных расстояний (также жесткий интерполятор), в отличие от радиальных базисных функций, никогда не интерполирует значения выше максимального или ниже минимального измеренного значения. Это можно увидеть на поперечном сечении опорных данных.
Пример профиля обратных взвешенных расстояний
Тем не менее, с помощью радиальных базисных функций можно прогнозировать значения выше максимальных и ниже минимальных измеренных значений, как показано на поперечном сечении.
Пример поперечного сечения радиальной базисной функции
Оптимальные параметры определяются с помощью перекрестной проверки, аналогично шагам, рассмотренным для функции обратных взвешенных расстояний и интерполяции по методу локальных полиномов.
Использование радиальных базисных функций
Радиальные базисные функции используют для создания сглаженных поверхностей из большого количества расчетных данных. С помощью функции можно успешно создавать слабо изменяющиеся поверхности, например поверхности высот.
Однако эти методы не подходят при значительных изменениях значений поверхности в пределах коротких расстояний и/или если вы подозреваете, что опорные данные могут быть ошибочными или неопределенными.
Концепции радиальных базисных функций
В модуле Geostatistical Analyst радиальные базисные функции формируются над каждым местоположением данных. Радиальная базисная функция – эта функция, которая изменяется при удалении от местоположения.
Радиальные базисные функции для различных местоположений
Например, предположим, что радиальная базисная функция – это расстояние от каждого местоположения, следовательно, она формирует перевернутый конус над каждым местоположением. Если сделать поперечное сечение плоскости x, z для y = 5, можно увидеть срез каждой радиальной базисной функции. Теперь, предположим, необходимо спрогнозировать значение для y = 5 и x = 7. Значение каждой радиальной базисной функции в интерполируемом местоположении можно взять из вышеприведенного рисунка. Значение определяется значениями Φ1, Φ2, и Φ3, которые просто зависят от расстояния от каждого местоположения данных. Предиктор формируется с помощью среднего взвешенного w1Φ1 + w2Φ2 + w3Φ3 +.
Как же определить веса? До сих пор вы не использовали значения данных. Веса w1, w2, w3 и т. д. можно определить, установив обязательное требование: при перемещении предиктора в местоположение с измеренным значением, значение должно быть проинтерполировано точно. Так мы получим N уравнений с N неизвестными, которые можно решить единственным образом. Таким образом, поверхность проходит через значения данных, что обеспечивает выполнение жесткой интерполяции.
Радиальная базисная функция в этом примере является специальным случаем радиальной базисной функции мультквадриков. Модуль Geostatistical Analyst также позволяет использовать другие радиальные базисные функции, например, функции полностью регуляризованных сплайнов, плоских сплайнов, сплайнов с натяжением и функций обратных мультиквадриков. Иногда разница между ними не велика. Можно использовать только одну или несколько функций одновременно, а затем выполнить перекрестную проверку и выбрать одну из них. Каждая радиальная базисная функция содержит параметр, управляющий сглаженностью поверхности.
Для всех методов, кроме обратных мультиквадриков, чем выше значение параметра, тем более сглаженная карта; обратное верно для метода обратных мультиквадриков.
Функция радиального распределения
Рис. 10.4. График функции радиального распределения для 1s-орбитали в зависимости от расстояния r до протона. Функция радиального распределения — это вероятность обнаружить электрон в тонком сферическом слое на расстоянии r от протона. Функция радиального распределения учитывает тот факт, что электрон может быть найден в любом направлении от протона. Расстояние r измеряется в ангстремах (1 Å = 10 −10 м)
где все параметры те же, что и в выражении для постоянной Ридберга через фундаментальные постоянные. На самом деле энергетические уровни атома водорода можно выразить через радиус Бора следующим образом:
Рис. 10.5. Волновая функция (вверху) и функция радиального распределения (внизу) для 2s-орбитали атома водорода в зависимости от расстояния r до протона. Волновая функция начинается с положительного значения, проходит через узел чуть дальше точки 1 Å (2a 0) и затем спадает до нуля. Функция радиального распределения демонстрирует максимум вероятности обнаружения электрона на отметке 2,8 Å, причём наиболее вероятно найти его в интервале от 2 до 4 Å (см. рис. 10.2). Расстояние r измеряется в ангстремах (1 Å = 10 −10 м)
Рис. 10.6. Волновая функция (вверху) и функция радиального распределения (внизу) для 3s-орбитали атома водорода в зависимости от расстояния r до протона. Волновая функция начинается с положительного значения, проходит через узел, становясь отрицательной, проходит через второй узел, вновь становясь положительной, и затем спадает до нуля. Функция радиального распределения показывает, что вероятность обнаружения электрона достигает максимума на отметке 7 Å, причём наиболее вероятно найти его в интервале от 5 до 11 Å (см. рис. 10.2). Расстояние r измеряется в ангстремах (1 Å = 10 −10 м)
Волна может быть положительной или отрицательной, но имеющие смысл значения вероятности являются положительными числами или нулём. Функция радиального распределения показывает, что бо́льшая часть вероятности приходится на интервал от 2 до 4 Å; это также видно на рис. 10.2, но без количественного описания. Пик вероятности приходится на отметку приблизительно 2,8 Å.
Формы p-орбиталей
Формы d-орбиталей
Рис. 10.8. Схематическое изображение пяти 3d-орбиталей атома водорода, обозначенных в соответствии с их формой. Каждая орбиталь имеет две узловые поверхности, а также положительные и отрицательные лепестки. На четырёх из них узловые поверхности имеют вид плоскостей, а на пятой — форму конусов. При пересечении узловых поверхностей волновая функция меняет знак. Лепестки на каждой диаграмме показывают, где расположены области наибольшей амплитуды вероятности для электрона. Четыре орбитали содержат по четыре лепестка каждая. Однако d x 2 — орбиталь имеет другую форму. У неё по-прежнему две узловые поверхности, но они имеют коническую форму. Все эти волны амплитуды вероятности плавно спадают к нулю с удалением от ядра (протона), а не обрываются резко, как на этих диаграммах
Русские Блоги
Сеть RBF (Радиальная Основа)
1. Что такое радиальная базисная функция
2. RBF нейронная сеть
Нейронная сеть RBF представляет собой трехслойную нейронную сеть, которая включает в себя входной слой, скрытый слой и выходной слой. Преобразование из входного пространства в скрытое пространство слоя является нелинейным, в то время как преобразование из скрытого пространства слоя в выходное пространство слоя является линейным. Блок-схема выглядит следующим образом:
Основная идея сети RBF состоит в том, чтобы использовать RBF в качестве «базы» скрытого модуля для формирования пространства скрытого слоя, чтобы входной вектор можно было напрямую отобразить в скрытом пространстве без подключения через весовые коэффициенты. Когда определяется центральная точка RBF, это отношение отображения также определяется. Отображение из скрытого пространства слоя в выходное пространство является линейным, то есть выход сети представляет собой линейную взвешенную сумму выходных данных скрытого блока, а вес здесь является сетевым регулируемым параметром.Среди них роль скрытого слоя состоит в том, чтобы отобразить вектор из низкоразмерного p в высокомерный h, так чтобы линейная неразделимая ситуация с малым измерением могла стать линейно делимой, в основном идея функции ядра.Таким образом, отображение сети от входа к выходу является нелинейным, в то время как выход сети является линейным для настраиваемых параметров. Вес сети может быть непосредственно решен с помощью системы линейных уравнений, таким образом, значительно ускоряя скорость обучения и избегая локальных минимальных проблем.
Функция активации нейронной сети RBF может быть выражена как:
Конечно, используя функцию наименьших квадратов для выражения:
3. Задача обучения нейронной сети RBF
Существует три параметра для решения: центр базовой функции, дисперсия и вес скрытого слоя для выходного слоя.
(1) Метод обучения самоорганизующийся центр отбора:
Первый шаг: неконтролируемый процесс обучения, решение центра и дисперсии базовых функций скрытого слоя
Второй шаг: контролируемый процесс обучения, решение весов от скрытого слоя до выходного слоя
Сначала выберите h центров для кластеризации k-средних. Для радиального базиса функции ядра Гаусса дисперсия определяется по формуле:
Вес соединения нейрона между скрытым слоем и выходным слоем может быть непосредственно рассчитан методом наименьших квадратов, то есть частная производная w по функции потерь решается для w, чтобы сделать его равным 0, и формула расчета может быть упрощена как:
(2) метод прямого расчета
Центр нейрона скрытого слоя выбирается случайным образом из входных выборок, и центр фиксируется. Как только центр зафиксирован, выход нейронов скрытого слоя известен, и вес соединения такой нейронной сети может быть определен путем решения линейных уравнений. Распределение, применимое к данным выборки, является четко представительным.
(3) контролируемый алгоритм обучения
Обучение выборочного набора для получения сетевого центра и других весовых параметров, которые удовлетворяют требованиям контроля, проходящих процесс обучения с исправлением ошибок, такой же, как принцип обучения сети BP, также с использованием метода градиентного спуска. Следовательно, RBF также можно рассматривать как разновидность нейронной сети BP.
4. Разница между нейронной сетью RBF и нейронной сетью BP
1. Локальное приближение и глобальное приближение:
Скрытые узлы нейронной сети BP используют внутреннее произведение входного шаблона и вектора весов в качестве независимой переменной функции активации, а функция активации использует функцию Sigmoid. Каждый параметр настройки оказывает одинаковое влияние на состояние сети BP, поэтому нейронная сеть BP представляет собой нелинейное отображениеГлобальное приближение。
Скрытые узлы нейронной сети RBF используют расстояние между входным режимом и центральным вектором (например, евклидово расстояние) в качестве независимой переменной функции и используют радиальную базисную функцию (например, функцию Гаусса) в качестве функции активации. Чем дальше вход нейрона от центра радиальной базисной функции, тем ниже активация нейрона (функция Гаусса). Выходной сигнал сети RBF связан с некоторыми параметрами настройки. Например, значение wij влияет только на выходной сигнал yi (для получения информации о выходе из сети см. Главу 2). Поэтому нейронная сеть RBF имеет«Местное картографирование»характерная черта.
Так называемая локальная аппроксимация означает, что целевая функция аппроксимируется только на основе данных рядом с точкой запроса. Фактически, для радиальных базисных сетей обычно используется гауссова радиальная базисная функция. Изображение функции ослабляется с обеих сторон и является радиально симметричным. Только когда выбранный центр очень близок к точке запроса (то есть входным данным) Входные данные имеют реальный эффект отображения: если центр находится очень далеко от точки запроса, а евклидово расстояние слишком велико, выходной результат стремится к 0, поэтому точка, которая действительно работает, все еще остается точкой, очень близкой к точке запроса, поэтому она является локальной Приближение, а подход сети BP к целевой функции связан со всеми данными, а не только с данными рядом с точкой запроса.
2. Разница между средними слоями
Нейронная сеть BP может иметь несколько скрытых слоев, но RBF имеет только один скрытый слой.
3. Разница в скорости обучения
В-пятых, разница между нейронной сетью RBF и SVM
SVM и другие методы, использующие функции ядра, не очень подходят для больших выборок и большого числа функций, поэтому был предложен RBF.
В-шестых, почему функция ядра Гаусса отображается в многомерное пространство
Сначала дается формула определения функции ядра Гаусса:
Фактически это можно упростить как:
Конечно, расширение по степенным рядам:
Как вы можете видеть, вектор X сгенерирует форму, аналогичную полиномиальному расширению ядра, например, исходные параметры x1, x2. После сопоставления параметры включают в себя x1 * x1, x1 * x2, x2 * x2, чтобы отобразить исходные 2 измерения в 3 измерения.
Семь, прямая сеть, рекурсивная сеть и сеть обратной связи
Сеть прямой связи обычно относится к нейронной сети прямой связи или нейронной сети прямой связи. Это самая простая нейронная сеть с нейронами, расположенными в слоях. Каждый нейрон связан только с нейроном в предыдущем слое. Выходные данные предыдущего уровня принимаются и выводятся на следующий уровень без обратной связи между уровнями. В том числе: нейронная сеть BP, нейронная сеть RBF и т. Д.
Сеть обратной связи (Recurrent Network), также известная как самоассоциативная сеть памяти, предназначена для проектирования сети, в которой хранится набор точек равновесия, так что, когда сети присваивается набор начальных значений, сеть в конечном итоге сходится к балансу проекта, работая самостоятельно. Точка. В том числе CHNN, DHNN и др.
Восемь, полный метод интерполяции
Для интерполяции RBF характерной особенностью является то, что во входном наборе данных точка, ближайшая к центральной точке, вносит наибольший вклад в функцию отображения.
Полный метод интерполяции требует, чтобы все точки интерполяции проходили через поверхность. Так как интерполяция RBF используется для каждого x, это форма полной интерполяции. Проблема состоит в том, что, когда образец содержит шум, нейронная сеть будет моделировать Объединяется неправильная поверхность, что снижает способность к обобщению. Кроме того, если данные выборки x намного больше, чем нелинейная функция φ, решение становится неустойчивым, то есть для решения переопределенного уравнения. Следовательно, необходимо ввести методы регуляризации, которые обычно добавляют термины регуляризации.