Materiały konferencyjne SEP 2021

5 połączonych ze sobą węzłów obliczeniowych zwanych neuronami, zorganizowanych w war- stwy(wejściową, wyjściową i warstwy ukryte). Każdy model charakteryzuje się trzema głównymi cechami: strukturą węzłów, topologią sieci oraz algorytmem uczącym odpowie- dzialnym za dopasowanie wag sieci. Każdy neuron jest nieliniową funkcją ograniczoną(1): (1) gdzie y jest wyjściem neuronu, są zmiennymi wejściowymi węzła, a są wagami związanymi z oczekiwanymi zmiennymi. Funkcja f, zwana funkcją aktywacji, jest zwykle parametryzowana na dwa sposoby[15]: a) parametry są silnie powiązane z danymi wejściowymi, a f jest funkcją sigmoidalną (naj- częściej tanh) potencjału v - liniowej kombinacji zmiennych i ich odpowiednich wag zsumowanych z progiem aktywacji zwanym „bias”, reprezentowanym przez stałą : (2) b) parametry są bezpośrednio związane z funkcją aktywacji. Typowym przykładem jest uży- cie radialnej funkcji bazowej jako funkcji aktywacji neutronu (np. Gaussianu): (3) gdzie jest centralnym wektorem neuronu. Zwykle sieci oparte na radialnych funkcjach ba- zowych składają się z maksymalnie 3 warstw (wejściowa, wyjściowa i jedna warstwa ukryta), tak że odpowiedź całej sieci można zdefiniować jako: (4) gdzie jest wagą przypisaną do wyjścia i-tego neuronu w warstwie ukrytej. • Regresja logistyczna - gdy zmienna celu przyjmuje postać binarną lub dychotomiczną (np. „AKCEPTUJ”/”ODMÓW”), najczęściej stosowanym typem regresji jest regresja logistycz- na. W przypadku tego algorytmu zmienne niezależne mogą być zarówno jakościowe, jak i ilościowe. Model logistyczny opiera się na liniowej zależności między zmiennymi predyk- cyjnymi ( a logarytmem szans (zmienna celu Y=1): (5) gdzie są parametrami modelu. Prawdopodobieństwo sukcesu można wyprowadzić z powyższego równania i zdefiniować jako: (6)

RkJQdWJsaXNoZXIy NTcxNzA3