Materiały konferencyjne SEP 2021

6 • Maszyna wektorów nośnych (ang. support vector mechanism –SVM) - klasyfikator binarny oparty na idei wyznaczania p-1 wymiarowej hiperpłaszczyzny, która może rozdzielić zbiór p-wymiarowych punktów danych na dwie klasy. Optymalna hiperpłaszczyzna to taka, która maksymalizuje odległość między dwiema klasami. W celu wydajnego rozwiązywania pro- blemów opartych na obszernych zestawach danych wykorzystywana jest specjalna, skalo- walna liniowo wersja algorytmu SVN – tzn. liniowa SVM (LSVM). • Algorytmy sieci bayesowskich — sieć bayesowska to model składający się ze skierowanego grafu acyklicznego i tablicy prawdopodobieństwa warunkowego dla każdego węzła reprezentującego zmienną. Łączny rozkład prawdopodobieństwa dla zmiennych można obliczyć jako iloczyn prawdopodobieństw warunkowych dla wszystkich węzłów, biorąc pod uwagę wartości pochodzących od rodziców danego węzła. • Algorytm k najbliższych sąsiadów (ang. k-nearest neighbors, KNN) - nieparametryczna klasyfikacja przypadków na podstawie podobieństwa do innych przypadków w zbiorze danych. Gdy brany jest pod uwagę kolejny nowy przypadek, obliczana jest jego odległość od każdego z pozostałych przypadków w modelu, a obiekt ten przypisuje się do klasy najczęściej występującej wśród jego najbliższych sąsiadów. 4. METODOLOGIA BADAŃ Głównym celem badawczym referatu jest stworzenie, dobór i weryfikacja skuteczności algoryt- mów klasyfikacji dla zadania identyfikacji przyszłych odchyleń w realizacji rocznego budżetu projektów inwestycyjnych na etapie śródrocznej aktualizacji planu inwestycji rzeczowych w przedsiębiorstwie branży wydobywczej. Informacja taka może wspierać właścicieli portfeli w podejmowaniu decyzji dotyczących m.in . optymalnego zagospodarowania niewykorzystanych środków w bieżącym roku oraz ustalania zapotrzebowania i limitów na nakłady w kolejnym roku budżetowym. Wcześniejsze badania nad skutecznością algorytmów [16] odnoszące się do pla- nów w perspektywie rocznej (tzw. budżetu bazowego), wykazały skuteczność najlepszych mode- li predykcyjnych na poziomie ok. 81%. Badanie przedstawione w tym referacie, ma na celu we- ryfikację skuteczności modeli opartych o te same algorytmy na etapie półrocznej aktualizacji pla- nów inwestycyjnych, a także stworzenie i ocenę skuteczności nowych modeli, opartych jedynie o predyktory o największej ważności, przy jednoczesnej redukcji pakietów danych wejściowych, z których wyłączono przypadki projektów, dla których zaplanowany budżet do dalszej realizacji w bieżącym roku kalendarzowym jest równy zero. Badanie przeprowadzono na podstawie projektów inwestycyjnych realizowanych w KGHM Pol- ska Miedź S.A. w 2020 roku. Predykcja opiera się na szeregu parametrów charakteryzujących projekty zgodnie ze standardem zarządzania portfelami projektów funkcjonującym w przedsię- biorstwie. W badaniu wykorzystano następujące parametry główne projektów i parametry dodat- kowe, które pełnią rolę predyktorów : 1) Category : kategoria projektu określająca jego wpływ na produkcję – zmienna jakościowa; 2) Label : etykieta projektu klasyfikująca przeznaczenie jego produktów - zmienna jakościowa; 3) Business_area : obszar biznesowy związany z projektem - zmienna jakościowa; 4) P_portfolio : portfel projektów – zmienna jakościowa; 5) Priority : priorytet projektu w portfelu – zmienna jakościowa; 6) Est_class : klasa oszacowania budżetu - zmienna jakościowa;

RkJQdWJsaXNoZXIy NTcxNzA3