Transformacja sztucznej inteligencji dzięki mocy sieci wytwórczych

- Nauka - 3 listopada, 2025
Transformacja sztucznej inteligencji dzięki mocy sieci wytwórczych
Transformacja sztucznej inteligencji dzięki mocy sieci wytwórczych

Ewolucja technik uczenia maszynowego stale przesuwa granice możliwości sztucznej inteligencji. W przełomowym badaniu naukowcy profesor Johan du Preez i dr Emile-Reyn Engelbrecht z Uniwersytetu Stellenbosch wypełnili lukę koncepcyjną między dwoma znaczącymi obszarami uczenia maszynowego: uczeniem się częściowo nadzorowanym (SSL) i generatywnym rozpoznawaniem zbioru otwartego (OSR). Ich odkrycia, opublikowane w czasopiśmie Scientific African, ujawniają głęboki związek wynikający z wykorzystania generatywnych sieci kontradyktoryjnych (GAN), które mogą prowadzić do bardziej opłacalnych i skutecznych modeli uczenia maszynowego.

U podstaw ich badań leży innowacyjne wykorzystanie GAN – dynamicznego narzędzia, które tradycyjnie porównuje ze sobą dwie sieci neuronowe: jedną do generowania danych, drugą do ich oceny. W badaniu zbadano, w jaki sposób sieci te można wykorzystać nie tylko do protokołu SSL, w przypadku którego etykietowana jest tylko część danych, ale także do OSR, co wymaga identyfikacji nowych, wcześniej niewidzianych kategorii na etapie testowania.

Badacze postawili hipotezę, że kluczem do powiązania SSL i OSR jest generowanie, jak to nazywają, „źle wyglądających” próbek – punktów danych, które są celowo spreparowane tak, aby były niejednoznaczne lub wprowadzające w błąd. Próbki te wypełniają „przestrzeń uzupełniającą”, obszar pojęciowy w widmie danych, który leży pomiędzy znanymi kategoriami. Ucząc klasyfikatory za pomocą tych próbek, modele mogą nie tylko rozpoznawać, ale także odpowiednio kategoryzować nowe dane wejściowe, w zakresie których nie zostały bezpośrednio przeszkolone.

Dr Engelbrecht wyjaśnia: „Rozszerzając naszą wiedzę na temat przestrzeni komplementarnej w SSL na OSR, odkryliśmy, że nasze modele mogą skutecznie uogólniać tę otwartą przestrzeń, znacznie zwiększając ich zdolność do radzenia sobie z nieoczekiwanymi danymi”. To odkrycie ma kluczowe znaczenie w zastosowaniach, w których często spotyka się nieznane, na przykład w zautomatyzowanych narzędziach diagnostycznych i technologii samochodów autonomicznych, gdzie błędna klasyfikacja może mieć poważne, jeśli nie śmiertelne, konsekwencje.

W badaniu przeprowadzono obszerne porównania między podstawowymi sieciami SSL-GAN i najnowocześniejszymi sieciami OSR-GAN w identycznych warunkach eksperymentalnych. Wyniki były uderzająco podobne, co potwierdziło teorię badaczy, że podstawowe mechanizmy rządzące zarówno SSL, jak i OSR są ze sobą powiązane poprzez traktowanie przez nie przestrzeni komplementarnej.

Kontynuując ten kierunek badań, zespół eksperymentował z różnymi modelami sieci GAN, aby określić, które konfiguracje zapewniają optymalną wydajność w scenariuszach SSL-OSR. Wśród testowanych modeli wyróżniały się Margin-GAN, zapewniające doskonałe wyniki dzięki wyrafinowanemu podejściu do definiowania i wykorzystywania uzupełniającej się przestrzeni.

Konsekwencje tych badań są ogromne i sugerują, że zintegrowana struktura SSL-OSR nie tylko upraszcza proces szkolenia, ale także zwiększa funkcjonalność systemów uczenia maszynowego, czyniąc je bardziej elastycznymi i wydajnymi w rzeczywistych zastosowaniach. Ponieważ dziedzina sztucznej inteligencji stale ewoluuje, badania takie torują drogę dla solidniejszych, wszechstronnych systemów, które będą w stanie poradzić sobie ze złożonością i nieprzewidywalnością danych ze świata rzeczywistego.

Odniesienie do czasopisma

Engelbrecht, E.-R. i du Preez, JA „O związku między generatywnym uczeniem się częściowo nadzorowanym a generatywnym rozpoznawaniem zbioru otwartego”. Naukowy Afrykanin, 2023. DOI: https://doi.org/10.1016/j.sciaf.2023.e01903

O Autorach

Ésmile Émim jest pracownikiem naukowym na Wydziale Inżynierii Elektronicznej Uniwersytetu Stellenbosch. Jest głównym i korespondentem autorem najnowszych badań wprowadzających Uczenie się na podstawie otwartego zestawu z rozszerzoną kategorią poprzez wykorzystanie danych nieoznaczonych (Open-LACU)w którym zaproponowano ujednolicone ramy uczenia maszynowego łączące uczenie się częściowo nadzorowane, rozpoznawanie zbiorów otwartych i wykrywanie nowości za pośrednictwem generatywnych sieci kontradyktoryjnych. Jest także współautorem pracy badającej związek między uczeniem się częściowo nadzorowanym za pomocą sieci GAN a rozpoznawaniem zbioru otwartego (SSL‑OSR), wykazując podstawowe powiązania między tymi metodami.

Profesor Johan A. du Preez jest wybitną postacią na Wydziale Inżynierii Elektrycznej i Elektronicznej Uniwersytetu Stellenbosch, specjalizującą się w badaniach nad uczeniem maszynowym, systemami probabilistycznymi oraz przetwarzaniem mowy i obrazu. Do jego godnych uwagi prac należą projekty dotyczące wykrywania mówcy i weryfikacji pisma ręcznego. Był członkiem-założycielem Centrum Języka i Technologii Mowy Stellenboscha (SU’CLaST). Jest także powiązany z grupą Vision and Learning, której wkład obejmuje technologie przetwarzania mowy, obrazu i sygnałów.

źródło

0 0 głosów
Article Rating
Subskrybuj
Powiadom o
guest
0 komentarzy
najstarszy
najnowszy oceniany
Inline Feedbacks
Wszystkie
Follow by Email
LinkedIn
Share
Copy link
Adres URL został pomyślnie skopiowany!
0
Would love your thoughts, please comment.x