Mówi: | Wai Keen Vong |
Firma: | Centrum Analityki Danych, Uniwersytet Nowojorski |
Sztuczna inteligencja coraz bliższa ludzkiemu sposobowi przyswajania wiedzy. Naukowcy opracowali model, który uczy się języka tak jak dzieci
Naukowcy z Uniwersytetu Nowojorskiego opracowali model uczenia maszynowego, który naśladuje sposób, w jaki dzieci uczą się języka. Wykorzystując nagrania wideo i audio rejestrowane z perspektywy małego dziecka, model z powodzeniem nauczył się dopasowywać słowa do odpowiadających im obrazów. Wysoka, dwukrotnie większa niż w przypadku dużo większych modeli skuteczność pozwala przypuszczać, że jesteśmy bliscy zrozumienia tego, w jaki sposób dzieci zaczynają rozumieć język i go używać. Dotychczas poruszaliśmy się w obszarze niepotwierdzonych, a jedynie uprawdopodobnionych teorii.
– Jest wiele różnych teorii na temat tego, jak dzieci przyswajają język. Z jednej strony mamy teorię naturalnego przyswajania języka – wielu badaczy twierdzi, że dzieci rodzą się ze specjalnymi elementami czy wiedzą wbudowaną w mózg, która w wyjątkowy sposób pozwala nam uczyć się języka. Z drugiej strony mamy teorię bazującą na wychowaniu, zgodnie z którą dzieci uczą się języka głównie na podstawie doświadczeń zmysłowych. Nie chodzi tu o zdolności wrodzone, ale doświadczenia zdobywane codziennie, które pozwalają nam przyswajać na przykład język angielski – wyjaśnia w rozmowie z agencją Newseria Innowacje Wai Keen Vong z Centrum Analityki Danych Uniwersytetu Nowojorskiego.
W swojej pracy naukowcy oparli się w przeważającej części na drugiej z wymienionych teorii. Opracowując model, chcieli jednocześnie głębiej zrozumieć proces wczesnego przyswajania języka.
Zbiór danych będących bazą do pracy zebrano za pomocą kamery montowanej na głowie i noszonej przez jedno dziecko. Rejestrowała ona nagrania wideo i audio, towarzysząc dziecku w okresie pomiędzy 6. a 25. miesiącem życia. Zbiór danych obejmował 600 tys. klatek wideo w połączeniu i 37,5 tys. transkrybowanych wypowiedzi. Kluczowe było to, by badanie nie odbywało się w warunkach laboratoryjnych, lecz jak najbliższych naturalnemu środowisku.
– To największy model tego rodzaju, jaki dotychczas powstał. Istnieją już zbiory danych zawierające nagrania ludzi mówiących do swoich dzieci, ale żaden z nich nie obejmował tak długiego okresu i nie zawierał materiałów wideo przedstawiających to, co dziecko widzi w danym momencie. Nasze dane dają wyjątkową perspektywę na kwestię przyswajania języka. Ponadto połączyliśmy te dane z multimodalną siecią neuronową. Model jest dość ogólny w zakresie sposobu uczenia się. Przesyła się dane i proste aktualizacje reguł, na podstawie których przebiega uczenie się. Fakt, że uczenie się zachodzi, dostarcza nowego spojrzenia na wczesne przyswajanie języka, jest ono inne od wcześniejszego podejścia w tej kwestii. Dużo większy nacisk jest położony na uczenie się i na to, co można dzięki niemu osiągnąć – podkreśla Wai Keen Vong.
Wydajność modelu została oceniona na podstawie kategoryzacji polegającej na przypisywaniu słów do odpowiadających im wizualizacji. Dokładność klasyfikacji wyniosła 61,6 proc. Dla porównania przeprowadzono testy na kontrastowej sieci neuronowej obrazu i tekstu CLIP, wyszkolonej na dużo większym zasobie danych. W tym przypadku dokładność klasyfikacji wyniosła zaledwie 34,7 proc.
– Po raz pierwszy potwierdzono, że nasz model może się uczyć tych słów na podstawie rzeczywistych doświadczeń dzieci. Ta możliwość uczenia się potwierdza słuszność koncepcji, że może być to jeden ze sposobów przyswajania tego rodzaju pojęć przez dzieci. Nie możemy stwierdzić tego kategorycznie, ale jest to bardzo sugestywny i interesujący kierunek dalszych badań – zapowiada badacz.
Według Precedence Research światowy rynek uczenia maszynowego przekroczył w 2022 roku 38 mld dol. przychodów. Do 2032 roku jego wielkość urośnie do ponad 771 mld dol.
Czytaj także
- 2025-03-05: Sztuczna inteligencja usprawni załatwianie spraw urzędowych. Polski model językowy PLLuM zadebiutuje w mObywatelu
- 2025-03-03: Unia Europejska spóźniona w wyścigu AI. Eksperci apelują o szybsze inwestycje i zaprzestanie regulacji
- 2025-03-13: Inwestycje w sztuczną inteligencję na bardzo niskim poziomie. Potencjał polskich kadr nie jest wykorzystywany
- 2025-02-13: Europa zapowiada ogromne inwestycje w sztuczną inteligencję. UE i USA mają wspólne interesy w obszarze AI
- 2025-02-07: Rola telekomów w upowszechnianiu sztucznej inteligencji rośnie. T-Mobile udostępnia klientom zaawansowaną wyszukiwarkę Perplexity Pro
- 2025-02-12: Młodzi naukowcy przez niskie płace odchodzą z uczelni. To duże zagrożenie dla rozwoju polskiej gospodarki i technologii
- 2025-01-31: Sztuczna inteligencja pomoże we wczesnym wykrywaniu wrodzonych wad serca. Obecnie rozpoznawalność wynosi 40 proc.
- 2025-02-05: Sztuczna inteligencja dużym wsparciem w diagnostyce. Może być szczególnie cenna w chorobach rzadkich
- 2024-12-30: Ludzie przestają ufać treściom publikowanym w internecie. Rośnie także potrzeba bycia offline
- 2024-12-18: Inżynierowie z Warszawy pracują nad innowacjami dla całej Grupy Orange. Ich specjalności to AI i cyberbezpieczeństwo
Transmisje online
Kalendarium
Więcej ważnych informacji
Jedynka Newserii

Jedynka Newserii

Ochrona środowiska

Obowiązki w zakresie zrównoważonego rozwoju staną się mniej uciążliwe. Będą dotyczyć tylko największych firm
Na pierwszy ogień deregulacji w Unii Europejskiej poszły przepisy dotyczące sprawozdawczości zrównoważonego rozwoju. Obowiązki w tym zakresie będą, zgodnie z planem KE, się koncentrowały na największych podmiotach, co stanowi duże ułatwienie dla średnich podmiotów i małych firm w łańcuchach dostaw, ale też może zmienić proces dochodzenia do neutralności klimatycznej w UE. Raportowanie wpływu na środowisko rzeczywiście wiąże się z dużym wysiłkiem i kosztami, czego firmy się obawiają, ale z drugiej strony coraz więcej podmiotów widzi w tym cenne narzędzie do analizy i dodatkową wartość.
Telekomunikacja
Wykluczenie cyfrowe szczególnie dotyka generacji silver. T-Mobile wystartował z darmowymi kursami z obsługi smartfona

44 proc. Polaków w 2023 roku posiadało przynajmniej podstawowe kompetencje cyfrowe przy średniej unijnej na poziomie 56 proc. – wynika z danych Eurostatu. Dla grupy osób powyżej 55. roku życia odsetek ten wynosi kilkanaście procent. T-Mobile – w ramach projektu „Sieć Pokoleń” – burzy cyfrowe bariery oraz pokazuje, jakie możliwości daje technologia. W tym prowadzi cykl warsztatów stacjonarnych oraz udostępnia kurs online z podstaw obsługi smartfona.
Konsument
Spada spożycie alkoholu wśród młodzieży. Coraz mniej nastolatków wskazuje na jego łatwą dostępność

Alkohol jest najbardziej rozpowszechnioną wśród polskiej młodzieży substancją psychoaktywną, choć jego spożycie przez nastolatków znacznie spadło w ciągu trzech ostatnich dekad. Wciąż spory odsetek 15–16-latków uważa, że alkohol jest dla nich łatwo dostępny, ale o ile w przypadku piwa spadek w tym obszarze jest znaczący, o tyle w przypadku wódki delikatny trend spadkowy został w ostatnim badaniu zahamowany. Dostępność zaczyna się jednak nie w sklepie, ale już w domu. Co piąty rodzic jest w tej kwestii na tyle liberalny, że godzi się na spożywanie alkoholu przez dziecko w swojej obecności.
Partner serwisu
Szkolenia

Akademia Newserii
Akademia Newserii to projekt, w ramach którego najlepsi polscy dziennikarze biznesowi, giełdowi oraz lifestylowi, a także szkoleniowcy z wieloletnim doświadczeniem dzielą się swoją wiedzą nt. pracy z mediami.