option
Questions
ayuda
daypo
search.php
ERASED TEST, YOU MAY BE INTERESTED ON Lingwistyka Koreańsko-Czeczeńska
COMMENTS STATISTICS RECORDS
TAKE THE TEST
Title of test:
Lingwistyka Koreańsko-Czeczeńska

Description:
Pingwiny i inne ssaki

Author:
Kominiarz
Other tests from this author

Creation Date:
20/01/2024

Category: Others

Number of questions: 48
Share the Test:
New CommentNuevo Comentario
No comments about this test.
Content:
Podany jest następujący zestaw danych: a b x 5 6 y 2 2 z 1 0 Wybierz jedną lub więcej: Przyjmując odległość euklidesową (euclidean distance) jako miarę podobieństwa, para (x, y) wynosi …??? Odległość euklidesowa (euclidean distance) między x i y wynosi 6.15 Odległość euklidesowa (euclidean distance) między x i y wynosi 25.
Czyszczenie danych (data cleaning) to ogólne pojęcie opisujące jeden z możliwych kroków wykonywanych podczas wstępnego przetwarzania danych. Którą z wymienionych poniżej metod można zastosować do czyszczenia danych (data cleaning)? Wybierz jedną lub więcej: wykrywanie wartości odstających (detection of outliers) inżynieria cech (feature engineering) zastępowanie brakujących wartości (replacing missing values) grupowanie (binning).
Wybierz odpowiedzi, które prawidłowo opisują proces walidacji typu „pomiń jeden element” (leave-one-out) dla n-elementowego zbioru danych. Wybierz jedną lub więcej: Podczas całego procesu uczenia klasyfikator jest szkolony n razy Podczas całego procesu treningowego w każdej iteracji zestaw TRENINGOWY ma wielkość 0.7 * n, a zestaw TESTOWY ma rozmiar 0.3 * n Podczas całego procesu uczenia klasyfikator jest szkolony k razy. K jest parametrem treningowym i najczęściej jego wartość jest ustawiona na 10 Podczas całego procesu treningowego w każdej iteracji zestaw TRENINGOWY ma rozmiar n-1, a zestaw TESTOWY ma rozmiar 1.
Dla klasyfikatora podane są następujące wyniki: TP = 60 TN = 10 FP = 50 FN = 20 Wybierz poprawne odpowiedzi: Wybierz jedną lub więcej: Dokładność (accuracy) klasyfikatora wynosi 0.5 Specyficzność (specificity) wynosi 0.75 Dokładność (accuracy) klasyfikatora wynosi 0.7 Czułość (sensitivity) wynosi 0.75 specyficzność wynosi 0,16.
Dane są trzy wektory: A = {1 3 4 5 7} B = {0.2 0.1 0.05 0.02 0.01} C = {10 5 18 12 20} Wybierz poprawne stwierdzenia dotyczące współczynnika korelacji Pearsona: Wybierz jedną lub więcej: A i B są ujemnie (negatively) skorelowane Nie ma istotnej (no significant) korelacji między A i B A i B są dodatnio (positively) skorelowane A i C są ujemnie (negatively) skorelowane.
Wybierz poprawne stwierdzenie(a): Wybierz jedną lub więcej: Jeśli model ma niską wariancję (variance), oznacza to, że jest przetrenowany (overfitted) Jeśli model ma dużą wariancję (variance), oznacza to, że jest przetrenowany (overfitted) Jeśli model ma niski odchylenie (bias), oznacza to, że jest zbyt prosty i nie może prawidłowo klasyfikować nowych obiektów Jeśli model ma wysokie odchylenie (bias), oznacza to, że jest zbyt prosty i nie może poprawnie sklasyfikować nowych obiektów .
Wybierz poprawne stwierdzenie(a): Wybierz jedną lub więcej: Klasyfikacja jest stosowana, jeśli celem analizy danych jest przewidywanie wartości liczbowych SVM jest klasyfikatorem, którego można użyć, jeśli istnieje potrzeba dostarczenia wartości wyjaśnienia funkcji opisujących obiekty i icPróbkowanie warstwowe (stratified sampling) to metoda próbkowania, która zachowuje w wyjściowym zbiorze danych taki sam rozkład obiektów wśród klas, jak w wejściowym zbiorze danychh przypisanie do określonej klasy decyzyjnej Algorytmy klastrowania (clustering algorithm) to nienadzorowane algorytmy uczenia maszynowego SVM jest klasyfikatorem, którego można użyć, jeśli istnieje potrzeba dostarczenia wartości wyjaśnienia funkcji opisujących obiekty i ich przypisanie do określonej klasy decyzyjnej Klika to podgraf, którego wszystkie wierzchołki są ze sobą połączone n-klika to podgraf, w którym odległość pomiędzy każdą parą wierzchołków jest nie większe niż n.
Dwumodowa sieć społecznościowa (two-mode social network) to sieć, w której: Wybierz jedną lub więcej: węzły tego samego typu nie są ze sobą połączone linki łączą tylko węzły tego samego typu istnieją dwa rodzaje węzłów istnieją dwa rodzaje połączeń.
Współczynnik skupienia (clustering coefficient) węzła sieci społecznej: Wybierz jedną lub więcej: charakteryzuje prawidłowe odwzorowanie węzła na społeczność zależy od centralności wektora własnego (eigenvector) danego węzła charakteryzuje, jak silnie są ze sobą powiązani sąsiedzi danego węzła zależy od długości najkrótszych ścieżek rozpoczynających się w danym węźle.
Algorytm identyfikacji społeczności w sieci społecznościowej zaproponowany przez autorów Girvana-Newmana (algorytm dzielenia hierarchicznego): Wybierz jedną lub więcej: opiera się na centralności betweenness krawędziami opiera się na centralności betweenness węzłami w kolejnych iteracjach dzieli sieć na społeczności usuwając kolejne krawędzie jest zbyt złożony, aby analizować duże sieci (np. 1 000 000 węzłów).
Okrągła wizualizacja sieci społecznościowych: Wybierz jedną lub więcej: wykorzystuje fizyczny model interakcji (sprężyny-połączenia i węzły ładunków elektrycznych) do reprezentacji sieci rozmieszcza węzły promieniście według ich wartości centralności (węzeł o najwyższej wartości znajduje się w środku) umieszcza węzły w kółko, w którym narysowane są łącza.
Centralność closeness węzła sieci społecznej: Wybierz jedną lub więcej: zależy od długości najkrótszych ścieżek rozpoczynających się w danym węźle jest największa dla węzłów z jednym łączem zależy od liczby najkrótszych ścieżek rozpoczynających się w danym węźle zależy od liczby połączeń węzłowych miara globalna Określa odległość danego węzła od wszystkich węzłów w sieci miara lokalna.
Współczynnik modułowości: Wybierz jedną lub więcej: jest parametrem metody wizualizacji sieci kołowej określa centralność węzła w sieci można być zmaksymalizowany w algorytmie identyfikacji społeczności pozwala ocenić jakość podziału sieci na społeczności.
Proszę wskazać jakie parametry z wymienionych poniżej należy podać dla algorytmu grupowania k-średnich: Wybierz jedną lub więcej: parametr definiujący maksymalną liczbę iteracji wykonania algorytmu parametr definiujący liczbę grup.
Proszę wskazać poprawne zdania dotyczące sieci społecznych: Wybierz jedną lub więcej: rozkład stopni węzłów sieci społecznej jest rozkładem potęgowym w sieciach społecznych występuje zjawisko małego świata (ang. small world phenomenon) Dobór preferencyjny.
Liczbę sąsiadów węzła w sieci społecznej (węzłów, z którymi dany węzeł jest powiązany) określa: Wybierz jedną lub więcej: centralność degree.
Dla poniższej tablicy decyzyjnej zdefiniowano regułę decyzyjną IF aura=deszczowa and temperatura=umiarkowana THEN c=1: Wybierz jedną lub więcej: reguła wspiera 2 obiekty reguła rozpoznaje 3 obiekty.
Poniżej przedstawiono dwuwymiarowy zbiór danych podzielony na grupy (każda grupa wyróżniona jest innym znakiem graficznym): Wybierz jedną lub więcej: DBSCAN.
Przyjmując następujące oznaczenia: TP - wyniki prawdziwie pozytywne (true positive) TN - wyniki prawdziwie negatywne (true negative) FP - wyniki fałszywie pozytywne (false positive) FN - wyniki fałszywie negatywne (false negative): Wybierz jedną lub więcej: dokładność klasyfikacji obliczamy za pomocą wzoru (TP)/(TP+FP) dokładność klasyfikacji obliczamy za pomocą wzoru: (TP+TN)/(TP+TN+FP+FN) czułość obliczamy za pomocą wzoru: (TP)/(TP+FN) czułość obliczamy za pomocą wzoru: (FP)/(FP+TP).
Czyszczenie danych to ogólna nazwa na jeden z etapów przetwarzania wstępnego. Które z poniższych metod można wykorzystać na tym etapie? Wybierz jedną lub więcej: analiza brakujących wartości kubełkowanie.
Wybierz poprawne pary - algorytm indukcji drzewa decyzyjnego - metoda wyboru najlepszego atrybutu: Wybierz jedną lub więcej: ID3 - information gain C4.5 - gain ratio.
Dany jest zbiór atrybutów {a1, a2, a3} oraz zbiory wartości tych atrybutów: a1 = {czarny, niebieski, brązowy, zielony}, a2 = {niski, średni,wysoki} a3 = {156, 160, 180, 120} Wybierz jedną lub więcej: atrybut a1 jest atrybutem nominalnym atrybut a2 jest atrybutem porządkowym atrybut a3 jest atrybutem ilościowym atrybut a1 jest atrybutem porządkowym atrybut a2 jest atrybutem ilościowym atrybut a3 jest atrybutem nominalnym.
Proszę wskazać jakie parametry z wymienionych poniżej należy podać dla algorytmu grupowania DBSCAN: Wybierz jedną lub więcej: parametr definiujący promień analizowanego sąsiedztwa każdego obiektu danych parametr definiujący liczbę sąsiadów stanowiących o gęstości analizowanego sąsiedztwa.
Dana jest tablica decyzyjna zawierająca 40 obiektów, w której wyróżniono dwie klasy decyzyjne. Liczność pierwszej z nich wynosi 20 obiektów, a liczność drugiej z nich wynosi 20 obiektów. Ile wynosi entropia całego zbioru? Wybierz jedną lub więcej: 1 2 3 4.
Która z poniższych metod wizualizacji pozwala na wyróżnienie społeczności w sieci społecznej: Wybierz jedną lub więcej: spring-embedder multidimensional scaling.
Zdania prawdziwe odnośnie dwumodalnej sieci:: Wybierz jedną lub więcej: ma dwa rodzaje węzłów węzły jednego rodzaju nie są ze sobą połączone posiada tylko połączenia pomiędzy węzłami różnego rodzaju.
Dwie tablice decyzyjne T1 z decyzjami 40% / 60% i T2 z decyzjami 10% / 90%: Wybierz jedną lub więcej: entropia T1 jest większa od T2 entropia T1 jest zbliżona do 1 entropia T1 jest zbliżona do 0.
Co to jest centralność degree ? Wybierz jedną lub więcej: określa liczbę powiązań danego węzła miara lokalna węzła miara globalna odzwierciedla liczbę powiązań danego węzła.
Zdania dotyczące strumieniowej analizy danych: Wybierz jedną lub więcej: ograniczony czas na analizę ograniczona pojemność bufora danych dane nadchodzą szybko danych się nie przechowuje, tylko ich agreguje coś z ograniczonym dostępem, brak możliwości przeglądania starych danych.
Metoda wizualizacji sieci społecznych o nazwie Fruchterman-Reingold:: Wybierz jedną lub więcej: ułatwia analizę społeczności wykorzystuje fizyczny model oddziaływań (sprężyny-powiązania i ładunki-węzły) w celu przedstawienia sieci układa węzły hierarchicznie zgodnie z wartościami wybranej centralności układa węzły na okręgu, wewnątrz którego narysowane są powiązania.
Wartość miary entropii dla rzutu monetą wynosi: Wybierz jedną lub więcej: 1 2 3 4.
Pytanie o betweenness: Wybierz jedną lub więcej: określa liczbę najkrótszych ścieżek przechodzących przez dany węzeł jest wysoka dla węzła łączącego dwie społeczności jest niska dla węzła łączącego dwie społeczności miara globalna miara lokalna.
Dobór preferencyjna w sieciach społecznych polega na tym, że: Wybierz jedną lub więcej: bardziej prawdopodobne jest połączenie się nowego węzła w sieci z węzłami mającymi względnie dużo powiązań bardziej prawdopodobne jest połączenie się nowego węzłą w sieci z węzłami mającmi względnie mało powiązań prawdopodobieństwa połączenia się nowego węzła z każdym z pozostałych węzłów jest jednakowe nowy tryb w sieci z większym prawdopodobieństwem łączy się z węzłami o względnych połączeniach.
.Zaznacz poprawne odpowiedzi dotyczące różnych metod testowania jakości klasyfikatorów: Wybierz jedną lub więcej: w przypadku jeśli zbiór danych jest nieliczny, dobrą taktyką jest wykorzystanie całego zbioru danych zarówno na etapie uczenia klasyfikatora jak i testowania jego jakości gdyż dzięki temu klasyfikator dostanie więcej informacji o obiektach na etapie uczenia 10-krotna stratyfikowana walidacja krzyżowa to metoda oceny jakości klasyfikatora, która dzieli zbiór danych w taki sposób, że losowo 70% obiektów stanowi zbiór treningowy a 30% zbiór testowy, Procedura ta powtarzana jest 10 razy, a jakość klasyfikatora jest średnią z jakości klasyfikacji 10-ciu powtórzeń w przypadku jeśli zbiór danych jest nieliczny, lepiej będzie zastosować metodą leave-one-out niż 10-krotną walidację krzyżową.
Przetwarzanie strumieni danych charakteryzuje: Wybierz jedną lub więcej: wyznaczanie podziału danych na treningowe i testowe szybki napływ danych przechowywanie jedynie zagregowanych charakterystyk zamiast danych stosowanie liniowych lub sub-liniowych metod analizy.
Podejście typu prequential do oceny jakości modelu wyznaczonego dla danych strumieniowych polega m.in. na: Wybierz jedną lub więcej: testowaniu modelu na specjalnie wydzielonych danych testowych testowaniu modelu na nadchodzących danych, które w kolejnym kroku posłużą do uczenia tego modelu wyznaczaniu błędu modelu jako skumulowanej sumy wartości funkcji straty, której wartość wyznaczana jest dla kolejnych przykładów.
Dany jest zbiór wartości pewnego atrybutu a. Wartość minimalna w tym zbiorze wynosi 300, a maksymalna 2700. Jaki będzie wynik normalizacji min-max do zakresu 0-1 dla konkretnej wartości tego atrybutu równej 900: Wybierz jedną lub więcej: 0.75 0.25 0.6 0.5.
Proszę wskazać jakie parametry z wymienionych poniżej należy podać dla algorytmu grupowania k-średnich: Wybierz jedną lub więcej: parametr definiujący liczbę sąsiadów o gęstości analizowanego sąsiedztwa parametr definiujący promień analizowanego sąsiedztwa każdego obiektu danych parametr definiujący liczbę iteracji parametr definiujący liczbę grup.
Proszę wskazać co jest efektem działania algorytmu grupowania hierarchicznego scalającego: Wybierz jedną lub więcej: rozmyta macierz podziału dendrogram ostra macierz podziału.
Liczbę sąsiadów węzła w sieci społecznej (węzłów, z którymi dany węzeł jest powiązany) określa: Wybierz jedną lub więcej: stopień węzła współczynnik grupowania centralność closeness.
Społeczność w sieci społecznej to: Wybierz jedną lub więcej: grupa węzłów o podobnym stopniu grupa węzłów o większej liczbie powiązań między sobą niż resztą sieci grupa węzłów o podobnej wartości współczynnika grupowania.
Regresja liniowa y = ax + b to przykład regresji: Wybierz jedną lub więcej: parametrycznej półparametrycznej nieparametrycznej.
Warunkiem koniecznym funkcji jądra jest: Wybierz jedną lub więcej: ∫ 𝐾(𝑥)𝑑𝑥 = 1 𝑅 𝐾(0) = 1 ∀ 𝑥𝐾(𝑥) = 𝐾(− 𝑥) .
Zbiór danych składa się z 4 obiektów {o1,o2,o3,o4}opisanych atrybutem a i przypisanych do jednej z dwóch klas decyzyjnych (atrybut class). Entropia warunkowa (ważona) tego zbioru przykładów ze względu na podział zakresu wartości atrybutu a za pomocą wartości progowej równej 2.5: a class o1 | 4 + o2 | 3 - o3 | 2 + o4 | 1 - jest taka sama jak dla wartości progowej równej 2.75 przyjmuje wartość ujemną przyjmuje wartość równą 0.5 jest liczbą z przedziału obustronnie domkniętego [0;1].
Metoda dyskretyzacji według równej częstości: Wybierz jedną lub więcej: wymaga znajomości klas decyzyjnych przykładów wymaga podania parametru określającego liczbę wynikowych przedziałów jest bardziej oporna na wartości odstające niż metoda dyskretyzacji według równej szerokości zmienia wartość atrybutu numerycznego na wartości binarne.
Co to jest centralność eigenvector? Wybierz jedną lub więcej: Odzwierciedla liczbę powiązań danego węzła Proporcjonalna do sumy wartości centralności węzłów z którymi dany węzeł jest powiązany Miara globalna Określa liczbę powiązań danego węzła Miara lokalna.
Co to jest PageRank? Wybierz jedną lub więcej: Określa istotność węzła w sieci Dotyczy go problem cykli Wyznaczany jest za pomocą modelu losowego przemieszczania się po sieci Obliczane jest prawdopodobieństwo znalezienia się na wybranej stronie.
Optymalizacja modularity (Newman) Wybierz jedną, bądź więcej odpowiedzi: Wartość modularity opisuje jakość podziału na społeczności Algorytm bazuje na optymalizacji modularity Hierarchiczny algorytm scalający Dwie społeczności są łączone, jeżeli pozwoli to na maksymalne zwiększenie wartości modularity Dwie społeczności są łączone, jeżeli pozwoli to na minimalne zmniejszenie wartości modularity.
Report abuse