TEORIE E TECNICHE DEI TEST B BONFIGLIO 40-49
|
|
Title of test:
![]() TEORIE E TECNICHE DEI TEST B BONFIGLIO 40-49 Description: TEORIE E TECNICHE DEI TEST B BONFIGLIO 40-49 |



| New Comment |
|---|
NO RECORDS |
|
Qual è l’ipotesi teorica alla base dello scaling centrato sugli stimoli secondo Thurstone?. Ogni stimolo ha un valore latente normalmente distribuito nella popolazione. Il valore di uno stimolo dipende esclusivamente dalla sua intensità emotiva. Gli stimoli vengono misurati in base alla frequenza con cui sono presentati. Ogni persona percepisce gli stimoli con la stessa soglia di gravità. Perché il metodo dei confronti a coppie può diventare problematico con un numero elevato di stimoli?. Non è possibile rappresentare graficamente più di 20 stimoli su una scala. Il numero di confronti cresce in modo combinatorio, richiedendo troppo tempo e attenzione. I partecipanti tendono sempre a scegliere la prima opzione presentata. Il metodo non può essere applicato a stimoli verbali o visivi. In che modo il NASA-TLX rappresenta un’evoluzione del metodo dei confronti a coppie?. È basato su una metrica oggettiva esterna e non soggettiva. Combina valutazioni soggettive dirette e confronti a coppie per stimare il carico mentale. Permette di evitare completamente i confronti tra stimoli. Utilizza esclusivamente confronti a coppie tra compiti fisici. Perché la trasformazione logit p/(1-p) è cruciale nel modello di Rasch?. Perché facilita la costruzione di item con più opzioni di risposta corretta. Perché permette di convertire probabilità in una scala continua e illimitata. Perché consente di rappresentare la difficoltà degli item tramite medie campionarie. Perché rende confrontabili i risultati tra test con diversa numerosità di item. Nel modello di Rasch, che cosa implica il principio di sufficienza in riferimento alla stima dell’abilità?. Il punteggio grezzo totale è un indicatore statisticamente sufficiente dell’abilità. È necessario analizzare la sequenza esatta delle risposte dell’individuo. Si richiede la conoscenza della difficoltà media degli item somministrati. La stima dell’abilità dipende dal pattern congiunto di risposte corrette ed errate. Quale tra le seguenti affermazioni rappresenta un criterio distintivo del modello di Rasch rispetto ad altri modelli IRT a più parametri?. Presume che ogni item abbia lo stesso potere discriminante. Utilizza una funzione gaussiana per modellare la probabilità di risposta. Permette di modellare la discriminatività specifica di ogni item. Include parametri di guessing per ciascun item. Quale interpretazione psicometrica è corretta osservando una probabilità di risposta pari a 0.5 nel modello di Rasch?. L’item ha una difficoltà moderata indipendentemente dal soggetto. L’abilità del soggetto è uguale alla difficoltà dell’item. La risposta corretta è dovuta al caso. Il soggetto ha il 50% di abilità richiesta dal test. Secondo la formula logistica del modello di Rasch, cosa accade alla probabilità di risposta corretta quando θ – β aumenta?. La probabilità diventa negativa. La probabilità tende ad avvicinarsi a 1. La probabilità diminuisce linearmente. La probabilità rimane stabile a 0.5. Nel modello di Rasch, quale tra le seguenti combinazioni di abilità e difficoltà darà la probabilità di risposta corretta più alta?. θ = +2, β = –1. θ = –2, β = –1. θ = 0, β = +2. θ = –2, β = +2. Qual è il significato psicometrico dell’intervallo di confidenza costruito attorno a un punteggio osservato?. Rappresenta l’intervallo entro cui si stima cada il punteggio vero con un dato livello di confidenza. Specifica l’intervallo tra punteggio osservato e media campionaria. Serve solo per confronti tra gruppi e non tra individui. Indica il margine massimo di errore assoluto nei punteggi osservati. Quale tra le seguenti affermazioni descrive correttamente l’errore standard di misurazione (SEM)?. Il SEM misura l’errore assoluto del singolo individuo. Il SEM è calcolato dividendo la deviazione standard per la media del campione. Il SEM rappresenta la deviazione standard degli errori di misurazione nei punteggi osservati. Il SEM aumenta all’aumentare dell’attendibilità. In che modo l’attendibilità di un test influenza la stima del punteggio vero secondo la teoria classica dei test?. Maggiore è l’attendibilità, più precisa sarà la stima del punteggio vero. L’attendibilità si applica solo ai test con punteggi standardizzati. L’attendibilità non influenza direttamente la stima del punteggio vero. Più alta è l’attendibilità, maggiore è l’errore standard di misurazione. Perché non è sufficiente osservare una differenza tra due punteggi per concludere che il cambiamento sia reale?. Perché bisogna verificare se la differenza supera la soglia statistica di significatività. Perché i test non possono essere ripetuti sullo stesso soggetto. Perché le medie di gruppo sono più informative dei singoli punteggi. Perché i punteggi devono sempre essere standardizzati prima. Quando si confrontano due punteggi della stessa persona nel tempo, quale fattore va considerato per il calcolo dell’errore standard della differenza?. L’attendibilità test-retest del test. La media dei punteggi osservati. Il numero totale di item nel test. La varianza spiegata del campione. Cosa esprime il valore ottenuto tramite il Reliable Change Index (RCI)?. Il grado di correlazione tra i due punteggi. La significatività statistica del cambiamento tra due misurazioni. La variazione assoluta tra punteggi osservati. La probabilità che il cambiamento sia clinicamente rilevante. Perché in un campionamento per strati è importante rispettare la distribuzione reale della popolazione?. Per evitare distorsioni sistematiche nella stima dei punteggi medi. Per escludere i soggetti ai margini della distribuzione. Per garantire l’omogeneità interna del test. Per ridurre l’errore standard dei punteggi individuali. Quale fattore rende inaffidabile un campione costituito solo da studenti universitari di psicologia?. È un campione selezionato, non rappresentativo della popolazione generale. I punteggi di questi studenti tendono a seguire una distribuzione normale. Il numero di soggetti è generalmente troppo basso. Gli studenti universitari non hanno familiarità con i test psicologici. Perché la raccolta dati tramite piattaforme online può compromettere la validità delle norme psicometriche?. Perché elimina il margine di errore nelle stime. Perché produce campioni auto-selezionati, non rappresentativi della popolazione. Perché impedisce il controllo della varianza della popolazione. Perché limita la numerosità campionaria disponibile. Qual è il rischio principale della trasformazione in punteggi Z quando la distribuzione dei punteggi grezzi è asimmetrica?. Impedire la comparabilità tra soggetti. Sovrastimare la curtosi della distribuzione. Attribuire significati fuorvianti a punteggi che non riflettono una distribuzione normale. Perdere l’informazione sulla media campionaria. Quando è preferibile utilizzare la trasformazione in percentili piuttosto che la standardizzazione in Z?. Quando si vogliono confrontare solo le medie tra gruppi. Quando la distribuzione dei punteggi è significativamente non normale. Quando i punteggi hanno una varianza molto bassa. Quando il numero di soggetti è superiore a 1000. Che cos’è l’equating dei test e perché è utile?. Una procedura per rendere comparabili i punteggi ottenuti da test diversi ma concettualmente equivalenti. Un processo per selezionare item con caratteristiche psicometriche simili. Un metodo per trasformare punteggi Z in punteggi T. Una tecnica per normalizzare la distribuzione dei punteggi in piccoli campioni. Quale trasformazione è più indicata quando i punteggi non seguono una distribuzione normale?. Trasformazione in percentili. Normalizzazione tramite stainine. Trasformazione in T-score. Standardizzazione in z-score. Perché il test di Kolmogorov-Smirnov può risultare utile nella costruzione delle norme?. Permette di valutare l’aderenza dei punteggi alla distribuzione normale. Misura l’omogeneità interna degli item. Serve per calcolare i coefficienti di attendibilità. Identifica la validità convergente del test. Qual è lo scopo principale dell’analisi del Differential Item Functioning (DIF)?. Verificare se alcuni item favoriscono sistematicamente un gruppo rispetto a un altro a parità di abilità. Calcolare la difficoltà media dei soggetti per ciascun gruppo. Individuare gli item con bassa attendibilità. Stabilire le bande percentile ottimali. Quale caratteristica dell’analisi fattoriale condotta sul RTS-A supporta la validità di costrutto?. La correlazione con l’età anagrafica. La significatività delle differenze tra gruppi clinici. La presenza di una struttura unifattoriale coerente con il modello teorico. L’uso di una scala Likert a 5 punti. Perché l'uso delle stanine è stato ritenuto appropriato per alcuni sottogruppi del campione del RTS-A?. Perché il numero di soggetti era inferiore a 50. Perché il test era costruito su scala dicotomica. Perché i punteggi T erano troppo alti. A causa della leggera asimmetria positiva osservata in quei sottogruppi. Quale tipo di validità è stato sostenuto attraverso le correlazioni con CDI e STAIC-trait nel manuale del RTS-A?. Validità di contenuto. Validità di criterio (convergente). Validità predittiva. Validità discriminante. Quale tecnica è stata utilizzata per stimare la stabilità temporale del RTS-A?. Correlazione test-retest su un sottocampione a tre settimane. Analisi della varianza tra gruppi. Confronto tra medie pre-post. Analisi della consistenza interna. |





