2011年自考“心理測量”各章復習重點


《心理測量》概念整理 $lesson$
1 智力水平 2 測量 3 心理測驗 4 標準化 5 反應定式 6 百分等級 7 百分點 8 掌握分數 9 復本信度 10 重測復本信度 11 評分者信度 12 效標關聯效度 13 預測效度 14 自陳量表 15 主體測驗 16 結構型會談 17 量表 18 顯示性測驗 19 預測性測驗 20 工作分析 21 主試誤差 22 導出分數 23 常模團體 24 常模總體 25 常模樣本 26 取樣 27 常模分數 28 發展常模 29 發展順序量表 30 年級當量 31 百分位常模 32 離差智商 33 內容參照分數 34 信度 35 重測信度 36 分半信度 37 內部一致性信度 38 效度 39 構思效度 40 內容效度 41 表面效度 42 效度指標 43 效度系數 44 項目分析 45 通過率 46 鑒別力指數 47 項目――總分相關 48 剪裁測驗 49 智力 50 能力傾向測驗
第1章 概論轉自環 球 網 校edu24ol.com
1、 中國古代心理測量簡述:
(1) 公元六世紀初,南朝人劉勰的著作《新論?專學》中提到了類似現代“分心測驗”的思想。
(2) 在中國古代,“七巧板”是很常見的一種兒童玩具,其實它可以作為創造力測量的工具。
(3) 中國古代心理測量的思想中包含著典型的東方文化特點:定性描述及帶有道德判斷色彩。
2、 中國近代心理測量的出現:
(1) 1916年,樊炳清先生首先介紹了比內-西蒙智力量表。
(2) 1920年,北京高等師范學校和南京師范學校建立了我國最早的兩個心理學實驗室,廖世承和陳鶴琴先生在南京高等師范學校開設心理測驗課。1921年,他倆正式出版《心理測驗法》一書。
(3)1922年夏天,中華教育改進社聘請美國教育心理測驗老師麥考爾來華講學。
(4)1924年,陸志韋先生發表了《訂正比內西蒙智力測驗說明書》,30年代又與吳天敏再次做了修訂。
(5)1931年由艾偉、陸志韋、陳鶴琴、蕭孝嶸等倡議,組織并成立了中國測驗學會。
(6)1932年《測驗》雜志創刊。
(7)至抗戰前夕,由我國心理學工作者制定或編制出的合乎標準的智力測驗和人格測驗約20種,教育測驗50多種。
3、 中國現代心理測量的發展:轉自環 球 網 校edu24ol.com
(1) 1936年,蘇聯在批判“兒童學”時擴大化,心理測驗也被一概禁止。
(2) 從1978年北京大學首建心理系開始,心理測驗才重新得到恢復。
(3) 1979年,林傳鼎、張厚等以國外資料為參考,編制了少年兒童學習能力測驗。
(4)1980年初,北師大心理系開設了心理測量課。1984年,在北京召開的第五屆全國心理學年會上,成立了心理測驗工作委員會,加強了測驗工作的指導和監督。
4、 科學心理測驗的產生:心理測驗的產生, 是出于實際需要。最初,人們用測驗,是因為要治療智力落后者和精神病病人。
(1) 法國的醫生艾斯奎羅第一個把智力落后與精神病分開。他認為,精神病以情緒障礙為標志,不一定伴隨智力落后,而智力落后則是以出生時或嬰兒期表現出來的智力缺陷為主要標志。
(2) 50多年后,法國的心理學家比內提出應該從正常學校學習的兒童中篩選出不適應的兒童,安排在特殊的班級里學習和教育。此舉動導致了心理測驗史上重大事件的發生――第一個智力測驗的誕生。
(3)實驗心理學的誕生是心理測驗產生的另一個重要原因。實驗心理學的誕生和發展,還給心理測量帶來了另一個副產品:嚴格的標準化程序。標準化是現代心理測驗的重要評價指標。
5、 西方早期的心理測驗嘗試:
(1) 弗蘭西斯?高爾頓是第一個倡導心理測驗的人。他于1884年在倫敦國際博覽會上專門設立了一個“人類測量實驗室”。他的這一舉動是心理測驗史上第一個大規模系統地測量個體差異的嘗試。
(2) 高爾頓還是使用評定量表和問卷法的先驅。并且他發展了分析個體差異資料的統計方法,不僅擴充了古特列特的百分位法,而且創造了粗淺的相關計算法。
(3) 美國心理學家卡特爾1980年發表《心理測驗與測量》一文于《心理》雜志上,這是在心理學文獻中首次出現“心理測驗”一詞。
6、 比內-西蒙量表的誕生及心理測驗的發展:
(1) 1904年比內為了鑒別弱智兒童,他與西蒙合作編制成了世界上第一個科學的智力測驗――比內-西蒙量表。1905年,他在《心理學年報》上發表了文章《診斷異常兒童的新方法》,介紹了該量表,歷史上稱為“1905量表”。從此,比內-西蒙量表宣告誕生。
(2) 比內-西蒙量表自1905年發表后,比內和西蒙親自主持過兩次修訂,一次在1908年,一次在1911年,此時比內已不幸去世。
(3)1905年量表主要強調的是判斷、理解和推理能力,也就是比內認為的智力的基本組成成分。1908年版的量表刪掉了1905年版中不合適的題目,增加了新題目,題目總數大59個。所有測驗題目按年齡分組,從3 ~ 13歲。測驗的結果用“智力水平”來表示。人們常叫它為“智力年齡” .它表示一個兒童能完成何種年齡水平的兒童所能完成的測驗。
(4)最有名的是1918年出版的美國斯坦福大學的推孟教授修訂的“斯坦福-比內量表”這一量表首次使用了“智力商數”的概念,簡稱為IQ,是心理年齡和實際年齡的比值。
(5)比較有名的幾個測驗。
1 智力測驗:推孟的研究生歐提斯編制的團體智力測驗,2 后在次基礎上發展出美國陸軍用甲、乙兩種測驗。有基于因素分析理論編制的測量多項能力的韋克斯勒的兒童智力量表。還有桑代克編制的標準化教育測驗。
2 人格測驗:1917年武德沃斯設計的“個人資料調查表”。1912年問世的羅夏克墨跡圖測驗(RIT)和于1943年首次出版,由哈撒韋和麥金利編制的目前影響最大的MMPI-明尼蘇達多相人格調查表。
7、 測量是:就是根據一定的法則用數字對事物加以確定。測量就是確定一個事物的屬性的量多少。因此,我們所指的測量,就是根據一定的法則,采用一定的操作程序,給事物確定出一種數量化的價值。
8、 測量的要素是:參照點和單位。
參照點:它可以分為兩種,一是絕對的零點;二是相對參照點。最理想的參照點是絕對零。心理測量中所用的參照點都是人為的,因而測量的結果常常不能以“倍數”來解釋。如IQ = 100的人IQ = 50的人的智力的兩倍。
9、 量表是:就是有參照點和單位的連續體。
10、 量表的種類有:量表是由人來制訂的,依單位和參照點的不同,量表的種類也不一樣。根據測量精度高低,斯蒂文斯將量表分為四個水平,由低到高分別為:命名量表、順序量表、等距量表和等比量表。
種類 定義 特點 備注
命名量表 只是用數字來代表事物或對事物進行分類。 命名量表中的數字沒有任何數值意義,不能作量化分析。無大小意義,只表明類別。 無參照點和單位。無法比較大小或進行任何數學方法運算。
順序量表 表明類別的大小或某種屬性的多少。 主要用于分等論級和分類。數字僅表示等級并不表示某種屬性的真正量或絕對值。 無參照點(沒有絕對零度)和單位。無法進行數學方法運算。
等距量表 存在大小關系。 無絕對零度,但存在相對零點。可以進行數學運算,有相等單位。
等比量表 是最精確的測量。大多是物理量表。而心理量表只能達到等距量表水平。 可以知道事物之間的某種特點上相差多少及它們之間的倍數關系。 有相等單位和絕對零點。可以進行數學運算。
11、 心理測量是:就是通過觀察人的少數有代表性的行為,對反映在人的行為活動中的心理特征,依確定的原則進行推論和量化分析的一種科學手段。
12、 著名的心理測驗學家安娜斯泰西認為:心理測驗實質上是行為樣本的客觀和標準化的測量“。
這一定義包含有至少三個基本要素:行為樣本、客觀測量和標準化。心理測驗要測量的是心理特征,但它要通過測量人的行為來實現,從行為測量中來推知心理特征。這就要找有代表性的少數行為作為全部行為的樣本。
13、 關于心理測量中的標準化:心理測量要做到客觀必須在測驗編制、實施、評分、解釋過程中減少主試和被試的隨意性程度。標準化的測量是測量客觀性的根本保證。
14、 心理測驗的性質:間接性、相對性、客觀性。
15、 心理測驗的種類:
(1) 按測驗的內容分:能力測驗(智力測驗、反應能力測驗);學績測驗,如成套的成就測驗;人格測驗如EPQ、MMPI等。
(2) 按測驗的對象特點分:個別測驗和團體測驗。
(3) 按測驗表現形式分:文字測驗(紙筆測驗)和非文字測驗。
(4) 按測驗的目的分:描述性測驗、診斷性測驗、預測性測驗。
(5) 按測驗的時間分:速度測驗和難度測驗。
(6) 按測驗要求分:有最高作為測驗和典型行為測驗。前者要求被試盡可能作出最好的回答,而且有正確的答案。能力測驗、學績測驗均屬此類。后者要求被試按照日常習慣回答,無正確答案,所有人格測驗均可稱為典型行為測驗。
16、 心理測驗的功能:
(1) 從實際應用角度看:選拔人才、崗位安置、診斷、評價、輔助咨詢。
(2) 從理論研究角度看:搜集資料、提出和驗證假設、實驗分組。
17、 正確的測驗觀:
(1) 測驗是重要的心理學研究方法之一,是決策的輔助工具。
(2) 心理測驗作為研究方法和測量工具尚不完善。心理測驗的最大問題是理論基礎不夠堅實。
(3) 科學地看待測驗,防止亂編濫用。
18、 錯誤的測驗觀:測驗萬能論、測驗無用論、文化公平測驗(只有相對的文化公平,沒有絕對的文化公平)、心理測驗即智力測驗。
第2章 心理測驗的編制
1、 心理測驗的目的是指:我們編測驗干什么用。
2、 測驗目的種類:
(1) 顯示性測驗是指:測驗題目和要測量的特征相似的測驗,比如成就測驗。
(2) 預測性測驗是:為了預測一些沒被測量的行為的測驗。
3、 心理測驗的目標是指:編制的測驗是測什么的,即測什么樣的心理特征或人格特點。
4、 目標分析依測驗不同可分為:
(1) 工作分析:對于預測或選拔用的測驗,主要任務就是對所預測行為活動做具體分析,即任務分析或工作分析。
(2) 對特定概念下定義:
(3) 確定測驗的具體內容。
5、 命題的基本原則:
(1) 試題要符合測驗的目的。
(2) 內容取樣要有代表性。
(3) 題目格式要不被人誤解。
(4) 語句要簡明扼要。既排除與答題無關的因素,又不能遺漏答題所依據的必要條件。避免使用生僻的字句或詞匯。
(5) 答案確定,不應引起爭議。(創造力測驗和人格測驗除外)。
(6)題目間內容相互獨立、互不牽連,對不同題目的回答不致相互影響。
(7)題目不能含有答題傾向的線索。
(8)題目內容不超出受測團體的知識水平和理解能力。
(9)比開社會敏感性問題,如涉及社會禁忌或個人隱私的題目不應使用。
(10)便于施測,評分簡捷。
6、 如測驗涉及社會敏感性問題時的策略:
(1) 命題時假定被試具有某種行為,使他不得不在確實沒有該行為時才否定,可避免否定答案過多的傾向。
(2) 假定規范不一致。
(3) 指出該行為是常見的,雖然是違規的。
7、 測驗題目的來源:已出版的標準測驗、理論和老師的經驗、臨床觀察和記錄。
8、 心理測驗題目的類型:根據對被試的要求不同來分,可有兩大類:提供型和選擇型的題目。前者求被試給出答案內容,如論文題、簡答題、填充題;選擇型題目要求被試在幾個有限的答案中選擇正確的答案,如是非題、匹配題(選擇題,由題干和選項構成)、填充題等。
9、 測驗題目在編排時所遵循的普遍原則是:測試同一因素的題目放在一起、同類型的測試題盡可能組合在一起、題目的難度排列宜逐步上升。
10、 測題的常見編排方式:并列-直進式、混合螺旋式。
第3章 測驗的實施、計分和誤差
1、 標準化是:測驗編制中遵循科學的理論和技術,測驗實施中要統一步驟和標準,結果解釋時也要統一標準。換句話說,不僅編制測驗時要嚴格選題、預試取樣、施測、建立常模、確定記分標準和解釋系統、有信度和效度驗證,而且測驗在實施測量時也要統一準和步驟,以控制無關因素對測驗目的和結果的影響。
2、 心理測驗的實施程序:預告測驗、準備測驗環境、準備測驗材料、熟悉測驗的具體步驟、熟悉測驗的指導語、具體實施。
3、 實施心理測驗的過程中的要素:主試(包括助手)、被試、測試工具、環境。
4、 主試誤差是:由于主試實施測驗必然伴隨的影響因素造成的誤差。
5、 主試誤差包括:主試者的生理物理因素、主試在施測時偏離規定程序。
6、 有幾種情況主試能發生較大影響:
(1) 測驗步驟復雜,指導語冗長、繁瑣。
(2) 測驗題目本身模糊不定,形式多變。
(3) 安排的測驗條件寬裕,有較多靈活機動的余地。
(4)被試屬幼兒或有情緒捆擾者。
7、 控制誤差的方法:
(1) 嚴格遵從指導語,不帶任何暗示,被試提問時,盡量按中性方式回答。
(2) 測驗前不講太多無關的話,以免引起被試的煩躁情緒和反感。
(3)對特殊問題有心理準備。
8、 被試誤差可分為:應試技巧與練習、動機和焦慮、反應定勢。
(1) 應試技巧與練習:速度測驗比難度測驗更易受練習因素的影響。
(2) 動機和焦慮:對智力測驗、成就測驗和能力傾向測驗來說,被試動機強才能有好成績。
一般來說,適度的測驗焦慮會使人提高興奮水平,促進注意力增強,反應速度加快,有利于智力測驗、成就測驗和能力傾向類測驗的成績。但是焦慮水平過高或過低都不利于測驗。
(3) 反應定勢:也叫反應風格。是被試的一種反應傾向,與測驗內容無關。簡言之即被試的答題習慣。
定勢的種類:求“快”定勢 、求“精確” 定勢、喜好正面敘述的定勢、位置定勢、長選項定勢、猜測定勢。
9、 主試的心理因素:主試的態度對智力測驗的成績有影響。主試的動機也會影響測驗。主試的期望對測驗結果的影響最典型的范例是“羅森塔兒效應”。
10、 被試對主試的五種需要:現實需要、受人尊重的需要、自我表現的需要、對主試權威性的需要、特殊需要。
11、 如何控制主、被試交互作用引起的誤差:可建立良好的主、被試協調關系。
協調關系是指:主、被試之間產生的一種友好、合作、能促使被試最大限度地作好測驗的關系。
12、 計分標準化的含義:
(1) 對測驗編制者而言,在編制測驗時就要根據測驗的目的、性質及題型確定一個適當的計分程序。
(2) 對施測者而言,在測驗完成以后要按測驗操作手冊上的規定要嚴格進行計分。
13、 計分的一般程序:記錄被試反應、參考標準答案、計算最后得分。
14、 常見的猜測修正方法:S=R-32、 W/n-33、 1 S是真正分數、R是被試答對的題目數,W是被試答錯的題目數,n為選擇項數目。
第4章 測驗的常模和分數的解釋
1、 導出分數:原始分數的意義需有參照意義標2、 準才能體現出來,在心理測驗中,這種標準是由原始分數構成的分布轉換而來的分數,就叫導出分數。導出分數具有一定的參照點和單位。
2、 常見的導出分數分:常模參照分數、內容參照分數、結果參照分數。
3、 常模團體:做心理測驗,得到的測驗分數需要做出有意義的解釋,因而參考標準不可缺少。導出分數是由原始分數轉換而來,而原始分數由被試完成測驗后得到,因此,許多被試構成的人群就是構成參照標準的被試團體,也叫參照團體,或叫常模團體。
常模團體是由具有某些共同特征的人所組成的一個群體,或者是該群體的一個樣本。
4、 常模樣本:找一個有代表性的樣本來代表目標總體,也代表常模總體。這個用來代表常模總體的樣本,就是常模樣本。常模樣本必須具備常模總體的基本特征。
5、 常模樣本的容量:總體的數目。一般情況,最小樣本為30 ~ 100個。要是全國性的常模,一般地要求有2000 ~ 3000人為宜。
6、 取樣就是:從目標總體中選擇有代表性的樣本。一般地有兩類取樣方法:隨機抽樣和非隨機抽樣。具體說有:簡單隨機抽樣、系統抽樣、分組抽樣、分層抽樣。
7、 常模分數:就是施測常模樣本被試后,將被試的原始分數按一定規則轉換出來的導出分數。
8、 常模分數構成的分布是:通常所說的常模。它是解釋心理測驗分數的基礎。
人們常常會忽略常模的時間性。常模分數和常模均會隨時間的變化而改變,因此常模必須經常修訂。
9、 常模的表示方法:表格法和圖示法。
(1) 表格法就是轉換表法。這種表示常模分數分布的方法是最常見的。它有三個要素:原始分數、導出分數、常模樣本的特征描述。
(2) 圖示法就是剖面圖法。
10、 參照常模的解釋分數是:將被試的分數直接或間接地以常模樣本中的相對等級或相對位置來表示。另一種常見法是以常模性質分,可分為:發展常模(反映心理發展程)、百分位常模和標準分常模。
11、 發展常模:按發展常模來解釋測驗分數,某一測驗分數就表示個人在以正常途徑發展的心理特征方面處于一個什么樣的發展水平。這些平均表現構成的量表就是發展常模,象智力年齡、年級當量、發展順序量表等均為發展常模。
(1) 發展順序量表:是直觀的發展常模,因為它告訴人們多大的兒童具備什么能力或行為就表明其發育正常。
(2) 智力年齡:在比內-西蒙智力量表中首先使用了智力年齡的概念。智力年齡實際上是一種年齡量表。也是用年齡來表示測驗分數。
以智力年齡為典型代表的年齡常模在做解釋時確實非常簡捷明了,但是智力年齡并不是單位恒定相等的,而是隨年齡的增長而增大。另外,智力年齡的概念顯然不適用于成人,成人到一定階段后智力發展相對穩定,表現不出一年與一年之間的差別。
(3) 年級當量:它實際上就是年級量表,測驗結果說明屬哪一年級的水平,在教育成就測驗中最常用。
12、 百分位常模是:把一個量表分成一百個位置,對不同的得分給予相應的等級評價,依據不同的等級對結果作出解釋。
13、 百分位常模可分兩類:百分等級和百分點。
(1) 百分等級:一個測驗分數的百分等級式是指在常模樣本中低于該分數人數的百分比。百分等級是應用最廣的測驗分數表示方法。
(2) 百分點:又叫百分位數,百分點或百分位數于百分等級的計算方法正好相反。百分等級是計算低于某測驗分數的人數百分化,而百分位數是計算處于某一百分比例的人對應的測驗分數是多少。
(3) 還有兩種常見的變式:四分位數和十分位數。兩者含義相似。
14、 百分位常模的優點與缺點:易于計算、解釋、實用;不受原始得分的分數分布形態的影響。缺點是:單位不相等,特別是分數的兩端;百分位無法說明被試間差異的原始分數量大小。
15、 標準分常模:標準分數最常見的是z分數。標準分數是等距量表,它可以做加、減、乘、除運算。
常見的標準分常模:z分數、Z分數、T分數、標準九分數、離差智商(IQ)等。
標準分由原始分轉換而來,這種轉換又可分成:線性轉換、非線性轉換。
16、 線性轉換的標準分 - z分數(最典型的線性轉換的標準分)。
(1) 公式:z = X-(2) X/SD
X為原始分, X為樣本平均數,SD為樣本標準差。從公式看,z的含義是:它表示某一分數與平均數之差是標準差的幾倍。
(3) z的性質:
1 平均數為0,標準差為1.
2 z分數有正、負,其絕對值表示原始分與平均數間的距離正值表示原始分大于平均數,負值則相反。
3 z分數的分布形態與原始分分布一致。
17、 非線性轉換的標準分:
(1) T分數是:平均數為50,標準差為10的分數。即
這一詞最早由麥柯爾于1939年提出,是為了紀念推孟和桑代克對智力測驗,尤其是提出智商這一概念所作出的巨大貢獻。
(2) 標準九:是標準化九分制的簡稱。它是以5為平均數,以2為標準差的一個分數量表,最早時被廣泛應用于美國空軍的心理測驗中。
標準九分數也是一種標準分,它將原始分劃分為9部分,最高是9分,最低1分。除1和9的范圍略大以外,其余均是以5為中心向兩邊各包含0.5個標準差的分數段。
18、 標準分常模小結:
(1) 標準分常模分數均是等距分數,雖然不同類型的常模其平均數和標準差不同,但均可用離均值來表示。
(2)標準分常模的局限性:標準化常模表示的是存在狀態之間的橫向比較,離開原常模樣本,不同常模樣本之間的比較就沒有意義。
名稱 z分數和z'分數 T分數 標準九 標準十 標準二十
平均數 0 50 5 5 10
標準差 1 10 2 1.5 3
19、 離差智商及其意義(傳統比率智商的缺點):
(1) 心理年齡與生理年齡呈線性關系。用傳統的比率智商,不同年齡組的標準差不相等,從10 ~ 20都有,因此智齡與年齡的發展并不是呈線性關系。
(2)智力增長到何時達終點仍在爭論。
1 離差智商:通過與同2 年齡的代表性樣本的平均數相比較來確定智商的高低。
離差智商是一種常態化標準分數,因而其計算方法與其他標準分數一樣,公式為:IQ = 100 + 15z'.由于離差智商的提出,過去使用比率智商的測驗都改用離差智商,其公式為:IQ = 100 + 16z'.兩者唯一的區別是標準差:一個是15,一個是16。
2 由于標準差不同,離差智商間就不能直接比較,因為單位不等,相同的IQ值表示的智力水平也不一樣。
3 常態化使得IQ的評定對智力較低者打分偏高,對智力較高者打分又偏低,而對中等智力者打分最準確。
20、 效標參照測驗是:格拉塞于1963年首先提出的。它是直接向人們報告被試完成什么測驗題,能拼多少單詞,能做什么樣的邏輯推理題等。
21、 效標參照測驗的優點:
(1) 效標參照測驗巧妙地避開了對得分、名次的過細糾纏,使個人都能有自己大致的奮斗目標和希望。
(2) 效標參照測驗能發現個人特有的長處,也會找到問題癥結所在。
(3)常模參照測驗的得分不能告訴我們評價被試的外在效標是什么,而指標參照測驗的結果本身可能就是效標 .
22、 對效標參照測驗的解釋的方法:內容參照分數、結果參照分數。
23、 內容參照分數與常模參照分數的本質區別:用內容參照分數來解釋測驗結果,很象我們平時所說的課程考查,只有“通過”與“不通過”,或“及格”與“不及格”之分,沒有100分與60分之分。就是說,它依據被試對某個確定的材料或技能的掌握程度和熟悉程度來表示測驗的結果。所以它比較的對象是測驗的內容,而非完成測驗的其他人。
24、 對內容參照測驗的解釋有兩種內容參照分數可供選擇:掌握分數和正確百分數。
(1) 掌握分數:按效標參照的思想,最簡便的做法就是確定一個評判標準,一判斷被試是否通過或達到掌握的水平。
(2) 正確百分數是指被試在測驗中答對題目的百分比例。
第5章 信度
1、 信度是指:測量結果的可靠性和一致性。因為心理測驗通常測量人的行為,行為會由于各種各樣的原因,因時、因事、因地而產生變動,這些因素有些是偶然的,有些是固有的,人在完成心理測驗時的行為也會受上述因素的影響,從而使測驗結果與真實結果不完全一致,所以我們要用信度來衡量測驗的可靠性和一致性。
2、 信度的操作化定義:
(1) 誤差理論認為:一個人的測驗分數X是由真實分數(T)和誤差(E)兩部分構成的,公式是X = T + E.
(2) 因此信度就被定義為:一組測量分數的真實方差與實得方差的比,或者是指真實方差占總方差的百分比。公式為:rxx = 1-SE 2/SX 2
(3) 根據統計學理論,真實方差與實得方差的比是一個相關系數的平方,所以我們把這種相關系數的平方叫做信度系數。
(4)計算公式為:rxx = ST2/SX2
3、 由于誤差的來源信度的可分為:這種分類是基于信度的傳統定義-真分數理論。
(1) 重測信度:考慮的誤差來源是時間取樣。
(2) 復本信度:考慮的誤差來源是內容取樣。
(3) 分半信度:它考慮的誤差來源也是內容取樣,它與復本信度的差別是:分半信度考查一個測驗內容的兩半題目測量的是否是同一個心理特點行為。
(4) 同質性信度(內部一致性系數):考慮的是測驗內容是否異質。
(5)評分者信度:考慮的誤差來源是評分者間的差別。
4、 信度的表示方法:
(1) 信度系數和信度指數:
1 信度系數:rxx = rx2T = S2T/S2
2 信度指數:rXT = ST/SX
(2) 測量標準誤:SE = SX 1-rxx
5、 信度的意義:
(1) 信度系數可以解釋為樣本測驗分數的總方差中有多少比例是真分數方差,也就是測驗的總變異中真分數造成的變異占百分之幾。它直接告訴我們測量的誤差有多大。
(2) 測量的標準誤可以告訴我們有多大可能性真實分數在某一分數范圍內,并且可以預測實得分數再測時可能的變化情況。
6、 信度的作用:
(1) 解釋預測個人分數的意義。
(2) 解釋真實分數與實得分數間的關系,明確告訴我們測驗誤差大小。
(3) 新編的測驗信度應高于原有的同類測驗或相似測驗。
(4)下結論說某測驗比較可靠,必須是依據情境的,經多次證實的。
(5) 它是確定測驗好壞的一個指標。一般的原則是:
1 當rxx< 0.70時,測驗不能用于對個人作出評價或預測,而且不能做團體間比較。
2 當0.70≤rxx<0.85時,可用于團體比較。
3 當rxx ≥0.85時,才可以用來鑒別或預測個人成績或作用
7、 重測信度:有時也叫穩定性,主要針對時間變量。
(1) 重測信度采集數據得方法是:對同一組被試間隔一定的時間重復測試一次。
(4) 重測信度的計算方法是積差相關法,因而rxx就是皮爾遜的積差相關系數。
(7) 重測信度的時間間隔選擇依測驗性質和目的而定,如果測驗是用于長期預測,則測量間隔長一些。對兒童的智力測驗一般是兩周到四周為宜。對成年人,間隔可到半年,很少超過6個月。
(13)使用重測信度應注意:不是所有測驗都可以計算重測信度。并且重測信度只是反映了隨機誤差的影響,而不是反映被試心理特點的長期變化。
8、 復本信度:又叫等值性系數。
(1) 數據采集方法是:給被試施測兩個內容等值但題目不同的測驗,求兩組數值的相關。計算方法常見的也是積差相關法。
(2) 復本信度的高低反映了兩個互為復本的測驗等價的程度,而不是反映一個測驗本身受隨機誤差影響的大小。復本信度的高低關鍵取決于復本測驗的選擇,因而施題目取樣問題,或者說是測驗的內容取樣問題。
(3)復本信度優于重測信度的地方是:避免了重測帶來的記憶效應和練習效應;可用于長期追蹤研究前后測量;減少了作弊的可能性。
(4)復本信度的缺點:有些測驗的復本很難找到;有些測驗因正遷移效應使測驗性質改變;如測量的內容很容易受練習的影響,復本信度也無法清除這種練習效應。
(5)重測復本信度,即再不同的時間里施測兩個等值的測驗(復本),得到的相關就是重測復本信度,也叫穩定等值系數。它比單一的重測信度或復本信度都要嚴格、全面一些。
9、 斯皮爾曼-布朗公式:rnn = nrtt/1 +(n-13、 1)rtt,14、 rnn是校正以后的相關系數,15、 rtt是實得的相關系數,16、 n為rnn對應的測驗長度與rtt 對應的測驗長度之比。分半時,17、 n = N/(N/2)= 2(N為測驗全長),18、 所以分半法信度的校正公式是:rxx = 2 rnn/1 + rhh 其中rhh為兩半測驗的相關系數。
(1) 盧倫公式:rxx = 1-Sd2/Sx2 其中Sd2是兩半測驗分數之差的方差,Sx2為總方差。
(2) 從理論上分析,分半信度反映的實際上是兩半測驗能夠測量相同內容或心理特點的程度。
10、 內部一致性信度(同質性信度):同質性是指測驗的所有題目間性質的一致性,即測的是同一種心理特質或行為。同質性是測量單一特質的必要條件。這里講的同質性是指測驗題目得分反映的心理特質一致,同質性的判別標準是:題目間呈高正相關,如果相關很低或是呈負相關,則題目為異質。
(1) 庫德和里查德森提出的K-R20公式只適合預測題目是二分法計分的。克倫巴赫α系數適合于非二分法計分的測驗的內部一致性信度估計法。
(2) 從同質性信度的含義我們不難看出,分半信度是求測驗兩半之間的一致性或同質性,而同質性是求所有題目間的一致性。因此分半信度實際上是同質性信度的一種,可以作為測驗同質性評價的粗略估計指標。因為可以根據測驗得分來推論或驗證某種概念或理論構思,因此同質性信度也是一種構思效度,或叫結構效度,它實際上介于信度與效度之間。
11、 評分者信度:有些心理測驗的得分不是根據客觀的計分系統計分的,是由評分者來給被試打分,因此,這樣的測驗的可靠性如何取決于評分者評分的一致性和穩定性如何。
評分者信度因評分者人數不同而估計方法不一樣。如果是兩個評分者,獨立對被試的反應評分,則可以用積差相關來計算,或用斯皮爾曼等級相關法計算。如果評分者在三人以上,而且是等級評分,則可以用“肯德爾和諧系數”(W)來求評分者信度。
12、 以測量標準誤表示信度的好處是:
(1) 信度的單位與測驗分數的單位相同,因此解釋個人分數時非常直接,能直接指出允許測驗分數變化的范圍。
(2) 測驗同質與否并不影響測量標準誤的大小。測量標準誤的不足之處時:無法比較不同測驗間的信度高低。比較不同測驗的信度用信度系數(rxx)解釋個人分數時用測量標準誤(SE)。
13、 常見的影響信度的因素有:樣本特征、測驗的長度、測驗的難度、測量的時間間隔等。
14、 我們做信度考驗時,常常選取一個與常模樣本性質相同的樣本施測,根據被試得分求出信度系數。
(1) 樣本團體得分分布的影響:求信度的樣本團體得分分布如果比較窄小的話信度就低。
(2) 樣本團體異質性的影響:樣本團體異質的話,測驗分數的分布就比同質樣本的要廣,分數的離差就大,樣本的方差就大,信度就高。實際上,高信度可能是假性高信度,是由樣本團體的異質造成的。但如果常模總體要求各種各樣的人,則異質的信度樣本求得的信度就是真信度。這時,相反的情況就需要校正信度。
(3)樣本團體平均能力水平的影響。由于信度也會因樣本間團體平均能力水平的不同而不同,因此在求信度時,一定要注意信度樣本與常模總體間是否一致。
15、 測驗的長度:在其他條件均等的情況下,測驗越長,信度越高。原因在于:
(1) 測驗越長,即題目越多,測驗的內容取樣就越有可能有代表性。
(2) 測驗越長,被試的猜測因素影響就越小。
16、 測驗的難度:難度對信度的影響之存在于某些測驗中,如智力測驗、成就測驗、能力傾向測驗、教育測驗等。測驗的難度對信度有間接影響,因為如果測驗過難,被試的得分會集中在低分區。過于容易,分數則集中在高分區。兩種情況都使信度樣本的得分范圍變窄,變異量降低,從而低估測驗信度。
17、 測驗的時間間隔:這一因素之對重測信度和不同時測量時的復本信度有影響,對其余的信度來說不存在時間間隔問題。
第6章 效度
1、 效度是指:測驗能測量到所要測量的對象的程度。這一定義包含著兩層含義:測驗測量什么?測驗對測量目標的測量精確度和真實性是多少?
2、 效度的公式為:rxy = SV2/SX2它是與測量目標有關的真實分數方差與總方差的比率。其中rxy是常用的效度表示法;SV2是“有關的真實方差”,也就是由測驗所要測量的心理變量引起的方差,也叫有效方差;SX2是總方差。
3、 信度和效度的差別是:兩者所涉及的誤差不同:信度僅考慮偶然的隨機誤差占測驗總變異的比例,效度則還包括與測驗無關的但穩定的測量誤差。
(1) 信度是效度的必要而非充分條件。
(2) 效度是受信度制約的。
4、 效度的性質:效度的真實含義是指測驗結果的效度,也就是測驗結果的準確程度。
(1) 效度具有相對性。
(2) 效度具有連續性。測驗的有效性只有程度上的差別。
(3) 效度也不是直接就可以測量到的,它是從已有的證據推理而來的。
5、 效度的種類:內容效度、構思效度和效標關聯效度。
6、 效標關聯效度是指:測驗總分數與外在標20、 準(效標)之間的相關程度,反映的是用測驗預測個體在某種情境下行為的表現如何的有效性程度。由于外在標準成了考察測驗有效性的參照標準,因此簡稱為效標。
7、 阿斯丁把效標分為兩個層次:一是理論描述水平的“觀念效標”,二是操作定義水平的“效標測量”。
(1) 觀念效標是效標的理論定義,效標測量是效標的操作定義,效標測量必須能真正反映觀念效標。
(2)效標測量的一個重要特征是客觀性。為此因做到:
1 避免偏見影響效標測量,特別是以等級評定為效標4 測量時,評分者的主觀偏見會有很大影響。
2 防止效標污染,即指個人的效標因評定者知道個體的測驗分數(也叫預測源分數)而受到影響。
8、 常用的效標:學業成就、臨床診斷、實際工作表現、特殊訓練成績、效標團體比較、先前有效的測驗、等級評定。
9、 同時效度:它的效標資料是和測驗分數差不多同時搜集的。一般情況下,它可以代替預測效度。
10、 預測效度的效標是經過一段時間以后才獲得的,預測效度反映的是從測驗分數預測任何效標情境或一段時間后被試的行為表現的程度。
11、 構思效度就是:心理測驗對某一理論概念或特質測量的程度。因此,研究構思效度就是要搞清楚:測驗測量的是什么構思(概念或特質)?測驗分數的變異中有多少來自于測驗的理論構思?構思效度是沒有單一指標的,它是由各方面證據累積起來作出評價的。
12、 確定構思效度的基本步驟:建立理論框架、根據理論框架推演出有關測驗成績的假設、用邏輯或實證的方法來證明假設。
13、 確定構思效度的方法:測驗內部的方法、測驗間的方法、效標效度的研究、實驗和觀察法驗證。
(1) 測驗內方法:這類方法是通過研究測驗內部結構來界定理論構思,從而為構思效度提供證據。
(2) 確定方法是:分析測驗的內容效度和測驗的內部一致性分析。測驗的內部一致性可以由分半信度、α系數、KR20或KR21等指標來衡量,它們考察的是測驗題目是否同質,分測驗與總測驗是否一致或同質,這些都可以證明測驗所測量的構思是否合理,因而構成了證實構思效度高低的證據。
(3) 有時分析被試對題目的反應特點也可以作為構思效度的證據。
(4) 測驗間的方法:通過分析幾個測驗間的相關關系,找出其共同之處,進行推斷這些測驗測量的特質是什么,也可以確定這些測驗構思效度如何。最簡單的方法是計算兩種測驗之間得分的相關。區分效度是構思效度的又一個證據。因素分析法也是建立構思效度的常用方法。
(5)實驗法和觀察法證實:觀察實驗前和實驗后分數的差異也是驗證構思效度的方法之一。
14、 內容效度是指:測驗題目對有關內容或行為總體取樣的適當性程度。因為這種效度主要是考察測驗的內容,因此叫內容效度。
(1) 要想使測驗的內容效度高,必須又兩個條件:內容的范圍或行為總體必須界定名確;測驗題目應該是所界定的內容范圍的代表性樣本。
(2) 內容效度的確定方法:老師判斷、經驗判斷、統計分析法。
15、 表面效度是指:一個測驗看起來好象是測量所要測的東西的程度。換句話說,當那些未經過訓練的被試或測驗應用者認為某測驗是有效的測驗時,該測驗就有表面效度。
16、 效度的指標是指:效標關聯效度和構思效度的的指標。效度指標一般有:效度系數、統計推斷參數、預期表等。
17、 效度系數:它是最常用的效度指標,尤其是效標關聯效度。它是以皮爾遜積差相關系數來表示的。效度系數的實際意義常以決定性系數來表示,表達式是rx2y,效度系數的平方就是決定性系數,測驗正確預測或解釋的效標的方差占總方差的比例。
18、 效度的其他指標:一些描述不同團體的差異的統計指標(參數)也可以作為效度的指標,比如:t考驗、F考驗、重疊百分比等。
19、 效度的影響因素:測驗本身的因素、測驗施測的樣本的性質、效標的性質等。
(1) 對于測驗本身因素又可分為:測驗題目的質量、測驗的長度、測驗實施中的干擾、被試的因素等。
(2) 樣本的性質:
1 影響之一是:不同的團體對同一測驗的反應可能會不一樣,因被試的背景不同,對測驗的題目可能采取完全不同的方法來回答。
2、響之二是:同一個測驗,效度團體的性質不同,效度也會有很大差別。效度團體的性質包括年齡、性別、教育程度、智力水平、動機、職業等有關的特點,1這些性質特點使測驗對不同的團體具有不同的預測能力。故稱為干涉變量。
3 影響之三是:樣本團體的異質性。其他條件相同的時候,樣本同質性越高,效度越低。
第7章 項目分析
1、 項目分析是指 :一組分析被試對測驗項目的反應的統計方法,而廣義的項目分析則還包括內容效度分析和項目編寫的分析。
2 最簡便的難度指標通過率:所謂通過率就是在回答某個項目的樣本中,正確回答該項目的人數的百分比。
3 項目難度與測驗難度的確定:
(1) 對題目難度來說,如果項目過難或過易,就會造成被試基本上都答錯或基本上都答對了,也就是P值接近0或1,這樣也就不能區分被試能力的差異。大體而言,項目難度為。50時最理想,此時項目具有最大鑒別力。
(2)在實際操作時,一般只需使項目的平均難度接近。50而各個項目的難度在。50±。20之間變化。如果測驗是用于選拔或診斷,則最好多選一些難度與錄取線接近的項目。在項目選擇上還有一個要注意的問題是:當項目形式是選擇題時,要考慮到讓P值大于概率水平,否則項目是無效的。
4 鑒別力分析的設想基礎:如果單個項目與測驗測的是同11、 一特性,那么我們可以預期在測驗上得高分的人正確回答這一問題的概率大,而在測驗上得低分的人正確回答這一問題的概率低。鑒別力分析就是在這一設想的基礎上進行的。項目的鑒別力就是其對于所測量的心理特性的區分能力。
5、 鑒別力分析的一般方法:鑒別力指數、項目-總分相關、項目間相關。
6 鑒別力指數是:運用極端組計算項目鑒別力的一種簡單方法。公式為:D = PH-PL是高分組在項目上的通過率,而是低分組在項目上的通過率。
當D<。19是,項目差,必須淘汰;但D在。20 ~ .29之間時,項目尚可,但必須修改;當D在。30 ~ .39之間時,項目良好,但還是最好稍做修改; 而當D.>40時,項目完全可以被接受,但一般測驗,D>。30項目就可以接受了。
7 項目總分相關是:被試在項目上的得分與其總測驗分的簡單相關。
8 難度水平與鑒別力:難度水平直接限制了一個項目的鑒別力。如果當P值接近。50,項目最可能具有高的鑒別力。但是,P值接近。50并不能保證項目有高的鑒別力,只能說在統計上已經沒有限制了。
9 項目特征曲線:運用圖象直觀地顯示了隨著測驗者某種心理特征水平的變化,正確回答某個項目的概率是如何變化的。項目特征曲線是現代心理測量學最有影響的理論之一-項目反應理論或稱潛特征理論的基礎。ICC歸納了項目分析的信息,顯示了心理能力水平與項目反應之間的關系。
當項目-總體相關為正時,ICC的斜率也是正的;當相關接近0時,ICC斜率也接近于0;當相關為負時,ICC斜率為負。
10、剪裁測驗:如果能使測驗適合于每個測驗者的水平,那么就不用對每個人施測長長的每個能力水平上均有項目的測驗。這種測驗就稱為剪裁測驗,又稱計算機化的適應測驗。
第8章 智力測驗
1、 關于智力的定義:
(1) 斯皮爾曼(Spearman)認為:智力是一種普遍的能力,它主要涉及聯系的引出和相關的引出。
(2 比內和西蒙(Binet & Simon)認為:智力是正確地進行理解、判斷和推理的能力。
(3 韋克斯勒(Wechsler)認為:智力是個體有目的地行動,理性地思考以及有效地應付環境的總體能力。
2、 智力是:通過經驗進行學習的能力;適應環境的能力。
3、 智力的理論-Spearman和g 因素:
(1) 在對各種智力和感覺能力的相關模式進行廣泛研究之后,提出智力由兩種因素組成:一個一般因素g、若干個特殊因素S.
(2 它認為g因子是整個大腦皮層共有的能力或能量,而S因子只是代表了大腦中某些神經元的生理功能。
4、 智力的理論-Thurstone與基本心理能力:Thrustone總結出了七種基本心理能力:語詞理解、數字、空間、知覺速度、語詞流暢性、聯想記憶、歸納推理。
5、 智力的理論-Cattell與流體智力-晶體智力:Cattell確定了兩大因素:流體智力、晶體智力。
(1) 流體智力:基本上是非語言、相對不受文化因素影響的心理功能。它與個體通過遺傳獲得的學習和解決問題的能力有聯系。
(2 晶體智力高度依賴于文化,是個體完成那些需要習得性或習慣性反應任務的能力。晶體智力是流體智力運用在不同文化環境中的產物。
6、 智力的理論-Piaget的認知發展理論:主要觀點:
(1) 兒童的思維與成人的思維存在質的差別。守恒是指:在物體表面看來發生變化時,能意識到物體的實質沒有變化。
(2 認知發展可分為四個階段:感覺運動階段、前運算階段、具體運算階段、形式運算階段。
(3 圖式是知識獲得的基礎。圖式是經過組織的行為模式或定義明確的心理結構。
7、 Guilford與智力結構模型:Guilford在1967年提出了一個智力結構模型。這一模型為三維立方體,每一維代表一個變量。它包括:
(1) 自變量:代表思維的內容。
(2) 中間變量:代表思維的操作。
(3) 因變量:代表思維的產物。
8 Sternberg與智力的三主理論:該理論包括三方面:成分智力、經驗智力、情境智力。
9 韋克斯勒智力測驗:
(1) 韋克斯勒是從1932年開始他的測驗編制的。目的是為了設計一個適合于測量精神病人的智力測驗。第一個韋氏測驗出版在1938年。他將量表分為言語、操作兩大部分。這一區分使我們可以比較測驗者使用詞語和符號的能力和操作實物、感知視覺模式的能力。
(2) 韋氏驗的一般特點:
1 幾個重要的韋氏測驗:1939年韋克斯勒-貝利弗測驗;1949年韋克斯勒兒童智力量表(WISC);1974年韋克斯勒兒童智力量表修訂版(WISC-R);1991年韋克斯勒兒童智力量表第三版(WISC-Ⅲ)。
2 各個韋氏測驗的特點:
A. 10 ~ 12個分測驗:多個分測驗使我們不B. 僅得到總IQ,C. 而D. 且可以分析個體智力上的強點和弱點。
E. 言語量表和操作量表各由5 ~ 6各分測驗組成。這體現了左右腦功能的整合。
F. 共同G. 的IQ計分系統。這使我們可以比較被試的分測驗分數,H. 了解其相對強弱。
I. 不J. 同K. 年齡組由相同L. 的分測驗有助于測驗間的相互比較。
3 韋克斯勒測驗的分測驗:常識、數字廣度、詞匯、算術、領悟、相似性、填圖、圖片排列、積木圖案、物體拼湊、譯碼或數字符號、迷津、句子、幾何圖形、動物房。
A. 常識是:一般知識性知識問題,B. 要求被試用幾句話或幾個數字回答,C. 問題從易到難排列。缺點是容易受到文化背景和被試熟悉程度的影響。
D. 數字廣度:由順背和倒背兩部分組成。
(4) 韋氏成人智力量表修訂版:WAIS-R共有11個分測驗,其中包括六個言語量表:常識、數字廣度、詞匯、算術、領悟、相似性;五個操作量表:填圖、圖片排列、積木圖案、物體拼湊、數字符號。所有11個分測驗分數合并成全量表分數,并可以分別求得三個智力商數:言語智商(VIQ)、操作智商(PIQ)、總智商(FIQ)。
WAIS-R的標準化,被試年齡從16 ~ 74歲。
(5 韋氏兒童智力測驗修訂版(WISC-R)適用于6 ~ 16歲兒童。它由五個言語分測驗和五個操作分測驗組成。此外還有2個補充分測驗。
(6 韋氏學前和小學兒童智力測驗修訂版(WPPSI-R)該測驗與WPPSI極為相似,只是年齡范圍從原來的4 ~ 6.5歲兒童擴展到3 ~ 7歲3個月兒童。
(7韋氏智力量表中國修訂版:從1979年起中國韋氏測驗的修訂工作由湖南醫學院龔耀先教授主持進行,于1982年出版了WAIS的中國修訂版,WAIS-RC.
10 個體智力測驗:
(1) 斯坦福-比內智力量表:
1 1916年量表:首先采用了智商這一概念。
2 1937年量表:年齡范圍從1916年量表的3 ~ 13歲擴展為2 ~ 18歲,并且編制了測驗復本,分別為L型和M型。
3 1960年量表:該量表采用離差智商。
4 斯坦福-比內第四版(SB:FE):該版的最大改變在于采用智力層次模型來劃分和構建分測驗。
SB:FE的智力模型:SB:FE的編制者用一個三層次的認知能力結構模型作為編制量表的框架。這一模型的最高層是一般智力g因子;第二層分成晶體智力和流體智力,此外又增加了短時記憶能力。短時記憶能力包括珠子記憶、句子記憶、數字記憶和物體記憶四個分測驗。
(2) 考夫曼兒童成套評估測驗(K-ABC)是智力和成就的綜合測量。K-ABC是以神經心理學和認知心理學研究為基礎,以“個體問題解決和信息加工模式”定義智力。
K-ABC提供四個方面的分數:系列加工、同時加工、綜合心理加工、成就測驗。
(3) 能力區分量表(DAS):適用于2歲6個月到17歲11個月的兒童。
11 團體測驗于個體測驗的差異:
團體測驗采用多項選擇,而個體測驗多采用開放式問題。
團體測驗多采用客觀的計算機評分,而個體測驗一般為施測者評分。
團體測驗為團體施測,個體測驗為個體施測。
團體測驗多用于篩選,而個體測驗多用于診斷及彌補工作。
團體測驗標準化樣本極大,而個體測驗一般只用幾千名 精心挑選的被試。
12 團體智力測驗:
(1) 文化公平智力測驗(CFIT)是:一個非言語流體智力測量,最早由R.B.Cattell發表在《教育心理學》期刊上,它的目標是測量流體智力,避免文化因素的干擾。
(2) 瑞文漸進測驗(RPM):該測驗既可以個體施測,但更多作為團體施測。
該測驗實際上是三個不同的測驗:瑞文兒童彩色漸進測驗、瑞文標準漸進測驗、瑞文高級漸進測驗。
我國由北京師范大學張厚桀教授主持,從1985年起對瑞文測驗進行修訂。
13 圖書群體測驗的類型:非言語測驗(古德依納芙-哈里斯繪人測驗)、非閱讀性測驗、嬰兒智力測驗、發展程序表。
14 非閱讀和非動作測驗-皮波迪圖畫詞匯測驗修訂本(PPVT-R)是:由L.M.Dunn編制,1981年修訂的測驗。測驗由175張圖片組成,每張圖片上有4個圖形。PPVT-R適用于2歲半到成人,測驗需用時10 ~ 20分鐘。由于不需要語言反應,所以常用于言語障礙、大腦麻痹、閱讀困難和智力落后的被試及孤僻、注意不集中的兒童。
15、嬰兒智力量表:
(1) 葛塞爾發展程序表:該量表是最早編制于1925年的第一個嬰兒智力量表。測量包括五個領域:大運動、精細運動、語言發展、適應行為、個體-社會行為。這一量表主要用于臨床篩查和診斷。
(2) 丹佛發展篩查測驗(DDST):主要用于篩查智力發展的大致范圍,它評定了四個行為領域:個人-社會行為、精細動作適應行為、語言、大運動。
16、遺傳和環境對智力的影響:遺傳對智力的影響在研究中一般用遺傳指數來表示。遺傳指數為0意味著遺傳在某種特質上不起作用;遺傳指數為1意味著遺傳完全決定了特質。當然,遺傳對大多數特質的影響介于0 ~ 1之間。
第9章 能力傾向測驗
1、 能力傾向測驗一般指:測量從事某種職業或活動的潛在能力的評估工具。
2、 能力傾向測驗可分成:一般能力傾向測驗、特殊能力傾向測驗和多因素能力傾向測驗。其中一般能力傾向測驗現在就是指4、 智力測驗。而5、 狹義的能力傾向測驗專指6、 后兩者。
3、 能力傾向測驗與智力測驗的關系:
(1) 智力測驗一般得到的是對個體總智能的評估分數,而能力傾向測驗則測量的是某種特定的或多因素的組合。
(2) 智力測驗與能力傾向測驗的另一個區別就是:克倫巴赫提出的帶寬和精確度。帶寬是指測驗可預測的效標全距,測驗能預測的效標總數越大,則這個測驗的帶寬越大,智力測驗比能力傾向測驗的帶寬普遍要大。精確度是指測驗可在多大程度上預測效標,一般而言能力傾向測驗的精確讀為更大一些。
4、 能力傾向測驗發展主要的原因:
(1) 智力測驗的局限:早期智力測驗的編制者,希望通過廣泛地測量心理功能,從而估計個體的總體智力水平。但是所謂的智力測驗只是涉及到智力的某些方面而已。
(2)體能力傾向的差異:個體在某一測驗的各部分上的作業,常常表現出顯著的差異。這種個體內變異在智力測驗上表現為分測驗得分的差異。智力測驗往往不足以作出這種個體能力傾向差異的分析。
(3)素分析技術的發展:因素分析使我們能夠編制多重能力傾向測驗,從而為個體各種能力傾向的強弱提供比較。來自實際的需要。
5、 能力傾向測驗的特點:能力傾向測驗預測失敗比預測成功更為正確;必須審慎解釋各種特殊能力分數間的差異;能力傾向測驗在訓練計劃中應審慎運用。
6、 多因素能力傾向測驗:該測驗被用來測量個體在不同領域內的技能和知識,從而為職業咨詢、分類和人員安置提供最有效的信息。這種測驗的結果不是一個總分或IQ,而是一組不同能力傾向的分數,它們提供了一種智能剖面圖,顯示出個體的強點和弱點。
7、 多因素能力傾向測驗發展的原因:對個體內在差異的認識、對一般智力測驗特征性的認識、職業咨詢和分類的需要。統計學發展的影響。
8、 工業能力傾向成套測驗:多用于工商業的人員選擇與安置。它包含了測驗有一般智力測驗及數學、知覺、機械和心理運動能力測驗。它還建立了一組職業能力模式。
9、 一般能力傾向測驗(GATB):由美國就業服務社編制。研究者們在工作分析和對59各測驗因素分析的基礎上,設計了GATB,主要用于職業咨詢。它共有12個分測驗,8個紙筆測驗和4個儀器測驗。適用于高中至成人。
第10章 成就測驗
1、 成就測驗的歷史發展:
(1) 最遲在漢朝,中國便已經有了非正式的考試制度。公元1370年(明朝初期)筆試成為科舉取士的一部分,這可視為成就測驗的正式開始。
(2) 今天在世界各地廣泛應用的標準化成就測驗發源于美國,始創者是賴斯。另外一個早期的奠基人是桑代克。并且桑代克被公認為是教育測驗的鼻祖。
2、 成就測驗和智力測驗、能力傾向測驗的區別:成就測驗和智力測驗、能力傾向測驗的測量對象都是認知性特質。這三種測驗都是測量個體從與環境的相互作用經驗中發展出來的能力。所以在本質上,它們有相同之處。能力傾向、智力測驗所測量的也可以看作一種“成就”。不過,如果從測驗的目的、性質及所含蓋的經驗范圍來看,這三種測驗仍有某些不同之處,不能相互取代。
就測驗的對象而言,三者本質上有重疊之處,無法加以截然區分。大多學者認為成就測驗測量的是一些特定的、限定于某一范圍的能力和知識,而另兩者所測驗的則為一般性的、較為廣泛的能力。
從功能上看,成就測驗也不同于智力、能力傾向測驗。后兩者的主要功能是預測一個人在未來的教育、訓練或工作經驗中可能的表現,它們的使用是在教育或訓練程序以前,用以反映被試是否有接受某種課程或專業技能訓練的能力。成就測驗則是評估被試在接受一些教育或訓練程序后所獲得的學習成果,它的實施發生在教育、訓練過程后。在測驗的技術品質上,成就測驗要注重內容效度,而能力傾向、智力測驗則必須有較高的預測效度,否則就失去其基本價值。
3 成就測驗的功能:考查和報告學習成就、篩選和安置、診斷、評估教育計劃或教育質量。成就測驗可以用于評估某種教學法和教學程序的功效,以作為改進教材和教法的參考。
4、 成就測驗的分類:成就測驗可從其內容、用途、編制方法和原理等四個方面進行分類,具體可分為:單科測驗與成套測驗、評估性測驗和診斷性測驗、標準化測驗和教師自編測驗、常模參照測驗和效標參照測驗。
5 低成就與學習障礙的評估:
(1) 低成就是指:學生在學業上的成就低于其所具有的學習能力。
(2)學習障礙可視為低成就中的一類。有關學習障礙的定義,使用最廣的是美國聯邦法的規定:“學習障礙是指和口頭或書面語言的理解和應用有關的一種或多種基本心理過程有障礙,這種障礙可表現在聽、想、說、讀、寫或數學運算的能力不足。”
(3)學習障礙的特點:
1 學習成就和一般智力之間不一致。
2 習障礙的絕大多數定義包含了排除標準。
3 障礙是異質性的。
4 習障礙是一類發展現象。
5 習障礙個體經常會因學業成就差而8 遇到社會交往和情緒適應上的困難。
6 學習障礙的評估:
(1) 在學習障礙的評估中,最基本的工具是:信度、效度可靠的成就和智力測驗。大多數學習障礙組合測驗包括這兩個領域的主要測量工具,如斯坦福-比內智力測驗、韋克斯勒兒童智力測驗及皮波迪個人成就測驗、考夫曼教育成就測驗等。
(2)為了保證兒童能從學業方面的補救措施中受益,測驗者有必要了解是否有社會交往和情緒適應問題。在這方面常用的測驗工具有:兒童人格問卷(PIC)和考納斯教師評定量表(CTRS)。
7 兒童多動癥的評估:兒童多動癥或稱注意缺陷多動癥(ADHD)是一種行為綜合癥。癥狀為注意缺陷、多動,21、 患者有輕微的腦功能障礙。考納斯編制了一系列辨別兒童多動及其他行為問題的評定量表。其中,22、 考納斯教師評定量表有兩種版式,23、 一個包含28個項目(CTRS-28),24、 一個包含39個項目(CTBS-39)。另外考納斯父母評定量表(CPRS)也有兩個版式:一個包含48個項目(CPRS-48),25、 另一個包含93個項目(CPRS-93)。
第11章 人格測驗
1、 心理測驗依據所測量的心理特質或行為,2、 分為:認知性和非認知性兩大類。非認知性測驗所測的特質或行為是情感性的。按照知、情、意的傳統三分法,前者是對知的方面,后者則是對情和意的方面的測驗。
2、 認知性測驗和非認知性測驗的區別:
(1) 認知性測驗和非認知性測驗在對被試的要求上,有一個很大的不同。認知性測驗基本上是最佳表現測驗,其目的是測得被試的最高能力或水平,被試應該盡最大努力做正確回答。而非認知性測驗是典型表現測驗,其目的是對被試的日常一般行為做代表性的取樣,而不是測量其是否有行為能力。非認知性測驗的答案并無“對”、“錯”之分。測驗者關心的是被試的反應能否確切地代表他或她的典型行為。
(2)非認知性性質的測量中,人格測驗都占有中心的地位。廣義的人格是指:個體所具有的能力、能力傾向、需要、動機、情緒、性格、興趣、態度及其它心理和行為的差異的總和,既包括認知性變量,又包括情感性變量。
3、 自陳量表:又稱自陳問卷,是由被試本人對自己的人格特質,按照自己的意見進行評定的一種方法。它們的一個特點是高度結構化,每一量表通常包括一個或多個系列數目較多、內容明確具體的敘述語句,項目形式多為是非題或選擇題。另一個特點是它們一般都建立了標準化常模,標準化和量化的結果必然會減少測驗者主觀因素的介入。自陳量表的高度客觀性是它的一個顯著優點,因此它有時又被稱為客觀式人格問卷。
(1) 自陳量表的編制方式:理論推演法、經驗效標法、因素分析法。
理論推演法的特點式以理性的邏輯或已知的人格理論作為測驗編制的基礎。測驗者根據要測的人格概念,找出有關的行為、情緒狀態、信念等,編成具體項目。然后,再依據試測的結果與理論假設是否一致,對初始量表進行項目分析、修改、并建立常模。
(2) 典型的力量推演法量表:愛德華個人偏好量表(EPPS)、顯相焦慮量表(MAS):也是根據理論推演原則編制的典型測驗工具。1953年泰勒為了研究個體的瞬眼條件反射,編制了這一量表。
4、 經驗效標法:以經驗效標法編制人格測驗,對要測的人格特質,并不需具有既定的理論基礎或假設。編者時,測驗項目的選擇完全是以實證資料為依據,即只保留那些能夠將效標組與控制組分開的項目,而不管其內容看起來是否合理。典型的經驗效標法量表有:
(1) 明尼蘇達多相人格調查表(MMPI):是當今人格量表中使用最廣而且最受研究者重視的一種。MMPI包括14個分量表,其中10個臨床量表和4個效度量表。MMPI中的測驗結果將原始分數轉化成T分數,超過70的分數被稱為高粉,可能指示著精神障礙的存在,值得特別注意。MMPI-2于1989年推出。
從1980 ~ 1989年的十年間,我國以宋維真為首的研究小組對中文版MMPI幾經修改和測試,于1989年1月正式發表了MMPI的測查表與使用手冊。
(2) 加洲心理量表(CPI)是一個類似MMPI的經驗效標問卷,最新修訂本出版于1987年。CPI主要用于測量正常人格維度。
5、 因素分析法:
(1) 這種方法的理論假設是,如果一項人格測驗能真正測量要測的特質,那么它包含的各測驗項目必須具有顯著的內部一致性。使用此法編制測驗時,編制者要根據對某一問題已有的各方面知識,編制大量項目,施測于大樣本,然后將所得資料進行因素分析,最后得到的一個或幾個因素即代表這些項目所測的人格結構。編制者可將具有顯著因素負荷量的項目保留,進行因素命名,并組成一個人格測驗。
(2)因素分析量表的典型代表:16PF和EPQ.
1 16人格因素問卷即卡特爾人格因素問卷是卡特爾根據自己的人格特質理論,運用因素分析方法編制的。16PF的計分方法是將各量表原始分數轉換成標準分數,并由此繪出被試的剖面圖。
2 EPQ-艾森克人格問卷:共含內-外傾(E)、神經質(N)、精神質(P)三個分量表和一個效度量表(L)。E量表的高分表示人格外傾,低分則表示內傾。N量表得高分的被試可能焦慮、擔憂、郁郁不樂、情緒反應強烈、以至出現不夠理智的行為。P量表的高分則可能表示孤獨、不關心他人、難以適應外界環境、感覺遲鈍、與他人關系不佳、喜歡尋釁鬧事等。L量表測量說謊或掩飾,但也代表假設的一種人格特質,即社會樸實或幼稚。
在EPQ測試結果上,男、女有差異;P、E、N量表得分隨年齡增加而下降,L則上升。精神病人的P、N分數都較高,L分數極高。EPQ有良好的信度和效度。
EPQ的中文版,在北方地區有陳仲庚等人的修訂本,南方有龔耀先、劉協和等人的修訂本。EPQ廣泛應用于人格研究,較少應用于臨床及其它場合。
6、 序列系統法:人格研究表是杰克遜根據默瑞的需要理論設計的,共有22個量表。
7、 投射測驗是:人格評估的工具之一,它通過被試對模糊不清、結構不明確的刺激的反應,分析、推斷其人格特點。它的基本假設是:一個人對曖昧不明、非結構化的刺激的反應,由于沒有明確的情境線索、過去經驗或他人的觀點的影響,會反映出其自身獨特的人格特征。刺激本身并不含有一定的意義,然而它們所引發的反應則是有特殊意義的。此一意義來自被試對測驗刺激的主觀解釋和想法,在不知不覺中,投射出其心理上的需要、個性、情緒、動機、沖突、防御等內在狀態。
8、 投射測驗的理論基礎:投射技術的緣起和發展與心理分析理論有密切關系。投射測驗的設計者常用心理分析觀點作為指導來選擇刺激,解釋測驗的結果。
(1) 羅夏克墨跡測驗(RIT):是由瑞士精神病學家羅夏克編制的使用最廣泛的墨跡測驗。
1 1921年,他從所使用的墨跡中篩選出10張圖片出版,這就是著名的RIT.在10張圖片中,有五張是黑白的,有兩張除黑白外,還有紅色墨跡,其余的三張則為淡彩色,每張圖片上的墨跡都是對稱的。
2 實驗的實施分為三個階段:自由聯想階段、詢問階段、極限試探階段。
11 RIT的計分和解釋通常從三方面進行:
A. 反應的部位:測試者要根據被試是對墨跡圖的整體、局部,B. 還是對空白處做反應,C. 將各反應分類。
D. 反應的決定因素:是指E. 被試做反應的依據,F. 包括形狀、彩色、陰影等。
G. 反應的內容:指H. 被試回答的內容。
12 RIT主要適用對象是成人,但也克應用于三或五年級以上的兒童。
(2) 主題統覺測驗(TAT):由默瑞和摩根在1935年編制出版。TAT的材料包括31張圖片,其中一張為空白圖片。圖片中繪有主題不明確的一些圖畫,大多數圖畫中包含人物。測驗者每次給被試看一張圖片,要求他/她講一個故事,在指導語中鼓勵被試盡量發揮想象力。
(3) 語句完成測驗的程序是要求被試將一系列的句子補充成為完整句子。
9、 對投射測驗的評價:
(1) 鑒于心理學家和臨床工作者對人格的深層結構或無意識仍保持相當興趣,投射測驗作為相應的測量工具仍有其地位。因為其它人格測驗根本就不以無意識內容作為測量對象。
(2) 投射測驗作為一種測驗工具,在評分、解釋的客觀性及信度、效度等測量指標上有待提高。
(3) 應該加強從事投射測驗人員的訓練工作。
10、 主體測驗:是一類非結構或半結構化的、隨意而非偽裝的人格評估技術。
(1) 主體測驗一般包括會談和自我概念的測量。
(2) 會談從結構性質上來分,包括結構型會談和非結構型會談。
(3) 語義區分測驗(SDT)最早出自奧斯古德等人1957年的語義心理學研究。
11、 Q-分類或稱Q-技術是:由司蒂芬森1953年創立的,用于單一被試前后測驗結果的相關或兩個人測驗結果的相關分析。Q-分類對研究自我概念的變化特別有用。
第12章 興趣、態度和價值測量
1、 在興趣測量方面貢獻最大的是:史特朗,他在1927年完成了第一個正式的職業興趣量表。另一個主要貢獻者是庫德。
2、 興趣的研究:
(1) 荷蘭德認為:興趣是個體人格的表現,個體對職業的選擇受到動機、知識、愛好和自知力等因素的支配,但最主要的影響因素是興趣和人格。荷蘭德界定出六種主要人格或興趣類型,與它們相應的是六大普通職業主題。
(2) 羅伊認為,職業興趣及職業選擇的首要因素,是由兒童與家庭成員的關系造成的。一個溫暖、和諧的家庭會使兒童成為“以人取向”者,而一個冷漠、疏離家庭中的兒童則具有“以事取向”的特點。職業選擇的另一個維度是從“有目的交流取向”到“利用資源取向”。依據這兩個連續的維度,可以對職業角色進行分類。
3、 史-坎興趣量表:其前身是史特朗職業興趣量表(SVIB)。SVIB是由史特朗在1927年首先編制,當時僅適用于男性。專門為女性而編制的量表則于1933年出版。
4、 總加量表:里克特1932年所設計的總加評定法在編制態度量表時較為簡易。這種方法假設每一項目都具有同等量值,不同被試對同一項目反應上的程度差異可以進行分極評定。
最新資訊
- 歷年整理!2025年10月自考《毛概》簡答題常考重點,附考前預測100題2025-09-24
- 歷年匯總!2025年10月《馬原》高頻考點及備考資料2025-09-23
- 重點!2025年10月自考《習概(15040)》常考簡答題匯總2025-09-22
- 臨考沖刺!2025年10月自考考試題型、評分標準確定,速領沖刺資料包2025-09-22
- 常考!2025年10月自考《英語二》高頻考點+必背知識點2025-09-22
- 2025年10月自考開考科目清單公布!新版教材這樣買才不會錯2025-09-21
- 倒計時!2025年10月自考考前沖刺,這些資料必須有2025-09-20
- 重點收藏!2025年10月自考《中國近代史綱要》歷史事件時間點梳理2025-09-19
- 考生必看!2025年10月自考《中國近代史綱要》必背考點2025-09-19
- 重點收藏!2025年10月自考《習概(15040)》歷年高頻簡答題匯總2025-09-19