最近,ACT考試越來越多受到廣*生、教師以及培訓(xùn)機構(gòu)的關(guān)注。同時,隨著我國教育體制的改革,業(yè)內(nèi)教育研究者也在不斷思考并尋找更有助于*學(xué)生綜合能力考查及運用的完善考試體系。為此教育研究專家將目光轉(zhuǎn)移向素有“美國高考”之稱的ACT考試,其考查內(nèi)容與形式相仿于*高考。為調(diào)研提供了更多可參考、有價值的依據(jù)。
2014年9月,國務(wù)院頒布《關(guān)于深化考試招生制度改革的實施意見》(以下簡稱《實施意見》),提出了深化高考考試內(nèi)容改革的一系列要求:“依據(jù)高校人才選拔要求和*課程標(biāo)準(zhǔn),科學(xué)設(shè)計命題內(nèi)容,增強基礎(chǔ)性、綜合性,著重考查學(xué)生獨立思考和運用所學(xué)知識分析問題、解決問題的能力。改進評分方式,加強評卷管理,完善成績報告。加強*教育考試機構(gòu)、*題庫和外語能力測評體系建設(shè)。”同時啟動了高考綜合改革試點。美國ACT(American College Test)考試,素有美國“高考”之稱,是美國使用最為廣泛、研究最為深入的*入學(xué)考試,至今已有50多年的歷史。ACT考試屬于學(xué)業(yè)成就測驗,是以中學(xué)所學(xué)課程內(nèi)容為基礎(chǔ)、側(cè)重于對中學(xué)所學(xué)內(nèi)容掌握程度的測試,與我國高考內(nèi)容比較接近。探討ACT考試評價體系的研制過程與方法,借鑒其促進考試科學(xué)性和公平性的有效經(jīng)驗,對提升我國高考專業(yè)化水平具有很好的啟迪意義。
一、ACT考試評價運作的科學(xué)化程序
美國ACT教育集團成立于1959年,是一個在教育和職業(yè)發(fā)展領(lǐng)域提供測評、研究、信息以及項目管理服務(wù)的獨立的非營利性機構(gòu),現(xiàn)有雇員超過1500人。1959年秋季舉辦*次ACT考試,當(dāng)時有75,460人參加,2015年美國國內(nèi)有超過190萬高中生參加ACT考試,約占當(dāng)年全美高中畢業(yè)生總數(shù)的59%,美國50個州和首都哥倫比亞特區(qū)4,300多所和*都認(rèn)可并接受其考試成績,將其作為招生錄取的重要標(biāo)準(zhǔn)。同時,ACT還為*招生單位和考生提供關(guān)于學(xué)業(yè)指導(dǎo)、專業(yè)和職業(yè)選擇、*課程安排、獎學(xué)金授予等方面的有效信息。ACT考試作為以課程為基礎(chǔ)、測量學(xué)生升入*所必需具備的學(xué)術(shù)能力的標(biāo)準(zhǔn)化考試,之所以成為衡量學(xué)生學(xué)術(shù)能力的客觀標(biāo)尺,關(guān)鍵在于其采用專業(yè)化標(biāo)準(zhǔn)和科學(xué)化程序開展研制工作,通過了嚴(yán)格的設(shè)計、審核、試測、分析、預(yù)測、校準(zhǔn)、評估等核心步驟,確保了測量的可靠性和有效性。
1.考試設(shè)計理念和運作程序
ACT考試的核心是測查學(xué)生是否為修讀*學(xué)業(yè)做好了知識與技能方面的準(zhǔn)備(College Readiness)。所謂“*準(zhǔn)備”是指一個學(xué)生升入*并取得成功,即不需要補習(xí)而在中等后教育課程*年學(xué)習(xí)中獲得學(xué)分所必需具備的學(xué)業(yè)成就水平,而這一水平是由*準(zhǔn)備標(biāo)準(zhǔn)(College Readiness Standards)和準(zhǔn)備基準(zhǔn)(College Readiness Benchmark)共同決定的。其中,*準(zhǔn)備標(biāo)準(zhǔn)描述了學(xué)生升入*所必需掌握的核心技能和知識,*準(zhǔn)備基準(zhǔn)是基于*性樣本進行評估后獲得的分?jǐn)?shù)線,意味著一個學(xué)生的成績在此基準(zhǔn)之上會有較大可能地完成中等后教育。ACT通過一套科學(xué)的評估框架和運作程序,確保測量評價的準(zhǔn)確性和可靠性,包括*課程調(diào)查以及經(jīng)常的外部標(biāo)準(zhǔn)審核、證據(jù)基礎(chǔ)、持續(xù)研究和監(jiān)測評估,不斷提高測試內(nèi)容效度和預(yù)測效度(參見圖1)。
2.考試內(nèi)容與結(jié)構(gòu)
ACT考試由四個部分構(gòu)成:(1)旨在測量考生書面英語理解與分析能力的英語測試;(2)旨在測量考生定量推理能力的數(shù)學(xué)測試;(3)旨在測量考生理解、分析、推理和解決問題能力的閱讀測試,閱讀測試的內(nèi)容涵蓋自然科學(xué)、社會科以及文學(xué)和藝術(shù);(4)旨在測量考生運用圖表、表格和研究總結(jié)等方式解釋、分析、評估、推理和解決問題能力的科學(xué)測試。還有非必選的40分鐘的英語寫作,屬于給材料的作文,測試學(xué)生的英語寫作能力。全套ACT考試,共計215道題,其中英語測試有75題,數(shù)學(xué)測試60題,閱讀測試40題,科學(xué)測試40題,考試時限為175分鐘。在美國本土、領(lǐng)地、波多黎各和加拿大一年有6次考試,其他地方有5次國際考試。
3.課程調(diào)查
為了選擇出特定的知識與技能用于評價,ACT重點調(diào)查研究三方面的資源:一是研究各州公布的課程框架,以了解7~12年級的教學(xué)目標(biāo)與教學(xué)內(nèi)容;二是審閱各州批準(zhǔn)的7~12年級各科教材目錄,以了解中學(xué)的教材內(nèi)容;三是進行*課程調(diào)查。ACT每3~5年開展一次*課程調(diào)查,詢問教師在課程中都教給(或沒教給)學(xué)生哪些知識和技能,以及他們認(rèn)為在當(dāng)前或未來課程學(xué)習(xí)中對學(xué)生取得學(xué)業(yè)成功最重要的*主題。調(diào)查還詢問教育工作者當(dāng)前關(guān)心的教育話題,如對學(xué)生的*學(xué)術(shù)準(zhǔn)備或ACT*準(zhǔn)備標(biāo)準(zhǔn)、2010年頒布的具有*統(tǒng)一性質(zhì)的課程標(biāo)準(zhǔn)“共同核心州立標(biāo)準(zhǔn)”的實施意見。
最近的一次調(diào)查是在2012年進行的,樣本來自全美公立和私立的*、*、高中和*,包括教授英語/寫作、數(shù)學(xué)、閱讀、科學(xué)的9,937名教師。調(diào)查發(fā)現(xiàn):(1)高中教師感覺的高中畢業(yè)生*學(xué)術(shù)準(zhǔn)備情況和*教師感覺的**學(xué)生的準(zhǔn)備情況存在較大的差距,說明基礎(chǔ)教育和中等后教育體系之間的課程缺乏銜接和連貫性;(2)許多課堂需要更好或更有保障地使用計算機,使學(xué)生更有效地適應(yīng)*或職業(yè)準(zhǔn)備標(biāo)準(zhǔn)要求和新的評價方法;(3)州、地方和學(xué)校執(zhí)行“共同核心州立標(biāo)準(zhǔn)”的努力程度存在差異,說明還沒有足夠的教師準(zhǔn)備在課程和課堂上進行必要的變革。通過調(diào)查,ACT形成并繼續(xù)推動以下發(fā)展議程:(1)在ACT*準(zhǔn)備標(biāo)準(zhǔn)和“共同核心州立標(biāo)準(zhǔn)”之間建立清晰的聯(lián)系;(2)盡可能地利用新技術(shù),提供更有意義的結(jié)果報告;(3)在題庫中把科學(xué)作為關(guān)鍵內(nèi)容領(lǐng)域;(4)注重以證據(jù)為中心的設(shè)計,通過研究來驗證ACT考試對*入學(xué)準(zhǔn)備的反應(yīng)和對*學(xué)業(yè)水平的預(yù)測效度。
4.試題編制
作為教育測評機構(gòu),ACT致力于所有測試在原理和準(zhǔn)確度方面的公平性,支持和遵循“教育公平測試實踐準(zhǔn)則”(美國考試實踐聯(lián)合委員會,2004)和“教育測量專業(yè)責(zé)任準(zhǔn)則”(*教育測量委員會,1995)。前者是為教育測試和數(shù)據(jù)開發(fā)、管理和使用者制定的準(zhǔn)則,規(guī)定了以下四個領(lǐng)域的公平標(biāo)準(zhǔn),包括開發(fā)和選擇適當(dāng)?shù)臏y試、管理和評分、報告和解釋測試結(jié)果并通知考生;后者要求測試開發(fā)人員研制和提供測評產(chǎn)品與服務(wù),盡可能避免由于與測量結(jié)果無關(guān)的特性,如性別、民族、種族、社會經(jīng)濟地位、殘疾、宗教信仰、年齡或國籍產(chǎn)生的偏見。這些準(zhǔn)則貫穿于ACT整個試題研制過程中,從考試設(shè)計和規(guī)范到試題編寫和審核、試測、題目選擇和形式建構(gòu)等各個環(huán)節(jié)。
(1)測試規(guī)范。測試規(guī)范是編制試題的藍(lán)圖,主要由兩部分組成:一是由考試來測量的內(nèi)容和技能認(rèn)知水平的說明;二是試卷*題統(tǒng)計特征的說明。為了讓考試有效和公正,確保規(guī)范僅包括滿足考試目的實際需要的知識和技能,并能夠?qū)W(xué)術(shù)準(zhǔn)備較好和較弱的學(xué)生做出有效的區(qū)分。
(2)試題編寫。招募并培訓(xùn)試題編寫者,通過向題目編寫者(作為內(nèi)容專家,許多是很活躍的高中和*任課教師)提供內(nèi)容領(lǐng)域的具體指南,包括測試規(guī)范(如對公平的關(guān)注、準(zhǔn)確的標(biāo)準(zhǔn)等)、內(nèi)容和風(fēng)格要求(如考題的內(nèi)容和范圍、考題類型、技能水平、期望的難度、字?jǐn)?shù)、格式和語言)以及可接受的題目的案例,同時考慮試題編寫者能夠代表全美人口民族、性別和地理背景方面的多樣性,確保編寫出反映多種視角的試題。ACT工作人員則對這些考題的公正性、利益和年級水平的適當(dāng)性以及語法的準(zhǔn)確性及測量特征等遵循規(guī)范的情況進行全面審查,避免涉及對某些社會群體不熟悉,包含可能被認(rèn)為冒犯或歧視任何群體的語言、角色、情境的內(nèi)容。
(3)外部審核。由代表地理區(qū)域、民族和性別多樣性的任課教師、*教師、課程專業(yè)人員組成的外部內(nèi)容專家組,以及反映民族、性別和地理背景多樣性和對測試項目公正問題保持敏感的外部公正專家組共同審核試題的準(zhǔn)確性、年級水平的適當(dāng)性、教育的重要性以及對所有考生的公平性,ACT工作人員然后進一步修改每一個考題使之符合專家的反饋意見,以保證所研制的試題與*準(zhǔn)備標(biāo)準(zhǔn)的一致性及不存在偏向某一特殊群體的現(xiàn)象。
(4)試用和統(tǒng)計分析。通過公正、課程、年級水平適當(dāng)性審核的考題在考試中作為不計分的部分進行試測,ACT工作人員對試用的每一個考題進行統(tǒng)計分析,看是否包含統(tǒng)計上的非常態(tài)現(xiàn)象,鑒定考題是否在技術(shù)上良好和難度水平適當(dāng),審查在統(tǒng)計上非常態(tài)的考題,確定是否修改準(zhǔn)備下一次試用或刪除。
(5)試題庫。如果一個考題成功通過試用,它就能被放進試題庫里備用,新試卷的考題從基于內(nèi)容標(biāo)準(zhǔn)和統(tǒng)計特性的題庫中選擇,每張試卷應(yīng)在多元文化和性別代表性上保持平衡,并有效地區(qū)分出不同表現(xiàn)水平的學(xué)生,被選出來的考題也要確保學(xué)生有足夠的時間完成整場考試。
(6)附加的外部審核。ACT工作人員將試卷作為一個整體審查內(nèi)容準(zhǔn)確性和風(fēng)格,再請新一批外部內(nèi)容與公正專家就是否存在攻擊、公正描述、多樣性和平衡、語言公正、基于課程的內(nèi)容和技能、不公正的考試和考生壓力等方面進行評審。根據(jù)專家的反饋意見,在管理使用之前對考試形式進行必要的修改??傊?,ACT研發(fā)一套新試題需要兩年或一年半的時間,每道考題出現(xiàn)在正式考卷之前至少經(jīng)過16次的獨立審查,確保每個學(xué)生的學(xué)業(yè)成就水平得到準(zhǔn)確和公正的評價。
5.試題形式
ACT考試普遍使用客觀題,除作文題外,一律為多項選擇,認(rèn)為編制較好的多項選擇題具有以下優(yōu)勢:(1)能夠在較短的時間內(nèi)考查較為寬泛的內(nèi)容,具有效率優(yōu)勢;(2)能夠?qū)崿F(xiàn)多重目標(biāo),盡管非常適于考查記憶性的內(nèi)容,但也能夠較好地評價高層次的思考技能;(3)通過改進可以減少猜測,通常具有較高的信度和效度;(4)受考生的歡迎;(5)閱卷經(jīng)濟和時間成本低,同時也比較容易采用計算機考試的方式??荚嚢纳倭块_放題(open ended),如建構(gòu)性試題(constructed response,如作文)或表現(xiàn)性任務(wù)(performance-based,如科學(xué)實驗),則要求有十分清晰的評分標(biāo)準(zhǔn)。
6.計分方法
ACT考試中的多項選題的成績(英語、數(shù)學(xué)、閱讀和科學(xué))的原始分(答對的題目數(shù)量)轉(zhuǎn)化為量表為1—36的標(biāo)準(zhǔn)分,總分是這四項標(biāo)準(zhǔn)分?jǐn)?shù)的平均值(小數(shù)四舍五入),*1分,*36分,還同時報告英語的用法/結(jié)構(gòu)和修辭技巧,數(shù)學(xué)的預(yù)備代數(shù)/初級代數(shù)、中級代數(shù)/解析幾何、平面幾何/三角函數(shù),閱讀的社會研究/自然科學(xué)、文學(xué)藝術(shù)七個方面的子分?jǐn)?shù),原始分轉(zhuǎn)化為1—18分的標(biāo)準(zhǔn)分。如果一個學(xué)生參加了寫作考試,將由兩個訓(xùn)練有素的專家采用六點計分法獨立評閱,基于學(xué)生表現(xiàn)出來的能力和判斷的證據(jù)、提出和堅持問題的立場、組織和表達觀點的邏輯、用標(biāo)準(zhǔn)書面英語清晰和有效表達的狀況,并作為一個整體進行評價,每個閱卷者的評定分?jǐn)?shù)范圍為1—6分,兩人評定分?jǐn)?shù)合計為該學(xué)生寫作考試的原始分?jǐn)?shù)(2—12分),報告結(jié)果時轉(zhuǎn)化為1—36的標(biāo)準(zhǔn)分并單獨計分,同時報告觀點與分析、發(fā)展與支持、組織、語言運用和慣用法等各個領(lǐng)域的分項分?jǐn)?shù)。
ACT考試中的多項選擇題閱卷采用電子掃描設(shè)備,*限度地減少錯誤評分的可能性。如果一個學(xué)生認(rèn)為評分有誤,可以提出書面申請,進行人工評分;如果一個學(xué)生認(rèn)為寫作考試評分有誤,可以提出申請,作文將被兩位不了解初始分?jǐn)?shù)的新專家評閱并重新賦分,新分?jǐn)?shù)在最終確定前經(jīng)過ACT工作人員寫作專家的裁定才能生效。ACT保留取消考試成績的權(quán)利,在考試管理過程中出現(xiàn)非正常情況,如偽造身份、替考、同一考場考生答卷的非正常雷同或其他不準(zhǔn)確反映考生教育成就的考試分?jǐn)?shù)等,都有可能導(dǎo)致ACT取消考試成績。
7.*與職業(yè)準(zhǔn)備標(biāo)準(zhǔn)和基準(zhǔn)
ACT在1997年開始開發(fā)*與職業(yè)準(zhǔn)備標(biāo)準(zhǔn),即學(xué)生在考試中的得分范圍代表著其可能知道和能夠做什么的說明,從而用于*入學(xué)和課程安排決策。在深入研究的基礎(chǔ)上,ACT工作人員認(rèn)為分值范圍1-12、13-15、16-19、20-23、24-27、28-32和33-36能夠較好地區(qū)分學(xué)生的學(xué)業(yè)水平,并從高中和*英語、數(shù)學(xué)等專業(yè)邀請**教師和研究人員提供獨立、權(quán)威的評審意見,確定特定的分值范圍是否準(zhǔn)確地反映了學(xué)生可能已經(jīng)掌握的知識和技能,并與下一步即將學(xué)習(xí)的內(nèi)容建立起聯(lián)系。這種評審?fù)ǔC咳剿哪赀M行一次,并確保標(biāo)準(zhǔn)中所描述的知識和技能能夠反映課堂教學(xué)內(nèi)容。ACT也定期通過分析數(shù)據(jù)和相應(yīng)的考題進行內(nèi)部評估,確保標(biāo)準(zhǔn)反映每一個分值范圍所測量的知識和技能,反映從*分到*分不斷增加的復(fù)雜技能和理解的累積性進展,對標(biāo)準(zhǔn)的說明做出微調(diào)。
*和職業(yè)準(zhǔn)備基準(zhǔn)是學(xué)生修讀*學(xué)分課程并取得成功所要求的*考試分?jǐn)?shù),是基于學(xué)生在*學(xué)習(xí)中的實際表現(xiàn)通過實證研究得來的,樣本充分考慮到*課程和機構(gòu)類型多樣化,2013年根據(jù)214所機構(gòu)和23萬多學(xué)生考試分析后,確定英語、閱讀、數(shù)學(xué)和科學(xué)的基準(zhǔn)分別為18分、22分、22分和23分,滿足了基準(zhǔn)的學(xué)生在相應(yīng)*課程學(xué)習(xí)中獲得B或以上的機率大約為50%,獲得C及以上的可能性為75%左右。在2015年全美參加ACT考試的1,924,436名高中畢業(yè)班學(xué)生中,滿足三項或四項ACT*準(zhǔn)備基準(zhǔn)的學(xué)生比例達到40%,完全沒有達到基準(zhǔn)的比例為31%。*準(zhǔn)備基準(zhǔn)能夠讓學(xué)生認(rèn)識到他們高中畢業(yè)時是否具備升學(xué)所要求的技能基礎(chǔ),研究者和政策制定者還能夠用來監(jiān)測學(xué)校、地區(qū)和州教育進展,中學(xué)則可以用來檢驗學(xué)生升學(xué)準(zhǔn)備情況,必要時及時采取干預(yù)措施,或者作為教育咨詢或生涯規(guī)劃的工具。
8.評分量表和常模
ACT常模是代表美國12年級開始參加考試、準(zhǔn)備進入兩年或四年制*的12年級學(xué)生的考試分?jǐn)?shù)。1988年10月,ACT開始對*超過10萬名高中學(xué)生進行學(xué)術(shù)技能研究,研制評分量表和提供代表*的常模。每年報告的常模是基于最近三年的高中畢業(yè)班學(xué)生參加ACT考試成績確定的,開發(fā)出累積性的百分位數(shù)。一位考生得分對應(yīng)的百分位排名,代表分布中有多大比例的*高中畢業(yè)的考生相同或低于此分?jǐn)?shù),從而可用以評估個人的相對優(yōu)勢和弱勢。各種穩(wěn)定性和效度研究表明,ACT報告的分?jǐn)?shù)的涵義及其在*課程學(xué)習(xí)結(jié)果預(yù)測能力方面,顯示出不同試卷和不同年度評分量表的一致性。
9.等值方法
ACT每年研發(fā)新試卷,即使每套題都遵循相同的內(nèi)容和統(tǒng)計規(guī)范,但題目在難度上還略微不同。為控制這些差異,即后來使用的試卷必須與以前的試卷是等值的,根據(jù)評定量表對考生報告的分?jǐn)?shù)應(yīng)具有相同的涵義,這樣不同試卷和日期的考試是可以比較的。ACT從*每年的六次考試中抽取一次考試的考生樣本作為等值的樣本,隨機抽取每張試卷的考生超過2,000多人,以初始研制評分量表的試卷作為錨題(共同題),采用等百分位等值方法使在另一份考卷中獲得的分?jǐn)?shù)與評定量表等值。
10.信度和效度
信度是測量分?jǐn)?shù)和真分?jǐn)?shù)一致性的估計,測量標(biāo)準(zhǔn)誤差反映考試分?jǐn)?shù)錯誤或不一致性的程度,兩者密切相關(guān)。ACT開發(fā)的評分量表具有大體穩(wěn)定的標(biāo)準(zhǔn)誤差,如果用正態(tài)分布曲線來估計,大約2/3可能被誤測考生的分?jǐn)?shù)會少于1個標(biāo)準(zhǔn)差。面對參加多次考試即重考(ACT允許最多參加12次考試)的人數(shù)越來越多,2009年高中畢業(yè)前重考比例為41%,2015年上升為45%,數(shù)據(jù)顯示擁有真實潛力的學(xué)生重考確實能夠增加總分,如在2015年重考高中畢業(yè)生中,57%的學(xué)生總分在第二次考試中有所改善,但22%的下降,21%的沒有變化。從這個意義上說,考試次數(shù)的增加傾向于能夠提高平均總分,然而,深入分析發(fā)現(xiàn)增加的分?jǐn)?shù)往往更多的是測量誤差而不是實際學(xué)術(shù)能力的收益,在10次考試后就可能達到天花板。
效度是體現(xiàn)測試結(jié)果解釋的相關(guān)性、有用性和有價值的程度,主要包括內(nèi)容效度和預(yù)測效度。ACT測驗藍(lán)圖的設(shè)計和編制題目的程序,定期的*課程調(diào)查和*專家、心理測量人員和其他專業(yè)人員的審核,保障了ACT考試聚焦于高中和*課程的內(nèi)容效度。學(xué)生考試成績和*課程等級數(shù)據(jù)的長期追蹤研究表明,ACT考試分?jǐn)?shù)和高中的平均成績點數(shù)(GPA)、*成績等級之間的統(tǒng)計關(guān)系顯示了良好的預(yù)測效度,有助于預(yù)測誰能夠在**甚至進入*取得學(xué)業(yè)成功(參見表1)。
二、ACT考試評價對提升我國高考專業(yè)化水平的啟示
ACT考試作為評價學(xué)生基礎(chǔ)教育課程內(nèi)容掌握程度和綜合能力的標(biāo)準(zhǔn)化測試,設(shè)計和編制的科學(xué)化程度較高,試題難度和分?jǐn)?shù)評定量表穩(wěn)定,得到了多數(shù)*的信任,其影響范圍已不僅限于美國,正走向全球越來越多的*。ACT考試?yán)砟?、設(shè)計、編制與實施方面的經(jīng)驗值得我們認(rèn)真研究與借鑒。
1.重新認(rèn)識高考的功能定位,實現(xiàn)基礎(chǔ)教育和高等教育的有效銜接
ACT考試誕生于第二次世界大戰(zhàn)后美國社會轉(zhuǎn)型時期,*面對申請注冊人數(shù)的陡增而缺乏指導(dǎo)入學(xué)和課程設(shè)置的測試工具,以確保來自多樣化教育和族群背景的學(xué)生取得成功。作為創(chuàng)始人的愛荷華*教授E. F.林奎斯特在1959年闡明了ACT考試存在的目的和意義:不同于SAT考試(美國*理事會1926年開始舉辦的學(xué)術(shù)能力評估測試)側(cè)重考查學(xué)生的學(xué)術(shù)潛能,過于強調(diào)選拔和排斥功能,ACT考試則側(cè)重考查學(xué)生為進入*所做的學(xué)業(yè)準(zhǔn)備情況,即判斷學(xué)生進入*學(xué)習(xí)所具備的知識和能力,并根據(jù)這種知識技能儲備和職業(yè)興趣來判斷適合他們的*和專業(yè)。ACT通過*課程調(diào)查制定了*準(zhǔn)備標(biāo)準(zhǔn),實現(xiàn)中學(xué)、*課程內(nèi)容框架的一致性,當(dāng)然與高中課程的相關(guān)程度更高。雖然以中學(xué)所學(xué)課程內(nèi)容為依據(jù)命題,但試卷中不會直接考查對所學(xué)知識的機械記憶或死記硬背,而是強調(diào)應(yīng)用所學(xué)內(nèi)容分析解決問題的能力。
《實施意見》提出深化高考內(nèi)容改革,要依據(jù)高校人才選拔要求和*課程標(biāo)準(zhǔn),科學(xué)設(shè)計命題內(nèi)容,增強基礎(chǔ)性、綜合性,著重考查學(xué)生獨立思考和運用所學(xué)知識分析問題、解決問題的能力。首先,考試機構(gòu)作為考試工具的開發(fā)者和標(biāo)準(zhǔn)的執(zhí)行者,了解高校的人才需求和高校課程內(nèi)容的基本框架,并從考試的可操作性出發(fā),聯(lián)合高校形成*課程標(biāo)準(zhǔn)之外的人才選拔標(biāo)準(zhǔn)或入學(xué)標(biāo)準(zhǔn)。其次,高考命題應(yīng)當(dāng)關(guān)照基礎(chǔ)教育特性,制定與課程標(biāo)準(zhǔn)相匹配的學(xué)業(yè)成就評價標(biāo)準(zhǔn),題目開發(fā)強調(diào)考查學(xué)生活學(xué)活用、分析問題與解決問題能力等在*學(xué)習(xí)中所必備的核心能力。再次,實施綜合性考試命題形式,隨著高中學(xué)業(yè)水平制度的建立和完善,借鑒ACT將中學(xué)所學(xué)課程內(nèi)容融合為語言、數(shù)學(xué)、閱讀、科學(xué)四大部分的經(jīng)驗,從*的整體高度出發(fā),注重反映*的知識結(jié)構(gòu)體系,體現(xiàn)*中各部分內(nèi)容的聯(lián)系和融合,增強高考考試內(nèi)容的綜合性。
2.加快高考測試?yán)碚?、技術(shù)和方法創(chuàng)新,提高高考科學(xué)化水平
ACT考試設(shè)計和命題以先進的教育測量理論和方法為指導(dǎo),如目前在教育測量領(lǐng)域被奉為圭臬的項目反應(yīng)理論、計算機自適應(yīng)考試等,通過*課程調(diào)查確??荚囁鶞y量的知識與技能是授課教師們一致認(rèn)可的內(nèi)容,且這些知識與技能對于學(xué)生在*相應(yīng)內(nèi)容領(lǐng)域?qū)W習(xí)獲得成功是至關(guān)重要的。恪守教育測量的行業(yè)規(guī)范和專業(yè)倫理,并貫穿于從考試設(shè)計、試題編寫和審核、試測、題目選擇和形式建構(gòu)等各個環(huán)節(jié),每道試題都要經(jīng)過內(nèi)容專家和公正專家的嚴(yán)格審核,各科目考試的考核點、試題類型、覆蓋面和比例等方面都進行明確的規(guī)定,確保不同考卷之間各類題材、體裁的合理分布與統(tǒng)一,確保所有各套試卷在總體難度上基本對等,成績經(jīng)過量表化和等值處理,使得各次考試得分之間具有可比性。在題型方面,客觀題的使用非常普遍。除作文題外,一律為多項選擇題,采用計算機閱卷,評分客觀、迅速,成本效益高,同時也較容易采用計算機考試的方式。
我國現(xiàn)行高考命題一直采取“入闈”命題的形式,即專家集中開會命制當(dāng)年試題的會議任務(wù)型命題方式,這種考試命題組織形式相對封閉,容易出現(xiàn)內(nèi)容的偏向性、不公平,也難以確保每次高考試題難度基本相當(dāng),實行多次考試存在等值性問題。提高我國高考的科學(xué)化程度,關(guān)鍵在于提高命題質(zhì)量。一是完善高考命題質(zhì)量保障體系。建立健全高考命題質(zhì)量標(biāo)準(zhǔn)、規(guī)范和程序,擴大命題隊伍,廣泛招募命題教師,甚至通過網(wǎng)絡(luò)開展社會征題,形成工作流程、試卷生成程序、*命題手冊、試題入庫標(biāo)準(zhǔn)等規(guī)范,加快建設(shè)*高考題庫,保證*生成的試卷在難度、區(qū)分度等方面的一致性。二是采用標(biāo)準(zhǔn)分計分法,研制評分量表,確保每一科目考試所測得的考生信息在分?jǐn)?shù)轉(zhuǎn)換前后守恒,并建立起分?jǐn)?shù)與能力水平的對應(yīng)認(rèn)知;利用等值技術(shù)使同一測驗或多次考試的不同套題之間考試結(jié)果具有可比性,并顯示出不同試卷和不同年度評分量表的一致性。三是完善高考效度檢驗體系?,F(xiàn)行高考命題質(zhì)量評價主要由考試*提供考后數(shù)據(jù)統(tǒng)計分析,其所提供的主要是試題的內(nèi)部效度證據(jù),應(yīng)該增加服務(wù)對象,研究測試結(jié)果與考生中學(xué)學(xué)習(xí)、*入學(xué)后成績的一致性,將預(yù)測效度作為高考效度的重要指標(biāo)。
3.基于研究和數(shù)據(jù)支撐增強服務(wù)功能,加快教育考試機構(gòu)專業(yè)化建設(shè)
ACT作為一個以幫助人們?nèi)〉媒逃凸ぷ鲌鏊晒槭姑姆菭I利組織,擁有一支高水準(zhǔn)的專業(yè)技術(shù)團隊,包括測驗方法的基礎(chǔ)研究人員、每個具體測驗項目的負(fù)責(zé)人及專家、政策研究人員,其中設(shè)有150余人的獨立的研究與發(fā)展*,將基于研究和證據(jù)基礎(chǔ)上的逐步更新和功能增強作為持續(xù)改進的哲學(xué),憑借其強大的項目研發(fā)和數(shù)據(jù)支撐基礎(chǔ),為學(xué)生實現(xiàn)從高中向*過渡提供信息支持和解決方案,從考前、考中和考后提供全方位的服務(wù),考前為考生提供考生手冊、樣題和練習(xí)資料,考中為殘疾考生提供特殊服務(wù)和裝置,為因家庭經(jīng)濟原因無力交納考試費的考生減*費用等,考后為考生、家長和學(xué)校提供面向不同群體的數(shù)據(jù)分析報告和周到的延伸管理服務(wù)。
我國教育考試機構(gòu)大多為具有一定行政職能的事業(yè)單位,有少數(shù)屬于*行政*,對考試本身的評價和系統(tǒng)研究、數(shù)據(jù)開發(fā)和證據(jù)積累以及由評價延伸的服務(wù)存在嚴(yán)重不足。編制大規(guī)??荚囀且豁椄叨葘I(yè)化的工作,高考的研究基礎(chǔ)、組織實施、信息服務(wù)、機構(gòu)設(shè)置等問題需要逐漸完善,發(fā)展方向應(yīng)該是由專業(yè)化的考試機構(gòu)或公司承擔(dān)高考命題與組織工作。隨著我國事業(yè)單位分類改革的推進,按照“考試和招生相對分離”的原則,教育考試機構(gòu)必須由管理型向研究、管理和服務(wù)型轉(zhuǎn)變,在行政*的監(jiān)控下獨自承擔(dān)考試設(shè)計、考試實施、數(shù)據(jù)開發(fā)、信息服務(wù)甚至失誤等責(zé)任,在理論研究、標(biāo)準(zhǔn)建設(shè)、技術(shù)發(fā)展、組織體系、隊伍素質(zhì)等方面加快專業(yè)化建設(shè),不斷提高高考命題質(zhì)量、水平及其評價服務(wù)能力。
注:本報告獲2015年*留學(xué)基金委國外教育調(diào)研訪問學(xué)者項目資助。本文轉(zhuǎn)載自*教育財政 王建
想了解更多關(guān)于ACT考試的官方資訊,請咨詢ACT俱樂部(ACT官方特許授權(quán)機構(gòu))。
只要一個電話
我們免費為您回電