【作者簡介】
黃曉婷,北京大學(xué)中國教育財(cái)政科學(xué)研究所助理研究員,中國PISA2015正式測試質(zhì)量監(jiān)控官; 張眉、關(guān)可心,北京大學(xué)中國教育財(cái)政科學(xué)研究所科研助理。
摘要:近年來,隨著我國學(xué)前教育總體規(guī)模的不斷擴(kuò)大,學(xué)前教育的質(zhì)量問題也逐漸受到越來越多的關(guān)注。本文介紹了一套成熟的評價(jià)幼兒園整體質(zhì)量的量表,即《幼兒學(xué)習(xí)環(huán)境評量表(修訂版)》(ECERS-R),及其在我國西部某市6所幼兒園進(jìn)行試測的情況。通過分析試測數(shù)據(jù),本研究對ECERS-R在我國使用的信、效度做了初步的驗(yàn)證,探討了這一量表在我國的適用性和使用價(jià)值。最后,本文詳細(xì)分析了量表中各題項(xiàng)的得分情況,試圖對我國幼兒園管理和教學(xué)工作的進(jìn)一步改善提出相關(guān)建議。
關(guān)鍵詞:學(xué)前教育 質(zhì)量評價(jià) ECERS-R 學(xué)習(xí)環(huán)境評量
一、研究背景
學(xué)前教育的意義和作用已經(jīng)在世界范圍內(nèi)得到了廣泛的認(rèn)可。我國自2010年實(shí)施“學(xué)前教育三年行動(dòng)計(jì)劃”以來,學(xué)前三年毛入學(xué)率、幼兒園數(shù)量、在園幼兒規(guī)模都實(shí)現(xiàn)了高速增長。隨著政府對學(xué)前教育財(cái)政投入的持續(xù)增加,如何保證和提升保教質(zhì)量,成為學(xué)前教育進(jìn)一步發(fā)展的重要挑戰(zhàn)。面對這一變化,我國多個(gè)省市制定了幼兒園評估標(biāo)準(zhǔn),但這些地方性評估標(biāo)準(zhǔn)往往偏重幼兒園的硬件設(shè)施,忽略教學(xué)過程等軟環(huán)境,或者是在可操作性、規(guī)范性及評價(jià)的時(shí)代性等方面不盡如人意。過去的相關(guān)研究也存在類似的問題,少數(shù)現(xiàn)有的評價(jià)工具信、效度未經(jīng)檢驗(yàn)或不夠高。因此,我們需要科學(xué)有效的評價(jià)工具,來了解幼兒園質(zhì)量的現(xiàn)狀,特別是過去知之甚少的過程性質(zhì)量,從而促進(jìn)學(xué)前教育質(zhì)量的提升。
國際上對學(xué)前教育質(zhì)量評價(jià)的研究已經(jīng)有了一定的積累和經(jīng)驗(yàn)。其中,美國的Harms等研發(fā)的《幼兒學(xué)習(xí)環(huán)境評量表》(ECERS)最早于1980年發(fā)布,1998年又出版了修訂版(以下簡稱“ECERS-R”)。該量表目前已經(jīng)在美國、加拿大、澳大利亞、加勒比地區(qū)、臺灣等多個(gè)國家和地區(qū)得到廣泛應(yīng)用,并有多項(xiàng)研究支持其在信、效度上的良好表現(xiàn)。該評量表不僅關(guān)注幼兒園的物理環(huán)境,更著重強(qiáng)調(diào)了教學(xué)實(shí)施中活動(dòng)安排、師生互動(dòng)等多項(xiàng)對兒童發(fā)展有重要影響的因素。
這一量表近年來也逐漸引起了我國學(xué)者的注意。例如,胡碧穎等于2008年在北京市運(yùn)用ECERS-R評量表,對7所幼兒園共計(jì)40個(gè)班級進(jìn)行了試測。研究者們在評價(jià)實(shí)踐中發(fā)現(xiàn)了量表中部分指標(biāo)的不適用,存在一定與我國文化特點(diǎn)不符合的情況。但這些現(xiàn)有的研究較少深入探討量表在我國使用時(shí)總體及子維度的信度和效度,且幼兒園類型比較單一,因此我們對ECERS-R在我國的適用性及其對我國幼兒園管理、教學(xué)工作的作用仍然缺乏細(xì)致詳盡的了解。
本文詳細(xì)介紹了ECERS-R量表及其在我國西部某市6所幼兒園進(jìn)行試測的情況,并深入分析了該評價(jià)工具在試用中的信、效度,探討其在我國的適用性和使用價(jià)值。研究還通過詳細(xì)解讀樣本幼兒園在各個(gè)題項(xiàng)上的得分情況,對幼兒園在管理和教學(xué)中可能存在的問題提出改進(jìn)建議。本研究旨在積累ECERS-R量表在中國應(yīng)用的經(jīng)驗(yàn),同時(shí)也為我國學(xué)者研發(fā)更適合國情的學(xué)前教育質(zhì)量評價(jià)工具積累經(jīng)驗(yàn)。
二、評價(jià)工具:《幼兒學(xué)習(xí)環(huán)境評量表(修訂版)》(ECERS-R)
ECERS-R由美國北卡羅來納州立大學(xué)兒童發(fā)展中心的Harms教授研究團(tuán)隊(duì)經(jīng)過幾十年的積累研發(fā)而成。該量表是目前學(xué)前領(lǐng)域最具權(quán)威的評價(jià)工具之一,在美國和其他多個(gè)國家被廣泛用來對幼兒園的總體質(zhì)量,包括結(jié)構(gòu)性質(zhì)量和過程性質(zhì)量,進(jìn)行全面的評價(jià)。
該量表包含7個(gè)子維度,即空間和設(shè)施、個(gè)人日常照料、語言-推理、活動(dòng)、互動(dòng)、作息結(jié)構(gòu)及家長和教師。具體來說,空間和設(shè)施子維度主要評價(jià)幼兒園的物理環(huán)境,包括室內(nèi)空間的面積和規(guī)劃,日常學(xué)習(xí)或游戲用的設(shè)施、休息的空間和設(shè)施,戶外活動(dòng)的空間和設(shè)施等。個(gè)人日常照顧子維度著重評價(jià)教師在幼兒在園期間的衛(wèi)生、健康和安全實(shí)務(wù)領(lǐng)域的工作。語言—推理子維度則對幼兒園在教學(xué)中對兒童語言發(fā)展方面的培養(yǎng)進(jìn)行了評價(jià)?;顒?dòng)子維度主要評價(jià)幼兒園室內(nèi)、外各種活動(dòng)的計(jì)劃性和多樣性?;?dòng)子維度包括了在教學(xué)和活動(dòng)中師幼間、幼兒間信息交換的質(zhì)量。作息結(jié)構(gòu)子維度針對幼兒園課程安排中的時(shí)間規(guī)則,評價(jià)教師面對不同個(gè)人需求的靈活性。最后,家長與教師子維度評價(jià)了家?;?dòng)、教師間互動(dòng)合作,幼兒園對教師的個(gè)人需要、專業(yè)成長需要的供應(yīng),以及幼兒園對教師的督導(dǎo)與評量等多個(gè)方面。
這7個(gè)子維度分別包含4-10個(gè)題項(xiàng),整個(gè)量表共包括43個(gè)題項(xiàng)。量表采用7點(diǎn)評分方式,1分表明幼兒園在該題項(xiàng)評價(jià)的方面“未達(dá)到最低要求”(inadequate),3分表明“僅滿足最低要求”(minimal),5分或以上為“表現(xiàn)良好”(good),7分為“優(yōu)秀”(excellent)。
量表的正確使用依賴于經(jīng)過嚴(yán)格訓(xùn)練的評分員。ECERS-R的作者們開發(fā)了一套標(biāo)準(zhǔn)化的評分員培訓(xùn)教材,主要包括量表解讀、案例分析和評分練習(xí)三個(gè)部分。完成培訓(xùn)的評分員,需對每個(gè)參與評價(jià)的班級進(jìn)行至少4小時(shí)的觀察,隨后完成評分。
由于本研究的評價(jià)實(shí)踐進(jìn)行時(shí),還沒有正式出版的簡體中文版本,我們在臺灣國立臺東大學(xué)郭李宗文、陳淑芳翻譯的版本(2006年出版)的基礎(chǔ)上,進(jìn)行了中文的繁簡體轉(zhuǎn)換和習(xí)慣用語的修改。
三、研究方法
我國西部某市6所幼兒園(4所城市園和2所農(nóng)村園)的45個(gè)班級參與了此次評價(jià)實(shí)踐。8名評分員一起學(xué)習(xí)和探討了與量表配套的標(biāo)準(zhǔn)化培訓(xùn)課程。在評價(jià)過程中,每個(gè)評分員一次只評價(jià)一個(gè)班級,每個(gè)班級觀察4小時(shí)。對于不能直接觀察到的信息,觀察員需要安排一定的時(shí)間對幼兒園教師進(jìn)行訪談。
本研究采用項(xiàng)目反應(yīng)理論(IRT, Item Response Theory)中的多維度分部計(jì)分模型(MultidimensionalPartial Credit Model,MPCM)對評價(jià)數(shù)據(jù)進(jìn)行分析,并驗(yàn)證量表的信度和效度。MPCM適用于多維度量表中每題有多個(gè)分值、難度隨分值的增加而增加的情況,常常被運(yùn)用于各類包含多個(gè)子維度的測試和問卷(如托福、GRE、PISA等)。專業(yè)軟件ConQuest可以用來分析數(shù)據(jù),除了每題的難度外,研究者可以同時(shí)得到量表總體和各子維度的信度系數(shù)。信度越高,表明評價(jià)結(jié)果的誤差越小。
此外,本研究還請8位評分員對2所幼兒園的16個(gè)班級進(jìn)行了交叉評分,即每個(gè)班級都由兩位評分員分別進(jìn)行了評分,用以計(jì)算評分員的內(nèi)部一致性。評分員一致性指的是采用多個(gè)評分員對特定題目進(jìn)行評判的一致性。目的是評估題目既定特征的可信程度。評分員一致性良好,是保證評價(jià)結(jié)果有效的必要條件。
除信度外,效度是量表的另一重要性質(zhì)。效度反映了量表在多大程度上實(shí)現(xiàn)了其測量評價(jià)的目的。效度研究不是單一的一個(gè)問題,而是包括內(nèi)容效度(content validity,即量表的內(nèi)容選擇的適當(dāng)性)、內(nèi)部效度(internal validity,即問題設(shè)計(jì)的合理性)、外部效度(external validity,即與其他相關(guān)因素的關(guān)系的合理性)和影響效度(consequence validity,即使用該測量結(jié)果作出推斷的科學(xué)性)等多個(gè)方面。ECERS-R是其作者們對學(xué)前教育質(zhì)量理論和實(shí)踐研究多年的產(chǎn)物,量表的內(nèi)容效度已從多個(gè)角度進(jìn)行了論證。本研究針對量表的內(nèi)部效度,對比了農(nóng)村園與城市園的各部分的得分,看其差異是否符合一般認(rèn)識。此外,本研究還通過教師問卷和教師對兒童發(fā)展多個(gè)方面的評價(jià)表,收集了相關(guān)教師背景和兒童發(fā)展情況的信息。這些信息和各個(gè)班級在ECERS-R中各部分得分的關(guān)系,成為量表外部效度的有力佐證。由于ECERS-R在本研究中未用來進(jìn)行任何獎(jiǎng)懲決定或其他判斷,因此本文沒有涉及影響效度的論證。
最后,我們還對ECERS-R的題項(xiàng)內(nèi)容進(jìn)行了逐條分析。參與研究的幼兒園大多數(shù)得分為“未達(dá)到最低要求”或“僅滿足最低要求”的題項(xiàng),可能揭示了該市幼兒園在這些方面存在普遍性問題,或是這些題項(xiàng)不適合該市的實(shí)際情況。而樣本幼兒園大多數(shù)得分為“表現(xiàn)良好”或“優(yōu)秀”的題項(xiàng),則可能彰顯了該市幼兒園的特點(diǎn)和長處,或可能是這些題項(xiàng)對該市幼兒園缺乏區(qū)分度。本文根據(jù)這些題項(xiàng)的具體內(nèi)容,逐一進(jìn)行分析和推論。
四、研究結(jié)果
1. 量表的信、效度
ECERS-R的43個(gè)題項(xiàng)中,有一個(gè)評價(jià)幼兒園對特殊兒童需要的供應(yīng)的題項(xiàng)。由于本研究的樣本中,僅有一個(gè)班級有特殊兒童,該題缺失數(shù)據(jù)太多,沒有納入下面的分析。表1顯示了45個(gè)班級在余下42個(gè)題項(xiàng)的總平均分和各個(gè)子維度的平均分。結(jié)果顯示,整個(gè)量表的總平均分為4.08,7個(gè)子維度的平均分從3.56到4.79不等。因此,整體來說,樣本幼兒園目前的質(zhì)量已滿足最低要求,但尚未達(dá)到良好水平;在互動(dòng)領(lǐng)域的水平較高,但在活動(dòng)安排的多樣性和靈活性方面相對不足。
ConQuest運(yùn)行的多維度分部計(jì)分模型分析結(jié)果顯示,ECERS-R的總體信度系數(shù)(同a系數(shù))高達(dá)0.95。表2顯示了各子維度的信度。除“個(gè)人日常照顧”外,其他子維度的信度系數(shù)都較高。
通過分析交叉評分的數(shù)據(jù),我們發(fā)現(xiàn)在此次評價(jià)中,評分員的內(nèi)部一致性偏低,為0.53。在此類通過實(shí)地觀察對行為表現(xiàn)等進(jìn)行評價(jià)的研究中,評分員的內(nèi)部一致性往往出現(xiàn)偏低的現(xiàn)象。在未來使用ECERS-R的評價(jià)實(shí)踐中,我們還應(yīng)該通過延長培訓(xùn)時(shí)間、增加評分練習(xí)等方式,提高評分員對評價(jià)標(biāo)準(zhǔn)的把握。
此外,本研究通過多個(gè)證據(jù)驗(yàn)證了ECERS-R的內(nèi)部效度和外部效度。表3總結(jié)了城市園與農(nóng)村園在各個(gè)子維度的得分,從中我們不難發(fā)現(xiàn)城市幼兒園在各個(gè)領(lǐng)域的得分都高于農(nóng)村園。其中差異最大的兩個(gè)維度是“作息結(jié)構(gòu)”和“空間和設(shè)施”。農(nóng)村園硬件較城市園落后是不爭的事實(shí)。同時(shí),由于農(nóng)村園師幼比往往更低,導(dǎo)致教師在時(shí)間分配上無法照顧到個(gè)體需求,這一情況與評價(jià)結(jié)果顯示的兩類幼兒園在“作息結(jié)構(gòu)”上的差異相呼應(yīng)。
最后,研究發(fā)現(xiàn),ECERS-R量表中園所對教師個(gè)人需求提供和專業(yè)成長機(jī)會(huì)的得分與教師問卷中教師對工作環(huán)境的滿意度(1-非常滿意,5-非常不滿意)呈顯著正向影響作用(B=-.39, t=-4.35; B=-.33, t=-.24)。ECERS-R量表中的作息結(jié)構(gòu)得分與兒童健康和體能發(fā)展有顯著的影響(B=.27,t=3.90);園所的活動(dòng)安排得分對兒童的社會(huì)心理(B=.52,t=3.68)、語言閱讀(B=.31,t=3.77)及數(shù)學(xué)科學(xué)(B=.17,t=2.90)等多個(gè)方面都有顯著正向影響;園所的“語言-推理”得分與兒童的語言閱讀能力也理所當(dāng)然的呈現(xiàn)了顯著正向影響(B=.15,t=2.85)。這些結(jié)果有力佐證了ECERS-R量表在中國使用時(shí)同樣具有外部效度。
2. 對題項(xiàng)內(nèi)容的質(zhì)性分析
為進(jìn)一步深入探討ECERS-R的適用性和使用價(jià)值,本研究統(tǒng)計(jì)了三分之二以上幼兒園被評為“未達(dá)到最低要求”或“僅滿足最低要求”的題項(xiàng)。共有11題出現(xiàn)了這種情況。其中有一些反映了我國目前大多數(shù)幼兒園仍無法滿足的質(zhì)量要求,如罕有滿足幼兒個(gè)體化需求的隱秘空間、柔軟性設(shè)施;缺少供幼兒游戲的多樣化設(shè)備、沙/水玩具;此外,樣本園普遍存在對紀(jì)律的過度強(qiáng)調(diào)、過多以團(tuán)體為單位組織的活動(dòng)的問題,也導(dǎo)致了個(gè)別題項(xiàng)整體得分偏低。此外,統(tǒng)計(jì)結(jié)果反映出對教師個(gè)人需要供應(yīng)不足等,也是樣本幼兒園亟待解決的問題。
另外有少數(shù)題項(xiàng)是因?yàn)榕c我國國情不符合,導(dǎo)致了樣本園整體得分偏低。如允許家長接送時(shí)進(jìn)入教室與我國大部分幼兒園的安全規(guī)定不符合。又如“自由游戲”中,樣本園所在地教育管理部門對自由游戲的時(shí)間有明確的規(guī)定,因此實(shí)際情況與題項(xiàng)要求不符。還有“鼓勵(lì)接納差異”一題出現(xiàn)了由社會(huì)文化差異導(dǎo)致的不適用性,該題要求在教材教具上具有明顯可見的種族及多元文化上的多樣性,與美國多種族文化背景不同,我國大部分地區(qū)的教材教具上沒有明顯可見的種族及文化上的多樣性。
除低分題項(xiàng)外,我們還統(tǒng)計(jì)了95%以上樣本園被評為“表現(xiàn)良好”或“優(yōu)秀”的題項(xiàng)。這10個(gè)題項(xiàng)主要包括基礎(chǔ)設(shè)施設(shè)備的提供和修繕、安全監(jiān)護(hù)、教師的責(zé)任劃分、對教師的督導(dǎo)評價(jià)和教師在職培訓(xùn)幾個(gè)方面。由于6所樣本園,特別是4所城市園均屬于該市優(yōu)質(zhì)幼兒園,因此這些題項(xiàng)是否對我國幼兒園缺乏區(qū)分度還需要進(jìn)一步實(shí)驗(yàn)和探討。
綜上所述,ECERS-R雖然有少量題項(xiàng)不符合我國幼兒園的實(shí)際情況,但主要的評價(jià)內(nèi)容能幫助研究者和實(shí)踐者們發(fā)現(xiàn)目前學(xué)前教育發(fā)展中的長處和問題,在我國也極具使用價(jià)值。
五、結(jié)論和探討
本研究使用ECERS-R對6所幼兒園45個(gè)班級進(jìn)行了評價(jià)。分析結(jié)果表明,ECERS-R在這次試用中展現(xiàn)了良好的信度和效度。深入的題項(xiàng)內(nèi)容分析發(fā)現(xiàn)樣本園在教師的督導(dǎo)與評量、安全實(shí)務(wù)、專業(yè)成長的機(jī)會(huì)、幼兒之間的互動(dòng)、教師的互動(dòng)與合作這些方面得分較高;而在隱秘空間、沙/水設(shè)施、休息和安撫設(shè)施以及對教師個(gè)人需要的供應(yīng)方面得分較低。大部分得分高的項(xiàng)目是較容易通過硬件投入就能實(shí)現(xiàn)的,而更多體現(xiàn)教育理念的“軟性”質(zhì)量指標(biāo)則得分偏低。
ECERS-R評價(jià)標(biāo)準(zhǔn)中貫穿的價(jià)值判斷是當(dāng)今學(xué)前教育領(lǐng)域所倡導(dǎo)的以兒童為中心、尊重兒童的個(gè)性成長的理念。而我國幼兒園在過去的實(shí)踐過程中更重視課堂目標(biāo)的實(shí)現(xiàn)和管理的便利性。如何以兒童發(fā)展為中心,安排和實(shí)施幼兒園的活動(dòng),對很多幼兒園來說仍然需要逐步摸索。ECERS-R在評價(jià)幼兒園質(zhì)量的同時(shí),也為幼兒園如何改進(jìn)工作提供了參考和線索。
在此次評價(jià)實(shí)踐中,我們?yōu)樵谥袊褂肊CERS-R積累了一定經(jīng)驗(yàn)。評分員一致性不夠高是本研究最大的局限所在。在未來的評分員培訓(xùn)中,我們建議延長培訓(xùn)時(shí)間,增加中國本土的評分實(shí)例。此外,還需要在培訓(xùn)過程中明確量表中涉及的概念,量化一些較為模糊的描述(如“足夠的設(shè)備”等),來統(tǒng)一評判標(biāo)準(zhǔn),提高評分員的內(nèi)部一致性。
最后,未來研究還可以調(diào)整、修改或刪除不適用題目,增加樣本量和幼兒園類型,以提高研究結(jié)論和政策建議的可推廣性。
參考文獻(xiàn)
OECD. (2012).Starting Strong III: A Quality Toolbox for Early Childhood Education and Care. 2012, Paris: OECD.
朱家雄.從幼兒園評估的角度談理論與實(shí)踐的脫節(jié).幼兒教育,2009(5).
康建琴,劉焱.制定幼兒園評估標(biāo)準(zhǔn)需要澄清的幾個(gè)問題.學(xué)前教育研究,2011(1).
劉霞.“托幼機(jī)構(gòu)環(huán)境評價(jià)量表(修訂版)”述評.教育導(dǎo)刊,2004(2、3).
郭良菁.上海市幼兒園教師專業(yè)發(fā)展自我評價(jià)體系研制簡介.學(xué)前教育研究, 2007(07-08).
虞永平. 幼兒園教學(xué)活動(dòng)的評價(jià). 早期教育:教師版, 2005(3).
黃曉婷,宋映泉.學(xué)前教育的質(zhì)量與表現(xiàn)性評價(jià)——以幼兒園過程性質(zhì)量評價(jià)為例.北京大學(xué)教育評論,2013(1).
Hamre, B. K., Mashburn, A. J.,Pianta, R. C., Lacasle-Crouch, J., & La Paro, K. M. (2006). Classroom Assessment Scoring System Technical Appendix.2006.
Stipek, D., & Byler, P. (2004).The early childhood classroom observation measure. Early Childhood Research Quarterly, 19, 375-397.
Perlmana, M. Zellman,G.,Leb,V.(2004).Examining the psychometric properties of the Early Childhood Environment Rating Scale-Revised (ECERS-R),Early Childhood Research Quarterly Volume 19, Issue3, 3rd Quarter 2004, P.398–412.
Ishimine,Karin (2010). Quality of Australian childcare and children's social skills. International journal of early years education,ISSN 0966-9760.
Lambert, Michael Canute (2008). "Are theindicators for the Language and Reasoning Subscale of the Early Childhood Environment Rating Scale-Revised psychometrically appropriate for Caribbean classrooms?". International journal of early years education (0966-9760),16 (1), p.41.
傅馨儀.運(yùn)用ECERS-R提升幼兒園品質(zhì)之研究.臺灣國立政治大學(xué)碩士論文,2010.
李克建,胡碧穎.國際視野中的托幼機(jī)構(gòu)教育質(zhì)量評價(jià)——兼論我國托幼機(jī)構(gòu)教育質(zhì)量評價(jià)觀的重構(gòu).比較教育研究,2012(7).
鄭曉邊.學(xué)前教育機(jī)構(gòu)環(huán)境質(zhì)量評價(jià)--Harms Clifford環(huán)境評價(jià)介紹.教育研究與實(shí)驗(yàn),1988(4).
馬潔然.美國兒童早期教育環(huán)境評估量表介評.早期教育,2011(7-8).
陳香艷.托幼機(jī)構(gòu)環(huán)境評價(jià)量表(修訂版)簡評.基礎(chǔ)教育研究,2012(9).
胡碧穎,朱宗順.美國《幼兒學(xué)習(xí)環(huán)境評量表》及其在中國的初步應(yīng)用.幼兒教育,2009(33).
Harms,T.,Clifford,R.M. ,Cryer,D. (2004) .Early Childhood Environment Rating Scale.(Revised Edition) (ECERS-R).Teachers'College Press.
Wright, B. D., & Masters, G. N.(1982). Rating scale analysis. Chicago: MESA Press.
Wu,M., Adams, R. J., & Wilson (1998). ConQuest. Hawthorn, Australia: ACERPress.
Fleiss,J. L., B. Levin, etal. (1981). "The measurement of interrater agreement." Statistical methods for rates and proportions 2: 212-236.
Wilson, M. (2005). Constructing Measures: An Item Response Modeling Approach.Mahwah, New Jersey: Lawrence Erlbaum Associates.
轉(zhuǎn)自【幼師寶典】官方網(wǎng)站 https://www.youshibaodian.com:http://www.youshibaodian.com/a/662d965755b749ee88ce1d5db102a39d.html
聯(lián)系客服