|
"津雲"客戶端 |
|||
如何防止人情分、照顧分——
一份“申論”答卷至少8人評判
12月5日,設置在河北的一處閱卷點在經過“申論”試評工作之後,進入正式評審階段。此時,閱卷老師面前計算機上顯示的答題卡圖像,已經完全屏蔽了考生的姓名、准考證號等個人信息。
從2011年中央機關公務員考試開始,副省級以上城市和地市級以下城市“申論”考試開始采用兩套不同的試卷。這樣,每套試卷4道題,全國8個閱卷點,每個閱卷點只負責一道試題的評閱。也就是說每個老師在閱卷期間只評閱一道題。
哪個考生的答卷由哪個閱卷員評分,也是由軟件系統隨機派發的。閱卷時,實行雙評以上誤差控制法,即每道題都會派發給兩名閱卷員,兩人分別獨立進行打分。如果兩人打分的結果差異處在事先設定的誤差范圍內,那麼平均分就是考生在這道題上的最後得分;但是,如果打分差異超出了誤差范圍,就會有第三個閱卷員再打分。如果三人打分的結果都超出了范圍,就會由閱卷核心專家對這道答題進行裁定。這樣,一份“申論”答卷至少要由8個人評判,最終得分要4個閱卷點的成績相加纔能得出。
“每個閱卷點的閱卷員人數在120人至250人之間,閱卷員能夠評到熟悉考生答卷的概率非常低。即便是閱卷員想故意給考生打高分,也會超出誤差控制范圍,打分結果也不會被評分軟件系統采納。”
閱卷員的評分質量也進行了實時監控。閱卷管理人員會經常查看每位閱卷員的評分結果統計曲線,判斷閱卷員是否把好中差的答卷有效地區分開來。有時,評分軟件系統會隨時把一定數量的標杆卷、閱卷員已經評過的答卷讓閱卷員重新評分,以此檢測閱卷員對執行參考答案的掌握是否始終如一、評分尺度的把控是否前後一致、評分工作狀態是否穩定。如果發現有明顯的評分質量問題,閱卷員就需要重新培訓、重新評分,如果還不能改正,就可能被取消閱卷員資格。
如何確定“申論”評分標准——
形成標杆卷庫、設置試評環節、嚴格培訓閱卷員
“申論”是筆試中的主觀性試題,由考生用文字作答,閱卷也需要人工完成,人為的因素更大。那麼,“申論”每道題的評分標准是怎樣確定的呢?
與外界想象不同,“申論”每道題的評分標准並不是在考試前就已經完全確定下來的,而是在考試後,通過綜合試題設計的基本設想和考生答題的整體狀況最終確定的。
命題相關負責人介紹,為了合理制定閱卷的執行參考答案,在考試結束後,命題核心專家和閱卷核心專家一起,會在全國隨機抽取一定數量的考生答卷,研究考生答題的整體狀況和好中差答卷的各種表現,以“申論”命題過程中形成的參考答案為基礎,修訂完善各答題要點或能力要素的表述及其相應的分值,這就是執行參考答案。同時,核心專家也要親自評閱一定數量的試卷,形成幾百份好、中、差的樣卷及相應的分數,這就是標杆卷庫。中央機關公務員考試閱卷專門設置了一個閱卷點負責這項工作。
標准答案有了,如何讓閱卷員充分掌握答案的采分點呢?
該負責人介紹,在網絡正式評分工作開始之前,考試主管部門會對閱卷員進行嚴格的參考答案培訓,並明確培訓合格標准。“答題卡閱卷核心專家要向閱卷員詳細介紹執行參考答案的具體內涵和分值分布,閱卷員了解後,要先試著對標杆卷庫中的樣卷進行評分,當他們的評分結果與核心專家的評分結果基本一致時,纔算真正掌握了執行參考答案。”
“公務員考試的閱卷員都是大學裡從事中文或管理專業教學的老師。”在“申論”答題卡掃描機房,該負責人說:“答題卡在掃描期間,我們會抽取5萬份已經轉換為圖片的答卷傳送給全國8個閱卷點,讓所有閱卷員先進行試評,組織實施過程與正評完全一樣。這樣可以提前發現正評過程中可能出現的各種異議或問題,核心專家和管理人員會根據情況進一步調整處理的原則、程序及評分尺度。”
如何查驗違紀違規答題卡——
多重技術手段專門甄別作弊試卷
閱卷過程中,如何及時發現和甄別作弊答題卡?考試主管單位負責人說,“我們有一道‘防火牆’,專門用於甄別作弊試卷。”
在“行測”答題卡掃描機房,記者看到每個答題卡卷袋裡都裝著一份考場記錄單,上面有考務人員和監考人員對考場情況所做的記錄。這些記錄如果有異常,閱卷領導小組會逐一進行分析,整理出各種疑似違紀違規行為的信息,並與考點進行核實、確認。
對隱蔽性較強,考試現場不易發現的作弊行為,包括各種高科技手段作弊怎麼辦?
從2009年度中央機關招考閱卷時起,閱卷主管部門就專門成立了雷同試卷檢測小組,運用四種國際公認的科學方法同時進行甄別,整理出只有通過作弊纔能形成的異常試卷。
該負責人介紹,2009年度檢測小組投入7人、8臺電腦(其中一臺為高性能服務器),歷時7天7夜不間斷測算,共檢測出作弊試卷600多份。當時社會上有一定的爭議,後來通過各種渠道驗證、核實,無一冤枉。2010年度這類異常試卷下降到了200多份,2011年度又進一步下降到90多份。從目前檢測的情況看,2012年度還會下降。這說明通過考後技術分析手段打擊隱蔽性違紀違規行為是比較有效的。
對此,國家行政學院教授宋世明解釋,用4種方法檢測得出同一甄別結果的誤差率,小於10的17次方分之一。換句話說,即使乘以今年的考生總人數,也大大小於1。國際上其他國家考試,通常只采用其中一種方法的檢測結果判定是否屬雷同,我國采用多重條件聯合判定,更科學也更負責。《中國組織人事報》2011年12月12日