112學年度教學評量分析
本學年度有較大的變革,原本本校採用期中評量方式,期中評量不同於期終評鑑的地方,原來在於期中評量是以「教學與學習改進」(teaching
and learning
improve-ment)為重心,在學期課程仍進行中施測,針對教師的教學和學生的學習成效,由學生來提供教師回饋與診斷,以使教師與學生雙方都有機會做一個反思,也讓老師有機會在剩下的下半學期,有機會做適當、適時的調整(教學評量平均未達70分的科目請授課教師撰寫報告)。本校以「教學與學習改進」為目標的教學評量,可以適時的調整課程方向和課業進行的成效,對老師、對學生雙方都是受益者,可同時在「教」與「學」上做雙向的導引改善,但考量學生在期中對於教師評量,若評量分數較低,當期科目分數仍掌握在教師手上,擔心學生因為分數問題為了迎合教師給予過高的評量,將失去評量目的,故自111學年度下學期起,教學評量時間改到學期末教師送出成績後再進行,但如此的操作,參與評量學生可能因為錯過評量時間而造成整體資料的減少。
在111 學年度第二學期第 2
次教務會議(112.04.10)中修改中華科技大學學生反應教學意見辦法第六條,內容如下:
教務處於每學期「期末考成績上傳截止日後」實施學生反應教學意見調查,學生必須於「規定期限內」完成學生反應教學意見問卷調查,始得繼續利用資訊系統進行線上查詢成績等資訊。這是111學年度下學期參與教學評量的同學較上學期少很多的原因,112學年度將持續這種做法,加上少子化影響,可能參與教學評量的同學持續下降,見圖1。
圖1.歷年參與教學評量有效問卷數量趨勢圖
課程學習滿意度調查信效度分析
每個學年度學生對教師教學之感受意見調查問卷都是10題,以因素分析方法,內部一致性分析其 Cronbach
= 0.988;各題與總分相關以及刪除該題之Cronbach均符合信度要求,每個題項信度都非常高,Cronbach 值介於0.984到0.985之間。
問卷中的10個題項歷年都沒有改變,內容如表1,學生以李克特五等分級填答,茲將所有有效問卷題項有效回應之平均分數進行檢視,歷年都沒變的是,第1題平均總是最高,最後1題分數最低,但由於樣本數很大,平均分數都非常接近,是否具有顯著意義放在後面分析。
表1.學年度學生對教師教學之感受意見調查個題平均分數(N=16457)
題
目 |
平均 |
1.
老師準時上下課。 |
4.58 |
2.
老師授課準備充分。 |
4.58 |
3.
我滿意老師的教學內容 且測驗在課程範圍內。 |
4.57 |
4.
老師講課生動有趣。 |
4.52 |
5.
老師上課時能引導啟發同學思考且講深入淺出容易了解。 |
4.53 |
6.
老師在短期內發還試卷或作業,並給予回饋。 |
4.53 |
7.
老師能鼓勵同學表達自己的看法。 |
4.55 |
8.
老師會適時鼓勵同學且讚揚的好表現。 |
4.55 |
9.
老師能注意到同學不同的想法。 |
4.53 |
10.學習本課程後,我願意向弟妹推薦這門並修相關或進階課程。 |
4.51 |
本調查分析報告就這10題學生對教師教學之感受意見調查問卷進行探索性因素分析,KMO值與球型檢定顯示適合因素分析,唯KMO值高達0.972非常接近1(見表2),意味著變量間的相關性非常强。
表2. KMO與Bartlett
檢定
Kaiser-Meyer-Olkin
測量取樣適當性。 |
.972 |
Bartlett
的球形檢定 |
大約
卡方 |
287297.412 |
df |
45 |
顯著性 |
.000 |
滿意度的比較與分析
研究策略
先使用F檢定變異數是否相等,當變異數不相同時,自由度非常複雜與難算,幸好SPSS以程式為我們計算好,只要看Levene的變異數相等測試之顯著性即可,若顯著性在0.05之下,我們就看不採用相等變異數的t值。若顯著性在0.05之上,我們就看採用相等變異數的t值
圖2. 獨立樣本t檢定策略
若要對多個獨立母體進行比較平均數,其流程先檢定是否所有的變異數都相等,若全都相等,採用變異數分析,如果只要有一個母體變異數不相同,則採用Welch或Brown-Forsythe的穩健檢定,詳細策略流程如下,如圖3。
圖3.
多個獨立母體進行比較平均數比較策略
比較分析首先進行不同校區滿意度綜合平均分數之檢視,台北校區有12548筆資料,平均分數4.566,標準差0.7873,新竹校區有3909筆資料,平均分數4.476,標準差0.8466,平均分數僅差0.09分
,如圖4。
圖4 台北與新竹校區各題項平均分數
檢定台北校區與新竹校區兩每個題項是否存在顯著差異?在雙母體差異性比較時首先採用F檢定兩母體的變異數是否相同,若F檢定結論為不顯著,表示接受變異數相同,t檢定採用加權標準差Sp,若F檢定結論為顯著,表示不接受變異數相同,t
檢定以修改自由度的Welch–Satterthwaite方程式檢定,策略見圖2,檢定結果見表3。
表3.
獨立樣本t檢定
|
Levene
的變異數相等測試 |
針對平均值是否相等的
t
測試 |
F |
顯著性 |
T |
df |
顯著性 |
平均數 |
採用相等變異數 |
78.390 |
.000 |
6.113 |
16455 |
.000 |
不採用相等變異數 |
|
|
5.884 |
6158.143 |
.000 |
平均分數之F檢定都呈現變異數不相等,故全部都應採用變異數不相等的策略,以總平均為例,自由度為6158.143,p值=0.00<0.05,差異顯著,搭配
t > 0,說明台北校區滿意度顯著高於新竹校區。
不同部制綜合滿意度比較
本校在109學年度前以部制區分為日間部、進修部與進修專校等3部制,2021年8月報教育部進修專校併入進修部,所以從110學年度開始只剩下2個部制。因為有2個群體,進行比較採用t檢定技巧即可。首先進行敘述統計觀察平均數,進修部平均滿意度都略高於日間部。
推論統計中F檢定所有題項均達顯著,說明日間部與進修部變異數不同,根據研究策略應採用修改自由度的Welch–Satterthwaite方程式檢定,表4的分析結果發現日間部與進修部教學評量平均分數均達到顯著差異,且進修部教學評量分數顯著高於日間部,與歷年分析的結果狀況相同。
表4.不同部制滿意度敘述統計
|
部制 |
N |
平均數 |
標準偏差 |
平均數 |
日間部 |
9736 |
4.464 |
.8494 |
進修部 |
6721 |
4.660 |
.7141 |
圖5.
日間部與進修部教學評量平均分數圖
表5.
獨立樣本t檢定
|
Levene
的變異數相等測試 |
針對平均值是否相等的
t
測試 |
F |
顯著性 |
T |
df |
顯著性 |
平均數 |
採用相等變異數 |
637.848 |
.000 |
-15.486 |
16455 |
.000 |
不採用相等變異數 |
|
|
-15.981 |
15832.112 |
.000 |
不同學制綜合滿意度比較
本校學制有碩士班、二技、四技、二專等四種學制,以四技為主力最多,碩士班人最少,綜合滿意度去年(111)碩士班最高,今年(112)改成二技最高(x-bar=4.789)四技分數最低(x-bar=
4.464),見表6與圖6。
表6.各學制之間綜合滿意度描述性統計資料
|
N |
平均數 |
標準差 |
標準誤 |
二專 |
580 |
4.674 |
.6992 |
.0290 |
二技 |
3228 |
4.789 |
.5649 |
.0099 |
四技 |
12169 |
4.464 |
.8525 |
.0077 |
碩士 |
480 |
4.776 |
.5414 |
.0247 |
總計 |
16457 |
4.544 |
.8027 |
.0063 |
圖6.各學制之間綜合滿意度敘述統計資料圖
下一步進行各學制之間平均數檢定,多群體的檢定第一步進行變異數同質性檢定,見表7,說明各群體變異數不全相同,根據研究策略應採用Brown-Forsythe或Welch平均值等式穩健測試進行比較,表8以Brown-Forsythe法的分析結果達到顯著(p=0.000<
0.05),表示至少有一個學制與其他學制平均分數不同,再繼續採用Games-Howell檢定事後比較(Post
Hoc)以確認哪些族群顯著差異,如表9。
表7. 變異數同質性測試
Levene 統計資料 |
df1 |
df2 |
顯著性 |
588.532 |
3 |
16453 |
.000 |
表8. 平均值等式穩健測試
|
統計資料 |
df1 |
df2 |
顯著性 |
Welch |
244.150 |
3 |
1386.628 |
.000 |
Brown-Forsythe |
256.232 |
3 |
2505.713 |
.000 |
表9.
各學制之平均值之Games-Howell多重比較
(I)
學制 |
(J)
學制 |
平均差異
(I-J) |
標準誤 |
顯著性 |
95%
信賴區間 |
下限 |
上限 |
二專 |
二技 |
-.1155* |
.0307 |
.001 |
-.195 |
-.036 |
四技 |
.2100* |
.0300 |
.000 |
.133 |
.287 |
碩士 |
-.1020* |
.0381 |
.038 |
-.200 |
-.004 |
二技 |
二專 |
.1155* |
.0307 |
.001 |
.036 |
.195 |
四技 |
.3255* |
.0126 |
.000 |
.293 |
.358 |
碩士 |
.0135 |
.0266 |
.958 |
-.055 |
.082 |
四技 |
二專 |
-.2100* |
.0300 |
.000 |
-.287 |
-.133 |
二技 |
-.3255* |
.0126 |
.000 |
-.358 |
-.293 |
碩士 |
-.3120* |
.0259 |
.000 |
-.379 |
-.245 |
碩士 |
二專 |
.1020* |
.0381 |
.038 |
.004 |
.200 |
二技 |
-.0135 |
.0266 |
.958 |
-.082 |
.055 |
四技 |
.3120* |
.0259 |
.000 |
.245 |
.379 |
*.
平均值差異在
0.05
層級顯著。 |
綜合表9的結果,將結論寫在表10中,二技與碩班的教學評量平均分數顯著高於二專,但可以確定的是四技學制顯著是所有學制顯著最低的。
表10各學制之教學評量平均分數比較註記
二專<二技 |
二專>四技 |
二專<碩士 |
二技>二專 |
二技>四技 |
|
四技<二專 |
四技<二技 |
四技<碩士 |
碩士>二專 |
碩士>四技 |
|
不同學院綜合滿意度比較
本校目前有三個學院,包含工程學院、健康學院、航空學院,通識課程因為不分院系,所以另行加入額外一個學院一起進行比較,今年延續去年的狀況,商管學院分數蟬聯最高,航空學院分數最低,平均分數差距在0.2分之內,見表11與圖7。
表11.
描述性統計資料
|
N |
平均數 |
標準差 |
標準誤 |
工程學院 |
4489 |
4.632 |
.7253 |
.0108 |
健康學院 |
7178 |
4.530 |
.8177 |
.0097 |
航空學院 |
3474 |
4.470 |
.8514 |
.0144 |
不分學院 |
1316 |
4.518 |
.8138 |
.0224 |
總計 |
16457 |
4.544 |
.8027 |
.0063 |
圖7.各學院綜合滿意度統計資料
首先進行變異數同質性檢定,見表12,顯著性低於0.05,說明各族群變異數不全相同,應採用Welch或Brown-Forsythe(B)
穩健測試,準備進行下一步。
表12.以學院別綜合綜合滿意度變異數同質性測試
Levene
統計資料 |
df1 |
df2 |
顯著性 |
78.191 |
3 |
16453 |
.000 |
表13.平均值等式穩健測試
|
統計資料a |
df1 |
df2 |
顯著性 |
Welch |
31.150 |
3 |
5054.127 |
.000 |
Brown-Forsythe(B) |
28.630 |
3 |
8781.521 |
.000 |
a. F
值已漸進發佈。 |
根據Welch或Brown-Forsythe平均值等式穩健測試,表6.13的分析結果達到顯著( p=0.000<
0.05),表示至少有一個族群與其他族群不同,本研究採用Games-Howell 檢定事後比較(Post
Hoc)以確認那些族群不同,如表13。
表14
Games-Howell多重比較
(I)
學院 |
(J)
學院 |
平均差異
(I-J) |
標準錯誤 |
顯著性 |
工程學院 |
健康學院 |
.1017* |
.0145 |
.000 |
航空學院 |
.1612* |
.0181 |
.000 |
不分學院 |
.1132* |
.0249 |
.000 |
健康學院 |
工程學院 |
-.1017* |
.0145 |
.000 |
航空學院 |
.0595* |
.0174 |
.003 |
不分學院 |
.0115 |
.0244 |
.965 |
航空學院 |
工程學院 |
-.1612* |
.0181 |
.000 |
健康學院 |
-.0595* |
.0174 |
.003 |
不分學院 |
-.0480 |
.0267 |
.275 |
不分學院 |
工程學院 |
-.1132* |
.0249 |
.000 |
健康學院 |
-.0115 |
.0244 |
.965 |
航空學院 |
.0480 |
.0267 |
.275 |
表15
各學制之教學評量平均分數比較註記
工程學院
>
健康學院 |
工程學院
>
航空學院 |
工程學院
>
不分學院 |
健康學院
<
工程學院 |
|
|
航空學院
<
工程學院 |
航空學院
<
健康學院 |
|
不分學院
<
工程學院 |
|
|
不同科系綜合滿意度比較
以學院別方式比較,工程學院的教學評量分數顯著最高,健康學院次之,航空學院最低,通識課程可能是數量相對較少,平均分數大約居中,除了確認低於工程學院,與其他各院比較沒有出現顯著高低,但可以發現今年各學院中,確認評量分數最低的是航空學院,與往年一樣。
本校因為科系整併或改名原本109學年度的土木、觀旅、行銷、遊戲、觀光、商務、航電、食科、資管、電子、文創、建築、電機、企管、航管、餐飲、生技、機械、航機整併為110學年度的機械、電資、遊戲、土建、企資、行銷、文創、生技、食科、餐旅、航機、航電、航管,112學年度教學評量資料因部分整併或停招的科系學生畢業,簡化為連同不分系的通識總計14個群體,其中電資2,118筆資料最多,食科因停招2年僅280筆最少,各系教學滿意度見表16與圖8。
表16.
各系教學綜合滿意度
|
N |
平均數 |
標準偏差 |
標準錯誤 |
機械 |
915 |
4.617 |
.7315 |
.0242 |
電資 |
2,118 |
4.706 |
.6617 |
.0144 |
建築 |
1,026 |
4.591 |
.7695 |
.0240 |
遊戲 |
426 |
4.400 |
.8342 |
.0404 |
生技 |
1,482 |
4.587 |
.7500 |
.0195 |
食科 |
280 |
4.268 |
1.0073 |
.0602 |
企資 |
1,358 |
4.626 |
.7449 |
.0202 |
行銷 |
1,604 |
4.602 |
.7849 |
.0196 |
文創 |
576 |
4.480 |
.9317 |
.0388 |
餐旅 |
1,877 |
4.408 |
.8539 |
.0197 |
航機 |
1,868 |
4.550 |
.8270 |
.0191 |
航電 |
868 |
4.367 |
.8624 |
.0293 |
航管 |
742 |
4.388 |
.8806 |
.0323 |
通識 |
1,317 |
4.518 |
.8136 |
.0224 |
總計 |
16,457 |
4.544 |
.8027 |
.0063 |
圖8.各系綜合滿意度統計資料圖
經過多重比較,我們知道精確的相互比較需要檢視次比較,繪出各自的比較圖是非常繁雜的,不如直接綜合結論如下:
112學年度教學評量較高的系: 電資系、機械系、企資系、行銷系
112學年度教學評量較低的系: 食科系、遊戲系、航電系、航管系
歷年來教學評量較高科系總是差不多電資系、機械系、企資系、行銷系等系,分析其原因可能如下
(1)這些科系的教師教學特別好?
(2)這些科系的學生學習特別優秀?
經過多年的分析(1)(2)的可能性並不高,關鍵的因素在於評量分數較高的系都是進修部開班的大系,例如電資系進修部開9班,機械系進修部連同校外班有13班,企資系進修部連同校外班有9班,行銷系在進修部有8班,在前面曾經比較過進修部學生比起日間部學生更加的尊師重道,分數都比較客氣,而那些分數較低的科系如食科系、遊戲系都沒有開示進修部,唯有航電系,分數較低但是無效問卷卻很少,顯示很有針對性,值得進一步探討其原因。
自開始分析教學評量至今已達12年,每年數萬筆資料,12年的資料可信度應該非常高了,回顧自101至112學年度的各題平均分數如圖9~圖20。
有人說這些教學評量都是學生隨機亂答,但多年來的分析,無論哪一年的1至10題平均分數資料,都有相同的性質,第1題分數最高,第4、6、10分數較低,如圖9~圖20,不得不說成績趨勢應該有其意義。
圖9.
101學年度教學評量各題項平均分數(N=70104)
圖10.
102學年度教學評量各題項平均分數(N=31805)
圖11.
103學年度教學評量各題項平均分數(N=74433)
圖12.
104學年度教學評量各題項平均分數(N=62036)
圖13.
105學年度教學評量各題項平均分數(N=47709)
圖14.
106學年度教學評量各題項平均分數
圖15.
107學年度教學評量各題項平均分數
圖16.
108學年度教學評量各題項平均分數(N=24421)
圖17.9
109學年度教學評量各題項平均分數(N=21127)
圖18.
110學年度教學評量各題項平均分數(N=28033)
圖19.1
111學年度教學評量各題項平均分數(N=18542)
圖20.
112學年度教學評量各題項平均分數(N=16457)
圖21.歷年各題項綜合顯示
圖22.由歷年資料推算各題項的95%信賴區間
以112年的平均分數加入過去信賴區間圖可以做為印證,如圖22,發現如預期的,所有資料均在上下界之間,但112學年度分數比較接近上界下緣,可見自110學年開始,整體教學評分數較往年有進步,見圖21。
結論與建議
「教學評量」是教學歷程中重要的環節。評量的真正目的,對教師而言,是了解學生起始程度、確認教學成果、發現學習困難以及修正教學方式;對學生而言,是要釐清教學目標、激發動機,以及增強自我了解。評量與考試,不是為了用分數標籤學生,而是為了「了解與促進學習」,學生滿意度教學評量是衡量教師的教學表現,包含教師的授課大綱、教材製作與上網、授課回饋與改進、多元學習評量、課業輔導、師生溝通、缺補課出席紀錄等,但最容易量化的部分就是「學生課堂滿意度」問卷,反映對該門課程的學習自評及對授課教師的教學回饋,以本校歷年因素分析的結果,因素只有一個向度,可以用「本課程的喜愛度」,或「任課教師歡迎度」取代,10個題項的相關性又非常高,110學年度將10個題項綜合分析外另將10個題項分數平均,稱為「綜合滿意度」,用「綜合滿意度」比較各母體平均數可以方便計算進行結論,
在111學年度的教學評量分析,硬將10個題項分出5個構面,雖然違反殘差的基本假設,不宜建立迴歸方程式模型,但也了解了學生最在意的關鍵是其中關係師生互動的四題(1)老師能鼓勵同學表達自己的看法(2)老師會適時鼓勵同學且會讚揚同學的好表現(3)老師在短期內發還試卷或作業,並給予回饋(4)老師能注意到同學不同的想法,也就是「師生互動」環節。
112學年度分析過後筆者做下列結論與建議:
1. 全部共 10 個題項,112學年度各題項平均分數介於最低的
4.51 到最高的
4.58,見圖7.12,平均分數差距不大僅0.7,且每個題項之間相關性都達到顯著水準,但比起111學年度稍有退步。
2.
每年的題目內容都一樣採用這10題,今年所建立方程式曲線1到10題題目分數趨勢較過去更為精準,見圖23。
圖23.分數趨勢
3.
過去各年級綜合滿意度平均分數隨著學生年級增高而提高的趨勢,今年也不例外,見圖28,所以年齡層高,平均滿意度也高,除了108學年度例外,見圖24~圖27。
圖24. 108學年度年級分數趨勢
圖25. 109學年度年級分數趨勢
圖26. 110學年度年級分數趨勢
圖27. 111學年度年級分數趨勢
圖28.
112學年度年級分數趨勢
4.
各系的綜合滿意度平均分數比較去年高低轉換,可能分數高低有隨機的成分在,分數大都在信賴區間中,見圖29~圖34,由各系的教學評量分數圖可以見到本校的科系持續在萎縮與合併,這是目前少子化的趨勢,到了112學年度可以推斷有大量進修部班級的系較有競爭力,因為回流教育的學生較不受少子化的影響,而且可以與業界結合,在教學評量上的分數也對各系有所幫助。
圖29. 107學年度各系滿意度分數
遊戲系在108學年度一枝獨秀,獲極高的評價(全校教學評量平均最高),見圖30,到了109學年度變得極低(全校教學評量平均最低),見圖31,自110學年度開始至今,學系停招且教學評量持續低落,可能真的與師資的問題有關。
圖30. 108學年度各系滿意度分數
圖31. 109學年度各系滿意度分數
圖32. 110學年度各系滿意度分數
圖33. 111學年度各系滿意度平均分數
圖34. 112學年度各系滿意度平均分數
在前面的112學年度有效問卷比例分析中,有效問卷比例較高的系有遊戲、食科、企資、航機、航電,均達到八成以上,遊戲(食科(-ba,航電(又是相對教學評量較低,是否值得注意這幾個系的學生有針對性的不滿意,以學生上網填答教學評量的心理而言,若沒有什麼特別意見,填答會較隨便,甚至不上網填答,若對特定科目有負面評價,會刻意仔細的打低分,就像現在的年輕人在店內用餐不滿意,就會上網打差評,年紀較長者相對比較少這樣做。
5.
107學年度之前,依學院分別,航空學院之學生填答結果平均分數持續都是最高,健康學院的分數最低,108學年度已有改變,健康學院最高,工程學院最差,航空學院還是保持不錯的位置,到了109學年度航空與健康學院都變差了,110學年度航空學院顯著最差,111學年度航空學院仍然敬陪末座,見圖38,若以系來看航機系與航電系退步得很多,尤其是航電系分數最低,到了112學年仍然沒有起色,見圖39,航電系教學滿意度的警訊持續多年,值得校方關注。
圖35. 108學年度各院滿意度分數
圖36.1 109學年度各院滿意度分數
圖37. 110學年度各學院滿意度分數
圖38. 111學年度各學院滿意度分數
圖39. 112學年度各學院滿意度分數
6. 由於各題目填答結果相互相關性全數答顯著水準,所以第一題到第十題
只有一種因素,可以解釋為對該科目的教學或對該科目教師整體滿意度,各別題目平均分數應僅供參考,今年挑戰將一個因素分解為5個因素,雖然殘差問題無法成功估計建模,但也找出學生最在意的核心問題。
7. 112學年度教學評量綜合比較的結論
(1)台北校區教學評量滿意度顯著高於新竹校區
(2)進修部 > 日間部
(3) 碩二、碩一 > 四年級 > 三年級 > 二年級 > 一年級
(4) 工程學院 > 健康學院 > 航空學院
(5) 顯著低於平均的系: 食科系、餐旅系、航電系、遊戲系
顯著高於平均的系: 企資系、電資系、行銷系、機械系
8.
問卷內容與施測方式仍可再邀請專家討論研議,可刪減題數,朝向更精簡、更簡單、更明確的方向努力。
--回到上面--