112學年度教學評量分析

本學年度有較大的變革,原本本校採用期中評量方式,期中評量不同於期終評鑑的地方,原來在於期中評量是以「教學與學習改進」(teaching and learning improve-ment)為重心,在學期課程仍進行中施測,針對教師的教學和學生的學習成效,由學生來提供教師回饋與診斷,以使教師與學生雙方都有機會做一個反思,也讓老師有機會在剩下的下半學期,有機會做適當、適時的調整(教學評量平均未達70分的科目請授課教師撰寫報告)。本校以「教學與學習改進」為目標的教學評量,可以適時的調整課程方向和課業進行的成效,對老師、對學生雙方都是受益者,可同時在「教」與「學」上做雙向的導引改善,但考量學生在期中對於教師評量,若評量分數較低,當期科目分數仍掌握在教師手上,擔心學生因為分數問題為了迎合教師給予過高的評量,將失去評量目的,故自111學年度下學期起,教學評量時間改到學期末教師送出成績後再進行,但如此的操作,參與評量學生可能因為錯過評量時間而造成整體資料的減少。

在111 學年度第二學期第 2 次教務會議(112.04.10)中修改中華科技大學學生反應教學意見辦法第六條,內容如下: 教務處於每學期「期末考成績上傳截止日後」實施學生反應教學意見調查,學生必須於「規定期限內」完成學生反應教學意見問卷調查,始得繼續利用資訊系統進行線上查詢成績等資訊。這是111學年度下學期參與教學評量的同學較上學期少很多的原因,112學年度將持續這種做法,加上少子化影響,可能參與教學評量的同學持續下降,見圖1。

 

圖1.歷年參與教學評量有效問卷數量趨勢圖

課程學習滿意度調查信效度分析

每個學年度學生對教師教學之感受意見調查問卷都是10題,以因素分析方法,內部一致性分析其 Cronbach = 0.988;各題與總分相關以及刪除該題之Cronbach均符合信度要求,每個題項信度都非常高,Cronbach 值介於0.984到0.985之間。

問卷中的10個題項歷年都沒有改變,內容如表1,學生以李克特五等分級填答,茲將所有有效問卷題項有效回應之平均分數進行檢視,歷年都沒變的是,第1題平均總是最高,最後1題分數最低,但由於樣本數很大,平均分數都非常接近,是否具有顯著意義放在後面分析。

1.學年度學生對教師教學之感受意見調查個題平均分數(N=16457)

    

平均

1. 老師準時上下課。

4.58

2. 老師授課準備充分。

4.58

3. 我滿意老師的教學內容 且測驗在課程範圍內。

4.57

4. 老師講課生動有趣。

4.52

5. 老師上課時能引導啟發同學思考且講深入淺出容易了解。

4.53

6. 老師在短期內發還試卷或作業,並給予回饋。

4.53

7. 老師能鼓勵同學表達自己的看法。

4.55

8. 老師會適時鼓勵同學且讚揚的好表現。

4.55

9. 老師能注意到同學不同的想法。

4.53

10.學習本課程後,我願意向弟妹推薦這門並修相關或進階課程。

4.51

本調查分析報告就這10題學生對教師教學之感受意見調查問卷進行探索性因素分析,KMO值與球型檢定顯示適合因素分析,唯KMO值高達0.972非常接近1(見表2),意味著變量間的相關性非常强。

2.  KMOBartlett 檢定

Kaiser-Meyer-Olkin 測量取樣適當性。

.972

Bartlett 的球形檢定

大約 卡方

287297.412

df

45

顯著性

.000

滿意度的比較與分析

研究策略
先使用F檢定變異數是否相等,當變異數不相同時,自由度非常複雜與難算,幸好SPSS以程式為我們計算好,只要看Levene的變異數相等測試之顯著性即可,若顯著性在0.05之下,我們就看不採用相等變異數的t值。若顯著性在0.05之上,我們就看採用相等變異數的t值

圖2. 獨立樣本t檢定策略

若要對多個獨立母體進行比較平均數,其流程先檢定是否所有的變異數都相等,若全都相等,採用變異數分析,如果只要有一個母體變異數不相同,則採用Welch或Brown-Forsythe的穩健檢定,詳細策略流程如下,如圖3。

3. 多個獨立母體進行比較平均數比較策略

依照不同校區綜合滿意度比較

比較分析首先進行不同校區滿意度綜合平均分數之檢視,台北校區有12548筆資料,平均分數4.566,標準差0.7873,新竹校區有3909筆資料,平均分數4.476,標準差0.8466,平均分數僅差0.09分 ,如圖4。


圖4 台北與新竹校區各題項平均分數

檢定台北校區與新竹校區兩每個題項是否存在顯著差異?在雙母體差異性比較時首先採用F檢定兩母體的變異數是否相同,若F檢定結論為不顯著,表示接受變異數相同,t檢定採用加權標準差Sp,若F檢定結論為顯著,表示不接受變異數相同,t 檢定以修改自由度的Welch–Satterthwaite方程式檢定,策略見圖2,檢定結果見表3。

3. 獨立樣本t檢定

 

Levene 的變異數相等測試

針對平均值是否相等的 t 測試

F

顯著性

T

df

顯著性

平均數

採用相等變異數

78.390

.000

6.113

16455

.000

不採用相等變異數

 

 

5.884

6158.143

.000

平均分數之F檢定都呈現變異數不相等,故全部都應採用變異數不相等的策略,以總平均為例,自由度為6158.143,p值=0.00<0.05,差異顯著,搭配 t > 0,說明台北校區滿意度顯著高於新竹校區。

不同部制綜合滿意度比較
本校在109學年度前以部制區分為日間部、進修部與進修專校等3部制,2021年8月報教育部進修專校併入進修部,所以從110學年度開始只剩下2個部制。因為有2個群體,進行比較採用t檢定技巧即可。首先進行敘述統計觀察平均數,進修部平均滿意度都略高於日間部。

推論統計中F檢定所有題項均達顯著,說明日間部與進修部變異數不同,根據研究策略應採用修改自由度的Welch–Satterthwaite方程式檢定,表4的分析結果發現日間部與進修部教學評量平均分數均達到顯著差異,且進修部教學評量分數顯著高於日間部,與歷年分析的結果狀況相同。

4.不同部制滿意度敘述統計

 

部制

N

平均數

標準偏差

平均數

日間部

9736

4.464

.8494

進修部

6721

4.660

.7141

 

5. 日間部進修部教學評量平均分數圖

5. 獨立樣本t檢定

 

Levene 的變異數相等測試

針對平均值是否相等的 t 測試

F

顯著性

T

df

顯著性

平均數

採用相等變異數

637.848

.000

-15.486

16455

.000

不採用相等變異數

 

 

-15.981

15832.112

.000

不同學制綜合滿意度比較

本校學制有碩士班、二技、四技、二專等四種學制,以四技為主力最多,碩士班人最少,綜合滿意度去年(111)碩士班最高,今年(112)改成二技最高(x-bar=4.789)四技分數最(x-bar= 4.464),見表6與圖6

6.各學制之間綜合滿意度描述性統計資料

 

N

平均數

標準差

標準誤

二專

580

4.674

.6992

.0290

二技

3228

4.789

.5649

.0099

四技

12169

4.464

.8525

.0077

碩士

480

4.776

.5414

.0247

總計

16457

4.544

.8027

.0063

 

 

6.各學制之間綜合滿意度敘述統計資料圖

下一步進行各學制之間平均數檢定,多群體的檢定第一步進行變異數同質性檢定,見表7,說明各群體變異數不全相同,根據研究策略應採用Brown-Forsythe或Welch平均值等式穩健測試進行比較,表8以Brown-Forsythe法的分析結果達到顯著(p=0.000< 0.05),表示至少有一個學制與其他學制平均分數不同,再繼續採用Games-Howell檢定事後比較(Post Hoc)以確認哪些族群顯著差異,如表9。

表7. 變異數同質性測試

Levene 統計資料

df1

df2

顯著性

588.532

3

16453

.000

表8. 平均值等式穩健測試

 

統計資料

df1

df2

顯著性

Welch

244.150

3

1386.628

.000

Brown-Forsythe

256.232

3

2505.713

.000

9. 各學制之平均值之Games-Howell多重比較

(I) 學制

(J) 學制

平均差異 (I-J)

標準誤

顯著性

95% 信賴區間

下限

上限

二專

二技

-.1155*

.0307

.001

-.195

-.036

四技

.2100*

.0300

.000

.133

.287

碩士

-.1020*

.0381

.038

-.200

-.004

二技

二專

.1155*

.0307

.001

.036

.195

四技

.3255*

.0126

.000

.293

.358

碩士

.0135

.0266

.958

-.055

.082

四技

二專

-.2100*

.0300

.000

-.287

-.133

二技

-.3255*

.0126

.000

-.358

-.293

碩士

-.3120*

.0259

.000

-.379

-.245

碩士

二專

.1020*

.0381

.038

.004

.200

二技

-.0135

.0266

.958

-.082

.055

四技

.3120*

.0259

.000

.245

.379

*. 平均值差異在 0.05 層級顯著。

綜合表9的結果,將結論寫在表10中,二技與碩班的教學評量平均分數顯著高於二專,但可以確定的是四技學制顯著是所有學制顯著最低的。

10各學制之教學評量平均分數比較註記

二專<二技

二專>四技

二專<碩士

二技>二專

二技>四技

 

四技<二專

四技<二技

四技<碩士

碩士>二專

碩士>四技

 

不同學院綜合滿意度比較

本校目前有三個學院,包含工程學院、健康學院、航空學院,通識課程因為不分院系,所以另行加入額外一個學院一起進行比較,今年延續去年的狀況,商管學院分數蟬聯最高,航空學院分數最低,平均分數差距在0.2分之內,見表11與圖7。

11. 描述性統計資料

 

N

平均數

標準差

標準誤

工程學院

4489

4.632

.7253

.0108

健康學院

7178

4.530

.8177

.0097

航空學院

3474

4.470

.8514

.0144

不分學院

1316

4.518

.8138

.0224

總計

16457

4.544

.8027

.0063

7.各學院綜合滿意度統計資料

首先進行變異數同質性檢定,見表12,顯著性低於0.05,說明各族群變異數不全相同,應採用Welch或Brown-Forsythe(B) 穩健測試,準備進行下一步。

12.以學院別綜合綜合滿意度變異數同質性測試

Levene 統計資料

df1

df2

顯著性

78.191

3

16453

.000

 

13.平均值等式穩健測試

 

統計資料a

df1

df2

顯著性

Welch

31.150

3

5054.127

.000

Brown-Forsythe(B)

28.630

3

8781.521

.000

a. F 值已漸進發佈。

根據Welch或Brown-Forsythe平均值等式穩健測試,表6.13的分析結果達到顯著( p=0.000< 0.05),表示至少有一個族群與其他族群不同,本研究採用Games-Howell 檢定事後比較(Post Hoc)以確認那些族群不同,如表13。

表14 Games-Howell多重比較

(I) 學院

(J) 學院

平均差異 (I-J)

標準錯誤

顯著性

工程學院

健康學院

.1017*

.0145

.000

航空學院

.1612*

.0181

.000

不分學院

.1132*

.0249

.000

健康學院

工程學院

-.1017*

.0145

.000

航空學院

.0595*

.0174

.003

不分學院

.0115

.0244

.965

航空學院

工程學院

-.1612*

.0181

.000

健康學院

-.0595*

.0174

.003

不分學院

-.0480

.0267

.275

不分學院

工程學院

-.1132*

.0249

.000

健康學院

-.0115

.0244

.965

航空學院

.0480

.0267

.275

 表15 各學制之教學評量平均分數比較註記

工程學院 > 健康學院

工程學院 > 航空學院

工程學院 > 不分學院

健康學院 < 工程學院

 

 

航空學院 < 工程學院

航空學院 < 健康學院

 

不分學院 < 工程學院

 

 

不同科系綜合滿意度比較

以學院別方式比較,工程學院的教學評量分數顯著最高,健康學院次之,航空學院最低,通識課程可能是數量相對較少,平均分數大約居中,除了確認低於工程學院,與其他各院比較沒有出現顯著高低,但可以發現今年各學院中,確認評量分數最低的是航空學院,與往年一樣。

本校因為科系整併或改名原本109學年度的土木、觀旅、行銷、遊戲、觀光、商務、航電、食科、資管、電子、文創、建築、電機、企管、航管、餐飲、生技、機械、航機整併為110學年度的機械、電資、遊戲、土建、企資、行銷、文創、生技、食科、餐旅、航機、航電、航管,112學年度教學評量資料因部分整併或停招的科系學生畢業,簡化為連同不分系的通識總計14個群體,其中電資2,118筆資料最多,食科因停招2年僅280筆最少,各系教學滿意度見表16與圖8。

16.  各系教學綜合滿意度

 

N

平均數

標準偏差

標準錯誤

機械

915

4.617

.7315

.0242

電資

2,118

4.706

.6617

.0144

建築

1,026

4.591

.7695

.0240

遊戲

426

4.400

.8342

.0404

生技

1,482

4.587

.7500

.0195

食科

280

4.268

1.0073

.0602

企資

1,358

4.626

.7449

.0202

行銷

1,604

4.602

.7849

.0196

文創

576

4.480

.9317

.0388

餐旅

1,877

4.408

.8539

.0197

航機

1,868

4.550

.8270

.0191

航電

868

4.367

.8624

.0293

航管

742

4.388

.8806

.0323

通識

1,317

4.518

.8136

.0224

總計

16,457

4.544

.8027

.0063


圖8.各系綜合滿意度統計資料圖

經過多重比較,我們知道精確的相互比較需要檢視次比較,繪出各自的比較圖是非常繁雜的,不如直接綜合結論如下:
112學年度教學評量較高的系: 電資系、機械系、企資系、行銷系

112學年度教學評量較低的系: 食科系、遊戲系、航電系、航管系

歷年來教學評量較高科系總是差不多電資系、機械系、企資系、行銷系等系,分析其原因可能如下

(1)這些科系的教師教學特別好?
(2)這些科系的學生學習特別優秀?

經過多年的分析(1)(2)的可能性並不高,關鍵的因素在於評量分數較高的系都是進修部開班的大系,例如電資系進修部開9班,機械系進修部連同校外班有13班,企資系進修部連同校外班有9班,行銷系在進修部有8班,在前面曾經比較過進修部學生比起日間部學生更加的尊師重道,分數都比較客氣,而那些分數較低的科系如食科系、遊戲系都沒有開示進修部,唯有航電系,分數較低但是無效問卷卻很少,顯示很有針對性,值得進一步探討其原因。

自開始分析教學評量至今已達12年,每年數萬筆資料,12年的資料可信度應該非常高了,回顧自101至112學年度的各題平均分數如圖9~圖20。

有人說這些教學評量都是學生隨機亂答,但多年來的分析,無論哪一年的1至10題平均分數資料,都有相同的性質,第1題分數最高,第4、6、10分數較低,如圖9~圖20,不得不說成績趨勢應該有其意義。

9. 101學年度教學評量各題項平均分數(N=70104)

10. 102學年度教學評量各題項平均分數(N=31805)

11. 103學年度教學評量各題項平均分數(N=74433)

圖12. 104學年度教學評量各題項平均分數(N=62036)

13. 105學年度教學評量各題項平均分數(N=47709)

14. 106學年度教學評量各題項平均分數

15. 107學年度教學評量各題項平均分數

16. 108學年度教學評量各題項平均分數(N=24421)

17.9 109學年度教學評量各題項平均分數(N=21127)

18. 110學年度教學評量各題項平均分數(N=28033)

19.1 111學年度教學評量各題項平均分數(N=18542)

20. 112學年度教學評量各題項平均分數(N=16457)

21.歷年各題項綜合顯示

22.由歷年資料推算各題項的95%信賴區間

以112年的平均分數加入過去信賴區間圖可以做為印證,如圖22,發現如預期的,所有資料均在上下界之間,但112學年度分數比較接近上界下緣,可見自110學年開始,整體教學評分數較往年有進步,見圖21。

結論與建議

「教學評量」是教學歷程中重要的環節。評量的真正目的,對教師而言,是了解學生起始程度、確認教學成果、發現學習困難以及修正教學方式;對學生而言,是要釐清教學目標、激發動機,以及增強自我了解。評量與考試,不是為了用分數標籤學生,而是為了「了解與促進學習」,學生滿意度教學評量是衡量教師的教學表現,包含教師的授課大綱、教材製作與上網、授課回饋與改進、多元學習評量、課業輔導、師生溝通、缺補課出席紀錄等,但最容易量化的部分就是「學生課堂滿意度」問卷,反映對該門課程的學習自評及對授課教師的教學回饋,以本校歷年因素分析的結果,因素只有一個向度,可以用「本課程的喜愛度」,或「任課教師歡迎度」取代,10個題項的相關性又非常高,110學年度將10個題項綜合分析外另將10個題項分數平均,稱為「綜合滿意度」,用「綜合滿意度」比較各母體平均數可以方便計算進行結論, 在111學年度的教學評量分析,硬將10個題項分出5個構面,雖然違反殘差的基本假設,不宜建立迴歸方程式模型,但也了解了學生最在意的關鍵是其中關係師生互動的四題(1)老師能鼓勵同學表達自己的看法(2)老師會適時鼓勵同學且會讚揚同學的好表現(3)老師在短期內發還試卷或作業,並給予回饋(4)老師能注意到同學不同的想法,也就是「師生互動」環節。

 112學年度分析過後筆者做下列結論與建議:

1. 全部共 10 個題項,112學年度各題項平均分數介於最低的 4.51 到最高的 4.58,見圖7.12,平均分數差距不大僅0.7,且每個題項之間相關性都達到顯著水準,但比起111學年度稍有退步。

2. 每年的題目內容都一樣採用這10題,今年所建立方程式曲線1到10題題目分數趨勢較過去更為精準,見圖23。

23.分數趨勢

3. 過去各年級綜合滿意度平均分數隨著學生年級增高而提高的趨勢,今年也不例外,見圖28,所以年齡層高,平均滿意度也高,除了108學年度例外,見圖24~圖27。

圖24. 108學年度年級分數趨勢

 

圖25. 109學年度年級分數趨勢

 

圖26. 110學年度年級分數趨勢

 

圖27. 111學年度年級分數趨勢

 

28. 112學年度年級分數趨勢

 

4. 各系的綜合滿意度平均分數比較去年高低轉換,可能分數高低有隨機的成分在,分數大都在信賴區間中,見圖29~圖34,由各系的教學評量分數圖可以見到本校的科系持續在萎縮與合併,這是目前少子化的趨勢,到了112學年度可以推斷有大量進修部班級的系較有競爭力,因為回流教育的學生較不受少子化的影響,而且可以與業界結合,在教學評量上的分數也對各系有所幫助。

圖29. 107學年度各系滿意度分數

遊戲系在108學年度一枝獨秀,獲極高的評價(全校教學評量平均最高),見圖30,到了109學年度變得極低(全校教學評量平均最低),見圖31,自110學年度開始至今,學系停招且教學評量持續低落,可能真的與師資的問題有關。

圖30. 108學年度各系滿意度分數
 

圖31. 109學年度各系滿意度分數
 

圖32. 110學年度各系滿意度分數
 

圖33. 111學年度各系滿意度平均分數
 

圖34. 112學年度各系滿意度平均分數

在前面的112學年度有效問卷比例分析中,有效問卷比例較高的系有遊戲、食科、企資、航機、航電,均達到八成以上,遊戲(食科(-ba,航電(又是相對教學評量較低,是否值得注意這幾個系的學生有針對性的不滿意,以學生上網填答教學評量的心理而言,若沒有什麼特別意見,填答會較隨便,甚至不上網填答,若對特定科目有負面評價,會刻意仔細的打低分,就像現在的年輕人在店內用餐不滿意,就會上網打差評,年紀較長者相對比較少這樣做。

5.  107學年度之前,依學院分別,航空學院之學生填答結果平均分數持續都是最高,健康學院的分數最低,108學年度已有改變,健康學院最高,工程學院最差,航空學院還是保持不錯的位置,到了109學年度航空與健康學院都變差了,110學年度航空學院顯著最差,111學年度航空學院仍然敬陪末座,見圖38,若以系來看航機系與航電系退步得很多,尤其是航電系分數最低,到了112學年仍然沒有起色,見圖39,航電系教學滿意度的警訊持續多年,值得校方關注。

圖35. 108學年度各院滿意度分數
 

圖36.1 109學年度各院滿意度分數
 

圖37. 110學年度各學院滿意度分數
 

圖38. 111學年度各學院滿意度分數

圖39. 112學年度各學院滿意度分數

6. 由於各題目填答結果相互相關性全數答顯著水準,所以第一題到第十題 只有一種因素,可以解釋為對該科目的教學或對該科目教師整體滿意度,各別題目平均分數應僅供參考,今年挑戰將一個因素分解為5個因素,雖然殘差問題無法成功估計建模,但也找出學生最在意的核心問題。

7. 112學年度教學評量綜合比較的結論
(1)台北校區教學評量滿意度顯著高於新竹校區
(2)進修部 > 日間部
(3) 碩二、碩一 > 四年級 > 三年級 > 二年級 > 一年級
(4) 工程學院 > 健康學院  > 航空學院
(5) 顯著低於平均的系: 食科系、餐旅系、航電系、遊戲系
     顯著高於平均的系: 企資系、電資系、行銷系、機械系

8. 問卷內容與施測方式仍可再邀請專家討論研議,可刪減題數,朝向更精簡、更簡單、更明確的方向努力。

 

 --回到上面--

  中華科技大學  學生輔導中心 115 台北市南港區研究院路三段245號  TEL:(02)27861862  轉 183