評価の最前線と４つの潮流 - こたえのない学校

先月末にハワイの伝統校Mid Pacific Institute(昨年訪問したときのレポートはこちらから）でプロジェクト型学習を中心に長年の経験を積まれている先生方による研修の企画実施を担当しました。

そこでプロジェクトの設計にあたって、大きな時間が割かれていたのが「本質的な問い」と「評価」です。「本質的な問い」「評価」は現場で繰り返される悩みポイントです。前回「本質的な問い」について振り返ってみましたが、このところ「評価」について、大きく変化の流れがあるように感じていますので、４点まとめておきたいと思います。

その１：総括的評価から形成的評価へ
その２：成績とアセスメントを区別する
その３：フィードバックの重要性
その４：教師による評価から自己評価・ピア評価へ

【その１：総括的評価から形成的評価へ】

まず、評価の基礎的なことから。「評価」には、総括的評価（Summative Assessment）と形成的評価（Formative Assessment）の二種類があります。総括的評価とは名の通り、ある一定期間に学んだことを総括的に評価されることです。いわゆる一般的なテスト、学期ごとの成績評価、中学・高校・大学受験、プレゼンテーションの発表に対する評価などです。社会人であれば、上半期の人事考課などもそうです。私たちが学校で慣れ親しんできたのは、圧倒的に総括的評価となります。結果のみが評価され、その一定期間に何が起きたのかは問われません。

一方で、形成的評価は、こちらも名の通り、ある一定期間中に取り組まれたそのプロセスを評価していくものとなります。学びの過程で何が起き、何を学んだのか。何がうまくいき、何がうまくいかなかったのか。うまくいかなかったとしたら、その原因は何か、私は何をすれば良いのか？と考えていくものです。

今、世界的な教育の潮流は「総括的評価」から「形成的評価」への比重を増やすようにぐいぐいと動いています。「学ぶべき正しい情報」があり、それを正しく記憶したか、理解したかをチェックしていくような学びの価値観が大きく変わり、「人はさまざまな経験をする中で自らその意味合いを構築していく」というような構成的価値観に変わっていますので、評価がこのように変わっていくのは当然の流れとも言えます。

たとえば、国際バカロレアの初等教育プログラム（PYP: Primary Years Programme）は最近改定になりましたが、形成的評価の拡充が行われました。プロジェクトの過程で子どもたちは Where am I going? (私はどこに行こうとしているのか？)、Where am I now? (私はどこにいるのか？)、Where to next? (次はどこに向かうのか？)を協働の営みの中で自身に問い直していきます。

【その２：成績とアセスメントを区別せよ】

もう一つ世界的な評価の潮流は成績（Grading）とアセスメント（Assessment）を明確に区別しよう、というものです。

ただ、日本語では「成績評価」という言葉があるくらいで、成績や評価という言葉の定義はそれほど明確ではなく、きちんと対応する言葉がありません。よって、ここでは一旦「成績（Grading）」は、学校などで「つけなければいけない評価」のこと、「アセスメント」は「対象者の学びや成長を評価するもの。成績のために活用することも可能であるし、成績と独立して実施することも可能なもの」としておきます。

本来は「成績」と「アセスメント」は分離すべきものではないでしょう。アセスメントのサブセットとして「成績」がある、という形が理想なのかもしれません。しかし現実問題として、大学受験のために高校の成績を提出しなければならないであるとか、学校や教育委員会の要請によって、「成績」をABCや５段階評価など決まったフォーマットで提出しなければならない、ということは一般的でしょう。そしてその成績のフォーマットに納得がいかない、ということは多々あると思います。「成績」については、実際の生徒の姿の説明はほとんどできないにも関わらず、そのために多くの時間を割かなければならない、というストレスを多くの現場の教師が抱える時に、いっそのこと、「成績」「アセスメント」を便宜的に切り分けてしまう、ということは非常に意味のあるものだと私も考えます。

【その３：フィードバックの重要性】

「総括評価」中心から「形成的評価」中心へと移行していること、「成績」と「アセスメント」を切り分けること、まで述べました。では、「形成的評価」は具体的にはどうしたらいいのでしょうか。

「形成的評価」には小テストのようなものから始まり、プロジェクトの進行において作成したものをファイルなどに記録する「ポートフォリオ」、レッジョ＝エミリアアプローチなどにみられるように、授業での様子や発言を丁寧に記録していく「ドキュメンテーション」などさまざまなものがあります。そのなかでも、最近特にフォーカスが当たっているのが「フィードバック」とその仕方です。

「フィードバック」については、1958年に実施されたエリス・ペイジによる古典的な実験があります。テストの点数に合わせて個別のコメントをもらった生徒のほうが、その後有意に高い得点を獲得し、後年の研究でもその結果が確認されているものです。

次に「タキソノミー（日本の私学では思考コードなどで応用されている）」でよく知られるベンジャミン・ブルームの研究が有名ですが、ブルームは形成的評価における「マスタリー」に向けて、「生徒は何を学ぶと期待されていたのか」「それまでに何を学んだのか」「これからなにを学べば良いか」を正確に特定するためのフィードバックが必要であるとしました。

さらに、「成績の良い生徒」と「悪い生徒」に与えるフィードバックの効果の違い（Butler, 1988）や、学年レベル、教科、授業スタイル、生徒の過去の学習経験などによって、どのような差が出るか（Kingston & Nash, 2011）、生徒と比較したり序列することで、エゴを刺激するような評価の悪影響(Guskey, 2006)などさまざまな実験がなされていきます。

ところで、「フィードバック」は漠然としたアドバイスや評価のことではありません。基本的には、「あなたはどこに到達しようとしており」「どこにいるのか」そして、「どうしたらいいのか」をガイドするものになります。つまり、生徒が自分の学びを理解するために必要な情報が与えられることが重要であり、結果として学びへの意欲が増すものでなければなりません。たとえば、人を笑わせたければ、そのことを認識して、自分のジョークがどのようなものかを振り返り、どのようにすればより多くの人をもっと笑わせられるかについて考えていくのですが、そのガイドをするものです。

今、こうした実験結果や基本的な考え方を踏まえた上で、「いつ、どのようなタイミングでどのくらいフィードバックしたらいいのか？」「生徒により受け取られるフィードバックをするには？」「自分のフィードバックの良し悪しはどうやって評価したらいいのか？」「生徒と一対一で向き合う時間をもっととりたいが、忙しい毎日の中でどうやったら時間をつくることができるのか」などの問いに教師たちは向き合い、日々実践を積み重ね、その結果を共有して、共有知としていっているのです。

【その４：自分の言葉で説明できるように導く】

もうひとつ、「評価」で加速している流れとしては、「評価」をする主体を「教師」から「生徒(本人)」へ権限委譲していくものです。そもそも「評価」は何のためにあるのでしょうか？　もちろん、学校や組織のパフォーマンスの説明やアピールのため、ということもあるでしょう。でも、その傾向が行きすぎて、生徒や従業員のモチベーションが下がってしまったり、酷い場合は、周りの評価を気にするあまり、自分がなにものかわからなくなっているような子どもを量産しているのであれば、そのことについて、私たちはもっと敏感にならければならないかもしれません。それなのに、残念ながらそうした評価は現実的には横行していると感じます。

しかし、仮にも「教育者」と名乗るのであれば、学び手の人生にプラスにならないような評価は可能な限り排除するように努力すべきでしょう。また、世の中の「評価」がいくら酷いからといって、批判だけするのではなく、「評価」とは何かを考え、「評価」の意味や価値を反転させ、「学び」を支援していくように、頭を切り替えなければならないかもしれません。なぜなら良くも悪くも「評価」は世の中から決して消えることはないからです。

たとえば、カリフォルニアサンディエゴにあるHigh Tech Highは、公正（Equity）を学校の目標に掲げている学校ですが、公正を「誰もが、人種や性別や、性的な意識や、身体的、もしくは認知的能力にかかわらず、同じように価値ある人間だと感じることができること」と定義し、目標としています。そして、「評価」は「公正」を実現するための手段なのだから、「自分が価値がある人間である」と思えるようにならなければ、なりません。そうなると、今、学び、取り組んでいることが「好きなのか、嫌いなのか。」「得意なのか、苦手なのか。」ということに始まり、「どうしたらよりよくできるのか」ということを自身で説明できるようにならなければなりません。つまり「評価」は自分を知るプロセスなのです。

「人はこうあるべき」と上から示され、それに当てはまっているかどうか評価されるのではなく、自分で自分のことを振り返ったり、それを友達と共有したり、またクラスメートに対して良質なフィードバックができるようになることで、自分自身に対しても良いフィードバックができるように（ピア評価）学校は環境を設定しなければなりません。

先ほどご紹介した国際バカロレアのPYPでも”Assessment-able Learners（自身で評価する能力のある学び手）” という言葉が使われるようになりました。学びの目的を常に共有し、時にはルーブリックなどの評価軸も生徒がアイディア出しをして、決めていきます。

【実際の運用について】

アメリカでも、まだまだ成績における総括的評価の比重は80%程度と高い（Brumage-Kilcourse 2017）ですし、こうした割合をどのように設定するのが良いのか、フィードバックをどのくらい取り入れるかなどについては様々な意見があり、学校単位、年度単位でトライ＆エラーが繰り返されている状況です。

ちなみに、私の娘は2014年から2016年にかけてアメリカテキサス州の公立小学校に通いましたが、その教育区での成績のフォーマットは、自動的にテストの点数だけで成績がつくというシンプルなものでした。テストは何度でも繰り返し受けて良かったり、特性のある生徒に対する配慮は教員や学校が判断して良い余地は与えられていましたが、「この子は学習に前向きである」などの関心、意欲や態度については一切「成績」の対象になりませんでした。（遅刻・欠席は厳しいです）一方で、クラス内では娘が書いたものや読んだ本については、一対一で先生とお話しする時間が必ず設けられていたり、個別フィードバックの時間が取られていました。また、先生と保護者は気軽にメールでやりとりをして、適宜会うことができるなど、親としても娘の学校での様子を知ることは難しくありませんでした。これはこれで、教師に負担の多い非認知能力の評価を強いることなく、直接の生徒や保護者のやりとりに時間を割ける仕組みとして納得のいくものでした。

今回の研修実施したMid-Pack Instituteでは9-10年生（日本の中3・高1）でプロジェクトがカリキュラムの中心のMPXというコースがあるのですが、そこでも日常でフィードバックはふんだんに行なっているし、形成評価を重要視しているが、成績に形成評価を反映させるのは5%だとのことでした。（あとの95%は総括評価で、エッセイや中間報告、プロジェクト、最終試験（といってもビデオを作成したり手を動かすものが多い））その割合も生徒の様子を見ながらどんどん変えているようです。MPXでも生徒たちがルーブリックの作成に関わったり、日々のフィードバックがオンラインで送られたり、自己評価やピア評価といって、クラスメートでお互い評価をし合う、ということは頻繁に行われています。もちろんテストは何度でも受け直して構いません。ちなみに以前形成評価を成績から外していた時には、生徒たちが形成評価にあたる部分を軽視するという傾向がでたので、5%に設定したとのことで、その辺はどの国もあまり変わらないようです（笑）。いずれにしても、現場では形成評価はふんだんに使われるものの、教師の主観が避けられないものは、保護者や本人とのトラブルにもつながるため、成績から極力はずす、ということはあるようです。

ところで、アメリカの話が中心になっていますが、日本の事例を一つだけ挙げておきます。総合学習で有名な長野県の公立伊那小学校では、60年以上前に通知表を廃止し、今もありません。それまでは通知表がありましたが、通知表では、子どもの長所・短所、学習のつまずきとその原因まで知ることはできなかったり、子どもの具体的な成長、日々の努力に目を向けないで、結果だけにとらわれてしまうということがあったそうです。そこで、期末懇談会を設け、学業・性格・行動・身体など、日々に歩んでいる生き生きとした姿を中心に、父母と直接話し合うようにしたそうです。形成的評価中心の学校は日本にも昔からありました。子どもたち中心にものごとを考えれば、当たり前の判断とも言えます。日本だからできないという理由はありません。

言うは易し、行うは難し、と言いますが、とはいえ、一歩でも前進しなければ、何も変わりません。学びと評価は表裏一体だと考えています。もし自分たちで学びをデザインするのであれば、評価もそれに合わせてデザインし直さなければならないというのは当然なのだろう、と思っています。

あと、最後に一つ。学びの目的を決めてしまうと面白くなくなる、というのはその通りだと思います。デューイの「探究」の定義からいくと、探究の起点は、「不確定なもの」であり、一旦「確定的」な気分になってもまた、「不確定」が顔をだします。フィードバックやルーブリックを含めた評価のデザインのときに、その基本を外さないことが肝要です。また、それ以上に、個人の人生では、目的も何も見えず、ただ歩いているだけのつもりが何かに偶然的、あるいは必然的に出会っていく、ということは多々あります。「本質的な問い」のブログでも書きましたが、「評価」「フィードバック」「問い」の設定は、「みんなとある時空を共にし、一緒に学ぶ」というときに威力を発揮するもので、非常に技術的なものです。こういう技術的なもの（武器）を使うときには、これは技術にすぎないことを認識した上で、なぜその技術を使うのかを常に心にとめておく必要があり、注意が必要でもあります。武器を手にすることが目的とならないようにしなければなりません。実際には、人は切り分けられる世界と切り分けられない世界を行ったり来たりしています。そこを行き来できるようになると、迷いが少なくなってくると感じています。

では、今日はこの辺で。

＜参考記事※＞

Grades versus comments: Research on student feedback, Thomas R. Guskey, 2019
https://kappanonline.org/grades-versus-comments-research-student-feedback-guskey/

Feedback That Fits, Susan M. Brookhart
http://www.ascd.org/publications/educational-leadership/dec07/vol65/num04/Feedback-That-Fits.aspx

Seven Keys to Effective Feedback, Grant Wiggins
http://www.ascd.org/publications/educational-leadership/sept12/vol70/num01/Seven-Keys-to-Effective-Feedback.aspx

Giving Student Feedback: 20 Tips To Do It Right, Laura Reynolds
https://www.opencolleges.edu.au/informed/features/giving-student-feedback/

※本ブログは論文ではありません。本文中に参考までに研究者名と年数を記載していますが、本文にあたりたい場合には、参考記事にある脚注を各自ご確認いただくようにお願いいたします。

「本質的な問い」に迷う方へ

よい授業とは？　主体的・対話的で深い学びとは？

探求の共同体を実現する対話とは？–子ども哲学の現場から

「学ぶ」とは何か　〜寺田寅彦から教えてもらったこと

本質的な問いとは？　良い問いのたて方とは？

教師の仕事は徹底した個への関心がないと成立しない　〜誰一人として見捨てない教育へ