●特集 U● 教育の場における情報管理システム
ビッグデータと学校現場
 −あらたなデータの流通−

 武沢 護
技術の恩恵
 人間社会の歴史は技術革新の歴史でもある。 技術革新が社会を変えるか、 社会的要請が技術革新をもたらすかはさておき、 この二つは密接な関係であり、 技術革新が生活をよりよくする社会的基盤として発展していることには間違いはない。
 かつてプラトンは 「パイドロス」 の中で、 技術としての 「文字」 の発明に対して、 ある物語 (テウトとタモスの会話) を紹介する形でソクラテスに次のように言わせている。

 エジプトの神テウトは、 はじめて算術、 計算、 幾何学と天文学さらに将棋、 双六を発明した神であるが、 とくに注目すべきは文字の発明である。 … (中略) … (そして、 別の神タモスに向かって) テウトはこう言った。
  「王様、 この文字というものを学べば、 エジプト人たちの知恵はたかまり、 もの覚えはよくなるでしょう。 私の発見したのは、 記憶と知恵の秘訣なのですから。」
 しかし、 タモスは答えて言った。
  「たぐいなき技術の主テウトよ、 技術上の事柄を生み出す力をもった人と、 生み出された技術がそれを使う人々にどのような害をあたえ、 どのような益をもたらすかを判断する力をもった人とは、 別の者なのだ。 … (中略) …人々がこの文字というものを学ぶと、 記憶力の訓練がなおざりにされるため、 その人たちの魂の中には、 忘れっぽい性質が植えつけられることだろうから。 それはほかでもない、 彼らは、 書いたものを信頼して、 ものを思いだすのに、 自分以外のものに彫りつけられたしるしによって外から思い出すようになり、 自分で自分の力によって内から思い出すことをしないようになるからである」【1】

 われわれは歴史的に技術が 「益」 をもたらす同時に 「害」 をあたえてきたことを知っている。 現代が高度情報通信 (ICT) 社会とよばれ、 ネットワーク技術とディジタル技術が社会を支える基盤となると、 これからどのような 「益」 を受け、 どのような 「害」 を被るのだろうか。
データの新しい流通
 教育事業大手企業の大量な顧客情報の流出事件がこの 7 月に発覚した。 顧客である子どもや保護者の名前、 子どもの生年月日と性別、 住所、 電話番号などの個人情報が流出したというものである。 ただ、 各家庭のクレジットカード番号や銀行口座、 子どもの成績といった情報の流出は確認されていないというが、 当該の顧客だけでなく教育界を含め広く一般社会にも衝撃を与えた事件となった。 流出件数が2070万件ともいわれ、 個人情報の流出件数としては過去最大で、 子どもたちに関わる非常に 「大量なデータ」 に関する事件であった。 神奈川県においても 「成績処理支援システム」 が稼働しており、 ひとたび情報の流出が起これば県内の高校生に対して非常に深刻な問題になることは明らかである。
 さらに最近では 「ビッグデータ」 というあらたな概念や技術にもとづいたデータ流通がわれわれの身近なところで進行している。 本稿ではこれに注目する。
 最近、 新聞を眺めているとかなりの頻度でこのビッグデータという言葉に出会う。 JR東日本がビッグデータとしての Suica 利用者乗降履歴を日立製作所に販売したことは記憶に新しい (2013年 8 月)。 日立としてはこのビッグデータを分析し、 マーケティング情報として一般企業に販売する目的だったようである。 結局、 個人情報など様々な問題が指摘され、 日立はこのサービスを凍結することになった。 この例を待たずとしても、 われわれは日常的にさまざまなクレジットカードを始めプリペイドカードやポイントカードを活用している。 ここには個人の行動履歴が収集・蓄積され、 いわゆる 「ビッグ」 なデータとなる。 ポイントカードでポイントを稼ぐ代わりに自己の行動履歴を 「売り渡している」 ことになる。 次の二つの事例はビッグデータに関する新聞記事からである。

事例1:商用車 4 万台ビッグデータ
 富士通は 4 万台の商用車の走行ビッグデータの販売を月内に始める。 貨物トラックに付けた機器から 1 秒毎に車両の位置・速度、 ブレーキをかけた場所などの情報を収集。 道路交通情報通信システムより、 多様な道路の詳細な利用データを自治体や高速道路会社などに提供し、 効率的な道路インフラの維持・整備につなげる【2】。

事例2:リコー、 健康管理参入
 リコーは定期検診とウエアラブル端末による日々の健康チェックを組み合わせた健康管理システムサービスを始める。 定期検診の結果をデータベース化し、 経年の変化を集計。 同端末で集めた日々の歩数や血圧などの数値も加え、 社員の健康変化を独自の専用ソフトで予測する。 (略) リコーは同サービスによって得た健康情報データをビッグデータとして蓄積。 個人のデータを匿名化して活用することで、 生活習慣病やうつ病などの発症リスクの度合いを推定する健康予測ソフトウエアの精度向上につなげる【2】。

 それでは、 このビッグデータとりわけ個人の行動や状態などに関する 「パーソナルデータ」 が学校現場にどのような影響を及ぼし問題になるか考察していこう。 まず、 そもそも 「データ」 とは何か。 また 「ビッグデータ」 とはどのようなものかについて考えていく。

「データ」 から 「ビッグデータ」 へ (因果関係から相関関係)
 データの有用性として歴史的にすぐ思い浮かぶものとして16世紀デンマークの天文学者チコ・ブラーエが観測した膨大なデータがある。 ヨハネス・ケプラーはこれをもとに有名なケプラーの法則を導く。 さらにはアイザック・ニュートンの運動法則へ発展しヨーロッパの自然科学の輝ける時代の幕開けとなった。 最近では、 ヒトゲノムと遺伝子解析や大地震の予測などはこのビッグデータ活用のはしりである。
 このようにさまざまなデータを分析し因果関係を解明することで自然科学の大きな進歩となる。 さらには確率・統計的なものの考え方を利用して、 日常的な気象予報、 大地震の予報などに役立てる技術がより理論として精密化される。
 そもそも人間には知的活動のひとつとして 「推論」、 すなわち演繹的推論、 帰納的推論さらには仮説推論 (アブダクション) がある。 特に最後のアブダクションは重要で、 観察された一連の事象 (データ) に対して、 最もよくその事象を説明する仮説を選択する推論法で、 観察された事象の集合から出発し、 それらの事象についての最良の理論へと推論する。 ケプラーの法則の発見など科学的理論の構築に使われることが多い。
 ではビッグデータとは何か。 そして今までの 「データ」 とはどのように異なるのだろうか。 一般に 「データ」 の捉え方としていくつかの側面がある。 単にデータ量が 「大きい」 「小さい」 だけでなく、 「構造化されたデータ」 「構造化されていないデータ」 や 「個人データ」 「集団データ」 という具合である。 このような捉え方からするとビッグデータは 「大量な」 そして 「構造化されていない」 「個人のデータ」 という側面が強い。 そして、 それを特徴づけるものとして3V、 すなわち 「規模 (Volume)」、 「速度 (Velocity)」、 「多様性 (Variety)」 があげられることがある。
 それに何よりも特徴的な事柄は因果関係よりも相関関係を重視するという立場である。 統計的な手法など論理的なプロセスを用いて結論を導くのでなく、 単に相関関係の結果のみを優先して判断することである。 「この本を購入した人はあの本も購入している」 などというレコメンダー機能はその一例である。 すなわち面倒な因果関係を統計的に分析するより、 コンピューターにデータを丸投げして 「相関関係」 を頼りにすればいいという発想である。 では、 なぜこれほどにビッグデータが注目されるようになったのだろうか。

「個人情報」 から 「パーソナルデータ」 へ
 情報通信社会に進展により、 個人のデータが技術的に取集しやすくなり、 またこれらを活用することが新たな産業を興す機会になるとの認識が高まってきた。 そのような社会的要請を受けて個人情報に関する国際的動き、 とりわけ2013年にはOECDのプライバシーのガイドラインも改正されたことを踏まえ、 わが国も個人情報保護法についての見直しが始まった。
 そもそもわが国の 「個人情報保護法 (2003年制定)」 は、 個人のデータとプライバシー保護に関する基本原則であるOECDの 8 つの原則がガイドラインになっており、 次の 5 つの原則 (収集制限の原則、 利用制限の原則、 個人参加の原則、 適正管理の原則、 責任明確化の原則) に整理して制定された。 今回、 政府の高度情報通信ネットワーク社会推進戦略本部の有識者検討会が 「パーソナルデータの利活用に関する制度改正大綱」 をまとめたがその社会的背景を次のように述べている。

 政府の成長戦略においては、 データ利活用による産業再興を掲げており、 特に利用価値が高いとされるパーソナルデータについて、 事業者の 「利活用の壁」 を取り払い、 これまでと同様に個人の権利利益の侵害を未然に防止し個人情報及びプライバシーの保護を図りつつ、 新産業・新サービスの創出と国民の安全・安心の向上等のための利活用を実現する環境整備を行うことが求められている【3】。

 そして個人情報保護法の改正に向けパブリックコメントを経て、 来年の通常国会に提出する予定である。 まだまだ紆余曲折があると思われるが、 成立すれば2003年にこの法律が成立して初めての大きな改正となる。
 従来の 「個人情報」 がなぜカタカナの 「パーソナルデータ」 に置き換わったのかは2013年の経済産業省のワーキンググループの報告書に遡るが【4】、 ここでの目的は、 情報通信社会の進展によって多種多様なデータの収集・分析が可能になったことを踏まえ、 利用価値の高い個人情報を積極的に産業振興のために活用しようということである。 すなわち、 パーソナルデータとしての 「個人情報」 に対して、 一定の匿名化措置を講じて 「特定可能性低減データ」 として加工すれば、 本人の同意なく外部提供も含めた利活用を可能にしようという訳である。 明らかにプライバシーの保護よりも 「利活用」 優先であり、 この流れはビジネスだけでなく社会のさまざまな場面、 とりわけ学校現場にも現れてくることは容易に想像できる。

ビッグマーケットとしての学校現場
 次のような教育ビジネスはどうだろうか。
『教育関連企業大手のA社はこの度、 生徒の学習履歴にもとづいたビッグデータとその分析システムを販売する。 これは、 同社が提供するサービスの一環で、 生徒がもつ学習モバイル端末から得られる学習履歴や反転授業 【5】によるデジタルコンテンツの利用時刻、 頻度、 使用言葉、 正解率などの情報を収集するもので、 この分析システムを利用することにより、 生徒の理解度、 行動特性、 思考特性、 さらには進路適性などへ活用することが見込まれる。』
 これは架空の記事である。 しかし、 このような現実はもうそこまで来ている。 最近では学校教務システムの情報化だけでなく、 生徒たちの学習そのものに対しての情報化が進んでいる。 具体的には各学校にiPadなどのモバイル端末の導入、 そして反転授業におけるe-Learningシステムの活用などICT教育が推進され、 それらにもとづく個人データの取集が可能になったからである。 お隣の韓国ではすでに2003年から National Education Information System (NEIS:全国教育行政情報システム) というインターネット基盤の総合行政システムも稼働している【6】。
 わが国でもかつてより、 業者による模擬試験のデータにもとづいた受験指導を行い、 進路指導では各種適性検査など外部データの分析結果にもとづいて行うことが多い。 そして学校という日本の中でのビッグマーケットをターゲットにしたビッグデータビジネスはいまより一層加速されることは想像に難くない。 学校全体が常に 「ビッグデータ」 を生成する場として、 すなわち子どもたちも教員集団もすべてがデータ生成主体となり、 そのデータがビッグデータとしてデータベース化されることは技術的に十分可能である。

ビッグデータに操られる個人 (考えることを放棄しやさしい管理へ)
 日常的に気が付かぬままにデータを提供し、 無意識にデータの 「おすすめ」 に従って行動する。
  「実はあなたはこういうことが好きなんですよ」 と囁いてくれる。 これは、 データ提供による個人のプロフィールに対して、 ある基準にもとづいたレコメンダー機能が働くからである。 自分のことはビッグデータが 「すべて」 決定してくれる。
 マーク・ポスター氏は 『情報様式論』 (第三章 フーコーとデータベース) の中で 「自己構築」 をキーワードとして、 コミュニケーションの流通やそれが作り出すデータベースを《一種の超パノプティコン》と定義し、 次のように述べている。

 民衆は超パノプティコンの規範化する眼差しに従属する主体として自らを自己構築することに参加しているのである。 われわれはデータベースを、 プライバシーの侵害とか、 中心化された個人への脅威とかではなく、 個人の多様化であり、 そこで起こっていることを知っている 「現実の」 自己をもたない 「現実」 自己の損失の上に働きかけているような付加的な自己の構築として見てきた。 データベースの比喩的な要素はこのような自己構築にある【7】。

 すなわち、 ネット空間内に自らがデータを提供して出来あがる分身をおき、 統計的な相関関係にもとづいた行動様式をもった自分を日々構築する自分がいる。 極端に表現するならばあらゆる場面での思考、 行動において 「考えること」 を放棄し、 統計的裏付けをもった現代版 「占い」 にゆだねる自分がいることになる。

市民教育としてのデータリテラシー (批判的思考力の育成)
 次世代の教育を語るとき、 「これからは知識獲得型学習でない課題解決型学習が求められる」 と言われる。 そして知識は獲得するものではなくネット上など外部から探索すればよく、 「考える力」 を育むことこそがこれからの若い世代への教育の主流だという訳である。
 しかし、 いまやネットが 「考えてくれる」 時代になったとも言える。 ビッグデータが分析し指示してくれるからである。 さらに政府が今後導入を計画している社会保障・税番号制度いわゆる 「マイナンバー制度」 がこれらビッグデータと連動する可能性がないとも言えず、 国民全体が 「便利」 だとか 「ビジネスチャンス」 などと言って素朴に喜んでばかりいられない。 ここまで来ると 「やさしい管理」 をはるかに超える大きな問題になる可能性を持つからである。
 とはいえ、 若い世代への教育にできることは何かと考えてもいい知恵は浮かばない。 ともかくビッグデータという新しい技術やサービスについて広い知識と高い意識を持つことはこれからの社会では特に重要である。 幸いにもわが国も欧米に後れを取りながらも小学校、 中学校、 高等学校においてデータや統計を学ぶ教育課程が新学習指導要領から整備された。 さらには、 「オープンデータ」 と言って福井県鯖江市などのように、 自治体が持っているさまざまな統計データ (例:気象、 住基人口、 国勢調査、 施設情報、 観光情報、 議会関係など) を公開し、 データの利活用を図っているケースも増えている。 また、 インターネット上の新しいプライバシーの保護の在り方として新しく登場した 「忘れられる権利 (right to be forgotten)」 のように市民がデータをコントロールできる体制もできつつある。
 遠回りでも、 学校教育を含め市民教育の一環としてデータリテラシー教育を充実させ、 若い世代に 「考える力」、 すなわちデータに対する確かな目そしてものごとを批判的に見る力を身につけさせることがまず第一歩なのかもしれない。

【注】
1 プラトン、 『パイドロス』 藤沢令夫訳、 岩波文庫、 岩波書店、 1967。
2 日本経済新聞朝刊 (2014年7月8日朝刊)。
3 高度情報通信ネットワーク社会推進戦略本部、 『パーソナルデータの利活用に関する制度改正大綱』、 2014年6月24日。
4 パーソナルデータ
 パーソナルデータとは、 2005年より経済産業省において推進した 「情報大航海プロジェクト」 で用いられた 「パーソナル情報」 の概念を引用しており、 個人情報保護法に規定する 「個人情報」 に限らず、 位置情報や購買履歴など広く個人に関する個人識別性のない情報を含む。 なお、 2012 年より総務省で開催されている 「パーソナルデータの利用・流通に関する研究会」 においても上記の概念と同様に個人識別性を問わない 「個人に関する情報」 を 「パーソナルデータ」 と定義している。
  『パーソナルデータ利活用の基盤となる消費者と事業者の信頼関係の構築に向けて』 より
 経済産業省2013年5月10日
5 反転授業 (flip teaching または flipped classroom)
 従来の授業と異なり、 学習者が新たな学習内容を自宅などで事前にビデオ授業を視聴して予習し、 教室では授業者が個々の学習者に合わせた指導を与えたり、 学習者同士と協働しながら議論したり発表したりして取り組む授業形態のこと。
6 韓国のNEIS (全国教育行政情報システム)
 韓国におけるインターネット基盤の教育行政システムのこと。 National Education Information System (NEIS:全国教育行政情報システム) といい、 全国の教育組織を対象に政府機関である韓国教育学術情報院が2003年から運用開始した。
 教育行政の効率性・透明性・利便性の向上や教職員の校務の負担を減らすことを目的とし、 総務、 校務と行政事務に分かれている。 総務は、 教員や学校職員の人事管理や、 学校の予算管理、 施設・資産管理など。 校務は、 カリキュラムや生徒の学籍、 成績、 保健・健康、 入学・転校・卒業などの管理など。 行政事務は、 在宅教育サービス、 卒業・学籍証明書などの申請・発行。 保護者は、 子どもの出欠や試験日程・結果・成績・教員のコメント、 また学校便りや献立などを閲覧できる。
7 マーク・ポスター、 『情報様式論』 室井尚・吉岡洋訳、 岩波書店、 1991、 p.183。

【参考・引用文献】
神奈川県高等学校教育会館、 『情報公開・個人情報と学校自治』、 2012。
『ポスト・ビッグデータと統計学の時代』、 現代思想6月号、 青土社、 2014。

 
 (たけざわ まもる 
      早稲田大学大学院教職研究科)

ねざす目次にもどる