ChatGPT にタイピング練習の問題を作らせる
こんにちは。Playgram(プレイグラム)開発チームです。
おかげさまで、プレイグラムタイピングはタイピング学習に取り組む月間 100 万人の皆さまにお使い頂いていますが、それに伴って「問題文を増やしてほしい」「もっと親しみやすい文章で練習したい」というお声を頂くことが増えてきました。
プレイグラムタイピングは、特訓モードや腕試しモードでの出題文として約 4,500 文を用意しており、これを学習者の実力や、苦手な文字に合わせて出題するようになっています。これまでは、その内訳は以下のようになっていました:
- 単語: 1,773 文
- 慣用句・四字熟語・ことわざ: 1,155 文
- それ以外の文: 875 文
開発チームでは、世の中の文章の読解に必要な知識である慣用句と、日常会話で使う表現をバランスよく出題することで、タイピング学習を「キーの位置を暗記する」のではなく「日常で実際に使う文を打つ際の手の動かし方を体に覚えさせる」ことを狙っています。
その一方で、問題文の考案には多大な時間と労力を要するため、数多くのご要望を頂いていたものの、なかなか着手できておりませんでした。
生成 AI を活用した問題文生成
昨今、ChatGPT のような大規模言語モデルに代表される「生成 AI」がにわかに注目を集めています。
大規模言語モデルは、文字通りに膨大なテキストデータから、我々が普段読み書きしている文章の文脈やパターンを学習した機械学習モデルで、コンピュータに、これまで人間にしかできないと考えられていた文章の生成や要約、質疑応答、翻訳といった応用的なタスクを行わせることができます。
中でも、米 OpenAI 社が2022年11月に公開した「ChatGPT」は、同社の大規模言語モデル「GPT」を「AI と対話(チャット)する」という形で提供し、人間の発する多様な質問に対して極めて自然な文章で回答できることで大きな注目を集めました。
2023年3月には GPT-3.5 の改良版である GPT-4 が公開され、メディアなどでも大きく取り上げられました。現在も、Web を参照して回答する機能の追加など、継続的に改良が続けられています。
ところで、「自然な文章を機械的に生成できる」という機能は、まさにプレイグラムタイピングが抱えていた「問題文の考案に大きな労力を要する」という課題に応えるものです。そこで、開発チームでは ChatGPT に問題文を生成させ、不適切な文章を人手で取り除く方法により、短期間で新たに 400 弱の文を追加できました。
今後も生成 AI を活用し、学習者の皆さんの声に応える形で問題文のさらなる追加を検討しています。
大規模言語モデルの仕組みと可能性
大規模言語モデルは「ある文章の次にどんな文章が来るのか?」を予測することで、自然な文章を出力する仕組みを備えています。
例えば、「あけまして」という文にはどんな言葉が続くでしょうか? 一般的には「おめでとう」と続ける人が多いのではないでしょうか。さらに、この後には「ございます」とか「今年もよろしく」といった言葉が繋がる可能性が高いでしょう。
この考え方を会話にも応用してみましょう。例えば、あなたが「最近、悩んでいるんです」と言ったら「何を悩んでいるんですか?」と聞かれるでしょう。そこで、あなたが「成績が伸びなくて…」と返せば、相手は「何の科目が伸び悩んでいるんですか?」と続けるでしょう。
大規模言語モデルは、このような連想ゲームをとても高いレベルで行うことができます。その結果、利用者があたかも実際の人間と自然な会話が成立しているかのような感覚を覚える域にまで達しています。一方で、本質的には「いかにもそれらしい会話」でしかないので、何か質問をした際にいかにもそれらしい嘘(ハルシネーション(幻覚)と呼ばれます)を織り交ぜた回答をする場合があります。
しかし、それを踏まえた上でも、教育への応用を含め、とても高い可能性を秘めていることは間違いありません。例えば、今回のプレイグラムタイピングでの応用のように、人間が後から内容を精査することを前提としたアイデア出し(ブレスト)や、文章の下書き・校正のようなタスクには非常に向いています(実は、この記事の一部も ChatGPT に提案させた文章を活用して書かれています)。
ChatGPT の使い方
今回、ChatGPT でどのように問題文を考案させたかご紹介します。ChatGPT の出力はプロンプト、つまり文章で与えた指示に大きく依存します。つまり、意図通りの結果を得るには、より具体的な指示を与える必要があります。
例えば、以下のようなプロンプトを与えると、ChatGPT は「出力させたい文章の例」「表形式で出力する」「出力する文章の文字数の制限」など、指示した制約に基づく文章を生成します。
日本語の文章を10個提案してください。表形式で、漢字かな交じりの文章と、読み仮名表記と、読み仮名の文字数の3列を出力してください。読み仮名の文字数が10以上、13以下になるように文章を調整してください。
例:
* 週末は家族サービス
* おしゃれなカフェ巡り
* 採れたて新鮮夏野菜
* ジョギングで健康維持
* 肉球がお気に入り
* 新時代の幕開け
* どっちの色が似合うかな
このプロンプトから実際に生成された文章は以下の通りです:
今回の作業を通じて、ChatGPT の活用について以下の知見が得られました。
例示することで期待する出力に近づけることができる
プレイグラムタイピングで日常会話文を出題する上で、無味乾燥な文ではなく、少しユーモアを含むようなものにしたいと考えました。そこで、最初は「おかしみのある文章にしてください」というプロンプトを与えましたが、「馬がコーヒーを飲む」「イカがバレエを踊る」といったシュールな文ばかりが出力されてしまいました。
その代わりに、期待する文の例をいくつか示すことにしたところ、先ほど示したように満足いくものが出力されました。
読み仮名を高精度で出力できる
今回のプロンプトでは読み仮名も出力するように指示しました。それが本当に正しいかは最終的に一つ一つ人間の手でチェックしましたが、今回追加した約 400 の文章のうち、読み仮名を誤っていたのはわずか 3 件でした。
例えば、「ショーケース」の読み仮名を「しょーケース」とカタカナ混じりにしてしまったり、「かいすいよく(海水浴)」を「うみすいよく」としてしまうなどのミスがありましたが、全体的には精度の高さに驚かされました。
GPT-4 の方が文字数の制限を守る
先ほども解説したように、ChatGPT には GPT-3.5 と GPT-4 という2種類のモデルが存在します。GPT-3.5 は文字数制限を守らずに20文字前後の文を出力することが多かったのですが、GPT-4 にすることで大きく改善しました。
それでもまだ完璧ではありませんが、おおよそ指定した長さの文が生成されるので、別に開発した簡単なプログラムで文字数を確認するだけで目的を達成できました。
教育現場での生成 AI の活用に向けて
この記事では、最近大きな話題となっている大規模言語モデルのような生成 AI のご紹介と、それをプレイグラムタイピングで「問題文のアイデア出し」という形で活用したことをご報告しました。今回の例は非常に簡単な応用ですが、教育現場の深刻な人手不足を解決する上で、生成 AI 技術は非常に大きな可能性を秘めています。
一方で、内容に嘘や誤りが含まれている場合があるなど、生成 AI の出力の取り扱いには注意が必要です。一般的には、児童・生徒に直接使わせるよりも、生成 AI との間に先生が入った形での活用が望ましいでしょう。OpenAI 社が、ChatGPT を活用する教育者向けの注意点をまとめたドキュメントを公開しているので、ご一読をお勧めします。
Playgram 開発チームでは、今後も AI 技術を開発・活用すると共に、教育現場をサポートする取り組みを続けていきます。