はじめに
今回はAIライティングアシストの英語学習への効果やデメリットについて考えていきたいと思います。さらに、最新の研究も紹介していきます。AIライティングアシストを支えているのが自然言語処理であり、それを言語に最適化したツールとしてChatGPTやGrammalyが英語学習のツールとして注目されています。今回はそれらのAIライティングアシストの正しい使い方について考えていきたいと思います。
↓↓英語学習動画を随時アップしています
主な参考文献
- AIライティングアシスト
- 自然言語処理(NLP)
- ディープラーニングとは
- 大規模言語モデル
- EFLにおける英語ライティングとは
- AIライティングアシスト効果の最新研究
- AIライティングアシスト使用の注意点
- AIライティングアシストの正しい使い方
AIライティングアシスト
AIライティングアシストとは
AI ライティングアシストとは書かれた文章を分析し、文法、語彙、構文、内容、構造などに対して最適なアドバイスを与えるツールです。有名なツールとしては「Quillbot」、「ChatGPT」、「DeepL Write」、「Grammarly」などがあります。
引用:QuillBot AI - Best AI writing assistant
例えば、QuillBotは2017年に開発された自然言語処理とAIを活用したAI ライティングアシストツールで、月間アクティブユーザーは700万人以上となっており、現在40ヶ国以上で使用されています。AIが文法チェック、パラフレーズなどを行い、意図した内容をより明瞭に表現できるように、文章を再構成してくれます。
英語学習者(EFL)とAIライティングアシスト
英語 (EFL) 学習者がライティング力を向上させるツールとして、上記のAIツールに近年注目が集まっています。これまでの研究ではEFL学習者は、限られた認知(作業記憶)リソースは、整理や改訂などのより高いレベルのライティングタスクではなく、低レベルのライティングタスク(単語の作成、翻訳)に費やされてきたと言われています。
AI ライティングアシストを使用すれば、より高レベルの整理や改訂に資源を費やすことができるのはもちろん、構成やフレーズのアドバイスなどさらに進化し続けています。
AIと第二言語習得研究
AIが第二言語習得をどれほど効果的に促すかという研究は盛んに実施されています。AIは後述する注意点もありますが、特にInteractivity(対話性)やReal-time feedback(即時フィードバック)は自主学習をする際にはかなり有益だと言えます。
引用: Leveraging Artificial Intelligence (AI): Chat GPT for Effective English Language Learning among Thai Students
自然言語処理(NLP)
自然言語処理とは
AI ライティングアシストを支えているのが自然言語処理(natural language processing)です。自然言語処理(natural language processing)とは人間の言語(自然言語)を機械で処理し、内容を抽出する技術です。つまり、コンピュータに「ことば」を教える分野とも言えます。次は自然言語処理発展の歴史を振り返ってみましょう。
自然言語処理の発展
引用:自然言語処理の歴史的背景を紹介! さらなる実用化に向けて
自然言語処理の黎明期で誕生したのが機械翻訳です。コンピュータを使用して、ある言語から別の言語へと翻訳する基礎技術が生まれます。次の忍耐期では、電子化された文書である大規模コーパスが発表されました。コーパスは後ほど説明するGPTのデータベースとして働いていきます。そして、発展期ではニューラルネットワーク技術が本格化されていきます。ニューラルネットワークとはどのようなものなのでしょうか。
AI ライティングアシスタント機能においても、 1980年代初頭はスペルチェックや文法チェックが中心でしたが、ニューラルネットワーク技術の発展により、後述する様々な機能の実装が可能となっていきます。
脳内に入り込んだニューラルネットワーク
ニューラルネットワークとは、人間の脳にあるニューロンと呼ばれる神経細胞の活動を参考に考案された出力プログラムを指します。脳内シナプスの入力と出力を模倣して、複数の数式を埋め込みながら下記のように生成されていきます。
もちろん脳内の構造や仕組みは全て解明されているわけではないので、シナプスの伝達構造においては複数の研究者が解明に努めているようです。例えば、シナプスの規則的な伝達パターンであるシークエンス入力が2020年の研究で解明され、これは従来の人工知能には組み込まれていないため、この現象を実装することで、より脳に近い機械学習の構築につながることが期待されています。
引用:高精度の配線によって実現される神経回路演算
ディープラーニングとは
ディープラーニングの種類
ディープラーニングは、先ほど説明したニューラルネットワークを多層化したもので、一般的には下記のようなディープニューラルネットワーク(DNN)というモデルが使用されています。混乱しやすいですが、ニューラルネットワークを少し複雑にさせた手法とは理解すれば大丈夫です。CNNやRNNもディープラーニングの一種と言われているようです。
ディープラーニングの種類(一例)
- DNN(Deep Neural Network):ニューラルネットワークが多層化した基本モデル
- CNN(Convolutional Neural Network):各層を別に処理し特徴量を決定するモデル
- RNN(Recurrent Neural Network):時系列データなどを扱う際に用いられるモデル
そもそも、ディープラーニングの何が凄いのかというとその画像解析の精度の高さです。人間が画像判定をすると約5%は間違えると言われていますが、2015年にはディープラーニングを使ったAIシステムが人間の判定を超えました。
引用:The Construction of Artificial Intelligence in the U.S. Political Expert Discourse
人間の脳を模倣したConvolutional Neural Network
CNN(Convolutional Neural Network)は先ほど、各層を別に処理し特徴量を決定するモデルと説明しましたが、下記の画像判定でよく使われる技術の一つで、人間の視覚野の階層構造からインスピレーションを得たと言われています。人間の脳内では網膜からインプットされた視覚情報が受容野(Receptive field)に伝わり画像を認識しています。CNNでは画像情報をピクセルに分解した後、一定のブロック事に特徴を検索及び分類して、画像を認識していきます。
引用:Ranking to Learn and Learning to Rank: On the Role of Ranking in Pattern Recognition Applications
↓↓CNNを視覚的に理解できます
大規模言語モデル
大規模言語モデルとは
少し遠回りしましたが、自然言語処理は人間の神経細胞の活動を模倣したり、視覚野の階層構造を取り入れ大規模言語モデル(Large Language Models)に辿りつきます。大規模言語モデルは非常に巨大なデータセットとディープラーニング技術を用いて構築された言語モデルで、下記のように前後に来る言葉を予測したりもできます。
大規模言語モデルの巨大なデータセットの中核になっているのがコーパス(Corpus)です。コーパスとは自然言語の文章や使い方を大規模に収集し、コンピュータで検索できるよう整理されたデータベースのです。AIが自然言語を扱うためには、膨大な量のデータ学習が必要です。人間が外国語を学ぶときと同じように、AIにも単語の意味や文法上の扱い、用例などを記した辞書のようなデータベースが必要となります。
↓↓コーパスにはついては下記で詳しく説明しています
GPTの正体
GPT(Generative Pretrained Transformer)とは、アメリカのOpenAIが開発した人間のように自然な文章を生成することができる大規模言語モデルのひとつです。そのGPTを会話向けに最適化したサービスがChatGPTです。
頭文字の意味
- Generative:AIモデルがデータ(テキスト、画像など)を生成する能力
- Pre-trained:大規模なデータセットを事前学習する能力
- Transformer:文脈を把握し単語の出現率から次の言葉を予測できる能力
↓↓TransformerやGPTをわかりやすく説明しています
OpenAIは2024年5月、最新のAIモデル「GPT-4o」を発表しています。末尾のoは「omni」の略称で、言語、画像、音声、動画を1つのモデルで処理が可能になりました。GPT-4oはあらゆる指標で高い評価を得ており、特にMMLU(一般知識の質問)で88.7%という高スコアを出しています。
引用:Hello GPT-4o
EFLにおける英語ライティングとは
第二言語習得研究と英語ライティング
そもそも第二言語習学習者における英語ライティングのプロセスはどのような道を辿るのでしょうか。ライティングモデルを理解すれば、どの部分をAIツールに任すべきか見えてくるかもしれません。
引用:Cognitive Models of Writing
第二言語習得研究おけるライティングは上記のようなライティングモデルを指すことが多いようです。1996年にkelloggが提案したのもので、主に4つのプロセスから構成されています。まずは書く内容を考えるために主張を提示(Proposer)します。その次に、考えたアイデアを言語に変換(Translator)、頭に浮かんだ文を評価・修正しながら(Evaluator/Reviser)、文字化します(Transcriber)。
ライティング産出認知プロセスモデル
文章がどのように生み出されていくのかという認知プロセスは、認知心理学の分野で盛んに議論されています。ここでは、実際にライティング指導に応用された2つの理論を紹介します。
一つ目は下記の認知プロセスモデル(Flower &Hayes, 1981)で、右下のライティング処理過程に対して、課題環境(Task Environment)や書き手の長期記憶が影響を及ぼすと唱えています。推敲を繰り返すことの重要性を説いたことから、現在主流となっているプロセスアプローチの論理的背景ともなっています。
引用:Research gate | New Directions in Writing Theory
もう一つは、Bereiter & Scardamalia (1987)によって提唱された知識変容モデルで、彼らはライティングプロセスは皆が同じようか形をとらないと主張しました。また、計画や目標設定を必要とし、ライティングそれ自体が思考プロセスの発展に重要な役割を担うと唱えています。
引用:「知識伝達モデル」から「知識変形モデル」への 発展を志向するアカデミック・ライティング指導
動的筆記修正フィードバック
Harthorn(2020)の研究によれば、外国語学習者のライティング能力を向上させるためには動的筆記修正フィードバック(dynamic written feedback)が有効である主張しています。彼の研究は現在のライティング指導に影響を与えており、1人1人の学習者に対応していることの重要性が主張されています。
動的筆記修正フィードバック
- individualized(1人1人の学習者に対応していること)
- meaningful(意義があること)
- timely(時宜にかなっていること)
- constant(一貫していること)
- manageble(処理しやすいこと)
実は上記の5点はAIライティングアシストツールとかなり相性が良いと言えます。実際の教師が一人一人に対して、時宜に適ったアドバイスをするのは難しいのが実情です。
AIライティングアシスト効果の最新研究
Grammarly
Grammalyは2009年に米国の企業によってリリースされたAIライティングアシストツールで、機械学習とディープラーニングのアルゴリズムを駆使して文法チェック・スペルチェック・盗用検出のためのサービスを提供しています。
Grammalyは第二言語習得におけるライティング能力の向上に寄与すると言われています。中国で実施された調査(対象:学生、人数:190人)では、従来のライティング指導を受けた生徒(Control G)よりGrammalyを導入した生徒(Experimental G)の方が事後テスト(Post-test)の点数が、あらゆる指標(課題、一貫性、語彙、正確性)で高くなるという結果が出ました。
引用:The impact of automated writing evaluation on second language writing skills of Chinese EFL learners: a randomized controlled trial
また、感情面への影響に関する研究も行われています。日本の大学生を58人を対象にGrammarlyを使ったライティング指導をしたところ、外国語不安の気持ちが下がり、 学習者の自主性 が高まる結果がでました。
ChatGPT
2023年に中国で実施された研究では、ChatGPTを活用した生徒のライティング能力が大きく向上したと報告されています。習熟度が一致している50 人の EFL 学生に対して、事前テストと事後テストを行い、下記のライティングスキルが評価されました。
引用:Enhancing academic writing skills and motivation: assessing the efficacy of ChatGPT in AI-assisted language learning for EFL students
50 人は実験グループ (ChatGPT による AI 支援指導) とコントロール グループ (従来の指導)にランダムに割り当てられます。定量分析により、AI 支援指導を受けた生徒は対照群と比較して、ライティング能力(構成、一貫性、文法、語彙、モチベーションなど)に大幅な改善が見られました。
AIライティングアシスト使用の注意点
記号設置問題
記号設置問題(シンボルグラウンディング問題)は記号で指し示されるものをAIがどのように認識するかという議論を指します。記号(シンボル)が概念に接地(グラウンディング)されることなしには、記号処理が意味をなさないことが問題になっています。
AIのなかでは、単語一つ一つが、経験や感覚に対応づけられていない――身体感覚に「接地していない」――状態にある。つまり、本当は単語一つ一つの「意味」を理解していない。にもかかわらず、あたかも理解しているようにふるまっている、ということです。
引用:算数が苦手な子どもはAIと似ている 「記号接地問題」とは?
引用:はじめての認知言語学 第1章認知 p15(図1) を参考に作成
認知言語学では感覚の働きと言語が密接に関係していると考えます。五感は対象のかたちをとらえ、音を聞いたり、匂いや味を感じる大切な能力で、それらの刺激を通して私達は精神活動(学習・記憶・推論・判断)を営みます。例えば、リンゴも五感を総動員して、丸くて赤い物体を必死に概念化し、「リンゴ」という記号を獲得すると考えます。
AIはリンゴを味わった事もないのに、あたかも経験したかのように振る舞います。つまり、記号(シンボル)が概念に接地(グラウンディング)されることなしに、果物や食べ物というように話がどんどん広がっていきます。抽象的な世界をしか知らないAIはたとえば、1/3という概念が分かったとしても、具体的な世界でケーキを1/3に切ったことがなければ、1/3のケーキがどれぐらいのサイズかも分かりません。
教師と生徒の共通理解
AIライティングアシストツールに対して、教師と生徒の間で認識がずれていることが多いようです。教師側がAIライティングアシストツールを使用する際は、生徒との認識をギャップをうめる取り組みが求められます。米国で合計 226 名の参加者(学生 158 名と教師 68 名)に対して、ChatGPTの仕様に対して下記のA〜Dの条件で反対か賛成かのアンケートをとりました。
- A : If a student or teacher is tasked with an assignment that they can already perform with a high degree of competency, then it is acceptable to offload that task to AI
- B :It is acceptable for students or teachers to use AI to generate models or ideas for task assignments, considering the submitted assignment is composed of their own language and not the language of the AI
- C: It is acceptable for students or teachers to submit task assignments that contain, in part or in whole, language produced by AI, considering that any AI language is clearly identified as such
- D : It is acceptable for students or teachers to submit task assignments that contain, in part or in whole, language produced by AI without disclosing the use of AI
アンケートはライティングにおける「Brainstorming」、「Outlining」、「Writing」、「Revision」、「Feedback」、「Evaluating」の6項目に対して実施され、「Feedback」の項目ではやや生徒と教師の間で認識の不一致が見られました(Bの質問に対して)。
引用:Not quite eye to A.I.: student and teacher perspectives on the use of generative artificial intelligence in the writing process
文化的背景の違い
日本と欧米文化の違いに関する研究は、1970年代から活発に行われ、特に文化的対称性に焦点が当てられています。Damenの研究によれば、日本は単一国家による単一言語の使用で同質性を好み、対人関係に対しても補助的で形式を重んじる傾向があるとされています。
関係する価値観 | アメリカ | 日本 |
---|---|---|
社会と文化の本質 |
異種混合(Heterogeneity) 水平の社会(Horizontal society) 行動(Doing) 押し(Pushing) |
同質(Homogeneity) 垂直性(Verticality) 存在(Being) 引き(Pulling) |
対人関係 |
独立(Independence) 対称的関係(Symmetrical) 形式ばらない(Informality) |
個人より全体(We over I) 補助的関係(Complementary) 形式(Formality) |
引用:日本人のための英語ライティング講座 p17
さらにレトリック(修辞法)という観点では、日本語は言わずともわかると聞き手や読み手に理解を求める傾向があり、アメリカの相手を説得するための無駄のない直線的ロジックとは真っ向から対立しています。
引用:Kaplan's (1966) diagram presenting cross-cultural differences in paragraph organization in the study on cultural thought patterns in intercultural education
AIライティングアシストのフィードバックはもちろんですが、英語的な直線的なロジックに基づいています。英語らしさやロジックを意識しないと、混乱を引き起こす可能性もあります。教師としても、文化的な違いを意識した使用が求められます。
AIライティングアシストの正しい使い方
AIに頼らない言語分析力
母語話者が、第二言語を習得使用すると下記の中間言語を形成するとも言われています。中間言語という概念はラリー・セリンカーによって1972年に提唱され、人間の頭の中には潜在的な言語体系があり、第二言語学習者が目標言語を習得していくプロセス、その言語体系を参照しつつ、独自の言語体系を構築すると主張しました。
英語などの第二言語を習得する際は気づき→理解→内在化→統合という認知プロセスは母国語を介して実行されます。それらの仮説検証を繰り返して、独自の言語体系である中間言語を形成していきます。
ですが、下記のようにAIに頼りすぎると自分なりの仮説検証ができず、独自の中間言語を生成できない恐れがあります。第二言語の習得を無視すれば、AIに任せて言語活動をする事は可能です。ただし、英語などのターゲット言語をより上達させたいのあれば、AIに頼りすぎるのはよくありません。AIとの思考を共存させる、新しいライティングモデルが求められます。
AIライティングアシスト共存モデル
私が考案したAIライティングアシスト共存モデルはStep1〜3までのプロセスでライティング活動を行います。Step2の「Monitor」とStep3の「Feed back」ではAI ライティングアシストツールを活用します。
共存モデルを使用したライティングの進め方
Step1 アイデア創出
Step1のアイデア創出のプロセスでは、テーマに関する知識やライティングプランを日本語でインプットしていきます。たとえば、英語のライティングフォーマットをそのまま転用したり、モデルとなるセンテンスをそのまま暗記してしまうと、中間言語を生成できず、第二言語習得のプロセスそのものを回せなくなるで注意が必要です。
Step2 AIを活用したライティング
Step2のAIを活用したライティングのプロセスでは、早速パラフレーズやコロケーションの知識を活用します。コロケーションは日本人にはわからない英語らしさを身につけるのに役に立ちますし、パレフレーズは文脈に則した最適な表現を自分のライティングに組み込むことができます。
例えば、Deepl Writeでは、下記のように「I like apples」と入力する「I like to eat apples」や「I lobe apples」などの異なる表現を提案してくれます。同じ表現を繰り返したくない時にも活用できます。
また、右上の文体をクリックして一般→学術に変更するとよりアカデミックな場面で適切な表現を提案してくれます。他にもビジネスやカジュアルも用意されているので、目的や状況に応じたライティングを学習できます。また、トーンを設定する項目では熱意を伝える・フレンドリーなどにも変更可能です。
冒頭で説明したQuillBotもかなり優秀です。文章を入力して、左下の「Rehrase」をクリックすると右側にリフレーズした表現が出てきます。さらに、単語にカーソルを合わせると複数のフレーズを提示してくれます。語彙力もアップするのでおすすめです。
厳密には、AIライティングアシストツールではないですが英語コーパスを気軽に使える「SKELL」もおすすめです。SKELLを使えば相性に良い単語や頻出の表現をすぐに検索する事が可能です。
Step3 即時フィードバック
Step3の即時フィードバックのプロセスでは、AIならではのスピーディーなフィードバックを最大限に活用します。伝統的な教師によりフィードバックは作成まで時間が必要となり、教師の力量にもばらつきがあります。AIによるフィードバックはデータベースから生成された文章構造を参照しながら実行されるので、次回以降のライティングプランのブラッシュアップにつながります。
たとえば、Grammarlyを使用すると、自分が作成した英作文を入力するとCorrectness(正確さ)、Clarity(明瞭さ)、Engagement(魅力)、Delivery(伝達)などの項目を採点し、点数を出してくれます。その他、模範解答やアドバイスも教えてくれます。リアルタイムでフィードバックを受け取る事で、次のライティングプランの練り直しに寄与してくれます。
ChatGPTから即時フィードバックを受けることも可能です。ただし、ChatGPTは会話型のサービスなので、英作文を入力した後に下記のようなプロンプト(Prompt)を入力する必要があります。自由な分、より上級者向けと言えます。
プロンプト例
- Can you correct my English? (英文を添削してもらえますか?)
- Can you show me the points and reasons that you corrected? (添削理由は?)
先ほども述べましたが、AIはリンゴを味わった事もないのに、あたかも経験したかのように振る舞います。抽象的な世界をしか知らないはずのChatGPTを活用しすぎると、具体⇆抽象の落とし穴に落ちる危険もあるので注意が必要です。
参考
QuillBot | AI - Best AI writing assistant
Medium | The Evolution of AI Writing Assistants: Past, Present, and Future
Accel Universe Corporation | 自然言語処理の歴史的背景を紹介! さらなる実用化に向けて
Gfl-journal | Cognitive Models of Writing
Research gate | New Directions in Writing Theory
千葉大学教育学部研究紀要 | 「知識伝達モデル」から「知識変形モデル」への 発展を志向するアカデミック・ライティング指導
Accel Universe Corporation | 自然言語処理の歴史的背景を紹介! さらなる実用化に向けて
山口県立大学学術情報 | 英語教育における人工知能(AI)の活用
ITmedia | 【図解】コレ一枚でわかるニューラル・ネットワークの仕組み
Researchgate | Artificial Neural Networks Accurately Predict Language Processing in the Brain
ExaWizards | ディープラーニング とは?ニューラルネットワークや機械学習との関係性、仕組みや実装する際の注意点を解説
ResearchGate | The Construction of Artificial Intelligence in the U.S. Political Expert Discourse
J-STAGE 早期公開記事 | 自動ライティング評価ツールGrammarly を援用した英語ライティング指導の探究的実践