chatGPTマスターを目指して vol.10 知識の威力

chatGPTのアプリケーションを自分で作成できるシステム、myGPTs。それらに知識を読み込ませると、どうなるのか?試してみました。

  

vol.9で取り組んでいた、自分にとって役に立つmyGPTs作り。

少しずつではありますが、形になってきました。

その名もScholarly Wordsmith。

https://chat.openai.com/g/g-1Kcj0EYLn-scholarly-wordsmith

現在アップデート中なので、まだまだ発展途上ではあり粗さも目立ちますがご容赦ください。

なお、名前を考えてくれたのももちろん、chatGPTさんです。

Wordsmith。

なんだかとってもかっこいい響きです。

(ファンタジー小説好きである私には、ちょっときゅんとします。)

 

このmyGPTsに何を求めているかというと、論文の校正です。

今は日本語でざっくりとした研究概要を伝えたときに、不足している要素を列挙してもらうことしか試してはいませんが、今後は簡単な英文校正あたりもしてくれるようになったら嬉しいなあと思います。

…もちろん、データ漏洩には十分注意する必要はありますが。

 

そもそもこのmyGPTsを作ろうと思ったきっかけは、GPT knowledgeと呼ばれる、myGPTsを作る際のいわば「追加情報」である知識を、どのように与えると良いのか、について検証をするためでした。

chatGPTの元となっている自然言語モデルは、そのパラメータを学習したときに取得できた言語データの情報のみしか考慮することができません。

つまり、最新の情報はモデルに組み込まれておらず、新しい情報を考慮させるためには、自分でモデルに与える必要がありました。

他にも、あくまでGPTのモデルは一般的な文章を学習しているため、例えば機械学習の論文、といったような特定の分野について特化させるためには、その分野に対する追加の知識が必要となります。

恐らくそれは、論文校正においても重要なのではないか、と踏んでいます。

私自身、専門以外の論文を読むことがほとんどないので、例えば心理学や言語学の論文を読んだことはないのですが、きっと、機械学習分野ならではの論文お作法があるはず、と思うのです。

私が書かなければいけないのは、機械学習の論文です。

であるならば、そのお作法をmyGPTsに学んでもらうことは、当然のことのように思います。

 

では早速、GPT knowledgeを読み込む前に、以下の文章を入力してみました。

*****

以下の文章について、論文として成立するように、必要な要素を指摘してください。

 

本研究では、3種類のユリの特徴量データセットに対してユリの品種を推定するモデルを構築する。

モデルとしては、ランダムフォレストを用いており、高い精度が期待される。

*****

そして回答は以下の通りです。

******

この文章を論文として成立させるためには、いくつかの要素が不足しています。以下の点を考慮して拡張することをお勧めします。

 

導入部: 研究の背景や重要性を説明し、なぜこの研究が必要なのか、どのような問題が存在するのかを明確にします。ユリの品種推定がどのような文脈で重要かも触れると良いでしょう。

文献レビュー: 関連する既存研究をレビューして、あなたの研究がどのようにそれらと関連づけられるか、またどのように異なるかを述べます。これにより、研究の位置付けが明確になります。

方法論: 使用するデータセットの詳細な説明(ユリの種類、データの収集方法、特徴量の説明など)と、モデル構築のプロセス(ランダムフォレストの選択理由、モデルの訓練方法など)を含める必要があります。実験設計の詳細を提供し、研究の再現性を保証します。

結果: モデルのパフォーマンスを示す結果を詳細に報告し、どのような評価指標を使用したかも明記します(例: 精度、リコール、F1スコアなど)。グラフや表を用いて結果を視覚的に提示することが望ましいです。

議論: 結果の意味を解釈し、研究の限界点や、予期せぬ発見について考察します。また、将来の研究への示唆も含めると良いでしょう。

結論: 研究の要約、その意義、及び実用的な応用の可能性について結論を述べます。

参考文献: 研究で引用または参照した全ての文献を列挙します。

これらの要素を含めることで、あなたの研究をより明確に伝え、学術的な価値を高めることができます。

 

******

 

一般的な情報のみを考慮しているはずではありますが、かなりまっとうな答えが返ってきました。

では次に、自然言語処理の分野で非常に重要な論文である「Attention is all you need」という論文をGPT knowledgeに入力し、再度myGPTに尋ねてみました。

なお、この入力する際には、機械学習がその内容を理解できるように、ちょっとした工夫をしています。

尋ねた結果、回答はほとんど変わらなかったのですが、2点大きく変化した部分がありました。

1点目は、関連研究という章をなくし、その内容を背景の箇所で記述すること。

2点目は、章立てが変化したことです。

いずれも、読み込ませた論文の内容を反映していることは明確です。

 

ここまで明確に変化してくれるとは驚きです。

さすが、GPT knowledgeと銘打っているだけのことはあります。

ひとつの論文を読ませただけで、ここまで変わるのであれば、今後どんどん追加することで、さらなる改良が見込まれます。

加えて、英語のよくあるフレーズなども、学んでくれるかも…!

夢は広がります。

 

 

P.S.

人事コンサルの知見が詰まった、求人票が作れちゃうGPTs。

 

こちらの動画でご紹介しています。

 

【採用担当者向け ChatGPTで求人票を書く方法】

 

 

 

Who is writing

大学にてデータサイエンスを学ぶ傍ら、多くの人にデータ分析の面白さを伝えたいと日々奮闘中。